• yangjianbo's avatar
    fix(兼容): 将 Kimi cached_tokens 映射到 Claude 标准 cache_read_input_tokens · f33a9501
    yangjianbo authored
    
    
    Kimi 等 Claude 兼容 API 返回缓存信息使用 OpenAI 风格的 cached_tokens 字段,
    而非 Claude 标准的 cache_read_input_tokens,导致客户端收不到缓存命中信息且
    内部计费缓存折扣为 0。
    
    新增 reconcileCachedTokens 辅助函数,在 cache_read_input_tokens == 0 且
    cached_tokens > 0 时自动填充,覆盖流式(message_start/message_delta)和
    非流式两种响应路径。对 Claude 原生上游无影响。
    Co-Authored-By: default avatarClaude Opus 4.6 <noreply@anthropic.com>
    f33a9501
gateway_service.go 176 KB