Commits · 7f317b9093363cd1130c3b7af2569223f0bb7cce · 陈曦 / sub2api

14 Jan, 2026 6 commits

feat(ops): 增强ops核心服务功能和重试机制 · 7f317b90
IanShaw027 authored Jan 14, 2026

7f317b90
refactor(ops): 更新gateway服务集成ops功能 · 060699c3
IanShaw027 authored Jan 14, 2026

060699c3
refactor(ops): 重构ops核心服务层代码 · 967e2587
IanShaw027 authored Jan 14, 2026

967e2587

refactor(ops): 移除duration相关告警指标，简化监控配置 · 18268381

IanShaw027 authored Jan 14, 2026

主要改动：
- 移除 p95_latency_ms 和 p99_latency_ms 告警指标类型
- 移除配置中的 latency_p99_ms_max 阈值设置
- 简化健康分数计算（移除latency权重，重新归一化SLA和错误率）
- 移除duration相关的诊断规则和阈值检查
- 统一术语：延迟 → 请求时长
- 保留duration数据展示，但不再用于告警判断
- 聚焦TTFT作为主要的响应速度告警指标

影响范围：
- Backend: handler, service, models, tests
- Frontend: API types, i18n, components

18268381

fix(ops): 修复告警状态验证和错误处理逻辑 · 33f58d58

IanShaw027 authored Jan 14, 2026

- 增强告警事件状态验证，添加合法状态值检查
- 移除重试逻辑中的遗留字段赋值
- 修正仓库不可用时的错误类型
- 格式化测试文件代码

33f58d58

feat(service): 增强ops业务逻辑和告警功能 · d6017680

IanShaw027 authored Jan 14, 2026

- 实现告警静默功能的业务逻辑
- 优化错误分类和重试机制
- 扩展告警评估和通知功能
- 完善错误解决和重试结果处理

d6017680

12 Jan, 2026 18 commits

Revert "fix(gateway): 修复 base_url 包含 /chat/completions 时路径拼接错误" · d85288a6
ianshaw authored Jan 12, 2026
```
This reverts commit 7fdc25df.
```
d85288a6

feat(gateway): 对所有请求（包括 Codex CLI）应用模型映射 · 3402acb6

ianshaw authored Jan 12, 2026

- 移除 Codex CLI 的模型映射跳过逻辑
- 添加详细的模型映射日志，包含账号名称和请求类型
- 确保所有 OpenAI 请求都能正确应用账号配置的模型映射

3402acb6

fix(gateway): 修复 base_url 包含 /chat/completions 时路径拼接错误 · 7fdc25df

ianshaw authored Jan 12, 2026

问题：
- 当账号的 base_url 配置为 https://example.com/v1/chat/completions 时
- 代码直接追加 /responses，导致路径变成 /v1/chat/completions/responses
- 上游返回 404 错误

修复：
- 在追加 /responses 前，先移除 base_url 中的 /chat/completions 后缀
- 确保最终路径为 https://example.com/v1/responses

影响范围：
- OpenAI API Key 账号的测试接口
- OpenAI API Key 账号的实际网关请求

Related-to: #231

7fdc25df

fix(gateway): 完善 max_output_tokens 参数处理逻辑 · fe6a3f42

ianshaw authored Jan 12, 2026

根据不同平台和账号类型处理 max_output_tokens 参数：
- OpenAI OAuth (Responses API): 保留 max_output_tokens（支持）
- OpenAI API Key: 删除 max_output_tokens（不支持）
- Anthropic (Claude): 转换 max_output_tokens 为 max_tokens
- Gemini: 删除 max_output_tokens（由 Gemini 专用转换处理）
- 其他平台: 删除（安全起见）

同时处理 max_completion_tokens 参数，仅在 OpenAI OAuth 时保留。

修复客户端（如 OpenCode）发送不支持参数导致上游返回 400 错误的问题。

Related-to: #231

fe6a3f42

feat(gateway): 优化 Antigravity/Gemini 思考块处理 · 524d80ae

xiluo authored Jan 10, 2026

此提交解决了思考块 (thinking blocks) 在转发过程中的兼容性问题。

主要变更：

1. **思考块优化 (Thinking Blocks)**：
   - 在 AntigravityGatewayService 中增加了 sanitizeThinkingBlocks 处理，强制移除思考块中不支持的 cache_control 字段（避免 Anthropic/Vertex AI 报错）
   - 实现历史思考块展平 (Flattening)：将非最后一条消息中的思考块转换为普通文本块，以绕过上游对历史思考块签名的严格校验
   - 增加 cleanCacheControlFromGeminiJSON 作为最后一道防线，确保转换后的 Gemini 请求中不残留非法的 cache_control

2. **GatewayService 缓存控制优化**：
   - 更新缓存控制逻辑，跳过 thinking 块（thinking 块不支持 cache_control 字段）
   - 增加 removeCacheControlFromThinkingBlocks 函数强制清理

关联 Issue: #225

524d80ae

style(ops): 修复代码格式问题以通过 golangci-lint · 2d45e61a
IanShaw027 authored Jan 12, 2026

2d45e61a

feat(ops): 添加 count_tokens 错误过滤功能 · 345a965f

IanShaw027 authored Jan 12, 2026

功能特性：
- 自动识别并标记 count_tokens 请求的错误
- 支持配置是否在统计中忽略 count_tokens 错误
- 错误数据完整保留，仅在统计时动态过滤

技术实现：
- ops_error_logger.go: 自动标记 count_tokens 请求
- ops_repo.go: INSERT 语句添加 is_count_tokens 字段
- ops_repo_dashboard.go: buildErrorWhere 核心过滤函数
- ops_repo_preagg.go: 预聚合统计中添加过滤
- ops_repo_trends.go: 趋势统计查询添加过滤（2 处）
- ops_settings_models.go: 添加 ignore_count_tokens_errors 配置
- ops_settings.go: 配置验证和默认值设置
- ops_port.go: 错误日志模型添加 IsCountTokens 字段

业务价值：
- count_tokens 是探测性请求，其错误不影响真实业务 SLA
- 用户可根据需求灵活控制是否计入统计
- 提升错误率、告警等运维指标的准确性

影响范围：
- Dashboard 概览统计
- 错误趋势图表
- 告警规则评估
- 预聚合指标（hourly/daily）
- 健康分数计算

345a965f

fix(ops): 修复Go代码格式问题 · e0cccf6e
IanShaw027 authored Jan 12, 2026

e0cccf6e

fix(gateway): 自定义错误码触发停止调度 · 6dcb2763

ianshaw authored Jan 11, 2026

- 修改 HandleUpstreamError 逻辑，启用自定义错误码时所有在列表中的错误码都会停止调度
- 添加 handleCustomErrorCode 函数处理自定义错误码的账号停用
- 前端添加 429/529 错误码的警告提示，因为这些错误码已有内置处理机制
- 更新 EditAccountModal、CreateAccountModal、BulkEditAccountModal 的错误码添加逻辑

6dcb2763

feat(scheduler): 引入调度快照缓存与 outbox 回放 · 3141aa51

yangjianbo authored Jan 12, 2026

- 调度热路径优先读 Redis 快照，保留分组排序语义
- outbox 回放 + 全量重建纠偏，失败重试不推进水位
- 自动 Atlas 基线对齐并同步调度配置示例

3141aa51

feat(ops): 集成实时流量API接口 · 62771583

IanShaw027 authored Jan 12, 2026

- 添加实时流量handler处理逻辑
- 注册实时流量路由
- 扩展ops service接口定义

62771583

feat(ops): 新增实时流量数据层 · 5526f122

IanShaw027 authored Jan 12, 2026

- 添加实时流量repository层实现
- 添加实时流量service层逻辑
- 定义实时流量数据模型

5526f122

refactor(settings): 简化流超时配置，移除冗余字段 · 0c528095
ianshaw authored Jan 11, 2026
```
- 移除 TimeoutSeconds 字段，超时判定由网关配置控制
- 默认禁用流超时处理功能
```
0c528095

feat(gateway): 添加流超时处理机制 · 2a0758bd

ianshaw authored Jan 11, 2026

- 添加 StreamTimeoutSettings 配置结构体和系统设置
- 实现 TimeoutCounterCache Redis 计数器用于累计超时次数
- 在 RateLimitService 添加 HandleStreamTimeout 方法
- 在 gateway_service、openai_gateway_service、antigravity_gateway_service 中调用超时处理
- 添加后端 API 端点 GET/PUT /admin/settings/stream-timeout
- 添加前端配置界面到系统设置页面
- 支持配置：启用开关、超时阈值、处理方式、暂停时长、触发阈值、阈值窗口

默认配置：
- 启用：true
- 超时阈值：60秒
- 处理方式：临时不可调度
- 暂停时长：5分钟
- 触发阈值：3次
- 阈值窗口：10分钟

2a0758bd

feat(ops): 后端添加指标阈值管理API · 7536dbfe

IanShaw027 authored Jan 12, 2026

- 新增GetMetricThresholds和UpdateMetricThresholds接口
- 支持配置SLA、延迟P99、TTFT P99、请求错误率、上游错误率阈值
- 添加参数验证逻辑
- 提供默认阈值配置

7536dbfe

fix(仪表盘): 添加聚合和回填操作的执行时间日志 · 955af6b3
yangjianbo authored Jan 12, 2026

955af6b3
fix(仪表盘): 增加对数据库驱动和仓储实例的有效性检查 · 1073317a
yangjianbo authored Jan 12, 2026

1073317a
fix: 修复PR合并后的功能回退和安全问题 · 50de5d05
shaw authored Jan 12, 2026

50de5d05

11 Jan, 2026 16 commits

fix(ci): 修复最后一批CI错误 · c48795a9

IanShaw027 authored Jan 12, 2026

- 修复 ops_repo_trends.go 中剩余3处 Rows.Close 未检查错误
- 修复 ops_settings.go, ops_settings_models.go, ops_trends.go 的格式化问题

c48795a9

fix(ci): 修复剩余的CI错误 · 19b67e89

IanShaw027 authored Jan 11, 2026

- 修复 ops_repo_latency_histogram_buckets.go 中另一个函数的 WriteString 未检查错误
- 修复 ops_repo_request_details.go 和 ops_repo_trends.go 中的 Rows.Close 未检查错误
- 修复 ops_alert_models.go, ops_cleanup_service.go, ops_request_details.go 的格式化问题
- 移除 ops_retry.go 中未使用的 status 字段
- 修复 maxTime 函数重复声明（将测试文件中的函数重命名为 testMaxTime）

19b67e89

fix(lint): 修复代码格式和未使用变量问题 · ce3336e3

IanShaw027 authored Jan 11, 2026

- 修复 ops_ws_handler.go 中的代码格式和返回值
- 移除 ops_repo_latency_histogram_buckets.go 中不必要的错误检查
- 修复 api_contract_test.go 缩进并添加运维监控配置项测试
- 移除 ops_cleanup_service.go 中未使用的变量
- 添加 ops_retry.go 中缺失的 status 字段

ce3336e3

fix(lint): 修复所有golangci-lint错误 · 54c5788b

IanShaw027 authored Jan 11, 2026

- 修复depguard错误：为ops service文件添加redis导入例外
- 修复errcheck错误：添加错误检查和类型断言检查
- 修复gofmt错误：格式化代码
- 修复ineffassign错误：移除无效的idx++赋值
- 修复staticcheck错误：合并条件赋值
- 修复unused错误：移除未使用的字段和函数
  - ops_cleanup_service.go: entryID字段
  - ops_retry.go: status字段
  - ops_upstream_context.go: getOpsUpstreamErrors函数

54c5788b

fix: 移除未使用的os包导入 · 4cb7b26f
IanShaw027 authored Jan 11, 2026

4cb7b26f

feat(ops): 增强上游错误追踪和新增定时报告服务 · 73b62bb1

IanShaw027 authored Jan 11, 2026

- 优化错误日志中间件，即使请求成功也记录上游重试/故障转移事件
- 新增OpsScheduledReportService支持定时报告功能
- 使用Redis分布式锁确保定时任务单实例执行
- 完善依赖注入配置
- 优化前端错误趋势图表展示

73b62bb1

feat(ops): 优化健康评分算法和智能诊断机制 · 8fffcd80

IanShaw027 authored Jan 11, 2026

- 采用分层加权评分（业务70% + 基础设施30%），避免重复扣分
- 新增延迟诊断（P99 > 2s critical, > 1s warning）
- 新增资源诊断（CPU/内存/DB/Redis状态）
- 调整诊断阈值（上游错误率5% critical，请求错误率3% critical）
- 为每个诊断项添加可操作建议
- 添加完整的单元测试覆盖（30+测试用例）
- 完善中英文国际化文本

8fffcd80

chore(ops): 更新依赖注入配置 · 76484bd5
IanShaw027 authored Jan 11, 2026

76484bd5
feat(ops): 增强告警评估和指标收集服务功能 · e4ed35fe
IanShaw027 authored Jan 11, 2026

e4ed35fe
test(ops): 添加告警评估服务单元测试 · a2f83ff0
IanShaw027 authored Jan 11, 2026

a2f83ff0
fix(账号管理): 修复BulkUpdateAccounts方法中的混合渠道检查逻辑缩进 · 5f80760a
yangjianbo authored Jan 11, 2026

5f80760a

feat(ops): 添加分组和账号级别监控指标 · dd59e872

IanShaw027 authored Jan 11, 2026

- 后端新增 GetAccountAvailability 方法获取账号可用性数据
- 添加分组可用率和限流率计算辅助函数
- 前端支持分组和账号级别的监控指标类型
- 优化警报规则指标选择器,按类别分组显示

dd59e872

fix(账号管理): 调度批量结果明细与刷新优化 · 32953405

yangjianbo authored Jan 11, 2026

补充批量调度返回 success_ids/failed_ids 并增加合约/单测

前端加入降级处理与部分失败提示，表格行使用稳定 key

测试: make test-frontend

测试: go test ./internal/service -run BulkUpdateAccounts -tags=unit

测试: go test ./internal/server -run APIContracts -tags=unit

32953405

feat(ops): 添加高级设置API支持 · 988b4d02

IanShaw027 authored Jan 11, 2026

- 新增OpsAdvancedSettings数据模型
- 支持数据保留策略配置（错误日志、分钟级指标、小时级指标）
- 支持数据聚合开关配置
- 添加GET/PUT /admin/ops/advanced-settings接口
- 添加配置校验和默认值处理

相关文件：
- backend/internal/service/ops_settings_models.go
- backend/internal/service/ops_settings.go
- backend/internal/handler/admin/ops_settings_handler.go
- backend/internal/server/routes/admin.go
- backend/internal/service/domain_constants.go

988b4d02

Revert Codex OAuth fallback handling · abbde130
cyhhao authored Jan 11, 2026

abbde130
fix(仪表盘): 兼容禁用聚合与回填限制 · 6271a33d
yangjianbo authored Jan 11, 2026

6271a33d