• Rose Ding's avatar
    fix: 单账号分组首次 503 不设模型限流标记,避免后续请求雪崩 · 021abfca
    Rose Ding authored
    单账号 antigravity 分组收到 503 (MODEL_CAPACITY_EXHAUSTED) 时,
    原逻辑会设置 ~29s 模型限流标记。由于只有一个账号无法切换,
    后续所有新请求在预检查时命中限流 → 几毫秒内直接返回 503,
    导致约 30 秒的雪崩窗口。
    
    修复:在 Handler 入口处检查分组是否只有单个 antigravity 账号,
    如果是则提前设置 SingleAccountRetry context 标记,让 Service 层
    首次 503 就走原地重试逻辑(不设限流标记),避免污染后续请求。
    021abfca
gemini_v1beta_handler.go 24.7 KB