docs(ops): record ollama retirement verification

This commit is contained in:
Your Name
2026-05-06 17:53:40 +08:00
parent ef3b05439a
commit d79ec4f647

View File

@@ -3963,3 +3963,26 @@ ruff check --select F401,F821,I001 apps/api/src/services/mcp_audit_context.py ap
- 這次先做 runtime 止血,避免 AwoooP / AI 飛輪的 MCP audit 盲點擴大。
- 後續仍建議用正式 migration 將 `mcp_audit_log.session_id` 放寬為 `varchar(128)``text`,讓 trace / run / session 語義可以完整保留。
---
## 2026-05-06台北— 188 Ollama 退場與 GCP-A/B live 推理驗證
**背景**:統帥再次確認 188 不應再作為 Ollama provider正式順序維持 GCP-A → GCP-B → 111 → Gemini 備援。Gemini 不是禁用,而是最後雲端備援,不可在告警路徑直接跳過 Ollama chain。
### Live 現況
| 檢查點 | 結果 |
|--------|------|
| `awoooi-prod` env | `OLLAMA_URL=http://34.143.170.20:11434``OLLAMA_SECONDARY_URL=http://34.21.145.224:11434``OLLAMA_FALLBACK_URL=http://192.168.0.111:11434` |
| `awoooi-dev` env | `OLLAMA_URL=http://192.168.0.110:11435``OLLAMA_SECONDARY_URL=http://192.168.0.110:11436``OLLAMA_FALLBACK_URL=http://192.168.0.110:11437` |
| 188 LAN 入口 | `ollama.service` 只聽 `127.0.0.1:11434``192.168.0.188:11434` 從 LAN / K8s 不可直連 |
| 近 30 分鐘 188 推理 POST | 無,`ollama188-retirement-gate.sh``POST_SINCE='30 minutes ago'` 下通過 |
| GCP-A 實際推理 | API Pod 直接打 `/api/generate``gemma3:4b``Ok.` |
| GCP-B 實際推理 | API Pod 直接打 `/api/generate``gemma3:4b``Ok.` |
| 111 fallback | API Pod 目前仍無法連 `192.168.0.111:11434`,屬網路不可達;不是 router 主動跳過 |
### 注意
- `ollama188-retirement-gate.sh` 預設 24 小時窗口仍會看到退場前歷史 POST因此短期會 fail判斷「現在是否仍打 188」需用較短觀察窗口。
- 後續若要讓 111 真正成為第三順位可用 fallback需要先修通 K8s / API Pod 到 `192.168.0.111:11434` 的網路路徑。