docs(ops): record ollama retirement verification
This commit is contained in:
@@ -3963,3 +3963,26 @@ ruff check --select F401,F821,I001 apps/api/src/services/mcp_audit_context.py ap
|
||||
|
||||
- 這次先做 runtime 止血,避免 AwoooP / AI 飛輪的 MCP audit 盲點擴大。
|
||||
- 後續仍建議用正式 migration 將 `mcp_audit_log.session_id` 放寬為 `varchar(128)` 或 `text`,讓 trace / run / session 語義可以完整保留。
|
||||
|
||||
---
|
||||
|
||||
## 2026-05-06(台北)— 188 Ollama 退場與 GCP-A/B live 推理驗證
|
||||
|
||||
**背景**:統帥再次確認 188 不應再作為 Ollama provider;正式順序維持 GCP-A → GCP-B → 111 → Gemini 備援。Gemini 不是禁用,而是最後雲端備援,不可在告警路徑直接跳過 Ollama chain。
|
||||
|
||||
### Live 現況
|
||||
|
||||
| 檢查點 | 結果 |
|
||||
|--------|------|
|
||||
| `awoooi-prod` env | `OLLAMA_URL=http://34.143.170.20:11434`、`OLLAMA_SECONDARY_URL=http://34.21.145.224:11434`、`OLLAMA_FALLBACK_URL=http://192.168.0.111:11434` |
|
||||
| `awoooi-dev` env | `OLLAMA_URL=http://192.168.0.110:11435`、`OLLAMA_SECONDARY_URL=http://192.168.0.110:11436`、`OLLAMA_FALLBACK_URL=http://192.168.0.110:11437` |
|
||||
| 188 LAN 入口 | `ollama.service` 只聽 `127.0.0.1:11434`,`192.168.0.188:11434` 從 LAN / K8s 不可直連 |
|
||||
| 近 30 分鐘 188 推理 POST | 無,`ollama188-retirement-gate.sh` 在 `POST_SINCE='30 minutes ago'` 下通過 |
|
||||
| GCP-A 實際推理 | API Pod 直接打 `/api/generate`,`gemma3:4b` 回 `Ok.` |
|
||||
| GCP-B 實際推理 | API Pod 直接打 `/api/generate`,`gemma3:4b` 回 `Ok.` |
|
||||
| 111 fallback | API Pod 目前仍無法連 `192.168.0.111:11434`,屬網路不可達;不是 router 主動跳過 |
|
||||
|
||||
### 注意
|
||||
|
||||
- `ollama188-retirement-gate.sh` 預設 24 小時窗口仍會看到退場前歷史 POST,因此短期會 fail;判斷「現在是否仍打 188」需用較短觀察窗口。
|
||||
- 後續若要讓 111 真正成為第三順位可用 fallback,需要先修通 K8s / API Pod 到 `192.168.0.111:11434` 的網路路徑。
|
||||
|
||||
Reference in New Issue
Block a user