From d79ec4f6475a7e8547b8b39ea297ed19064e84dc Mon Sep 17 00:00:00 2001 From: Your Name Date: Wed, 6 May 2026 17:53:40 +0800 Subject: [PATCH] docs(ops): record ollama retirement verification --- docs/LOGBOOK.md | 23 +++++++++++++++++++++++ 1 file changed, 23 insertions(+) diff --git a/docs/LOGBOOK.md b/docs/LOGBOOK.md index 1f8b8a52..11e457aa 100644 --- a/docs/LOGBOOK.md +++ b/docs/LOGBOOK.md @@ -3963,3 +3963,26 @@ ruff check --select F401,F821,I001 apps/api/src/services/mcp_audit_context.py ap - 這次先做 runtime 止血,避免 AwoooP / AI 飛輪的 MCP audit 盲點擴大。 - 後續仍建議用正式 migration 將 `mcp_audit_log.session_id` 放寬為 `varchar(128)` 或 `text`,讓 trace / run / session 語義可以完整保留。 + +--- + +## 2026-05-06(台北)— 188 Ollama 退場與 GCP-A/B live 推理驗證 + +**背景**:統帥再次確認 188 不應再作為 Ollama provider;正式順序維持 GCP-A → GCP-B → 111 → Gemini 備援。Gemini 不是禁用,而是最後雲端備援,不可在告警路徑直接跳過 Ollama chain。 + +### Live 現況 + +| 檢查點 | 結果 | +|--------|------| +| `awoooi-prod` env | `OLLAMA_URL=http://34.143.170.20:11434`、`OLLAMA_SECONDARY_URL=http://34.21.145.224:11434`、`OLLAMA_FALLBACK_URL=http://192.168.0.111:11434` | +| `awoooi-dev` env | `OLLAMA_URL=http://192.168.0.110:11435`、`OLLAMA_SECONDARY_URL=http://192.168.0.110:11436`、`OLLAMA_FALLBACK_URL=http://192.168.0.110:11437` | +| 188 LAN 入口 | `ollama.service` 只聽 `127.0.0.1:11434`,`192.168.0.188:11434` 從 LAN / K8s 不可直連 | +| 近 30 分鐘 188 推理 POST | 無,`ollama188-retirement-gate.sh` 在 `POST_SINCE='30 minutes ago'` 下通過 | +| GCP-A 實際推理 | API Pod 直接打 `/api/generate`,`gemma3:4b` 回 `Ok.` | +| GCP-B 實際推理 | API Pod 直接打 `/api/generate`,`gemma3:4b` 回 `Ok.` | +| 111 fallback | API Pod 目前仍無法連 `192.168.0.111:11434`,屬網路不可達;不是 router 主動跳過 | + +### 注意 + +- `ollama188-retirement-gate.sh` 預設 24 小時窗口仍會看到退場前歷史 POST,因此短期會 fail;判斷「現在是否仍打 188」需用較短觀察窗口。 +- 後續若要讓 111 真正成為第三順位可用 fallback,需要先修通 K8s / API Pod 到 `192.168.0.111:11434` 的網路路徑。