fix(aiops): persist emergency intervention traces
This commit is contained in:
@@ -63,9 +63,9 @@ ADR-071(2026-04-11)設計了 TYPE-1/2/3/4/4D 五種通知類型,並實作
|
||||
| TYPE-3 | 需人工審核(預設)| 依 category 動態 ≤4 個 | SRE 群組 |
|
||||
| TYPE-4 | AI 無法判斷 | [手動記錄][查面板][忽略] | SRE 群組 |
|
||||
| TYPE-4D | Config Drift | [查Diff][採納][回滾][忽略] | SRE 群組 |
|
||||
| TYPE-5S | 資安防禦(未來)| [隔離][封鎖IP][驅逐Pod][確認授權] | SRE 群組 |
|
||||
| TYPE-5S | 資安防禦 | [隔離][封鎖IP][驅逐Pod][確認授權];危險動作先記授權/多簽 | SRE 群組 |
|
||||
| TYPE-6B | 業務/FinOps(未來)| [暫停][查SignOz][忽略] | SRE 群組 |
|
||||
| TYPE-7E | 重大事故升級(未來)| [建立戰情室][Postmortem][DR手冊][確認接手] | SRE 群組 |
|
||||
| TYPE-7E | 重大事故升級 / auto-repair unavailable | 無 ghost callback;人工/AI 接手先靠卡片與 timeline/AOL 留痕,按鈕需有 dispatcher 後才可開 | SRE 群組 |
|
||||
| TYPE-8M | 飛輪/告警鏈路健康 | [觸發診斷][查看面板][靜默] | SRE 群組 |
|
||||
|
||||
### D4:雙頻道路由規則
|
||||
@@ -87,13 +87,19 @@ NOTIFICATION_TYPE_RULES = {
|
||||
"TYPE-3": "最多 4 個 Callback Button,依 alert_category 動態選擇",
|
||||
"TYPE-4": "固定 3 個按鈕:[手動記錄][查看面板][忽略]",
|
||||
"TYPE-4D": "固定 4 個按鈕:[查看Diff][採納][回滾][忽略]",
|
||||
"TYPE-5S": "固定 4 個按鈕:[隔離][封鎖IP][驅逐Pod][確認授權]",
|
||||
"TYPE-5S": "固定 4 個按鈕:[隔離][封鎖IP][驅逐Pod][確認授權],危險動作只記授權/多簽",
|
||||
"TYPE-6B": "最多 3 個按鈕:[暫停][查看SignOz][忽略]",
|
||||
"TYPE-7E": "固定 4 個按鈕:[建立戰情室][Postmortem草稿][DR手冊][確認接手]",
|
||||
"TYPE-7E": "無 ghost callback;未落地 dispatcher 前不顯示 callback button",
|
||||
"TYPE-8M": "固定 3 個按鈕:[觸發診斷][飛輪面板][靜默]",
|
||||
}
|
||||
```
|
||||
|
||||
2026-05-01 補充:TYPE-7E 已用於 `auto_repair_unavailable` 與
|
||||
`drift_auto_adopt_blocked` 緊急通道。Telegram 卡片本身不是閉環;每次升級
|
||||
必須寫入 `alert_operation_log` 與 `timeline_events`,讓 WarRoom、KM 與
|
||||
learning loop 能反查。TYPE-5S 的 `record_authorization` 也必須寫 Redis TTL
|
||||
和 AOL/timeline;不得只回 Telegram toast。
|
||||
|
||||
---
|
||||
|
||||
## 實施計畫
|
||||
|
||||
Reference in New Issue
Block a user