DevOpsDays Taipei 2026

半夜收到告警，你還在手動 SSH、翻 Grafana、查 Log 拼湊原因嗎？

這場演講分享我們如何打造一個 AI Ops Agent，讓它像資深 SRE 一樣自主操作基礎設施：從 Prometheus 查指標、Loki 撈日誌、透過跳板 SSH 進邊緣站點，到最終產出結構化診斷報告。

我會展示完整的生產架構設計，包含：Discovery-First 模式避免 AI 幻覺、PreToolUse Hook 確保安全護欄、知識庫累積組織記憶，從收到告警到找出根因的全過程。這不是概念驗證，而是正在生產環境運行的實戰經驗。

聽眾收穫：

實戰架構藍圖 — 如何用 Claude + MCP Tools 建構可操作真實基礎設施的 AI Agent，包含 SSH、kubectl、Prometheus、Loki 等工具整合
Discovery-First 模式 — 讓 AI 先探索再查詢，從源頭避免幻覺與錯誤查詢，大幅提升診斷準確率
安全護欄設計 — 透過 PreToolUse/PostToolUse Hook 與黑白名單機制，確保 AI 在生產環境中只讀不寫、不會誤操作
知識庫驅動的持續學習 — 將每次事件的診斷結果存回向量資料庫，讓組織經驗可被 AI 複用，越用越聰明

講者

中階

中文

DevOps老司機 (DevOps Veteran)IT人員 / 偏維運 (IT / OPS)DevOps新手 (Newbie)IT人員 / 偏開發 (IT / DEV)IT人員 / 全都做 (IT / I have to do everything)