OpenNet
DevOps
從前端後端做到 Devops 的工程師,近年在雲原生與 Kubernetes 領域耕耘,樂於將知識有脈絡的串連分享。
著作有 ""從異世界歸來發現只剩自己不會 Kubernetes""、""你以為你在學 Grafana 其實你建立了 Kubernetes 可觀測性宇宙""、""後 Grafana 時代的自我修養""。
在瞬息萬變的雲端世界中,系統監控與即時反應不僅關乎企業營運的持續性,更是預防重大風險的第一道防線。過去 Grafana 和可觀測性無疑是近幾年的閃耀之星,如同一場數據與視覺化的盛宴,而告警事件中心正是在這場盛宴中,承擔著將龐大資訊轉化為即時行動的關鍵角色。
這次,我們從探討告警事件中心的重要性開始,逐步深入至最佳實踐的驗證,並以 Prometheus AlertManager 與 Grafana Alerting 的正確姿勢,為我們描繪出一條從理論到實戰的清晰路徑;更進一步,透過解讀告警歷史、列表管理以及 OnCall 待命通知管理,最終構築出一個高效且靈活的告警事件中心架構。
聽眾收穫:
透過 Grafana 理解告警事件中心的重要性,了解主流告警系統設計精神。精實高效的團隊往往對這個領域深刻著墨,目的都在於聚焦核心問題解決,進而提升系統穩定性與效率。使工程師把精力投入真正重要的產出。
LLM(大型語言模型)在許多場景中能帶來顯著的價值,但其運行過程與結果往往充滿不確定性。因此,LLM 可觀測性成為一個關鍵議題,用於掌握模型實際運作情形、分析輸入輸出的行為模式,並及時發現異常或潛在風險。在本場議程中,將會跟大家介紹 LLM 可觀測性的核心觀念與實務技巧,並透過實作範例帶領大家從設計到應用,逐步體驗如何在開發流程中落實可觀測性。
工作坊將會帶大家實作一個小型專案,深入理解以下內容: