講者資訊

江俊誼 (Brian)

江俊誼 (Brian)

國泰世華銀行
SRE

任職於國泰世華銀行科技應用發展部,負責 PaaS 平台穩定工作,強化監控與告警設計,讓系統負責人即時或是早先一步收到告警資訊進而提早解決可能發生的問題。

演講議程

SRE的未來:LLM 引領的可觀測性與可追溯性革命

開場白: 簡單介紹 SRE 的重要性,以及當前面臨的挑戰。

引入 LLM: 簡要介紹大型語言模型 (LLM) 及其在各領域的應用。

主題點題: 闡述 LLM 如何賦能 SRE,特別是在可觀測性與可追溯性方面。

第一部分:LLM 與可觀測性

  • 傳統可觀測性的挑戰: 分析傳統可觀測性方法的局限性,例如日誌分析困難、異常檢測不夠智慧等。
  • LLM 賦能可觀測性:
  • 智慧日誌分析: LLM 如何理解日誌語義,自動提取關鍵資訊、異常模式。
  • 增強指標預測: LLM 如何分析歷史數據,更準確地預測系統行為,提前發現潛在問題。
  • 多模態資料融合: LLM 如何整合不同來源的資料 (日誌、指標、追蹤),提供更全面的系統視圖。
  • 案例分享: 展示 LLM 在可觀測性方面的實際應用案例,例如智慧異常檢測、日誌分析平台等。

第二部分:LLM 與可追溯性 

  • 傳統可追溯性的挑戰: 分析傳統可追溯性方法的不足,例如追蹤鏈路不完整、根因分析困難等。
  • LLM 賦能可追溯性:
  • 完善追蹤鏈路: LLM 如何分析請求路徑,自動補全追蹤鏈路,確保問題可追溯。
  • 加速根因分析: LLM 如何分析事件關聯性,快速定位問題根源,縮短故障排除時間。
  • 知識圖譜構建: LLM 如何從日誌、指標等資料中提取知識,構建系統知識圖譜,輔助故障診斷。

第三部分:LLM 在 SRE 中的應用展望 

  • 未來趨勢: 探討 LLM 在 SRE 領域的發展趨勢,例如 AIOps、自動化運維等。
  • 挑戰與應對: 分析 LLM 在 SRE 應用中可能面臨的挑戰,例如資料安全、模型可靠性等,並提出應對建議。

結論 (5 分鐘)

  • 總結: 總結 LLM 對 SRE 的重要意義,強調其在可觀測性與可追溯性方面的巨大潛力。
  • 展望: 展望 LLM 在 SRE 領域的廣闊應用前景,鼓勵聽眾積極擁抱 LLM 技術。


聽眾收穫:

  1. 了解 LLM 在 SRE 領域的應用前景
  2. 掌握 LLM 在 SRE 中應用案例
  3. 洞悉未來 SRE 的發展趨勢
詳細介紹