• 2023-09-25
  • 14:20 - 15:00

國泰人壽的可觀測性實踐

國泰人壽已經推動 DevOps 數年,在 DevOps 循環的前段(CICD),我們建立了一個較為完整的架構,並成功適應多種服務類型,以確保快速交付服務並產生商業價值。同時,我們也開始關注 DevOps 循環的後段,即維運與監控。透過建立可觀測平台與資訊收集標準,我們逐步引入可觀測性(Observability)與 SRE 觀念,以確保服務能如期持續產生商業價值。在本次演講中,我將分享我們在可觀測性實踐方面的經驗和成果。

本次分享將包含以下內容:

  1. 背景與挑戰:介紹現有監控系統的限制,無法滿足日益多元化的軟體架構與監控需求。
  2. 透過開源標準與工具提升可觀測性:使用 OpenTelemetry、Prometheus 等工具提升 Java Spring Boot 與 Python FastAPI 應用程式的可觀測性,深入瞭解應用程式狀態與效能。
  3. 建立單一平台:以 Grafana 為核心的單一平台,交互查詢各類資訊產生綜效,並以 IaC 的方式建立多租戶環境供不同團隊使用,確保資源隔離並提供彈性的客製化功能。
  4. 推廣策略與挑戰:透過與 Pilot User 合作以及舉辦 Workshop,推廣可觀測性和 SRE 觀念,克服在推廣中所面臨的挑戰。
劉義瑋 Blueswen

劉義瑋 Blueswen

國泰人壽保險 襄理

工作經驗約6年,由 SWE 轉為偶爾做做機器學習專案的 DevOps Engineer。主要工作為 Python CICD Pipeline、各類 DevOps 工具評估與導入以及強化開發者體驗。目前負責導入可觀測性平台,鋪墊 SRE 文化發展的良好的基礎。

GitHub: https://github.com/blueswen

  • LEVEL
    中階
  • ROOM
    6F ABC會議室
  • FORM
    現場演講
  • LANGUAGE
    中文
  • TAG
    Observability
  • 適合聽眾
    DevOps 新手(Newbie) DevOps 老司機(DevOps Veteran) IT人員/全都做(IT / I have to do everything)
  • RESOURCE
    簡報下載
    共筆連結