iKala / Platform Team
Site Reliability Engineer
從資料工程師轉型成為 SRE 工程師。目前於 iKala 的 Platform Team 擔任 SRE 一職。我們團隊的主要職責包括 iKala 產品的 Monitoring、IaC 以及建置與維護 CI/CD Pipeline,並致力於在公司推動並實踐 SRE 的最佳實踐。
Prometheus 和 Grafana 經常被視為初學者接觸監控系統時的理想選擇。然而,隨著產品規模的增加也逐漸面臨更多複雜的挑戰。從 Platform Engineering 的視角出發,我們所追求的是能滿足全面可觀察性(Observability)需求的通用解決方案,並期望透過一個統一平台來實現這一目標。
Grafana Lab 提供的解決方案 LGTM (Loki, Grafana, Tempo, Mimir) 是目前覺得最有 CP 值的選擇,因此在今年的 DevOps Day 中跟大家介紹分享 "Grafana 全家桶",並透過實際演示來展示當一個 Application 整合了 Observability 功能後,能為開發者帶來多大的便利。