- เป้าหมายหลักของ เครื่องมือ Observability ตลอดหลายทศวรรษที่ผ่านมา คือการทำให้ มนุษย์เข้าใจ Telemetry data ขนาดใหญ่ที่หลากหลายได้
- การมาถึงของ AI และ LLM กำลังเปลี่ยนกระบวนทัศน์เดิมที่เน้น "แดชบอร์ด+การแจ้งเตือน+การสุ่มตัวอย่าง" และทำให้กระบวนการวิเคราะห์ถูกแทนที่ด้วย ระบบอัตโนมัติ
- ในความเป็นจริง AI agent วิเคราะห์สาเหตุของ latency spike ได้ภายใน 80 วินาทีด้วยการเรียกใช้เครื่องมือ 8 ครั้ง ทำงานที่เคยใช้ในเดโมแบบเดิมให้เป็นอัตโนมัติ และแก้ปัญหาได้ด้วยต้นทุนเพียง 60 เซนต์
- แดชบอร์ดสวย ๆ หรือการทำ instrumentation ที่สะดวก ไม่ได้มีคุณค่าเฉพาะตัวอีกต่อไป เพราะ LLM ทำให้การวิเคราะห์กลายเป็นสินค้าโภคภัณฑ์ และ OpenTelemetry ทำให้ instrumentation กลายเป็นมาตรฐานทั่วไป
- อนาคตของ Observability คือ "feedback loop ที่รวดเร็ว" และ เวิร์กโฟลว์ความร่วมมือระหว่าง AI+มนุษย์ ซึ่งจะเป็นกุญแจสู่ความสำเร็จและขับเคลื่อนยุคของซอฟต์แวร์และระบบอัตโนมัติที่มากยิ่งขึ้น
ประวัติของเครื่องมือ Observability และการมาถึงของ AI
- ตลอดหลายทศวรรษที่ผ่านมา เป้าหมายหลักของเครื่องมือ Observability คือการ บีบอัด/สรุปข้อมูลมหาศาลที่ต่างชนิดกัน (telemetry) ให้อยู่ในระดับที่มนุษย์เข้าใจได้
- ทุกครั้งที่มี abstraction ใหม่ของซอฟต์แวร์เกิดขึ้น (เช่น Rails, AWS, Kubernetes, OpenTelemetry ฯลฯ)
ก็จะมีการพัฒนาเครื่องมือต่าง ๆ เช่น monitoring, measurement, dashboard, adaptive alerting, dynamic sampling เพื่อซ่อนความซับซ้อนนั้น และส่งต่อข้อมูลที่ถูกย่อให้เหมาะกับขีดความสามารถในการรับรู้ของมนุษย์
LLM = ตัวประมาณฟังก์ชันอเนกประสงค์ และตอนนี้มันใช้งานได้จริงแล้ว
- ในเชิงคณิตศาสตร์ LLM เป็นเพียง ตัวประมาณฟังก์ชันอเนกประสงค์ (universal function approximator) แต่ในทางปฏิบัติมันมีประโยชน์มากในการแก้ปัญหาด้าน Observability
- ตัวอย่างจากเดโมของ Honeycomb ที่ ให้ AI agent วิเคราะห์ latency spike บน heatmap ด้วยภาษาธรรมชาติ
- “ช่วยวิเคราะห์สาเหตุของ latency spike ที่เกิดขึ้นทุก 4 ชั่วโมงในบริการ frontend ให้หน่อย”
- ใช้ LLM แบบ off-the-shelf (Claude Sonnet 4) เชื่อมต่อกับ Model Context Protocol (MCP) ของ Honeycomb
- ใช้เวลา 80 วินาที เรียกใช้เครื่องมือ 8 ครั้ง และมีค่าใช้จ่ายเพียง 60 เซนต์ในการวิเคราะห์สาเหตุโดยอัตโนมัติ
- มันไปถึงระดับที่ แก้สถานการณ์จริงแบบ zero-shot ได้ โดยไม่ต้องมี prompt เพิ่มเติม การฝึกเฉพาะทาง หรือคู่มือกำกับ
- การทำให้การวิเคราะห์กลายเป็นสินค้าโภคภัณฑ์ (commoditization):
- เมื่อ LLM ทำให้การวิเคราะห์เป็นอัตโนมัติ จุดแตกต่างของผลิตภัณฑ์ Observability แบบเดิม (กราฟสวย ๆ, instrumentation ที่ทำได้ง่าย ฯลฯ) ก็เริ่มหมดความหมาย
- OpenTelemetry ทำให้ instrumentation กลายเป็นมาตรฐานทั่วไป และ LLM ทำให้การวิเคราะห์กลายเป็นสินค้าโภคภัณฑ์
- ต่อจากนี้ “feedback loop ที่รวดเร็ว” จะเข้ามาแทนคุณค่าหลักของเครื่องมือ Observability
บทบาทของมนุษย์ และการเปลี่ยนแปลงในอนาคต
- บทบาทของมนุษย์จะไม่ได้หายไปทั้งหมด
- เหมือนกับที่การมาถึงของคลาวด์ไม่ได้ทำให้การมีอยู่ของ IT หมดไป AI ก็ไม่ได้เข้ามาแทนที่นักพัฒนา/ผู้ปฏิบัติการทั้งหมด
- การเพิ่มขึ้นของผลิตภาพจะขยายภูมิทัศน์โดยรวม และทำให้มีซอฟต์แวร์เกิดขึ้นมากกว่าเดิม
- คำถามสำคัญคือ
ในโลกที่ต้นทุนของการเขียนโค้ด/รีแฟกเตอร์/วิเคราะห์ลดลงอย่างมาก และการวิเคราะห์กลายเป็นสิ่งต้นทุนคงที่
แก่นแท้ของ Observability จะมุ่งไปทางไหน?
สิ่งที่สำคัญจริง ๆ คือ "feedback ที่รวดเร็ว"
- สิ่งที่สำคัญที่สุดคือการมี "feedback loop ที่รวดเร็วและถี่" ในทุกขั้นตอนของการพัฒนาและการปฏิบัติการ
- AI จะเหนือกว่ามนุษย์ในเรื่องความเร็วเสมอ
- LLM สามารถตั้งสมมติฐานได้หลายสิบครั้งอย่างรวดเร็ว ล้มเหลวได้เร็ว และในที่สุดก็หาคำตอบที่ถูกต้องเจอ
(และต้นทุนก็ต่ำมาก)
- ปรัชญาของ Honeycomb:
- feedback loop ที่รวดเร็ว, การแบ่งปันความรู้แบบร่วมมือ, การพัฒนา/ปฏิบัติการเชิงทดลอง
- ต่อจากนี้ AI assistant จะถูกนำมาใช้ตลอดวงจรชีวิตของการพัฒนาและการปฏิบัติการซอฟต์แวร์
- ตัวอย่าง
- ระหว่างการเขียนโค้ดและ deploy, AI agent ให้ feedback แบบเรียลไทม์ และเสนอแนะการแก้บั๊ก/ปรับปรุงคุณภาพ
- ระหว่างการปฏิบัติการ ตรวจจับ/วิเคราะห์ emergent behavior/สร้างรายงานอัตโนมัติ และหลังได้รับอนุมัติก็ปรับปรุงให้เองอัตโนมัติ
- องค์กรแนวหน้าจะทำให้บทบาท SRE/SWE เป็นอัตโนมัติด้วย AI+เครื่องมือ และไปถึงขั้นบรรลุเป้าหมายทางธุรกิจได้โดยตรง
- เงื่อนไขของอนาคต Observability เพื่อความสำเร็จ
- ประสิทธิภาพการ query ที่มี latency ต่ำมาก
- ที่เก็บข้อมูลแบบรวมศูนย์
- เวิร์กโฟลว์การทำงานร่วมกันที่ลื่นไหลระหว่างมนุษย์กับ AI
- สรุป:
- เครื่องมือ Observability แบบเดิมที่เน้นแดชบอร์ด การแจ้งเตือน และการแสดงผลข้อมูล
จะไม่ใช่แกนหลักในยุค AI อีกต่อไป
และมีเพียง “feedback loop ที่รวดเร็ว” กับ แพลตฟอร์มความร่วมมือระหว่าง AI-มนุษย์ เท่านั้นที่จะอยู่รอด
4 ความคิดเห็น
เช่นเดียวกับที่ Observability ไม่ใช่จุดจบของ Monitoring, LLM ก็คงไม่ใช่จุดจบของ Observability
เหมือนที่ Observability พัฒนาต่อยอดขึ้นมาบนพื้นฐานของ Monitoring ที่ก้าวหน้า, การวิเคราะห์ด้วย LLM ก็คงจะพัฒนาต่อยอดขึ้นมาบนพื้นฐานของ Observability ที่ก้าวหน้าเช่นกัน
ฉันก็คาดหวังเหมือนกันว่าเพราะ LLM วงการ Observability จะถูกพลิกโฉมอย่างรวดเร็ว แต่พาดหัวล่อเป้าเกินไปหน่อย 555
โปรโมตบริการของตัวเองด้วยการบอกว่า "วันสิ้นสุดกำลังใกล้เข้ามา" ก็แอบเขินนิดหน่อยนะ...
ส่วนตัวแล้วผมคาดหวังว่า vision llm จะพัฒนาขึ้นและถูกนำมาใช้กับงานมอนิเตอร์ริงได้ ช่วงหลังมานี้ผมเคยเห็นโพสต์ของผู้ปกครองที่ใช้ vlm เพื่อตรวจดูตอนลูกหลับว่ามีความผิดปกติอะไรไหม ซึ่งผมว่ามันน่าสนใจมาก
ความคิดเห็นจาก Hacker News