- เครื่องมือเฝ้าระวังที่ขับเคลื่อนด้วย AI ซึ่งมุ่งเน้น การทำงานอัตโนมัติในการรับมือเหตุขัดข้องในสภาพแวดล้อม Kubernetes
- ใช้ Claude Code เพื่อ วิเคราะห์สถานะของ Pod แบบเรียลไทม์ ตรวจจับข้อผิดพลาด และทำ การแก้ไขอัตโนมัติหรือสร้างรายงาน
- ทำงานเป็น CronJob แบบรันตามรอบ เพื่อคง ระบบตอบสนองอัตโนมัติได้ตลอด 24 ชั่วโมง แม้ในช่วงที่ไม่มีผู้ดูแล
- การทำงานหลัก
- มอนิเตอร์สถานะ Pod ของ Namespace เป้าหมาย
- ตรวจจับ สถานะผิดปกติ เช่น CrashLoopBackOff, Error
- ระบุสาเหตุของข้อผิดพลาด ผ่านการวิเคราะห์ล็อก
- หากจำเป็น สามารถเข้าไปภายใน Pod เพื่อ ใช้ hotfix
- บันทึกการแก้ไขลงใน SQLite DB และจัดทำรายงาน
- รองรับการแสดงผล ข้อผิดพลาดและประวัติการแก้ไขแบบภาพรวม บนเว็บ UI ผ่านการตั้งค่าดีพลอย Dashboard แยกต่างหาก
- โครงสร้างน้ำหนักเบาที่ประกอบด้วย Go + HTML + Shell และ เหมาะสำหรับการดีพลอยแบบ Kubernetes CronJob
- ไลเซนส์ MIT
1 ความคิดเห็น
ผมก็คิดอยู่ว่าน่าจะมีอะไรแบบนี้ได้ก็ดี ดูแล้วน่าสนใจทีเดียวครับ ถ้าใช้ในโหมด watcher ก็น่าจะลองเริ่มจากการทดสอบอย่างปลอดภัยก่อนได้ด้วย