Geas - ฮาร์เนสการกำกับดูแลแบบอิงสัญญาสำหรับงานระยะยาวแบบมัลติเอเจนต์ของ Claude Code
(github.com/choam2426)▎ ปัญหาเมื่อ AI เอเจนต์หลายตัวเขียนโค้ดพร้อมกัน: ไม่รู้ว่าใครเป็นคนตัดสินใจอะไร, ไม่สามารถตรวจสอบได้ว่าผลลัพธ์ตรงตามข้อกำหนดหรือไม่, และสิ่งที่เรียนรู้จะหายไปในเซสชันถัดไป
▎ - มอบหมาย TaskContract ให้กับทุกงาน โดยมีเกณฑ์การยอมรับที่ตรวจสอบได้
▎ - Evidence Gate 3 ขั้น: รันโค้ด → เทียบกับสัญญา → ตรวจสอบความสอดคล้องกับภารกิจ
▎ - การตัดสินใจด้านสถาปัตยกรรมใช้การโหวตแบบมีโครงสร้าง พร้อมข้อโต้แย้งภาคบังคับ (Critic)
▎ - ทบทวนหลังจบทุกงาน → เรียนรู้ข้ามเซสชันผ่าน rules.md + หน่วยความจำแยกตามเอเจนต์
▎ - บันทึก audit trail ของการตัดสินใจทั้งหมดไว้ในไดเรกทอรี .geas/
▎ ปรัชญาหลัก: "Don't trust. Verify." — ไม่เชื่อเพียงเพราะเอเจนต์บอกว่า "เสร็จแล้ว" แต่ตรวจสอบจากหลักฐานเทียบกับสัญญา
ส่วนนด้านบนเป็นส่วนที่ Claude เขียนไว้ครับ ตอนแรกผมเริ่มโปรเจกต์นี้เพราะอยากเห็นมัลติเอเจนต์ที่มีมุมมองหลากหลายสื่อสารกันและทำงานกันเหมือนสตาร์ตอัป แต่พอทำไปเรื่อย ๆ ก็รู้สึกว่าถ้านำไปใช้กับการพัฒนาจริงก็น่าจะมีประสิทธิภาพ เลยศึกษาจากมุมมองของ harness engineering อย่างจริงจังและพัฒนาโปรเจกต์ต่อมา
ผมตั้งใจจะใช้งานและพัฒนามันต่อเนื่องทั้งในงานและโปรเจกต์ส่วนตัว ถ้าได้ลองใช้แล้วส่งฟีดแบ็กมาให้จะขอบคุณมากครับ!
ยังไม่มีความคิดเห็น