▎ ปัญหาเมื่อ AI เอเจนต์หลายตัวเขียนโค้ดพร้อมกัน: ไม่รู้ว่าใครเป็นคนตัดสินใจอะไร, ไม่สามารถตรวจสอบได้ว่าผลลัพธ์ตรงตามข้อกำหนดหรือไม่, และสิ่งที่เรียนรู้จะหายไปในเซสชันถัดไป

▎ - มอบหมาย TaskContract ให้กับทุกงาน โดยมีเกณฑ์การยอมรับที่ตรวจสอบได้
▎ - Evidence Gate 3 ขั้น: รันโค้ด → เทียบกับสัญญา → ตรวจสอบความสอดคล้องกับภารกิจ
▎ - การตัดสินใจด้านสถาปัตยกรรมใช้การโหวตแบบมีโครงสร้าง พร้อมข้อโต้แย้งภาคบังคับ (Critic)
▎ - ทบทวนหลังจบทุกงาน → เรียนรู้ข้ามเซสชันผ่าน rules.md + หน่วยความจำแยกตามเอเจนต์
▎ - บันทึก audit trail ของการตัดสินใจทั้งหมดไว้ในไดเรกทอรี .geas/

▎ ปรัชญาหลัก: "Don't trust. Verify." — ไม่เชื่อเพียงเพราะเอเจนต์บอกว่า "เสร็จแล้ว" แต่ตรวจสอบจากหลักฐานเทียบกับสัญญา

ส่วนนด้านบนเป็นส่วนที่ Claude เขียนไว้ครับ ตอนแรกผมเริ่มโปรเจกต์นี้เพราะอยากเห็นมัลติเอเจนต์ที่มีมุมมองหลากหลายสื่อสารกันและทำงานกันเหมือนสตาร์ตอัป แต่พอทำไปเรื่อย ๆ ก็รู้สึกว่าถ้านำไปใช้กับการพัฒนาจริงก็น่าจะมีประสิทธิภาพ เลยศึกษาจากมุมมองของ harness engineering อย่างจริงจังและพัฒนาโปรเจกต์ต่อมา

ผมตั้งใจจะใช้งานและพัฒนามันต่อเนื่องทั้งในงานและโปรเจกต์ส่วนตัว ถ้าได้ลองใช้แล้วส่งฟีดแบ็กมาให้จะขอบคุณมากครับ!

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น