NambaAI - เครื่องมือ CLI ที่จัดระเบียบงาน Codex เป็นโฟลว์ SPEC, การตรวจสอบ, และการส่งต่องาน PR
(github.com/Nam-Cheol)เวลาที่ใช้ Codex ผมรู้สึกว่าโฟลว์ที่คำขอคลุมเครือถูกพาไปสู่การแก้โค้ดทันทีนั้นไม่ค่อยสะดวก เลยกำลังสร้างเครื่องมือ CLI ที่จัดสิ่งนี้ให้เป็นกระบวนการพัฒนาที่มีโครงสร้างมากขึ้น
NambaAI ไม่ใช่เครื่องมือที่มาแทน Codex แต่ใกล้เคียงกับการเป็น workflow layer ที่ทำงานอยู่รอบ ๆ Codex มากกว่า
แนวคิดพื้นฐานมีดังนี้
request → SPEC → execution → validation → PR handoff
กล่าวคือ แทนที่จะส่งคำขอของผู้ใช้ไปสู่การลงมือทำทันที เครื่องมือนี้จะช่วยจัดระเบียบเป้าหมาย ขอบเขต ข้อจำกัด และเกณฑ์การยอมรับก่อน จากนั้นบันทึกไว้เป็นไฟล์ SPEC แล้วค่อยดำเนินงานต่อ
ตอนนี้โครงสร้างหลักเน้นที่โฟลว์ต่อไปนี้
namba project
namba plan "คำของาน"
namba run SPEC-XXX
namba sync
namba pr
namba land
ตอนนี้กำลังทดลองโฟลว์แบบ queue สำหรับประมวลผลหลาย SPEC แบบต่อเนื่องกันด้วย
เหตุผลที่เริ่มทำเครื่องมือนี้คือ ยิ่ง AI coding สะดวกขึ้นมากเท่าไร ก็ยิ่งมีหลายกรณีที่กระบวนการเปลี่ยนแปลงติดตามได้ยาก หรือยากที่จะกลับมาตรวจสอบภายหลังว่าอิมพลีเมนต์ตามเกณฑ์อะไร โดยเฉพาะเมื่อใช้ Codex ซ้ำ ๆ จะรู้สึกได้ว่า “ตกลงจะทำอะไร”, “ขอบเขตอยู่ถึงไหน”, “ตรวจสอบอย่างไร”, และ “ควรดูอะไรใน PR” อาจเริ่มเลือนรางได้
NambaAI เป็นความพยายามที่จะลดปัญหานี้ด้วยวิธีต่อไปนี้
- จัดระเบียบเป้าหมายและขอบเขตก่อนเริ่มงาน
- สร้างไฟล์ SPEC ก่อนลงมืออิมพลีเมนต์
- บันทึกผลการทำงานและ evidence ของการตรวจสอบ
- สร้างเอกสาร PR handoff
- จัดระเบียบการเปลี่ยนแปลงที่ Codex สร้างขึ้นให้มนุษย์รีวิวได้ง่าย
- บริหารจัดการเป็นกระบวนการพัฒนาที่ทำซ้ำได้ แทนการใช้พรอมป์ต์แบบครั้งเดียวจบ
ทิศทางนี้ไม่ได้ตั้งใจจะสร้าง autonomous agent แบบใช้งานทั่วไปเหมือน AI agent framework เดิม ๆ ตอนนี้โฟกัสยังอยู่ที่การวาง Codex ไว้เป็นแกนกลาง แล้วแยกงานออกเป็นหน่วยที่นักพัฒนาตรวจทานได้ พร้อมมีการบันทึกประกอบ
ยังอยู่ในช่วงเริ่มต้น จึงมีจุดที่ยังขาดอีกมาก
- ตัวอย่างการใช้งานจริงยังไม่เพียงพอ
- เอกสาร onboarding ยังต้องปรับปรุง
- eval pack ยังมีไม่พอ
- installer/hook ยังต้องทบทวนด้านความปลอดภัย
- ต้องทดสอบข้ามแพลตฟอร์มบน macOS, Linux, Windows
- ยังเปรียบเทียบกับ AI coding harness ที่มีอยู่ไม่มากพอ
- ยังขาดการตรวจสอบในโปรเจ็กต์จริง
นี่เป็นโอเพนซอร์สโปรเจ็กต์แรกเริ่มที่ทำขึ้นเอง และตอนนี้ยังไม่ใช่ผลิตภัณฑ์ที่สมบูรณ์มากนัก แต่เป็นช่วงของการพิสูจน์ทิศทางมากกว่า
สำหรับคนที่ใช้ Codex ในงานจริงหรือโปรเจ็กต์ส่วนตัว อยากขอฟีดแบ็กเป็นพิเศษในประเด็นต่อไปนี้
- workflow ของ Codex ที่อิง SPEC แบบนี้ดูมีประโยชน์ในกระบวนการพัฒนาจริงหรือไม่
- มีส่วนไหนที่ดูเหมือนออกแบบเกินความจำเป็นบ้าง
- ถ้าจะนำไปใช้กับโปรเจ็กต์จริง ยังต้องมีมาตรการสร้างความเชื่อมั่นอะไรเพิ่มอีก
- มีเครื่องมือหรือแพตเทิร์นเดิมอะไรที่ควรนำมาเปรียบเทียบบ้าง
- ในโฟลว์การติดตั้ง/ใช้งาน มีส่วนไหนที่ดูไม่สะดวกหรือเสี่ยงบ้าง
ความเห็นเชิงวิจารณ์ก็ยินดีรับครับ เพราะยังเป็นช่วงเริ่มต้น ตอนนี้การรู้ว่าจุดอ่อนจริง ๆ อยู่ตรงไหนมีประโยชน์มากกว่าคำชม
1 ความคิดเห็น
ตั้งใจทำมาให้เป็น CLI แต่ช่วงนี้ผมใช้บน Codex desktop อยู่ครับ! ตอนแรกกังวลว่าจะชนกับฮาร์เนสที่ฝังมาใน Codex desktop แต่โชคดีที่ใช้งานร่วมกันได้ลื่นไหลมากครับ
นอกจากนี้ยังต้องอัปเดตให้รองรับเนื้อหาของการอัปเดต codex 0.131.0 ครั้งนี้ด้วย และเพราะตอนนี้ผมใช้แค่ฮาร์เนสตัวนี้อยู่ เลยยังเห็นจุดที่ขาดอยู่เรื่อย ๆ แต่สุดท้ายคนที่ไม่พอที่สุดก็คือตัวผมเองนี่แหละครับ...