2 คะแนน โดย namcher9428 4 일 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

เวลาที่ใช้ Codex ผมรู้สึกว่าโฟลว์ที่คำขอคลุมเครือถูกพาไปสู่การแก้โค้ดทันทีนั้นไม่ค่อยสะดวก เลยกำลังสร้างเครื่องมือ CLI ที่จัดสิ่งนี้ให้เป็นกระบวนการพัฒนาที่มีโครงสร้างมากขึ้น

NambaAI ไม่ใช่เครื่องมือที่มาแทน Codex แต่ใกล้เคียงกับการเป็น workflow layer ที่ทำงานอยู่รอบ ๆ Codex มากกว่า

แนวคิดพื้นฐานมีดังนี้

request → SPEC → execution → validation → PR handoff

กล่าวคือ แทนที่จะส่งคำขอของผู้ใช้ไปสู่การลงมือทำทันที เครื่องมือนี้จะช่วยจัดระเบียบเป้าหมาย ขอบเขต ข้อจำกัด และเกณฑ์การยอมรับก่อน จากนั้นบันทึกไว้เป็นไฟล์ SPEC แล้วค่อยดำเนินงานต่อ

ตอนนี้โครงสร้างหลักเน้นที่โฟลว์ต่อไปนี้

namba project
namba plan "คำของาน"
namba run SPEC-XXX
namba sync
namba pr
namba land

ตอนนี้กำลังทดลองโฟลว์แบบ queue สำหรับประมวลผลหลาย SPEC แบบต่อเนื่องกันด้วย

เหตุผลที่เริ่มทำเครื่องมือนี้คือ ยิ่ง AI coding สะดวกขึ้นมากเท่าไร ก็ยิ่งมีหลายกรณีที่กระบวนการเปลี่ยนแปลงติดตามได้ยาก หรือยากที่จะกลับมาตรวจสอบภายหลังว่าอิมพลีเมนต์ตามเกณฑ์อะไร โดยเฉพาะเมื่อใช้ Codex ซ้ำ ๆ จะรู้สึกได้ว่า “ตกลงจะทำอะไร”, “ขอบเขตอยู่ถึงไหน”, “ตรวจสอบอย่างไร”, และ “ควรดูอะไรใน PR” อาจเริ่มเลือนรางได้

NambaAI เป็นความพยายามที่จะลดปัญหานี้ด้วยวิธีต่อไปนี้

  • จัดระเบียบเป้าหมายและขอบเขตก่อนเริ่มงาน
  • สร้างไฟล์ SPEC ก่อนลงมืออิมพลีเมนต์
  • บันทึกผลการทำงานและ evidence ของการตรวจสอบ
  • สร้างเอกสาร PR handoff
  • จัดระเบียบการเปลี่ยนแปลงที่ Codex สร้างขึ้นให้มนุษย์รีวิวได้ง่าย
  • บริหารจัดการเป็นกระบวนการพัฒนาที่ทำซ้ำได้ แทนการใช้พรอมป์ต์แบบครั้งเดียวจบ

ทิศทางนี้ไม่ได้ตั้งใจจะสร้าง autonomous agent แบบใช้งานทั่วไปเหมือน AI agent framework เดิม ๆ ตอนนี้โฟกัสยังอยู่ที่การวาง Codex ไว้เป็นแกนกลาง แล้วแยกงานออกเป็นหน่วยที่นักพัฒนาตรวจทานได้ พร้อมมีการบันทึกประกอบ

ยังอยู่ในช่วงเริ่มต้น จึงมีจุดที่ยังขาดอีกมาก

  • ตัวอย่างการใช้งานจริงยังไม่เพียงพอ
  • เอกสาร onboarding ยังต้องปรับปรุง
  • eval pack ยังมีไม่พอ
  • installer/hook ยังต้องทบทวนด้านความปลอดภัย
  • ต้องทดสอบข้ามแพลตฟอร์มบน macOS, Linux, Windows
  • ยังเปรียบเทียบกับ AI coding harness ที่มีอยู่ไม่มากพอ
  • ยังขาดการตรวจสอบในโปรเจ็กต์จริง

นี่เป็นโอเพนซอร์สโปรเจ็กต์แรกเริ่มที่ทำขึ้นเอง และตอนนี้ยังไม่ใช่ผลิตภัณฑ์ที่สมบูรณ์มากนัก แต่เป็นช่วงของการพิสูจน์ทิศทางมากกว่า

สำหรับคนที่ใช้ Codex ในงานจริงหรือโปรเจ็กต์ส่วนตัว อยากขอฟีดแบ็กเป็นพิเศษในประเด็นต่อไปนี้

  1. workflow ของ Codex ที่อิง SPEC แบบนี้ดูมีประโยชน์ในกระบวนการพัฒนาจริงหรือไม่
  2. มีส่วนไหนที่ดูเหมือนออกแบบเกินความจำเป็นบ้าง
  3. ถ้าจะนำไปใช้กับโปรเจ็กต์จริง ยังต้องมีมาตรการสร้างความเชื่อมั่นอะไรเพิ่มอีก
  4. มีเครื่องมือหรือแพตเทิร์นเดิมอะไรที่ควรนำมาเปรียบเทียบบ้าง
  5. ในโฟลว์การติดตั้ง/ใช้งาน มีส่วนไหนที่ดูไม่สะดวกหรือเสี่ยงบ้าง

ความเห็นเชิงวิจารณ์ก็ยินดีรับครับ เพราะยังเป็นช่วงเริ่มต้น ตอนนี้การรู้ว่าจุดอ่อนจริง ๆ อยู่ตรงไหนมีประโยชน์มากกว่าคำชม

1 ความคิดเห็น

 
namcher9428 4 일 전

ตั้งใจทำมาให้เป็น CLI แต่ช่วงนี้ผมใช้บน Codex desktop อยู่ครับ! ตอนแรกกังวลว่าจะชนกับฮาร์เนสที่ฝังมาใน Codex desktop แต่โชคดีที่ใช้งานร่วมกันได้ลื่นไหลมากครับ

นอกจากนี้ยังต้องอัปเดตให้รองรับเนื้อหาของการอัปเดต codex 0.131.0 ครั้งนี้ด้วย และเพราะตอนนี้ผมใช้แค่ฮาร์เนสตัวนี้อยู่ เลยยังเห็นจุดที่ขาดอยู่เรื่อย ๆ แต่สุดท้ายคนที่ไม่พอที่สุดก็คือตัวผมเองนี่แหละครับ...