12 คะแนน โดย xguru 4 일 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เอเจนต์ AI สำหรับงานเขียนโค้ดแบบมินิมัล ที่พัฒนาโดยทีม Princeton·Stanford ผู้สร้าง SWE-bench และ SWE-agent
  • เป็นเอเจนต์วิศวกรรมซอฟต์แวร์ AI แบบน้ำหนักเบามากที่ประกอบด้วย โค้ด Python ราว 100 บรรทัด ทำงานได้โดยไม่ต้องมีไฟล์ตั้งค่าขนาดใหญ่หรือโมโนรีโป
  • ใช้ bash เป็นเครื่องมือเพียงอย่างเดียว และรองรับการทำงานกับโมเดลใดก็ได้แม้ไม่มีอินเทอร์เฟซ tool-calling ของ LLM
  • ทำคะแนนได้ มากกว่า 74% บนเบนช์มาร์ก SWE-bench verified และทำได้ในระดับเดียวกันเมื่อใช้ Gemini 3 Pro
  • ใช้ subprocess.run เพื่อให้แต่ละแอ็กชัน รันแยกจากกันอย่างอิสระ จึงไม่ต้องมีเชลล์เซสชันแบบคงสถานะ และหากสลับไปใช้ Docker ก็ง่ายแค่เปลี่ยนเป็น docker exec
  • มี โครงสร้างประวัติแบบเชิงเส้นทั้งหมด ทำให้ทราเจกทอรีและข้อความที่ส่งให้ LLM เหมือนกัน จึงเหมาะอย่างยิ่งสำหรับการดีบักและการไฟน์จูน
  • รองรับการปรับใช้ในสภาพแวดล้อมแซนด์บ็อกซ์หลากหลายแบบ เช่น โลคัล, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree
  • รองรับทุกโมเดลผ่าน litellm, openrouter, portkey เป็นต้น และเข้ากันได้กับเอนด์พอยต์ /completion และ /response รวมถึง interleaved thinking
  • ถูกนำไปใช้โดย Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale และ Princeton·Stanford
  • เมื่อเทียบกับ Claude Code แล้ว เริ่มทำงานได้เร็วกว่าอย่างมาก และยังใช้เป็นเบสไลน์สำหรับประเมินความสามารถของ LLM โดยตรงได้โดยไม่เกิดการโอเวอร์ฟิตกับ agent scaffold
  • มี CLI (mini), การอนุมานแบบแบตช์, ตัวดูทราเจกทอรี และ Python binding (DefaultAgent, LitellmModel, LocalEnvironment)
  • ใบอนุญาต MIT

1 ความคิดเห็น

 
ragingwind 3 일 전

ตอนนี้การพัฒนาเอเจนต์โดยตรงก็ดูง่ายขึ้นแล้วนะ