mini-swe-agent - เอเจนต์ AI ขนาด 100 บรรทัดสำหรับแก้ GitHub Issues และช่วยงานผ่านคอมมานด์ไลน์

xguru · 2026-04-26T09:31:02+09:00

เอเจนต์ AI สำหรับงานเขียนโค้ดแบบมินิมัล ที่พัฒนาโดยทีม Princeton·Stanford ผู้สร้าง SWE-bench และ SWE-agent เป็นเอเจนต์วิศวกรรมซอฟต์แวร์ AI แบบน้ำหนักเบามากที่ประกอบด้วย โค้ด Python ราว 100 บรรทัด ทำงานได้โดยไม่ต้องมีไฟล์ตั้งค่าขนาดใหญ่หรือโมโนรีโป ใช้ bash เป็นเครื่องมือเพียงอย่างเดียว และรองรับการทำงานกับโมเดลใดก็ได้แม้ไม่มีอินเทอร์เฟซ tool-calling ของ LLM ทำคะแนนได้ มากกว่า 74% บนเบนช์มาร์ก SWE-bench verified และทำได้ในระดับเดียวกันเมื่อใช้ Gemini 3 Pro ใช้ subprocess.run เพื่อให้แต่ละแอ็กชัน รันแยกจากกันอย่างอิสระ จึงไม่ต้องมีเชลล์เซสชันแบบคงสถานะ และหากสลับไปใช้ Docker ก็ง่ายแค่เปลี่ยนเป็น docker exec มี โครงสร้างประวัติแบบเชิงเส้นทั้งหมด ทำให้ทราเจกทอรีและข้อความที่ส่งให้ LLM เหมือนกัน จึงเหมาะอย่างยิ่งสำหรับการดีบักและการไฟน์จูน รองรับการปรับใช้ในสภาพแวดล้อมแซนด์บ็อกซ์หลากหลายแบบ เช่น โลคัล, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree รองรับทุกโมเดลผ่าน litellm, openrouter, portkey เป็นต้น และเข้ากันได้กับเอนด์พอยต์ /completion และ /response รวมถึง interleaved thinking ถูกนำไปใช้โดย Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale และ Princeton·Stanford เมื่อเทียบกับ Claude Code แล้ว เริ่มทำงานได้เร็วกว่าอย่างมาก และยังใช้เป็นเบสไลน์สำหรับประเมินความสามารถของ LLM โดยตรงได้โดยไม่เกิดการโอเวอร์ฟิตกับ agent scaffold มี CLI (mini), การอนุมานแบบแบตช์, ตัวดูทราเจกทอรี และ Python binding (DefaultAgent, LitellmModel, LocalEnvironment) ใบอนุญาต MIT

(github.com/SWE-agent)

12 คะแนน โดย xguru 2026-04-26 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

เอเจนต์ AI สำหรับงานเขียนโค้ดแบบมินิมัล ที่พัฒนาโดยทีม Princeton·Stanford ผู้สร้าง SWE-bench และ SWE-agent
เป็นเอเจนต์วิศวกรรมซอฟต์แวร์ AI แบบน้ำหนักเบามากที่ประกอบด้วย โค้ด Python ราว 100 บรรทัด ทำงานได้โดยไม่ต้องมีไฟล์ตั้งค่าขนาดใหญ่หรือโมโนรีโป
ใช้ bash เป็นเครื่องมือเพียงอย่างเดียว และรองรับการทำงานกับโมเดลใดก็ได้แม้ไม่มีอินเทอร์เฟซ tool-calling ของ LLM
ทำคะแนนได้ มากกว่า 74% บนเบนช์มาร์ก SWE-bench verified และทำได้ในระดับเดียวกันเมื่อใช้ Gemini 3 Pro
ใช้ subprocess.run เพื่อให้แต่ละแอ็กชัน รันแยกจากกันอย่างอิสระ จึงไม่ต้องมีเชลล์เซสชันแบบคงสถานะ และหากสลับไปใช้ Docker ก็ง่ายแค่เปลี่ยนเป็น docker exec
มี โครงสร้างประวัติแบบเชิงเส้นทั้งหมด ทำให้ทราเจกทอรีและข้อความที่ส่งให้ LLM เหมือนกัน จึงเหมาะอย่างยิ่งสำหรับการดีบักและการไฟน์จูน
รองรับการปรับใช้ในสภาพแวดล้อมแซนด์บ็อกซ์หลากหลายแบบ เช่น โลคัล, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree
รองรับทุกโมเดลผ่าน litellm, openrouter, portkey เป็นต้น และเข้ากันได้กับเอนด์พอยต์ /completion และ /response รวมถึง interleaved thinking
ถูกนำไปใช้โดย Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale และ Princeton·Stanford
เมื่อเทียบกับ Claude Code แล้ว เริ่มทำงานได้เร็วกว่าอย่างมาก และยังใช้เป็นเบสไลน์สำหรับประเมินความสามารถของ LLM โดยตรงได้โดยไม่เกิดการโอเวอร์ฟิตกับ agent scaffold
มี CLI (mini), การอนุมานแบบแบตช์, ตัวดูทราเจกทอรี และ Python binding (DefaultAgent, LitellmModel, LocalEnvironment)
ใบอนุญาต MIT

1 ความคิดเห็น

ragingwind 2026-04-26

ตอนนี้การพัฒนาเอเจนต์โดยตรงก็ดูง่ายขึ้นแล้วนะ

mini-swe-agent - เอเจนต์ AI ขนาด 100 บรรทัดสำหรับแก้ GitHub Issues และช่วยงานผ่านคอมมานด์ไลน์

บทความที่เกี่ยวข้อง

1 ความคิดเห็น