มินิมัลเอเจนต์ที่พอร์ตมาเป็น Python โดยเริ่มจาก `pi-mono` ซึ่งเป็นแกนหลักของ OpenClaw
(github.com/solvit-team)ผมคิดว่าสำหรับหลายคน เอเจนต์ยังเป็นสิ่งที่ค่อนข้างคลุมเครืออยู่เล็กน้อย มันดูเหมือนจะยิ่งใหญ่มาก แต่พอเปิดดูข้างในจริง ๆ ก็ยังไม่ค่อยเห็นภาพว่ามันทำงานอย่างไร และบ่อยครั้งก็ไม่แน่ใจด้วยซ้ำว่าควรเริ่มลองจับจากตรงไหนดี
ผมเองก็รู้สึกคล้ายกัน จนได้ยินมาว่าแกนหลักของ
OpenClawคือpi-monoและสิ่งที่น่าประทับใจก็คือมันเป็นเอเจนต์ที่มินิมัลมาก โดยเฉพาะอย่างยิ่ง ผมรู้สึกว่านี่เป็นตัวอย่างที่สะท้อนปรัชญาว่า "สิ่งที่ทรงพลังที่สุดคือระบบที่เรียบง่าย" ได้ดีมาก ดังนั้นผมจึงตัดสินใจใช้สิ่งนี้เป็นจุดเริ่มต้นในการสร้างเอเจนต์ของตัวเอง และลองพอร์ตมันมาเป็น Python จนถึงระดับที่สามารถเขียนโค้ดได้อัตโนมัติจริง ๆ แล้วใน
py-pimonoตอนนี้ ยังมีสิ่งอีกมากที่มีอยู่แล้วในpi-monoแต่ยังไม่ได้ถูกนำเข้ามา เช่นสิ่งเหล่านี้
- การจัดการเซสชัน
- การสตีริง
- การติดตามต่อ
- ยูทิลิตี้หลากหลายแบบ
- สตรีมมิง
ด้วยเหตุนี้
py-pimonoจึงใกล้เคียงกับเอเจนต์ที่เหลือแทบแค่โครงกระดูกมากกว่าจะเป็นผลิตภัณฑ์ที่สมบูรณ์แบบ คือแทบไม่มีอะไรเลยแต่ก็ยังพอทำงานได้ อย่างไรก็ตาม มันเปิดโครงสร้างเอาไว้ค่อนข้างชัดเจน เพื่อให้เห็นได้ง่ายว่าควรเปิดดูตรงไหน และควรต่ออะไรเพิ่มตรงใดบ้าง ผมจึงคิดว่ามันน่าจะเหมาะกับคนที่ยังรู้สึกว่าเอเจนต์เป็นเรื่องคลุมเครือ ให้ลองตามดูโครงสร้างและลงมือแก้เองได้ง่าย ตัวอย่างเช่น ผมอยากให้สามารถตามดูคำถามแบบนี้ได้ภายในโค้ดเบสที่เล็กที่สุดเท่าที่เป็นไปได้
- บางคนอาจสงสัยว่า "เอเจนต์ทำงานต่อเนื่องในระยะยาว" ถูกแสดงออกมาในโค้ดอย่างไร
- บางคนอาจสงสัยว่าข้อมูลเซสชันถูกเก็บและโหลดกลับมาอย่างไร
เพราะฉะนั้น ผมจึงหวังว่ารีโพซิทอรีนี้จะเป็นจุดเริ่มต้นที่ดีสำหรับการแยกส่วนสิ่งเหล่านั้นออกมาให้มากที่สุดเท่าที่ทำได้ แล้วใช้ LLM อ่านและวิเคราะห์โค้ดไปพร้อมกัน เพื่อต่อวงลูปหรือระบบจัดการเซสชันในแบบของคุณเอง และค่อย ๆ ขยายโครงสร้างออกไป
แต่เพื่อให้สามารถรันและลองจนคุ้นมือได้ทันที ผมจึงแนบ UI ไว้บนฮาร์เนสมินิมัลนี้ด้วย หากเปิดดูไดเรกทอรี
ui/คุณจะพบทั้ง UI หลายแบบที่ผมเคยลองเล่นไว้ รวมถึงการเชื่อมต่อกับ Discord ด้วยการติดตั้ง:
pip install py-pimonoถ้าคุณยืนยันตัวตน Codex ไว้แล้ว ก็รันได้ทันที
pyaiถึงจะยังไม่มีการยืนยันตัวตน Codex ก็ยังมี
MockLlmแบบนกแก้วเป็น fallback ทำงานอยู่ ดังนั้นการค่อย ๆ ใส่จุดดีบักแล้วดูเอเจนต์ลูปทำงานก็สนุกไม่น้อยหากยังไม่ได้ยืนยันตัวตน Codex ให้ล็อกอินก่อนแล้วค่อยรัน
codex login pyaiหลังจากนั้น ผมคิดว่าน่าจะสนุกถ้าได้ช่วยกันค่อย ๆ เติมเฉพาะสิ่งที่สำคัญจริง ๆ แต่ยังขาดอยู่ตรงนี้เข้าไป โดยพยายามทำให้สะอาดและมินิมัลที่สุด แทนที่จะปล่อยให้เอเจนต์ยังคงเป็นสิ่งที่คลุมเครือ ผมอยากให้คนได้สัมผัสความรู้สึกของการเปิดดูมัน แก้ไขมัน และเปลี่ยนให้เป็นของตัวเองมากขึ้น เลยนำมาแชร์ไว้ครับ
ยังไม่มีความคิดเห็น