ผมได้สร้างทางเลือกแทน OpenClaw และ Hermes ที่เบากว่าและใช้งานง่ายกว่าชื่อว่า TabyAgent

มันทำงานได้ภายใน Docker เท่านั้น โดยไม่ต้องใช้ host mount และสามารถโต้ตอบผ่าน Telegram ได้

ก่อนหน้านี้ผมเคยลองใช้ทั้ง OpenClaw และ Hermes มาแล้ว แต่เพราะมีส่วนที่ไม่เสถียร และในกรณีของ OpenClaw ก็ทั้งหนักและมีบั๊กมากเกินไป จึงลงมือสร้างขึ้นมาเอง

มันถูกออกแบบให้เรียบง่ายโดยตั้งใจ จึงไม่มีฟีเจอร์ซับซ้อนอย่างการรองรับเมสเซนเจอร์หลายตัวแบบ OC หรือ HA, การสร้างภาพ, หรือการโทรด้วยเสียง แต่ผมมองว่านี่เป็นข้อดี เพราะทำให้ดูแลรักษาง่ายกว่าและช่วยให้คงความเบาไว้ได้

ณ เวลาที่เขียนโพสต์นี้ เวอร์ชัน 0.3.0 ได้ปล่อยแล้ว และอยู่บน GitHub ภายใต้ไลเซนส์ AGPL 3.0: https://github.com/gpdir16/tabyAgent

ตอนนี้ฟีเจอร์ที่ผมใช้งานจริงได้ถูกทำไว้ครบแล้วเป็นอันดับแรก แต่ถ้าลองใช้แล้วมีฟีเจอร์ที่อยากได้เพิ่มเติมหรือมีข้อเสนอแนะใด ๆ ก็แจ้งมาได้เลย

จุดที่แตกต่าง

  • ใช้ RAM น้อยกว่า OpenClaw ประมาณ 9 เท่า (OC ~3GB, HA ~600MB)
  • ทำงานบน Docker ได้โดยไม่ต้องใช้ host mount จึงมีความเสี่ยงที่จะทำลายโฮสต์น้อยกว่า (OC เป็นตัวเลือก, HA ต้องเชื่อมต่อกับโฮสต์)
  • ตั้งค่าแบบโต้ตอบที่ง่ายผ่านสคริปต์ติดตั้งบรรทัดเดียวและภายใน Telegram bot (OC/HA ซับซ้อน)
  • เรนเดอร์ตารางให้แสดงผลได้ถูกต้องภายใน Telegram ด้วย (OC/HA ไม่รองรับ)
  • ประหยัดกว่าด้วยจำนวนโทเค็นที่ใช้และจำนวนครั้งในการเรียกใช้น้อยกว่าเมื่อเทียบกัน (ลดการเรียกเบื้องหลังและการเรียกที่ไม่จำเป็นให้ต่ำที่สุด)

ฟีเจอร์ที่รองรับ

  • การควบคุมเบราว์เซอร์: รองรับ browser-use, playwright แบบในตัวเป็นค่าเริ่มต้น
  • งานทำซ้ำ (cron job): เอเจนต์ตั้งค่าได้เองและรันอัตโนมัติตามเวลาที่กำหนด
  • สกิลในตัว: ดึงข้อมูลอาหารกลางวัน/ตารางเรียนของโรงเรียนในเกาหลี, ค้นหาสกิล, สร้างสกิล เป็นต้น
  • ไฟล์, เครื่องมือเทอร์มินัล: ทำงานแทนได้เกือบทุกอย่าง
  • ผู้ให้บริการหลากหลาย: OpenAI, OpenRouter, Synthetic เป็นต้น
  • หน่วยความจำอัตโนมัติ: เพิ่ม/ลบ/อัปเดตความทรงจำอย่างชาญฉลาดระหว่างการสนทนา เมื่่อเริ่มเซสชันใหม่ เป็นต้น
  • Markdown: รองรับการจัดรูปแบบของ Telegram API และเรนเดอร์ตารางเป็นภาพแล้วส่ง
  • สถานะแบบเรียลไทม์: โมเดล, จำนวนครั้งที่เรียกใช้ทูลและ context window, สถานะเอาต์พุต, ทูลที่กำลังใช้งาน, เวลาที่ผ่านไป เป็นต้น
  • คอนเท็กซ์ไม่สิ้นสุด: คงข้อความล่าสุดไว้ พร้อมบีบอัดเฉพาะข้อความเก่าหรือไม่สำคัญ
  • โพสต์ X: ดูโพสต์ Twitter ได้โดยไม่ต้องใช้คีย์ X API (ใช้ FxEmbed)
  • และอื่น ๆ อีกมาก

แพลตฟอร์มที่รองรับ

หากมี Docker ก็รองรับทั้งหมด

ในกรณีของ macOS และ Linux สามารถติดตั้งแบบคำสั่งบรรทัดเดียวด้วยสคริปต์ติดตั้งอัตโนมัติได้ด้วย (ส่วน Windows ต้องติดตั้งด้วยตนเอง)

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น