Toddlerbot - แพลตฟอร์มหุ่นยนต์ฮิวแมนนอยด์โอเพนซอร์สที่รองรับ ML
(toddlerbot.github.io)- ToddlerBot เป็น แพลตฟอร์มหุ่นยนต์ฮิวแมนนอยด์ โอเพนซอร์สราคาประหยัด ออกแบบมาเพื่อรองรับ การเรียนรู้นโยบายและการขยายการทดลอง ในงานวิจัยด้านหุ่นยนต์และ AI
- เวอร์ชันใหม่ (2.0) รองรับฟีเจอร์ใหม่หลากหลาย เช่น ตีลังกาข้าง, คลาน, เดินเร็ว, ควบคุมระยะไกลด้วย VR, การประเมินความลึกแบบสเตอริโอเรียลไทม์
- เน้น ความสามารถในการทำซ้ำและความทนทาน ด้วย การออกแบบ 30 องศาอิสระ, end-effector หลายแบบ (แบบฝ่ามือและ gripper) และการซ่อมแซมรวดเร็วด้วยการพิมพ์ 3D
- พิสูจน์แล้วว่ารองรับ ML ผ่าน การเดิน การใช้สองมือ การจัดการทั้งร่างกาย และการเชื่อมต่อทักษะ (skill chaining) ที่ใช้การเรียนรู้แบบเสริมกำลังและ diffusion model
- ให้ คู่มือและโค้ดโอเพนซอร์ส แบบครบถ้วน ทำให้ทุกคนสามารถสร้าง ทดสอบการถ่ายโอนนโยบาย และทำการทดลองความร่วมมือของหุ่นยนต์หลายตัวได้
ความสำคัญของโปรเจกต์โอเพนซอร์ส Toddlerbot
- Toddlerbot เป็นโปรเจกต์หุ่นยนต์ฮิวแมนนอยด์โอเพนซอร์สที่ทุกคนสามารถนำซอร์สไปใช้เพื่อ ประกอบและดัดแปลง ได้ด้วยตนเอง
- จุดเด่นคือมีต้นทุนการสร้างต่ำกว่าเมื่อเทียบกับหุ่นยนต์ฮิวแมนนอยด์เชิงพาณิชย์ และมีโครงสร้างกับจำนวนชิ้นส่วนน้อย ทำให้เริ่มต้นได้ง่าย
- สามารถนำไปใช้ได้หลากหลายวัตถุประสงค์ เช่น การออกแบบฮาร์ดแวร์หุ่นยนต์ การควบคุมซอฟต์แวร์ และการฝึกอัลกอริทึม
- มีชุมชนที่เคลื่อนไหวอย่างต่อเนื่องและเอกสารประกอบที่ดี ทำให้ใช้งานได้ตั้งแต่มือใหม่จนถึงผู้เชี่ยวชาญ
- เป็นแพลตฟอร์มหุ่นยนต์ที่เหมาะสำหรับงานวิจัยและพัฒนา การศึกษา และการทำต้นแบบ
ฟีเจอร์หลักและข้อดี
- สร้างได้ง่ายผ่าน 3D printer, แผงวงจรโอเพนซอร์ส และซอฟต์แวร์สาธารณะ
- โครงสร้างแบบ modular design ทำให้สามารถออกแบบและเปลี่ยนหัว แขน ลำตัว ฯลฯ ได้อย่างอิสระ
- เชื่อมต่อกับหลายภาษาโปรแกรม เช่น Python ทำให้ทดลอง ยุทธวิธีการควบคุม ได้หลากหลาย
- รองรับการขยายเพิ่มเติมแบบเลือกได้ เช่น sensor, motor และ camera
ฟีเจอร์หลักของ ToddlerBot 2.0
- ตีลังกาข้าง: แสดงความคล่องตัวและความสามารถในการทรงตัวสูง และแทบไม่เสียหายแม้ล้มเหลว
- คลาน: การเคลื่อนไหวแบบคลานสี่ขาโดยใช้แขนและขาเหมือนเด็กเล็ก
- เดินเร็ว: ความเร็วการเดินรอบทิศทาง 0.25m/s และหมุนอยู่กับที่ได้สูงสุด 1rad/s
- ควบคุมระยะไกลด้วย VR: ควบคุมแบบเรียลไทม์บนพื้นฐาน Meta Quest 2
- การประเมินความลึกแบบสเตอริโอ: ติดตั้ง Jetson Orin NX 16GB และประมวลผลแบบเรียลไทม์ที่ 10Hz
ลักษณะการออกแบบ
- 30 องศาอิสระ (DoF): แขน 7, ขา 6, คอ 2, เอว 2
- เซนเซอร์·อุปกรณ์อิเล็กทรอนิกส์: กล้องตาปลา 2 ตัว, ลำโพง, ไมโครโฟน 2 ตัว, IMU, Jetson Orin NX
- end-effector: มี 2 ตัวเลือกคือแบบฝ่ามือยืดหยุ่นและ parallel-jaw gripper
การทดลองประสิทธิภาพ
- ทดสอบความยาวแขน: สามารถจับวัตถุที่มีขนาดใหญ่กว่าปริมาตรลำตัว 14 เท่าได้
- ทดสอบการรับน้ำหนัก: ยกน้ำหนัก 1.48kg ซึ่งเท่ากับ 40% ของน้ำหนักรวมทั้งตัว พร้อมรักษาสมดุลได้
- ทดสอบความต่อเนื่องในการทำงาน: เดินได้นาน 19 นาทีด้วยนโยบายการเดินที่ใช้การเรียนรู้แบบเสริมกำลัง ล้ม 7 ครั้งโดยไม่เสียหาย และซ่อมได้ภายใน 35 นาที (พิมพ์ 3D + ประกอบ)
การเคลื่อนไหวที่ขับเคลื่อนด้วย AI
- สนทนา·วิดพื้น: เชื่อมต่อ OpenAI Realtime API + GPT-4o
- โหนบาร์ดึงข้อ: การระบุตำแหน่งด้วย AprilTag และถ่ายโอนนโยบายจากซิมูเลชันสู่เครื่องจริง
- การเดิน·การจัดการวัตถุ: ใช้การเรียนรู้แบบเสริมกำลังและ diffusion policy ที่อิง RGB เพื่อทำการจัดการด้วยสองมือและทั้งร่างกาย
- การเชื่อมต่อทักษะ (Skill Chaining): จับที่จับ (diffusion policy) → ดันรถเข็น (นโยบายการเรียนรู้แบบเสริมกำลัง)
ความสามารถในการทำซ้ำและการขยายต่อ
- การถ่ายโอนนโยบาย: สามารถถ่ายโอนนโยบายการจัดการที่ฝึกบน ToddlerBot ตัวหนึ่งไปยังอีกตัวได้โดยไม่สูญเสียประสิทธิภาพ
- ความร่วมมือของหุ่นยนต์หลายตัว: หุ่นยนต์ 2 ตัวสามารถร่วมกันทำงานระยะยาว (จัดห้อง) ได้
- ประกอบง่าย: ทุกคนสามารถสร้างได้จากคู่มือและวิดีโอโอเพนซอร์ส
การสนับสนุนงานวิจัย
- บทความวิจัย: ToddlerBot: Open-Source ML-Compatible Humanoid Platform for Loco-Manipulation (arXiv:2502.00893)
- พัฒนาโดยทีมนักวิจัยจากมหาวิทยาลัยสแตนฟอร์ด และได้รับการสนับสนุนจาก NSF, Sloan Fellowship และอื่น ๆ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
งานนี้น่าประทับใจมาก หวังว่าถ้าราคาถูกลงกว่านี้จะได้ลองเอามาใช้ทำโปรเจกต์ง่ายๆ ที่บ้าน
วิดีโอล้มเหลวตอนตีลังกาข้างดูสะเทือนใจพอสมควร ดูเหมือนว่าหุ่นยนต์ยังไม่เรียนรู้วิธีป้องกันการล้มหรือพยุงตัวเองเวลาล้มได้ การสาธิตตีลังกาข้างนั้นเองก็น่าทึ่งมาก ตอนแรกนึกว่าเป็นของเล่นหรือ CG แต่พอเห็นฉากพลาดก็เชื่อขึ้นมาหน่อยว่าเป็นของจริง
เป็นผลงานที่เจ๋งมาก! สงสัยว่าโครงสร้างที่ทั้งตัวหุ่นยนต์เกือบทั้งหมดพิมพ์ 3D ได้จะมีข้อจำกัดอะไรบ้าง แต่ถ้าจะประกอบเองก็ดูน่าจะเป็นสิ่งจำเป็น
สงสัยว่าจะมีเวอร์ชันที่ถูกกว่านี้หรือเป็นมิตรกับมือใหม่กว่านี้ไหม โดยยังใช้ Jetson nano เหมือนเดิม แต่ชิ้นส่วนอื่นๆ จัดให้มือใหม่รับมือได้ง่ายหน่อยก็น่าจะดี
โปรเจกต์เจ๋งมาก! สงสัยว่ามี Mujoco simulator เตรียมไว้สำหรับทำวิจัยต่อด้วย VLA หรือไม่
ลองจินตนาการว่าจะซื้อหุ่นยนต์แบบนี้มาให้คอยให้อาหารแมว แล้วก็หยิบพัสดุที่หน้าประตูเข้ามาได้ไหม หรือว่าฉันกำลังคาดหวังมากเกินไปป.ล. พอเห็นว่าคำว่า "ราคาถูก" หมายถึง $6,000 ก็ได้แต่หัวเราะ
นั่นขึ้นอยู่กับสถานการณ์ ถ้าใส่อาหารสัตว์ไว้ในภาชนะที่เหมาะกับหุ่นยนต์ มันจะง่ายกว่าการให้หุ่นยนต์ตักอาหารเองตรงๆ มาก ถ้าพนักงานส่งของ (หรือหุ่นยนต์) วางพัสดุไว้จุดเดิมทุกครั้งก็จะง่ายขึ้น แต่ถ้าไม่ใช่แบบนั้น การให้หุ่นยนต์หาพัสดุจะยากมาก ทีมแพ็กของกับผู้ใช้อาจต้องตกลงกันไปถึงตำแหน่งวางด้วย เป็นเป้าหมายที่ทะเยอทะยาน แต่สิ่งที่ขวางไม่ใช่ว่ามันทำไม่ได้ เพียงแต่ต้องโปรแกรมความเปลี่ยนแปลงและรายละเอียดของแต่ละสภาพแวดล้อมทั้งหมด การทำให้หุ่นยนต์ขยับไป 5 ซม. เป็นเรื่องง่าย แต่การให้มันหาของแปลกหน้าที่ถูกวางทิ้งไว้ที่ไหนก็ไม่รู้นั้นยากมาก แม้จะดีขึ้นเรื่อยๆ แต่ก็ยังเป็นปัญหาที่ยุ่งยาก
ทุกวันนี้มีเครื่องให้อาหารอัตโนมัติขายอยู่แล้วเยอะมาก ฉันใช้อยู่ทั้งเครื่องให้อาหารเม็ดที่เติมเดือนละครั้ง เครื่องให้อาหารเปียกที่ต้องเติมทุกวัน และน้ำพุให้น้ำสัตว์เลี้ยง
ราคา $6,000 สำหรับหุ่นยนต์เซอร์โวขนาดเด็กถือว่าแพง แต่ก็ยังถูกกว่าหุ่นยนต์สุนัขจากจีนส่วนใหญ่ หุ่นยนต์นี่มีต้นทุนสูงมากจริงๆ
คิดว่าถ้ามีเวอร์ชันราคา 1,000 ดอลลาร์ออกมาคงดีมาก (ไม่แน่ใจว่าจะเป็นไปได้ไหม)
เอวสองแกน (2 DOF)! แพสชันสุดยอดจริงๆ
ดูเจ๋งมาก ขอบคุณที่แชร์ข้อมูลดีๆ