RoboCat - เอเจนต์หุ่นยนต์ที่พัฒนาตัวเองได้

kuroneko · 2023-06-21T10:24:42+09:00

Google DeepMind เปิดตัว RoboCat ที่สามารถเรียนรู้ได้ด้วยตัวเองขณะใช้แขนหุ่นยนต์ทำงานหลากหลายรูปแบบ พัฒนาบนพื้นฐานของ Gato ซึ่งเป็นโมเดลมัลติโหมดที่ทำงานได้ทั้งในสภาพแวดล้อมจริงและสภาพแวดล้อมจำลอง (gato ในภาษาสเปนแปลว่า 'แมว') เพื่อการพัฒนาตัวเอง ระบบจะเก็บข้อมูลจริงเกี่ยวกับงานใหม่ก่อน ใช้ข้อมูลจริงมาปรับจูนโมเดลพื้นฐานแบบละเอียดเพื่อสร้างเอเจนต์แยกสาย เอเจนต์ใหม่นี้ฝึกประมาณ 10,000 ครั้งเพื่อสร้างชุดข้อมูลสำหรับการฝึก รวมข้อมูลจริงและข้อมูลที่สร้างขึ้นเองเข้ากับชุดข้อมูลการฝึกของ RoboCat ฝึก RoboCat เวอร์ชันใหม่ ด้วยวิธีนี้ จึงสามารถปรับตัวเข้ากับแขนหุ่นยนต์รุ่นใหม่ที่มีข้อต่อมากขึ้นหรือมีคีบมากขึ้นได้ภายในไม่กี่ชั่วโมง นอกจากนี้ยังเกิดวงจรการเรียนรู้เชิงบวก โดยโมเดลเริ่มต้นที่มีอัตราความสำเร็จ 36% ในงานบางประเภท เพิ่มขึ้นมากกว่าสองเท่าเป็น 74%

(deepmind.com)

10 คะแนน โดย kuroneko 2023-06-21 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

Google DeepMind เปิดตัว RoboCat ที่สามารถเรียนรู้ได้ด้วยตัวเองขณะใช้แขนหุ่นยนต์ทำงานหลากหลายรูปแบบ
พัฒนาบนพื้นฐานของ Gato ซึ่งเป็นโมเดลมัลติโหมดที่ทำงานได้ทั้งในสภาพแวดล้อมจริงและสภาพแวดล้อมจำลอง (gato ในภาษาสเปนแปลว่า 'แมว')
- เพื่อการพัฒนาตัวเอง ระบบจะเก็บข้อมูลจริงเกี่ยวกับงานใหม่ก่อน
- ใช้ข้อมูลจริงมาปรับจูนโมเดลพื้นฐานแบบละเอียดเพื่อสร้างเอเจนต์แยกสาย
- เอเจนต์ใหม่นี้ฝึกประมาณ 10,000 ครั้งเพื่อสร้างชุดข้อมูลสำหรับการฝึก
- รวมข้อมูลจริงและข้อมูลที่สร้างขึ้นเองเข้ากับชุดข้อมูลการฝึกของ RoboCat
- ฝึก RoboCat เวอร์ชันใหม่
ด้วยวิธีนี้ จึงสามารถปรับตัวเข้ากับแขนหุ่นยนต์รุ่นใหม่ที่มีข้อต่อมากขึ้นหรือมีคีบมากขึ้นได้ภายในไม่กี่ชั่วโมง
นอกจากนี้ยังเกิดวงจรการเรียนรู้เชิงบวก โดยโมเดลเริ่มต้นที่มีอัตราความสำเร็จ 36% ในงานบางประเภท เพิ่มขึ้นมากกว่าสองเท่าเป็น 74%

3 ความคิดเห็น

nicewook 2023-06-21

ในที่สุดก็ถึงเวลาที่ปัญญาประดิษฐ์จะได้พบและสัมผัสกับโลกจริงเสียที

kuroneko 2023-06-21

คอมเมนต์ในเธรด HN ฮามากเลยครับ
ผมเองก็คิดคล้ายกันเป๊ะว่า มีแค่ผมคนเดียวเหรอที่คาดหวังว่าจะได้เห็นแมวหุ่นยนต์? แอบผิดหวังนิดหน่อย...

ถ้าอย่างน้อยแปะสติกเกอร์แมวบนแขนหุ่นยนต์ก็คงดีนะครับ

kuroneko 2023-06-21

พอสรุปงานวิจัยออกมาได้ดังนี้

RoboCat คือเอเจนต์แบบพัฒนาตัวเองได้สำหรับการควบคุมจัดการของหุ่นยนต์ โดยฝึกด้วยชุดข้อมูลขนาดใหญ่และหลากหลายของงานหุ่นยนต์ที่ใช้ทั้งการจำลองหลายรูปแบบและแขนหุ่นยนต์จริง

เป้าหมายหลักของ RoboCat มีดังนี้

ทำให้ใช้กับงานและหุ่นยนต์ใหม่ได้ด้วยข้อมูลเพียงเล็กน้อย RoboCat สามารถปรับตัวเข้ากับงานและหุ่นยนต์ใหม่ได้โดยใช้ตัวอย่างสาธิตเพียง 100 ถึง 1000 ตัวอย่าง
พัฒนาตัวเองผ่านกระบวนการทำซ้ำ โมเดล RoboCat ที่ผ่านการปรับจูนละเอียดจะถูกนำไปใช้สร้างข้อมูลฝึกเพิ่ม และข้อมูลนี้จะถูกเพิ่มเข้าไปในชุดฝึกเพื่อพัฒนาเอเจนต์ทั่วไปให้ดีขึ้น
รองรับหลายรูปแบบการทำงานที่มีงานและพื้นที่การสังเกตแตกต่างกัน RoboCat ถูกทดสอบกับแขนหุ่นยนต์ที่มีองศาอิสระสูงสุด 14 แกนและใช้ gripper ที่แตกต่างกัน
แก้งานควบคุมจัดการที่ต้องใช้ความคล่องแคล่วหลากหลายรูปแบบ โดยใช้ออบเจ็กต์ที่มีรูปร่าง ขนาด และพื้นผิวต่างกัน งานที่รองรับรวมถึงการวางซ้อน การเสียบใส่ และการยก

ผลลัพธ์สำคัญมีดังนี้

เมื่อข้อมูลฝึกของ RoboCat เพิ่มขึ้นและมีความหลากหลายมากขึ้น การถ่ายโอนข้ามงานทำได้ดีขึ้น และการปรับตัวกับงานใหม่ก็มีประสิทธิภาพมากขึ้น
RoboCat สามารถปรับตัวเข้ากับงานและหุ่นยนต์ใหม่ได้สำเร็จโดยใช้ข้อมูลสาธิตเพียงเล็กน้อย และต้องใช้ความพยายามในการเรียนรู้น้อยกว่าเมื่อเทียบกับ baseline
ด้วยการขยายข้อมูลฝึกผ่านการพัฒนาตัวเอง RoboCat จึงทำผลงานได้ดีขึ้นในงานฝึกเดิม และได้รับการปรับจูนละเอียดเพิ่มเติม

สรุปคือ RoboCat ซึ่งเป็นเอเจนต์แบบพัฒนาตัวเองได้สำหรับการควบคุมจัดการของหุ่นยนต์ที่ฝึกด้วยชุดข้อมูลขนาดใหญ่และหลากหลาย แสดงให้เห็นว่าสามารถปรับจูนละเอียดและพัฒนาตัวเองเพื่อให้ใช้กับงานและหุ่นยนต์ใหม่ได้ด้วยข้อมูลเพียงเล็กน้อย ความสามารถในการใช้ประโยชน์จากประสบการณ์หุ่นยนต์ที่หลากหลายและแตกต่างกันในสเกลใหญ่มีศักยภาพที่จะพลิกโฉมการเรียนรู้ของหุ่นยนต์ได้

RoboCat - เอเจนต์หุ่นยนต์ที่พัฒนาตัวเองได้

บทความที่เกี่ยวข้อง

3 ความคิดเห็น