10 คะแนน โดย kuroneko 2023-06-21 | 3 ความคิดเห็น | แชร์ทาง WhatsApp
  • Google DeepMind เปิดตัว RoboCat ที่สามารถเรียนรู้ได้ด้วยตัวเองขณะใช้แขนหุ่นยนต์ทำงานหลากหลายรูปแบบ
  • พัฒนาบนพื้นฐานของ Gato ซึ่งเป็นโมเดลมัลติโหมดที่ทำงานได้ทั้งในสภาพแวดล้อมจริงและสภาพแวดล้อมจำลอง (gato ในภาษาสเปนแปลว่า 'แมว')
    • เพื่อการพัฒนาตัวเอง ระบบจะเก็บข้อมูลจริงเกี่ยวกับงานใหม่ก่อน
    • ใช้ข้อมูลจริงมาปรับจูนโมเดลพื้นฐานแบบละเอียดเพื่อสร้างเอเจนต์แยกสาย
    • เอเจนต์ใหม่นี้ฝึกประมาณ 10,000 ครั้งเพื่อสร้างชุดข้อมูลสำหรับการฝึก
    • รวมข้อมูลจริงและข้อมูลที่สร้างขึ้นเองเข้ากับชุดข้อมูลการฝึกของ RoboCat
    • ฝึก RoboCat เวอร์ชันใหม่
  • ด้วยวิธีนี้ จึงสามารถปรับตัวเข้ากับแขนหุ่นยนต์รุ่นใหม่ที่มีข้อต่อมากขึ้นหรือมีคีบมากขึ้นได้ภายในไม่กี่ชั่วโมง
  • นอกจากนี้ยังเกิดวงจรการเรียนรู้เชิงบวก โดยโมเดลเริ่มต้นที่มีอัตราความสำเร็จ 36% ในงานบางประเภท เพิ่มขึ้นมากกว่าสองเท่าเป็น 74%

3 ความคิดเห็น

 
nicewook 2023-06-21

ในที่สุดก็ถึงเวลาที่ปัญญาประดิษฐ์จะได้พบและสัมผัสกับโลกจริงเสียที

 
kuroneko 2023-06-21

คอมเมนต์ในเธรด HN ฮามากเลยครับ
ผมเองก็คิดคล้ายกันเป๊ะว่า มีแค่ผมคนเดียวเหรอที่คาดหวังว่าจะได้เห็นแมวหุ่นยนต์? แอบผิดหวังนิดหน่อย...

ถ้าอย่างน้อยแปะสติกเกอร์แมวบนแขนหุ่นยนต์ก็คงดีนะครับ

 
kuroneko 2023-06-21

พอสรุปงานวิจัยออกมาได้ดังนี้

RoboCat คือเอเจนต์แบบพัฒนาตัวเองได้สำหรับการควบคุมจัดการของหุ่นยนต์ โดยฝึกด้วยชุดข้อมูลขนาดใหญ่และหลากหลายของงานหุ่นยนต์ที่ใช้ทั้งการจำลองหลายรูปแบบและแขนหุ่นยนต์จริง

เป้าหมายหลักของ RoboCat มีดังนี้

  1. ทำให้ใช้กับงานและหุ่นยนต์ใหม่ได้ด้วยข้อมูลเพียงเล็กน้อย RoboCat สามารถปรับตัวเข้ากับงานและหุ่นยนต์ใหม่ได้โดยใช้ตัวอย่างสาธิตเพียง 100 ถึง 1000 ตัวอย่าง
  2. พัฒนาตัวเองผ่านกระบวนการทำซ้ำ โมเดล RoboCat ที่ผ่านการปรับจูนละเอียดจะถูกนำไปใช้สร้างข้อมูลฝึกเพิ่ม และข้อมูลนี้จะถูกเพิ่มเข้าไปในชุดฝึกเพื่อพัฒนาเอเจนต์ทั่วไปให้ดีขึ้น
  3. รองรับหลายรูปแบบการทำงานที่มีงานและพื้นที่การสังเกตแตกต่างกัน RoboCat ถูกทดสอบกับแขนหุ่นยนต์ที่มีองศาอิสระสูงสุด 14 แกนและใช้ gripper ที่แตกต่างกัน
  4. แก้งานควบคุมจัดการที่ต้องใช้ความคล่องแคล่วหลากหลายรูปแบบ โดยใช้ออบเจ็กต์ที่มีรูปร่าง ขนาด และพื้นผิวต่างกัน งานที่รองรับรวมถึงการวางซ้อน การเสียบใส่ และการยก

ผลลัพธ์สำคัญมีดังนี้

  • เมื่อข้อมูลฝึกของ RoboCat เพิ่มขึ้นและมีความหลากหลายมากขึ้น การถ่ายโอนข้ามงานทำได้ดีขึ้น และการปรับตัวกับงานใหม่ก็มีประสิทธิภาพมากขึ้น
  • RoboCat สามารถปรับตัวเข้ากับงานและหุ่นยนต์ใหม่ได้สำเร็จโดยใช้ข้อมูลสาธิตเพียงเล็กน้อย และต้องใช้ความพยายามในการเรียนรู้น้อยกว่าเมื่อเทียบกับ baseline
  • ด้วยการขยายข้อมูลฝึกผ่านการพัฒนาตัวเอง RoboCat จึงทำผลงานได้ดีขึ้นในงานฝึกเดิม และได้รับการปรับจูนละเอียดเพิ่มเติม

สรุปคือ RoboCat ซึ่งเป็นเอเจนต์แบบพัฒนาตัวเองได้สำหรับการควบคุมจัดการของหุ่นยนต์ที่ฝึกด้วยชุดข้อมูลขนาดใหญ่และหลากหลาย แสดงให้เห็นว่าสามารถปรับจูนละเอียดและพัฒนาตัวเองเพื่อให้ใช้กับงานและหุ่นยนต์ใหม่ได้ด้วยข้อมูลเพียงเล็กน้อย ความสามารถในการใช้ประโยชน์จากประสบการณ์หุ่นยนต์ที่หลากหลายและแตกต่างกันในสเกลใหญ่มีศักยภาพที่จะพลิกโฉมการเรียนรู้ของหุ่นยนต์ได้