2 คะแนน โดย GN⁺ 2023-09-21 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Toyota Research Institute (TRI) ประกาศความก้าวหน้าครั้งสำคัญในการสอนทักษะใหม่ให้หุ่นยนต์ โดยใช้แนวทาง Generative AI ที่อิงกับ Diffusion Policy
  • แนวทางใหม่นี้ช่วยเพิ่มประโยชน์ใช้สอยของหุ่นยนต์อย่างมาก และเป็นอีกก้าวสู่การสร้าง "Large Behavior Models (LBMs)" สำหรับหุ่นยนต์ ซึ่งคล้ายกับ Large Language Models (LLMs) ที่ปฏิวัติ AI เชิงสนทนา
  • เทคนิคการสอนใหม่นี้มีประสิทธิภาพและสร้างพฤติกรรมที่มีสมรรถนะสูง ทำให้หุ่นยนต์สามารถช่วยเหลือผู้คนได้อย่างมีประสิทธิผลยิ่งขึ้น
  • เทคนิคการสอนหุ่นยนต์แบบเดิมนั้นช้า ไม่สม่ำเสมอ และไม่มีประสิทธิภาพ โดยส่วนใหญ่จำกัดอยู่กับงานขอบเขตแคบที่ทำได้ในสภาพแวดล้อมที่จำกัดมาก
  • TRI ใช้แนวทางใหม่นี้สอนทักษะที่ยากและต้องอาศัยความคล่องแคล่วให้หุ่นยนต์มากกว่า 60 อย่าง เช่น การเทของเหลว การใช้เครื่องมือ และการจัดการวัตถุที่เปลี่ยนรูปได้
  • TRI ตั้งเป้าจะสอนทักษะใหม่หลายร้อยอย่างภายในปลายปีนี้ และให้ถึง 1,000 อย่างภายในปลายปี 2024
  • ตอนนี้หุ่นยนต์ของ TRI สามารถโต้ตอบกับโลกได้อย่างหลากหลายและลุ่มลึกยิ่งขึ้น ซึ่งอาจนำไปสู่วันที่หุ่นยนต์สามารถช่วยเหลือผู้คนในสถานการณ์ประจำวัน รวมถึงสภาพแวดล้อมที่คาดเดาไม่ได้และเปลี่ยนแปลงตลอดเวลา
  • โมเดลพฤติกรรมหุ่นยนต์ของ TRI ผสานการสาธิตผ่านการสัมผัสจากผู้สอนเข้ากับคำอธิบายเป้าหมายด้วยภาษา และใช้ Diffusion Policy ที่ขับเคลื่อนด้วย AI เพื่อเรียนรู้ทักษะที่ถูกสาธิต
  • TRI พัฒนา Diffusion Policy ร่วมกับทีมของศาสตราจารย์ Song แห่ง Columbia University ซึ่งเป็นแนวทาง Generative AI ที่ทรงพลังสำหรับการเรียนรู้พฤติกรรม
  • แพลตฟอร์มหุ่นยนต์ของ TRI ถูกสร้างขึ้นเฉพาะสำหรับงานควบคุมแบบสองแขนที่ต้องใช้ความคล่องแคล่ว พร้อมรองรับ tactile feedback และ tactile sensing
  • TRI ใช้ Drake ซึ่งเป็นการออกแบบเชิงแบบจำลองสำหรับการออกแบบหุ่นยนต์ โดยมีชุดเครื่องมือและแพลตฟอร์มจำลองสถานะล้ำสมัยที่ช่วยขยายและเร่งการพัฒนาทั้งในสภาพจำลองและโลกจริง
  • ความปลอดภัยเป็นหัวใจสำคัญของความพยายามพัฒนาหุ่นยนต์ของ TRI และระบบมีมาตรการป้องกันที่แข็งแกร่งซึ่งออกแบบมาให้เคารพการรับประกันด้านความปลอดภัย เช่น การไม่ให้หุ่นยนต์ชนกับตัวเองหรือสิ่งแวดล้อม
  • ข้อมูลเชิงเทคนิคเพิ่มเติมเกี่ยวกับความก้าวหน้าครั้งนี้ของ TRI สามารถดูได้จากบล็อก Medium ของ TRI และจะมีการพูดคุยในเซสชัน LinkedIn Live Q&A วันที่ 4 ตุลาคม

1 ความคิดเห็น

 
GN⁺ 2023-09-21
ความคิดเห็นจาก Hacker News
  • Toyota Research Institute (TRI) ได้รับคำชื่นชมว่าได้สร้างความก้าวหน้าในการสอนพฤติกรรมใหม่ ๆ ให้กับหุ่นยนต์
  • แก่นสำคัญของความก้าวหน้านี้มาจาก Diffusion Policy ที่พัฒนาโดยห้องแล็บของศาสตราจารย์ Shuran Song แห่งมหาวิทยาลัยโคลัมเบีย ซึ่งปัจจุบันอยู่ที่มหาวิทยาลัยสแตนฟอร์ด
  • Diffusion Policy ได้รับความสนใจอย่างมากจากชุมชน และอาจคว้ารางวัลบทความยอดเยี่ยมในการประชุม R:SS ปีนี้
  • ศาสตราจารย์ Song ได้รับการยอมรับว่าเป็นผู้นำด้านหุ่นยนต์ที่มีหลายแนวทางซึ่งสามารถขยายไปสู่การประยุกต์ใช้ในโลกจริงได้
  • คอร์สออนไลน์ 'Underactuated Robotics' ของ Russ Tedrake ถูกแนะนำสำหรับการทำความเข้าใจความซับซ้อนของวิทยาการหุ่นยนต์
  • Google ก็มีโครงการลักษณะคล้ายกันที่มุ่งเน้นไปที่ force feedback และเซ็นเซอร์แรงกด
  • วิดีโอหุ่นยนต์กลับแพนเค้กของ Toyota Research ที่แสดงให้เห็นว่าหุ่นยนต์เรียนรู้ผ่านการสาธิตได้ ถูกมองว่าน่าประทับใจ
  • ผู้ใช้บางคนเปรียบเทียบงานของ TRI กับโครงการ PaLM-E ของ Google ซึ่งสะท้อนให้เห็นว่าเป็นช่วงเวลาที่น่าตื่นเต้นสำหรับวงการหุ่นยนต์
  • หุ่นยนต์มนุษย์ทั่วไปแบบอเนกประสงค์อาจทำได้สำเร็จด้วยการผสานเทคโนโลยี motion capture เข้ากับอัลกอริทึม machine learning
  • ผู้ใช้บางคนตั้งคำถามถึงความเป็นไปได้ในทางปฏิบัติของการดำรงตำแหน่งเต็มเวลาสองตำแหน่งพร้อมกัน เช่น กรณีที่ศาสตราจารย์ของ MIT ดำรงตำแหน่งรองประธานของ TRI ไปพร้อมกัน
  • มีความกังวลเกี่ยวกับความเสี่ยงที่อาจเกิดขึ้นจากการใช้ gen-AI ในงานหุ่นยนต์ โดยการเคลื่อนไหวที่ไม่คาดคิดอาจก่อให้เกิดความเสียหายหรือการบาดเจ็บได้