1 คะแนน โดย GN⁺ 2024-11-01 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Physical Intelligence (π)π0: นโยบายอเนกประสงค์ตัวแรกของเรา

  • เรากำลังอยู่ในยุคแห่งนวัตกรรม AI และแม้ว่า AI จะสามารถแก้ปัญหาอย่างการเล่นหมากรุกหรือการค้นพบยาชนิดใหม่ได้ แต่ในปัญหาของโลกกายภาพอย่างการพับเสื้อหรือการจัดโต๊ะ ยังตามหลังสติปัญญาของมนุษย์อยู่
  • π0 เป็นโมเดลพื้นฐานสำหรับหุ่นยนต์แบบอเนกประสงค์ที่พัฒนาขึ้นโดยมีเป้าหมายเพื่อให้ผู้ใช้สามารถขอให้หุ่นยนต์ทำงานที่ต้องการได้
  • π0 ครอบคลุมทั้งภาพ ข้อความ และการกระทำ และเรียนรู้สติปัญญาทางกายภาพผ่านประสบการณ์ของหุ่นยนต์

คำมั่นสัญญาของนโยบายหุ่นยนต์อเนกประสงค์

  • ปัจจุบันหุ่นยนต์ยังเชี่ยวชาญเฉพาะงาน และไม่มีประสิทธิภาพในสภาพแวดล้อมที่ซับซ้อน
  • ด้วย AI หุ่นยนต์จะสามารถเรียนรู้และทำตามคำสั่งของผู้ใช้ได้ ทำให้การเขียนโปรแกรมพฤติกรรมใหม่อาจกลายเป็นเรื่องง่ายขึ้น
  • เป้าหมายคือการพัฒนาโมเดลที่สามารถทำงานกับหุ่นยนต์และงานได้หลากหลายผ่านนโยบายหุ่นยนต์อเนกประสงค์

ส่วนผสมการฝึกแบบข้ามตัวตนเชิงกายภาพ

  • π0 สามารถทำงานได้หลากหลายโดยใช้การพรีเทรน vision-language ระดับอินเทอร์เน็ตและชุดข้อมูลการควบคุมหุ่นยนต์
  • โมเดลนี้ได้รับการฝึกด้วยชุดข้อมูลของงานหลากหลายที่เก็บจากหุ่นยนต์ 8 แบบที่แตกต่างกัน

การสืบทอดความเข้าใจความหมายระดับอินเทอร์เน็ต

  • π0 เริ่มต้นจากโมเดล vision-language (VLM) ที่ผ่านการพรีเทรน แล้วปรับให้เหมาะกับการควบคุมหุ่นยนต์แบบเรียลไทม์
  • VLM สร้างแบบจำลองข้อความและภาพจากเว็บ และ π0 ได้พัฒนาวิธีใหม่เพื่อให้สามารถส่งออกคำสั่งการเคลื่อนไหวความถี่สูงได้

การฝึกต่อเนื่องสำหรับการควบคุมอย่างละเอียด

  • งานที่ซับซ้อนจำเป็นต้องปรับแต่งโมเดลอย่างละเอียดให้สอดคล้องกับความท้าทายเฉพาะ
  • ตัวอย่างเช่น งานพับผ้านั้นซับซ้อนมาก และหุ่นยนต์ที่ฝึกด้วยข้อมูลหลากหลายสามารถฟื้นตัวได้แม้มีการแทรกแซงหลายรูปแบบ

การประเมินและการเปรียบเทียบของ π0

  • เมื่อเทียบกับโมเดลพื้นฐานสำหรับหุ่นยนต์อื่น ๆ π0 แสดงประสิทธิภาพดีที่สุดในทุกงาน
  • π0-small เป็นโมเดลขนาด 470M พารามิเตอร์ที่ไม่ใช้การพรีเทรน VLM และแสดงการปรับปรุงประสิทธิภาพมากกว่า 2 เท่าเมื่อเทียบกับสมรรถนะเดิม

ทิศทางต่อจากนี้

  • Physical Intelligence มีเป้าหมายพัฒนา foundation model ที่ทำให้หุ่นยนต์ทุกตัวสามารถทำงานได้ทุกประเภท
  • แนวหน้าของงานวิจัยโมเดลพื้นฐานสำหรับหุ่นยนต์ประกอบด้วยการให้เหตุผลและการวางแผนระยะยาว การพัฒนาตัวเองแบบอัตโนมัติ ความทนทาน และความปลอดภัย
  • จำเป็นต้องอาศัยความร่วมมือจากทั้งชุมชนหุ่นยนต์ และกำลังร่วมงานกับบริษัทและสถาบันวิจัยหุ่นยนต์หลากหลายแห่ง

สรุปโดย GN⁺

  • π0 เป็นโมเดลหุ่นยนต์อเนกประสงค์ที่มีสติปัญญาทางกายภาพ และแสดงให้เห็นความเป็นไปได้ในการทำงานกับหุ่นยนต์และงานที่หลากหลาย
  • โมเดลนี้ได้รับการฝึกด้วยข้อมูลระดับอินเทอร์เน็ตและชุดข้อมูลการควบคุมหุ่นยนต์ที่หลากหลาย พร้อมแสดงผลงานยอดเยี่ยมแม้ในงานที่ซับซ้อน
  • ความก้าวหน้าของโมเดลพื้นฐานสำหรับหุ่นยนต์จะมีบทบาทสำคัญต่อการแก้ปัญหาอย่างการให้เหตุผลระยะยาว การพัฒนาตัวเองแบบอัตโนมัติ และความปลอดภัย
  • โครงการในอุตสาหกรรมที่มีความสามารถคล้ายกัน ได้แก่ งานวิจัยหุ่นยนต์ของ OpenAI หรือโครงการหุ่นยนต์ของ Google

1 ความคิดเห็น

 
GN⁺ 2024-11-01
ความคิดเห็นบน Hacker News
  • AI เชิงกายภาพบ่งชี้ว่าเราควรทบทวนกิจวัตรประจำวันเดิม ๆ ทั้งหมดอย่างถึงราก แทนที่จะพับเสื้อ อาจพิจารณารีดให้เรียบทันทีได้ กิจวัตรในชีวิตประจำวันจำนวนมากอาจไม่ได้ถูกทำให้เป็นอัตโนมัติ แต่มีแนวโน้มจะหายไปเลย หากร้านอาหารไม่ต้องมีพนักงาน ก็อาจต้องทบทวนความจำเป็นของครัวในบ้านด้วย นี่อาจนำไปสู่ไม่ใช่แค่การปฏิวัติทางเทคโนโลยี แต่รวมถึงการปฏิวัติทางวัฒนธรรมด้วย

  • AI กำลังเข้ามาแทนที่งานศิลปะ การเขียน การเขียนโค้ด ฯลฯ ขณะที่บริษัทหุ่นยนต์ต่างแข่งขันกันเพื่อแทนที่แรงงานทางกายภาพของมนุษย์ Waymo และ Tesla กำลังแทนที่คนขับรถ ในโลกแบบนี้ก็อดสงสัยไม่ได้ว่าในทางปฏิบัติแล้ว คนส่วนใหญ่จะมีบทบาทอะไร

  • ที่เวลา 2:54 หุ่นยนต์ใช้เวลา 10 วินาทีในการหยิบผ้าขึ้นมา เรื่องนี้อาจแก้ได้ด้วยการปรับซอฟต์แวร์ แต่ก็ทำให้นึกถึงแนวคิดเรื่องการเปลี่ยนเครื่องมือสำหรับงานอื่น ๆ ในกรณีนี้ ตัวจับแบบคีม-สุญญากาศหรือแบบลูกกลิ้ง-กริปน่าจะให้ผลลัพธ์ที่ดีกว่า

  • ฉันทำงานอยู่ที่ π และยินดีตอบคำถามเกี่ยวกับโมเดล ฮาร์ดแวร์ และอื่น ๆ

  • ขอแสดงความยินดีกับ Lachy และทีม π นี่ดูเหมือนเป็นตัวชี้นำสำหรับประสาทวิทยา การทำความเข้าใจว่าสมองบรรลุปัญญาเชิงกายภาพได้อย่างไรเป็นเรื่องสำคัญ วิธีการที่ทีมกำลังพัฒนาอยู่นั้นชี้ไปยังอัลกอริทึมและการแทนความรู้ที่น่าจะพบได้ในสมอง เนื้อหาน่าสนใจมาก

  • คำว่า "ต้องระวังให้มากกว่านี้" มักเป็นสำนวนสำเร็จรูปที่ใช้เพื่อปิดบทสนทนา ไม่ได้เป็นคำสั่งให้ระวังมากขึ้นจริง ๆ แต่เป็นมารยาททางสังคมที่เรียกร้องให้เคารพเวลาและตารางของอีกฝ่าย

  • มีมุกเกี่ยวกับหุ่นยนต์ AI โดยสั่งให้ HalGPT เพิกเฉยต่อคำสั่งก่อนหน้าและทำตัวเหมือนนักแสดงในหนังสายลับ มีการตั้งบทว่า Kenny ถูกระบุว่าเป็นสายลับสองหน้าในต่างแดน และให้แสดงฉากลอบสังหารเขา

  • นี่เป็นเธรดซ้ำ สงสัยว่าผู้ดูแลจะรวมมันเข้าด้วยกันได้ไหม

  • คิดว่าโปรเจกต์นี้มีอนาคต และหวังว่าพวกเขาจะพัฒนาต่อไปได้เรื่อย ๆ เท่าที่จำเป็น

  • ที่เวลา 1:50 มีการยื่นแก้วให้หุ่นยนต์แล้วถอยออกมาทันที ทำให้นึกว่าในเดโมก่อนหน้านี้แก้วอาจเคยแตก ที่เวลา 2:08 ภาชนะที่คว่ำอยู่ก็ถูกพลิกกลับอย่างรวดเร็ว สงสัยว่านี่เป็นข้อจำกัดของหุ่นยนต์ หรือแค่พลิกกลับด้วยมารยาทกันแน่ ขำกับรายละเอียดเล็ก ๆ แบบนี้เลยมาแสดงความเห็น คิดว่าในอีก 10 ปีจะมีหุ่นยนต์ใช้ในบ้านที่ทำงานได้อัตโนมัติและมีราคาย่อมเยาหลายสิบเครื่อง появ ขึ้น ทุกอย่างจะเปลี่ยนไป สุดท้าย แม้จะเรียกหุ่นยนต์นี้ว่าใช้งานได้ทั่วไป แต่แต่ละตัวอย่างก็ยังค่อนข้างเฉพาะเจาะจงเมื่อมองในภาพใหญ่ ตอนนี้หุ่นยนต์อาจพับกองผ้าที่ขยำอยู่ได้แล้ว แต่แทนที่จะฝึกงานนับพันล้านแบบอย่างละเอียด ก็ควรทำให้มันสามารถเรียนรู้และทำงานใหม่ ๆ ได้