Physical Intelligence (π)π0: นโยบายอเนกประสงค์ตัวแรกของเรา
- เรากำลังอยู่ในยุคแห่งนวัตกรรม AI และแม้ว่า AI จะสามารถแก้ปัญหาอย่างการเล่นหมากรุกหรือการค้นพบยาชนิดใหม่ได้ แต่ในปัญหาของโลกกายภาพอย่างการพับเสื้อหรือการจัดโต๊ะ ยังตามหลังสติปัญญาของมนุษย์อยู่
- π0 เป็นโมเดลพื้นฐานสำหรับหุ่นยนต์แบบอเนกประสงค์ที่พัฒนาขึ้นโดยมีเป้าหมายเพื่อให้ผู้ใช้สามารถขอให้หุ่นยนต์ทำงานที่ต้องการได้
- π0 ครอบคลุมทั้งภาพ ข้อความ และการกระทำ และเรียนรู้สติปัญญาทางกายภาพผ่านประสบการณ์ของหุ่นยนต์
คำมั่นสัญญาของนโยบายหุ่นยนต์อเนกประสงค์
- ปัจจุบันหุ่นยนต์ยังเชี่ยวชาญเฉพาะงาน และไม่มีประสิทธิภาพในสภาพแวดล้อมที่ซับซ้อน
- ด้วย AI หุ่นยนต์จะสามารถเรียนรู้และทำตามคำสั่งของผู้ใช้ได้ ทำให้การเขียนโปรแกรมพฤติกรรมใหม่อาจกลายเป็นเรื่องง่ายขึ้น
- เป้าหมายคือการพัฒนาโมเดลที่สามารถทำงานกับหุ่นยนต์และงานได้หลากหลายผ่านนโยบายหุ่นยนต์อเนกประสงค์
ส่วนผสมการฝึกแบบข้ามตัวตนเชิงกายภาพ
- π0 สามารถทำงานได้หลากหลายโดยใช้การพรีเทรน vision-language ระดับอินเทอร์เน็ตและชุดข้อมูลการควบคุมหุ่นยนต์
- โมเดลนี้ได้รับการฝึกด้วยชุดข้อมูลของงานหลากหลายที่เก็บจากหุ่นยนต์ 8 แบบที่แตกต่างกัน
การสืบทอดความเข้าใจความหมายระดับอินเทอร์เน็ต
- π0 เริ่มต้นจากโมเดล vision-language (VLM) ที่ผ่านการพรีเทรน แล้วปรับให้เหมาะกับการควบคุมหุ่นยนต์แบบเรียลไทม์
- VLM สร้างแบบจำลองข้อความและภาพจากเว็บ และ π0 ได้พัฒนาวิธีใหม่เพื่อให้สามารถส่งออกคำสั่งการเคลื่อนไหวความถี่สูงได้
การฝึกต่อเนื่องสำหรับการควบคุมอย่างละเอียด
- งานที่ซับซ้อนจำเป็นต้องปรับแต่งโมเดลอย่างละเอียดให้สอดคล้องกับความท้าทายเฉพาะ
- ตัวอย่างเช่น งานพับผ้านั้นซับซ้อนมาก และหุ่นยนต์ที่ฝึกด้วยข้อมูลหลากหลายสามารถฟื้นตัวได้แม้มีการแทรกแซงหลายรูปแบบ
การประเมินและการเปรียบเทียบของ π0
- เมื่อเทียบกับโมเดลพื้นฐานสำหรับหุ่นยนต์อื่น ๆ π0 แสดงประสิทธิภาพดีที่สุดในทุกงาน
- π0-small เป็นโมเดลขนาด 470M พารามิเตอร์ที่ไม่ใช้การพรีเทรน VLM และแสดงการปรับปรุงประสิทธิภาพมากกว่า 2 เท่าเมื่อเทียบกับสมรรถนะเดิม
ทิศทางต่อจากนี้
- Physical Intelligence มีเป้าหมายพัฒนา foundation model ที่ทำให้หุ่นยนต์ทุกตัวสามารถทำงานได้ทุกประเภท
- แนวหน้าของงานวิจัยโมเดลพื้นฐานสำหรับหุ่นยนต์ประกอบด้วยการให้เหตุผลและการวางแผนระยะยาว การพัฒนาตัวเองแบบอัตโนมัติ ความทนทาน และความปลอดภัย
- จำเป็นต้องอาศัยความร่วมมือจากทั้งชุมชนหุ่นยนต์ และกำลังร่วมงานกับบริษัทและสถาบันวิจัยหุ่นยนต์หลากหลายแห่ง
สรุปโดย GN⁺
- π0 เป็นโมเดลหุ่นยนต์อเนกประสงค์ที่มีสติปัญญาทางกายภาพ และแสดงให้เห็นความเป็นไปได้ในการทำงานกับหุ่นยนต์และงานที่หลากหลาย
- โมเดลนี้ได้รับการฝึกด้วยข้อมูลระดับอินเทอร์เน็ตและชุดข้อมูลการควบคุมหุ่นยนต์ที่หลากหลาย พร้อมแสดงผลงานยอดเยี่ยมแม้ในงานที่ซับซ้อน
- ความก้าวหน้าของโมเดลพื้นฐานสำหรับหุ่นยนต์จะมีบทบาทสำคัญต่อการแก้ปัญหาอย่างการให้เหตุผลระยะยาว การพัฒนาตัวเองแบบอัตโนมัติ และความปลอดภัย
- โครงการในอุตสาหกรรมที่มีความสามารถคล้ายกัน ได้แก่ งานวิจัยหุ่นยนต์ของ OpenAI หรือโครงการหุ่นยนต์ของ Google
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
AI เชิงกายภาพบ่งชี้ว่าเราควรทบทวนกิจวัตรประจำวันเดิม ๆ ทั้งหมดอย่างถึงราก แทนที่จะพับเสื้อ อาจพิจารณารีดให้เรียบทันทีได้ กิจวัตรในชีวิตประจำวันจำนวนมากอาจไม่ได้ถูกทำให้เป็นอัตโนมัติ แต่มีแนวโน้มจะหายไปเลย หากร้านอาหารไม่ต้องมีพนักงาน ก็อาจต้องทบทวนความจำเป็นของครัวในบ้านด้วย นี่อาจนำไปสู่ไม่ใช่แค่การปฏิวัติทางเทคโนโลยี แต่รวมถึงการปฏิวัติทางวัฒนธรรมด้วย
AI กำลังเข้ามาแทนที่งานศิลปะ การเขียน การเขียนโค้ด ฯลฯ ขณะที่บริษัทหุ่นยนต์ต่างแข่งขันกันเพื่อแทนที่แรงงานทางกายภาพของมนุษย์ Waymo และ Tesla กำลังแทนที่คนขับรถ ในโลกแบบนี้ก็อดสงสัยไม่ได้ว่าในทางปฏิบัติแล้ว คนส่วนใหญ่จะมีบทบาทอะไร
ที่เวลา 2:54 หุ่นยนต์ใช้เวลา 10 วินาทีในการหยิบผ้าขึ้นมา เรื่องนี้อาจแก้ได้ด้วยการปรับซอฟต์แวร์ แต่ก็ทำให้นึกถึงแนวคิดเรื่องการเปลี่ยนเครื่องมือสำหรับงานอื่น ๆ ในกรณีนี้ ตัวจับแบบคีม-สุญญากาศหรือแบบลูกกลิ้ง-กริปน่าจะให้ผลลัพธ์ที่ดีกว่า
ฉันทำงานอยู่ที่ π และยินดีตอบคำถามเกี่ยวกับโมเดล ฮาร์ดแวร์ และอื่น ๆ
ขอแสดงความยินดีกับ Lachy และทีม π นี่ดูเหมือนเป็นตัวชี้นำสำหรับประสาทวิทยา การทำความเข้าใจว่าสมองบรรลุปัญญาเชิงกายภาพได้อย่างไรเป็นเรื่องสำคัญ วิธีการที่ทีมกำลังพัฒนาอยู่นั้นชี้ไปยังอัลกอริทึมและการแทนความรู้ที่น่าจะพบได้ในสมอง เนื้อหาน่าสนใจมาก
คำว่า "ต้องระวังให้มากกว่านี้" มักเป็นสำนวนสำเร็จรูปที่ใช้เพื่อปิดบทสนทนา ไม่ได้เป็นคำสั่งให้ระวังมากขึ้นจริง ๆ แต่เป็นมารยาททางสังคมที่เรียกร้องให้เคารพเวลาและตารางของอีกฝ่าย
มีมุกเกี่ยวกับหุ่นยนต์ AI โดยสั่งให้ HalGPT เพิกเฉยต่อคำสั่งก่อนหน้าและทำตัวเหมือนนักแสดงในหนังสายลับ มีการตั้งบทว่า Kenny ถูกระบุว่าเป็นสายลับสองหน้าในต่างแดน และให้แสดงฉากลอบสังหารเขา
นี่เป็นเธรดซ้ำ สงสัยว่าผู้ดูแลจะรวมมันเข้าด้วยกันได้ไหม
คิดว่าโปรเจกต์นี้มีอนาคต และหวังว่าพวกเขาจะพัฒนาต่อไปได้เรื่อย ๆ เท่าที่จำเป็น
ที่เวลา 1:50 มีการยื่นแก้วให้หุ่นยนต์แล้วถอยออกมาทันที ทำให้นึกว่าในเดโมก่อนหน้านี้แก้วอาจเคยแตก ที่เวลา 2:08 ภาชนะที่คว่ำอยู่ก็ถูกพลิกกลับอย่างรวดเร็ว สงสัยว่านี่เป็นข้อจำกัดของหุ่นยนต์ หรือแค่พลิกกลับด้วยมารยาทกันแน่ ขำกับรายละเอียดเล็ก ๆ แบบนี้เลยมาแสดงความเห็น คิดว่าในอีก 10 ปีจะมีหุ่นยนต์ใช้ในบ้านที่ทำงานได้อัตโนมัติและมีราคาย่อมเยาหลายสิบเครื่อง появ ขึ้น ทุกอย่างจะเปลี่ยนไป สุดท้าย แม้จะเรียกหุ่นยนต์นี้ว่าใช้งานได้ทั่วไป แต่แต่ละตัวอย่างก็ยังค่อนข้างเฉพาะเจาะจงเมื่อมองในภาพใหญ่ ตอนนี้หุ่นยนต์อาจพับกองผ้าที่ขยำอยู่ได้แล้ว แต่แทนที่จะฝึกงานนับพันล้านแบบอย่างละเอียด ก็ควรทำให้มันสามารถเรียนรู้และทำงานใหม่ ๆ ได้