- วงการโรโบติกส์ดึงดูดเงินลงทุนสูงเป็นประวัติการณ์ 4.07 หมื่นล้านดอลลาร์ ในปี 2025 เพิ่มขึ้น 74% จากปีก่อน คิดเป็น 9% ของเงินทุนร่วมลงทุนทั้งหมด และก้าวขึ้นมาเป็นหนึ่งในภาคส่วนที่นำการลงทุนร่วมกับซอฟต์แวร์ AI
- Physical AI / AI เชิงกายภาพ คือเทคโนโลยีหลักที่ทำให้หุ่นยนต์สามารถเรียนรู้จากข้อมูลแทนกฎที่ตั้งโปรแกรมไว้ล่วงหน้า และทำงานได้ในโลกกายภาพ
- ต่างจากโมเดลภาษา โมเดล Physical AI ต้องอาศัย ข้อมูลหุ่นยนต์จริง จึงทำให้เกิดโอกาสในการยึดพื้นที่ล่วงหน้าเพื่อควบคุมตลาด
- มี มากกว่า 70 บริษัท กำลังแข่งขันกันใน 10 หมวดหมู่ของโมเดล Physical AI ครอบคลุมด้านข้อมูลและการจำลอง แนวทางของโมเดล ฟาวน์เดชันโมเดล และ observability
- การทำงานร่วมกันของหุ่นยนต์หลายตัวเป็นโจทย์หลักที่ยังไม่ถูกแก้ของ Physical AI และบริษัทที่แก้ได้ก่อนมีแนวโน้มจะเป็นผู้นำ การขยายตัวของฟลีตหุ่นยนต์อัตโนมัติในภาคอุตสาหกรรม
ประเด็นสำคัญ
- ข้อมูลฝึกแบบกรรมสิทธิ์คือความได้เปรียบทางการแข่งขันหลักของ Physical AI โดยบริษัทยักษ์ใหญ่ด้านเทคโนโลยีกำลังเดินหน้าเข้าถึงสิทธิ์ในข้อมูลผ่านการเข้าซื้อกิจการ
- Nvidia เข้าซื้อผู้ให้บริการข้อมูลสังเคราะห์ Gretel ในเดือนมีนาคม 2025 ด้วยมูลค่ากว่า 320 ล้านดอลลาร์
- Meta ลงทุนถือหุ้นมูลค่า 1.48 หมื่นล้านดอลลาร์ใน Scale บริษัทด้านโครงสร้างพื้นฐานข้อมูลและการพัฒนาโมเดล
- OpenAI พยายามเข้าซื้อ Medal เพื่อให้ได้มาซึ่งข้อมูลฝึก แต่ Medal ได้เปิดตัว General Intuition ซึ่งสร้างโมเดลจากข้อมูลดังกล่าว
- บริษัทที่ถือครองข้อมูลฝึกแบบกรรมสิทธิ์สามารถพัฒนาโมเดลที่เหนือกว่าได้ ขณะที่คู่แข่งต้องพึ่งการเข้าถึงผ่านไลเซนส์
- การได้มาซึ่งข้อมูลฝึกที่หลากหลายและมีคุณภาพสูงตั้งแต่เนิ่น ๆ คือกุญแจสู่การขยายเชิงพาณิชย์
- World model ช่วยให้หุ่นยนต์สามารถคาดการณ์และวางแผนได้อย่างอัตโนมัติ ซึ่งเป็นความสามารถที่โมเดลภาษาขนาดใหญ่ (LLM) ยังทำไม่ได้
- เงินลงทุนใน world model พุ่งจาก 1.4 พันล้านดอลลาร์ในปี 2024 เป็น 6.9 พันล้านดอลลาร์ ในปี 2025
- บริษัทในกลุ่มนี้มี คะแนน Mosaic เฉลี่ย 722 (อยู่ใน 3% แรกของทั้งตลาด)
- ความสำเร็จต้องอาศัยข้อมูลฝึกคุณภาพสูงจากสภาพแวดล้อมที่ควบคุมได้ และความร่วมมืออย่างใกล้ชิดกับผู้ผลิตฮาร์ดแวร์
- การทำงานร่วมกันของหุ่นยนต์หลายตัว ยังเป็นโจทย์หลักที่ยังไม่ได้รับการแก้ไขของ Physical AI
- บริษัทสหรัฐระดมทุนได้ มากกว่า 1.7 หมื่นล้านดอลลาร์ จาก 17 ดีล
- บริษัทจีนระดมทุนได้ 416 ล้านดอลลาร์ จาก 15 ดีล
- ทั้งสองภูมิภาคยังแทบมุ่งเน้นไปที่ความสามารถของหุ่นยนต์เดี่ยวเกือบทั้งหมด และมีเพียงไม่กี่บริษัทที่สร้าง ชั้น orchestration ที่จำเป็นต่อการให้หุ่นยนต์หลายประเภททำงานร่วมกัน
- บริษัทที่แก้ปัญหาการทำงานร่วมกันได้ก่อน อาจควบคุมการขยายตัวของฟลีตหุ่นยนต์อัตโนมัติในภาคอุตสาหกรรมได้
ภาพรวมหมวดหมู่
-
ข้อมูลและการจำลอง
- เป็นรากฐานของการฝึกหุ่นยนต์ โดยหุ่นยนต์ต้องใช้ข้อมูลฝึกจำนวนมาก แต่การเก็บข้อมูลจริงนั้นช้าและมีต้นทุนสูง
- ประกอบด้วย 3 ตลาดย่อย:
- ข้อมูลฝึกสังเคราะห์ — โรโบติกส์: เครื่องมือสำหรับสร้างชุดข้อมูลสังเคราะห์ เช่น ภาพ ข้อมูลเซนเซอร์ และฉาก 3D โดยไม่ต้องเก็บข้อมูลจริงที่มีราคาแพง
- ผู้ให้บริการข้อมูลการสาธิตหุ่นยนต์: บริษัทที่เก็บข้อมูลจริง เช่น ข้อมูลการควบคุมระยะไกล เส้นทางการเคลื่อนไหว และวิดีโอ เพื่อใช้กับการเรียนรู้แบบเลียนแบบ
- แพลตฟอร์มจำลองโรโบติกส์: สภาพแวดล้อมเสมือนสำหรับฝึก ทดสอบ และตรวจสอบหุ่นยนต์ก่อนนำไปใช้งานจริง
- ความขาดแคลนของข้อมูล เป็นคอขวดหลักของ Physical AI เนื่องจากต้นทุนและข้อจำกัดด้านการเข้าถึงทำให้ได้ข้อมูลฝึกจริงยาก
- ตลาดเหล่านี้มีคะแนน Mosaic เฉลี่ยราว 600 (อยู่ในครึ่งบนของตลาดด้านโมเมนตัม)
- 50% ของบริษัทเข้าสู่ระยะ deployment แล้ว สะท้อนว่าโครงสร้างพื้นฐานข้อมูลสำหรับ Physical AI กำลังเติบโตจากงานวิจัยไปสู่การใช้งานเชิงพาณิชย์
- หลายบริษัทพึ่งพาข้อมูลสังเคราะห์และการจำลอง โดย Nvidia เป็นผู้นำตลาด
- อย่างไรก็ตาม ข้อมูลสังเคราะห์เพียงอย่างเดียวไม่เพียงพอ และข้อมูลหุ่นยนต์จริงยังสำคัญต่อการฝึกโมเดลที่เชื่อถือได้
- Scale ได้รับเงินลงทุน 1.64 หมื่นล้านดอลลาร์ และอยู่ใน 1% แรกของคะแนน Mosaic
- Scale ผสานการสร้างข้อมูลสังเคราะห์เข้ากับการเก็บข้อมูลจริง (รวมถึงการควบคุมหุ่นยนต์จากมนุษย์ระยะไกลและข้อมูลเซนเซอร์จากสภาพแวดล้อมจริง) เพื่อขยายธุรกิจจากการติดป้ายข้อมูลไปสู่การพัฒนาโมเดล
- ผู้เล่นรายใหม่กำลังมองหาแหล่งข้อมูลแบบใหม่เพื่อแก้ปัญหาการขาดข้อมูลเดิม
- General Intuition ระดมทุน 134 ล้านดอลลาร์เพื่อฝึกโมเดลด้วยวิดีโอการเล่นเกมที่สามารถนำไปใช้กับระบบหุ่นยนต์ได้
- micro1 ได้รับเงินลงทุน 35 ล้านดอลลาร์ที่มูลค่ากิจการ 500 ล้านดอลลาร์ เพื่อสร้างชุดข้อมูลฝึกด้านโรโบติกส์ขนาดใหญ่ที่สุดในโลกจากวิดีโอปฏิสัมพันธ์ของมนุษย์
- หากไม่มีชุดข้อมูลแบบกรรมสิทธิ์หรือแพลตฟอร์มจำลอง บริษัทหุ่นยนต์อาจต้องซื้อไลเซนส์จากผู้นำตลาด หรือเสี่ยงตามหลังในข้อมูลสำคัญอย่างการสัมผัส แรงกด และการเคลื่อนไหวทางกายภาพ
-
แนวทางต่อโมเดล
- มอบความสามารถด้านการมองเห็น การใช้เหตุผล และการกระทำให้กับหุ่นยนต์ โดยแต่ละโมเดลสร้างต่อยอดบนอีกโมเดลหนึ่ง
- ทำให้หุ่นยนต์ปรับตัวกับงานใหม่ได้ แทนการเขียนโปรแกรมแบบตายตัว
- ประกอบด้วย 3 ตลาดย่อย:
- ผู้พัฒนา Vision-Language Model (VLM): โมเดลหลายรูปแบบที่รวมความเข้าใจภาพกับภาษาธรรมชาติ ทำหน้าที่เป็นชั้นการรับรู้ของหุ่นยนต์
- ผู้พัฒนา Vision-Language-Action (VLA) model: ระบบ AI ที่ต่อยอดจาก VLM โดยรวมการรับรู้ภาพ ความเข้าใจภาษา และการควบคุมการเคลื่อนไหว เพื่อแปลงคำสั่งเป็นการกระทำทางกายภาพโดยตรง
- ผู้พัฒนา World model AI: โมเดลที่จำลองการเปลี่ยนแปลงของสภาพแวดล้อมเพื่อคาดการณ์ความสัมพันธ์เชิงพื้นที่ กฎฟิสิกส์ และความเป็นเหตุเป็นผล
- Physical AI กำลังเปลี่ยนโรโบติกส์จากการเขียนโปรแกรมแบบฮาร์ดโค้ดไปสู่ ระบบที่ยืดหยุ่นและปรับตามงานได้ โดย VLA model กำลังกลายเป็นสถาปัตยกรรมหลัก
- บริษัทหุ่นยนต์ฮิวแมนนอยด์ชั้นนำอย่าง Figure, 1X, Galbot กำลังสร้าง VLA model แบบกรรมสิทธิ์
- บริษัทยักษ์ใหญ่อย่าง Nvidia และ Meta กำลังพัฒนาโมเดลเพื่อให้ผู้ผลิตหุ่นยนต์นำไปใช้ผ่านไลเซนส์เชิงพาณิชย์
- World model อาจเป็นนวัตกรรมที่แท้จริงด้วยการเพิ่มการใช้เหตุผลเชิงคาดการณ์
- บริษัทอย่าง World Labs และ Runway กำลังสร้าง world model
- ต่างจาก VLA ที่ตอบสนองต่ออินพุตทันที world model จะจำลองการเปลี่ยนแปลงของสภาพแวดล้อมตามเวลา
- ทำให้หุ่นยนต์คาดการณ์ผลลัพธ์ วางแผนการกระทำหลายขั้นตอน และฟื้นตัวจากข้อผิดพลาดได้
-
ฟาวน์เดชันโมเดล
- ผสานข้อมูลกับสถาปัตยกรรมเพื่อสร้างสติปัญญาหุ่นยนต์ที่ผ่านการพรีเทรนและสามารถรับรู้ ใช้เหตุผล และลงมือกระทำได้
- บางส่วนเป็นโมเดลทั่วไปสำหรับการจัดการวัตถุ และบางส่วนเป็นโมเดลเฉพาะทาง
- นักพัฒนาสามารถขอไลเซนส์เพื่อนำสติปัญญานี้ไปใช้ได้ โดยไม่ต้องสร้างทุกอย่างขึ้นใหม่ตั้งแต่ต้น
- ประกอบด้วย 3 ตลาดย่อย:
- ผู้พัฒนา Robot foundation model: โมเดลทั่วไปที่ช่วยให้หุ่นยนต์มองเห็น คิด และเคลื่อนไหวได้บนฮาร์ดแวร์หลากหลายประเภท
- ผู้พัฒนา Foundation model สำหรับการขับขี่อัตโนมัติ: ฝึกจากชุดข้อมูลการขับขี่ขนาดใหญ่เพื่อรวมการรับรู้ การคาดการณ์ การวางแผน และการควบคุม และใช้แทนระบบอัตโนมัติเดิมสำหรับโรโบแท็กซี่ รถบรรทุก และการส่งของ
- ผู้พัฒนาโมเดลการทำงานร่วมกันของหุ่นยนต์หลายตัว: อัลกอริทึมแบบหลายเอเจนต์ที่จัดการการแบ่งงาน การหลีกเลี่ยงการชน และการตัดสินใจแบบกระจาย เพื่อให้ฝูงหุ่นยนต์ทำงานร่วมกันได้
- ตลาดฟาวน์เดชันโมเดลมีความเคลื่อนไหวสูงมาก
- บริษัทยักษ์ใหญ่ด้านเทคโนโลยีของสหรัฐ (Microsoft, Google, Amazon) และผู้นำจีน (Huawei, Baidu) กำลังแข่งขันกับสตาร์ทอัพที่ถูกจับตาอย่าง DeepSeek และ Physical Intelligence
- หลายบริษัททำงานครอบคลุมฟาวน์เดชันโมเดลหลายประเภท
- ข้อมูลฝึกจากโดเมนหนึ่งสามารถช่วยยกระดับประสิทธิภาพของโมเดลในอีกโดเมนหนึ่งได้
- Nvidia เป็นบริษัทเดียวที่ทำงานในทั้ง 3 หมวดของฟาวน์เดชันโมเดล และกำลังวางตำแหน่งตนเองเป็นโครงสร้างพื้นฐานของสแต็ก Physical AI ทั้งหมด
- การทำงานร่วมกันของหุ่นยนต์หลายตัว คือแนวหน้าถัดไป
- เช่น สถานการณ์ในคลังสินค้าที่หุ่นยนต์ฮิวแมนนอยด์ หุ่นยนต์เคลื่อนที่อัตโนมัติ และรถยกอัตโนมัติทำงานร่วมกัน
- การทำงานร่วมกันของหุ่นยนต์หลายประเภทต้องมี ชั้น orchestration ที่จัดการงาน ทรัพยากร และการหลีกเลี่ยงการชนโดยไม่ต้องมีการควบคุมจากส่วนกลาง
- มีเพียงสตาร์ทอัพไม่กี่ราย (Field AI, Intrinsic) และบริษัทยักษ์ใหญ่บางรายเท่านั้นที่กำลังไล่ตามเรื่องนี้
- งานส่วนใหญ่ยังอยู่ในขั้นวิจัยมากกว่าการใช้งานเชิงพาณิชย์
- บริษัทที่มีโมเดลแบบกรรมสิทธิ์สามารถสร้างมาร์จินที่สูงกว่าได้ผ่านความแตกต่างและการบูรณาการแนวดิ่ง
- บริษัทที่ไลเซนส์ AI จากบุคคลที่สามอาจได้ประโยชน์จากต้นทุนที่ลดลงตามการกลายเป็นสินค้าโภคภัณฑ์ของโมเดล แต่ต้องแข่งขันด้วยความเร็วในการนำไปใช้และคุณภาพของการผสานระบบ มากกว่าด้วยเทคโนโลยีแกนหลัก
-
Observability
- จับภาพสิ่งที่เกิดขึ้นเมื่อหุ่นยนต์ทำงานจริงในโปรดักชัน เพื่อเชื่อมช่องว่างระหว่างการพัฒนาในห้องแล็บกับการนำไปใช้งานจริง
- แพลตฟอร์ม observability สำหรับโรโบติกส์: แพลตฟอร์มสำหรับมอนิเตอร์ ดีบัก และเพิ่มประสิทธิภาพหุ่นยนต์ทั้งในระหว่างพัฒนาและในโปรดักชัน
- เมื่อหุ่นยนต์ล้มเหลวหรือทำงานผิดคาด วิศวกรสามารถเล่นเหตุการณ์ย้อนหลัง หาสาเหตุ และส่งการแก้ไขกลับไปได้
- เคสขอบจริงจะถูกป้อนกลับเข้าสู่การจำลองและการฝึก เพื่อปรับปรุงโมเดลและเพิ่มประสิทธิภาพ
- Foxglove และ Formant เป็นตัวอย่างเด่น โดยติดตามประสิทธิภาพ วิเคราะห์ความล้มเหลว และป้อนอินไซต์จากการใช้งานกลับไปยังชุดข้อมูลฝึก การจำลอง และโมเดล
- บริษัทที่มี observability แข็งแกร่งสามารถเรียนรู้จากความล้มเหลวและปรับปรุงโมเดลได้อย่างรวดเร็ว
- สถานการณ์ที่ไม่คาดคิดจะถูกเปลี่ยนเป็นข้อได้เปรียบในการเรียนรู้ และเป็นปัจจัยสำคัญที่ แยกระบบพร้อมใช้งานจริงออกจากต้นแบบในห้องแล็บ
ยังไม่มีความคิดเห็น