"Generative Interactive Environments"
- เป็น foundation world model ที่ฝึกจากวิดีโอบนอินเทอร์เน็ต และสามารถสร้างโลกที่เล่นได้ซึ่งมีความหลากหลายไม่สิ้นสุดจากภาพสังเคราะห์/ภาพถ่าย/สเก็ตช์
- ฝึกด้วยชุดข้อมูลวิดีโออินเทอร์เน็ตขนาดใหญ่จากเกมแพลตฟอร์ม 2D และงานหุ่นยนต์ สามารถประยุกต์ใช้ได้กับทุกโดเมน และขยายต่อด้วยชุดข้อมูลจากอินเทอร์เน็ตได้
การเรียนรู้การควบคุมโดยไม่มีป้ายกำกับการกระทำ
- มีความสามารถในการเรียนรู้การควบคุมอย่างละเอียดจากวิดีโอบนอินเทอร์เน็ตเพียงอย่างเดียว ซึ่งเป็นเรื่องท้าทายเพราะวิดีโอบนอินเทอร์เน็ตไม่มีป้ายกำกับสำหรับการกระทำหรือส่วนของภาพที่ต้องควบคุม
- Genie สามารถอนุมานได้ว่าส่วนใดของสิ่งที่สังเกตได้โดยทั่วไปสามารถควบคุมได้ และอนุมานชุดการกระทำแฝงที่หลากหลายซึ่งสอดคล้องกันตลอดทั้งสภาพแวดล้อมที่สร้างขึ้น
เปิดทางให้กับผู้สร้างสรรค์ยุคใหม่
- สามารถสร้างสภาพแวดล้อมเชิงโต้ตอบใหม่ได้จากภาพเพียงภาพเดียว มอบวิธีใหม่ในการสร้างและเข้าไปสู่โลกเสมือน
- สามารถใช้โมเดลสร้างภาพจากข้อความสู่ภาพที่ล้ำสมัยเพื่อสร้างเฟรมเริ่มต้น แล้วให้ Genie เติมชีวิตจนกลายเป็นโลกเสมือน
- ยังสามารถสร้างสภาพแวดล้อมเสมือนได้จากสเก็ตช์หรือภาพจากโลกจริง
ก้าวสำคัญสำหรับเอเจนต์แบบทั่วไป (Generalist)
- แม้สภาพแวดล้อมของเกมจะเป็นสนามทดสอบที่มีประสิทธิภาพสำหรับการพัฒนา AI agent แต่ก็ถูกจำกัดด้วยจำนวนเกมที่มีให้ใช้งาน
- เมื่อใช้ Genie จะสามารถฝึก AI agent ในสภาพแวดล้อมใหม่ที่ถูกสร้างขึ้นได้อย่างไม่สิ้นสุด และพิสูจน์แล้วว่าการกระทำแฝงที่ Genie เรียนรู้สามารถถ่ายโอนไปยังสภาพแวดล้อมที่มนุษย์ออกแบบไว้จริงได้
อนาคตของโลกเสมือนที่ถูกสร้างขึ้น
- แม้เว็บไซต์นี้จะมุ่งเน้นผลลัพธ์ของเกมแพลตฟอร์มเป็นหลัก แต่ Genie เป็นวิธีวิทยาแบบทั่วไปที่สามารถนำไปใช้ได้กับหลายโดเมน
- Genie ยังสามารถจำลองวัตถุที่เปลี่ยนรูปได้ ซึ่งเป็นงานที่ท้าทายสำหรับซิมูเลเตอร์ที่มนุษย์ออกแบบซึ่งเรียนรู้จากข้อมูล
- คาดว่า Genie จะเปิดยุคที่สามารถสร้างโลกทั้งใบที่โต้ตอบได้จากภาพหรือข้อความ และจะเป็นตัวเร่งให้กับการฝึกเอเจนต์ AI แบบทั่วไปในอนาคต
1 ความคิดเห็น
เด็กแสบ Gemini
หมอนั่น Gemma
คนนั้น Genie