- DeepMind เปิดตัว Scalable Instructable Multiworld Agent (SIMA)
-
- Google DeepMind มีประวัติอันยาวนานในด้าน AI และเกม ตั้งแต่เกม Atari ไปจนถึงระบบ AlphaStar ที่เล่น StarCraft II ได้ในระดับแกรนด์มาสเตอร์ของมนุษย์
- SIMA เป็นเอเจนต์ AI แบบทั่วไปสำหรับสภาพแวดล้อมเสมือน 3 มิติ ที่สามารถทำตามคำสั่งภาษาธรรมชาติในสภาพแวดล้อมวิดีโอเกมที่หลากหลายได้
- งานวิจัยครั้งนี้มีเป้าหมายเพื่อเปลี่ยนจากการมุ่งเน้นที่เกมเฉพาะเกม ไปสู่เอเจนต์ AI สำหรับการเล่นเกมแบบทั่วไปที่สามารถสั่งการได้
- ได้รับการฝึกบนวิดีโอเกมหลายเกมผ่านความร่วมมือกับนักพัฒนาเกมหลากหลายราย
- แสดงให้เห็นเป็นครั้งแรกว่าเอเจนต์ AI สามารถเข้าใจโลกของเกมที่กว้างขวาง และทำงานภายในนั้นตามคำสั่งภาษาธรรมชาติได้
เรียนรู้จากวิดีโอเกม
- SIMA ถูกฝึกและทดสอบบนวิดีโอเกมที่หลากหลาย 9 เกม รวมถึง No Man’s Sky ของ Hello Games และ Teardown ของ Tuxedo Labs
- เพื่อให้ได้สัมผัสกับสภาพแวดล้อมที่หลากหลาย DeepMind จึงร่วมมือกับนักพัฒนาเกมและจับมือเป็นพาร์ตเนอร์กับสตูดิโอเกม 8 แห่ง
- SIMA เรียนรู้ทักษะที่หลากหลาย ตั้งแต่การสำรวจแบบง่าย การใช้เมนู ไปจนถึงการขุดทรัพยากร การบังคับยานอวกาศ และการสร้างหมวกกันน็อก
- ยังถูกใช้งานในสภาพแวดล้อมเพื่อการวิจัย 4 แห่ง รวมถึง Construction Lab ซึ่งเป็นสภาพแวดล้อมใหม่ที่สร้างด้วย Unity
SIMA: เอเจนต์ AI อเนกประสงค์
- SIMA เป็นเอเจนต์ AI ที่สามารถรับรู้และเข้าใจสภาพแวดล้อมที่หลากหลาย จากนั้นลงมือทำเพื่อบรรลุเป้าหมายที่ได้รับคำสั่ง
- ประกอบด้วยโมเดลสำหรับการแมปภาพกับภาษาอย่างแม่นยำ และโมเดลวิดีโอที่ทำนายสิ่งที่จะเกิดขึ้นต่อไปบนหน้าจอ
- ไม่จำเป็นต้องเข้าถึงซอร์สโค้ดของเกมหรือ API เฉพาะใด ๆ โดยต้องการเพียงภาพจากหน้าจอและคำสั่งภาษาธรรมชาติแบบสั้น ๆ จากผู้ใช้
- SIMA ใช้เอาต์พุตจากคีย์บอร์ดและเมาส์เพื่อควบคุมตัวละครหลักของเกมและทำตามคำสั่งเหล่านี้
การทำให้ใช้งานได้ทั่วไปในเกมและสภาพแวดล้อมอื่น ๆ
- เอเจนต์ที่ฝึกจากหลายเกมแสดงประสิทธิภาพได้ดีกว่าเอเจนต์ที่ฝึกจากเกมเดียว
- ยังต้องมีการวิจัยเพิ่มเติมเพื่อให้สามารถแสดงประสิทธิภาพระดับมนุษย์ได้ ทั้งในสภาพแวดล้อมที่เคยฝึกและสภาพแวดล้อมที่ไม่เคยเห็นมาก่อน
- ประสิทธิภาพของ SIMA ขึ้นอยู่กับภาษา และหากไม่มีการฝึกด้านภาษาหรือไม่มีคำสั่ง มันจะยังพอทำงานได้แต่ไร้เป้าหมาย
ความก้าวหน้าในการวิจัยเอเจนต์ AI
- ผลลัพธ์ของ SIMA แสดงให้เห็นถึงศักยภาพของการพัฒนาเอเจนต์ AI แบบทั่วไปที่อิงกับภาษา
- นี่เป็นงานวิจัยระยะเริ่มต้น และคาดว่าจะพัฒนา SIMA ให้ก้าวหน้าขึ้นด้วยการรวมสภาพแวดล้อมการฝึกที่มากขึ้นและโมเดลที่มีความสามารถมากขึ้น
- เป้าหมายสุดท้ายคือการสร้างระบบและเอเจนต์ AI แบบทั่วไปที่สามารถเข้าใจและปฏิบัติงานที่หลากหลายได้อย่างปลอดภัย เพื่อเป็นประโยชน์ต่อผู้คนทั้งในโลกออนไลน์และโลกจริง
ความเห็นของ GN⁺
- SIMA เป็นงานวิจัยสำคัญที่แสดงให้เห็นความสามารถของ AI ในการเข้าใจคำสั่งและลงมือทำได้เหมือนมนุษย์ในสภาพแวดล้อมที่หลากหลาย
- งานวิจัยลักษณะนี้อาจเปิดทางสู่อนาคตที่ AI ไม่ได้แค่ทำงานง่าย ๆ แต่สามารถทำการวางแผนเชิงกลยุทธ์ที่ซับซ้อนและทำงานหลายอย่างพร้อมกันได้
- อย่างไรก็ตาม AI ยังต้องการการวิจัยและพัฒนาอีกมากกว่าจะไปถึงระดับประสิทธิภาพของมนุษย์
- จำเป็นต้องมีการถกเถียงว่าเทคโนโลยีนี้จะนำไปใช้แก้ปัญหาในโลกจริงได้อย่างไร และความสามารถในการทำให้ใช้งานได้ทั่วไปของ AI อาจมีข้อจำกัดอะไรบ้าง
- โครงการ AI อื่นที่มีความสามารถคล้ายกันคือ OpenAI Gym ซึ่งเป็นแพลตฟอร์ม AI ที่สามารถเรียนรู้จากวิดีโอเกมหลากหลายประเภทได้
1 ความคิดเห็น
ความเห็นจาก Hacker News