- Sora เป็นโมเดล AI ที่สร้างฉากสมจริงและเปี่ยมจินตนาการตามคำสั่งข้อความ
- สามารถสร้างวิดีโอความยาวสูงสุด 1 นาที โดยคงคุณภาพด้านภาพไว้พร้อมตอบสนองต่อพรอมป์ต์ของผู้ใช้อย่างซื่อตรง
- แนะนำตัวอย่างวิดีโอที่สร้างขึ้นตามพรอมป์ต์หลากหลายรูปแบบซึ่งให้สถานการณ์อย่างละเอียด
- วิดีโอทั้งหมดในหน้านี้สร้างโดย Sora โดยตรงและไม่ได้ผ่านการแก้ไขใด ๆ
- ขณะนี้ Sora ถูกส่งให้ทีม 'red team' ใช้เพื่อประเมินความเสี่ยง และกำลังรับฟีดแบ็กจากศิลปินภาพ นักออกแบบ และผู้สร้างภาพยนตร์
- OpenAI ต้องการแบ่งปันความคืบหน้าของงานวิจัยเพื่อรับฟีดแบ็กจากคนนอก และแสดงให้สาธารณชนเห็นอนาคตของความสามารถด้าน AI
ความสามารถของ Sora
- สามารถสร้างฉากที่ซับซ้อน มีตัวละครหลายตัว การเคลื่อนไหวเฉพาะ และรายละเอียดที่แม่นยำของทั้งตัวแบบและฉากหลัง
- เข้าใจไม่เพียงแค่พรอมป์ต์ของผู้ใช้ แต่ยังเข้าใจการดำรงอยู่ของสิ่งต่าง ๆ ในโลกกายภาพด้วย
ความปลอดภัยของ Sora
- OpenAI มีแผนจะใช้มาตรการด้านความปลอดภัยหลายอย่างก่อนนำ Sora ไปผนวกรวมเข้ากับผลิตภัณฑ์ของ OpenAI
- รวมถึงการพัฒนาเครื่องมือสำหรับตรวจจับเนื้อหาที่อาจทำให้เข้าใจผิด และการพัฒนาตัวจำแนกที่สามารถระบุได้ว่าวิดีโอนั้นถูกสร้างโดย Sora หรือไม่
เทคโนโลยีการวิจัย
- Sora เป็นโมเดล diffusion ที่เริ่มจากวิดีโอที่เต็มไปด้วย noise แล้วค่อย ๆ ลบ noise ออกเพื่อสร้างวิดีโอ
- ใช้สถาปัตยกรรม transformer ที่คล้ายกับโมเดล GPT จึงให้ความสามารถในการขยายขนาดที่ยอดเยี่ยม
ความเห็นของ GN⁺
- Sora เป็นเทคโนโลยี AI เชิงนวัตกรรมที่สร้างวิดีโอจากคำสั่งข้อความ และมอบความเป็นไปได้ใหม่ ๆ ให้กับผู้เชี่ยวชาญสายสร้างสรรค์
- การใช้มาตรการความปลอดภัยและฟีดแบ็กเพื่อเรียนรู้การใช้งานในโลกจริง มีบทบาทสำคัญต่อการทำให้ระบบ AI ปลอดภัยมากขึ้นอย่างค่อยเป็นค่อยไป
- เทคโนโลยีนี้ดูมีแนวโน้มจะเป็นหมุดหมายสำคัญสำหรับการบรรลุ AGI (ปัญญาประดิษฐ์ทั่วไป) ในอนาคต
6 ความคิดเห็น
ได้แต่ร้องว้าวจริง ๆ เลยนะ
คงระดมทุนได้ 7 ล้านล้านแน่เลย...?
ถ้ามองผ่าน ๆ ก็คงแยกไม่ออกว่าเป็นวิดีโอจริงหรือวิดีโอที่ AI สร้างขึ้น
ว้าว... อยากลองใช้เร็ว ๆ แล้ว
โมเดลแบบ diffusion นี่หมายถึงเป็นวิธีเดียวกับ stable diffusion ใช่ไหมครับ?
ตลาด stock photo กับ stock video คงลำบากกันน่าดู..
คุณภาพของการสร้างนั้นน่าทึ่งมากเลยนะ พัฒนาได้เร็วขนาดนี้เลยเหรอ
ความเห็นจาก Hacker News