Lumiere: โมเดลการแพร่เชิงกาลอวกาศสำหรับการสร้างวิดีโอที่สมจริง
(lumiere-video.github.io)ข้อความเป็นวิดีโอ
- ทีมวิจัยของ Google เปิดตัวโมเดลการแพร่จากข้อความเป็นวิดีโอชื่อ Lumiere
- โมเดลนี้มุ่งเน้นการสังเคราะห์วิดีโอที่แสดงการเคลื่อนไหวได้อย่างสมจริง หลากหลาย และสอดคล้องกัน
- ใช้สถาปัตยกรรม space-time U-Net เพื่อสร้างช่วงเวลาทั้งหมดของวิดีโอพร้อมกันในครั้งเดียว
ภาพเป็นวิดีโอ
- ด้วย Lumiere สามารถสร้างวิดีโอในสไตล์เป้าหมายได้โดยใช้ภาพอ้างอิงเพียงภาพเดียว
- ใช้น้ำหนักของโมเดลข้อความเป็นภาพที่ผ่านการปรับจูนละเอียด
การทำวิดีโอให้มีสไตล์
- ผ่าน Lumiere สามารถนำวิธีแก้ไขภาพแบบอิงข้อความที่มีอยู่มาใช้กับการตัดต่อวิดีโออย่างสอดคล้องกันได้
ซิเนมากราฟ
- โมเดล Lumiere สามารถทำให้เนื้อหาในภาพเคลื่อนไหวได้ภายในบริเวณเฉพาะที่ผู้ใช้กำหนด
การเติมเต็มวิดีโอ
- โมเดล Lumiere สามารถกู้คืนเนื้อหาของวิดีโอที่ถูกมาสก์ไว้เพื่อสร้างวิดีโอที่สมบูรณ์ได้
ผู้เขียนและคำขอบคุณ
- ทีมวิจัยประกอบด้วยผู้เขียนร่วมจาก Google Research และมหาวิทยาลัยหลายแห่ง
- ขอขอบคุณผู้เขียนที่มีส่วนร่วมกับงานวิจัยระหว่างการฝึกงาน ตลอดจนบุคคลต่างๆ ที่ให้ความร่วมมือและการสนับสนุน
GN⁺ ความเห็น:
- โมเดล Lumiere แสดงถึงความก้าวหน้าครั้งสำคัญในด้านการสังเคราะห์วิดีโอ ความสามารถในการสร้างวิดีโอที่มีการเคลื่อนไหวสมจริงและหลากหลายจะเป็นประโยชน์อย่างมากต่อผู้สร้างคอนเทนต์และผู้ตัดต่อวิดีโอ
- เทคโนโลยีนี้อาจมีส่วนช่วยเสริมพลังการเล่าเรื่องด้วยภาพ โดยเฉพาะในอุตสาหกรรมภาพยนตร์และโฆษณา และขยายขอบเขตการแสดงออกเชิงสร้างสรรค์
- การพัฒนา Lumiere เป็นตัวอย่างที่แสดงให้เห็นว่าเครื่องมือสร้างสรรค์ที่ขับเคลื่อนด้วยปัญญาประดิษฐ์กำลังเปลี่ยนแปลงงานสร้างสรรค์อย่างไร
1 ความคิดเห็น
ความเห็นบน Hacker News