- โมเดลสร้าง วิดีโอ แบบหลายช็อตที่อิงจากข้อความและภาพ ซึ่งให้ ความแม่นยำและความยืดหยุ่นสูงกว่า โมเดลเดิมในด้านความเข้าใจความหมายและการตีความพรอมป์ต์
- มอบผลลัพธ์ที่มีความละเอียดสูงระดับ 1080p พร้อมด้วย การเปลี่ยนฉากที่ลื่นไหล รายละเอียดที่สมบูรณ์ และอารมณ์แบบภาพยนตร์
- ปรับปรุงประสิทธิภาพโดยรวมด้วย การฟाइनจูนอย่างละเอียด และ กลไกรางวัล RLHF ที่ออกแบบมาเฉพาะสำหรับวิดีโอ
- สามารถสร้างคอนเทนต์ภาพที่มีความเคลื่อนไหวและชวนดื่มด่ำ โดยอิงจากคำบรรยายข้อความหรือภาพให้ตรงตามเงื่อนไขที่ต้องการ
- รองรับทั้งการสร้างหลายช็อตและงานข้อความ→วิดีโอ/ภาพ→วิดีโอ ด้วย สถาปัตยกรรมที่มีประสิทธิภาพและกระบวนทัศน์การเรียนรู้แบบใหม่
แนะนำ Seedance 1.0
- ช่วงหลังมานี้ เทคโนโลยี การสร้างวิดีโอ กำลังพัฒนาอย่างรวดเร็วจากความก้าวหน้าครั้งใหญ่ของโมเดล diffusion
- แต่โมเดลเดิมส่วนใหญ่ยังคงมีปัญหาในการสร้างสมดุลระหว่าง การทำตามคำสั่ง (พรอมป์ต์) ความเป็นธรรมชาติของการเคลื่อนไหว และคุณภาพด้านภาพ
- Seedance 1.0 เป็นโมเดลพื้นฐานสำหรับ การสร้างวิดีโอ ที่นำการปรับปรุงทางเทคนิคสำคัญต่อไปนี้มาใช้
- (i) การเก็บรวบรวมข้อมูลจากหลายแหล่งพร้อมเพิ่ม คำบรรยายวิดีโอที่แม่นยำ ทำให้เรียนรู้ได้ครอบคลุมในหลายสถานการณ์
- (ii) สถาปัตยกรรมและกระบวนทัศน์การเรียนรู้ที่มีประสิทธิภาพ รองรับทั้งการสร้างหลายช็อต และงานข้อความ→วิดีโอ กับ ภาพ→วิดีโอ ไปพร้อมกัน
- (iii) การปรับแต่งหลังการประมวลผลที่เพิ่มประสิทธิภาพอย่างละเอียด: supervised fine-tuning ที่ประณีต, RLHF สำหรับวิดีโอโดยเฉพาะ และกลไกรางวัลหลายมิติ ช่วยยกระดับประสิทธิภาพโดยรวมอย่างมาก
- (iv) การเร่งความเร็วของโมเดล: เพิ่มความเร็วในการอนุมาน 10 เท่าด้วยการกลั่นหลายขั้นตอนและการปรับแต่งในระดับระบบ
- สามารถสร้าง วิดีโอ 1080p ความยาว 5 วินาที ได้ในเวลาเพียง 41.4 วินาทีบน NVIDIA-L20 GPU
- เมื่อเทียบกับโมเดลสร้างวิดีโอรุ่นล่าสุด โมเดลนี้โดดเด่นในด้าน ความยืดหยุ่นเชิงพื้นที่-เวลา ความเสถียรของโครงสร้าง การทำตามคำสั่งในสถานการณ์ซับซ้อนหลายรูปแบบ รวมถึงความสม่ำเสมอของการสร้างหลายช็อตและการเล่าเรื่อง
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
Tea. Earl Grey. Hot.ที่ออกมาจากเครื่องอย่างเป็นกลไกThe Wirelive modeที่สร้างวิดีโอได้แบบเรียลไทม์ทันทีตามเสียงของผู้ใช้AI textเขียนอยู่ ชายชราในคาเฟ่มีมือทะลุหมวกเบเรต์ และเด็กสาวที่หันกลับมาริมทะเลก็หมุนหัวเหมือนนกฮูกUnicornเจ้าสาวชราก้มตัวกับเจ้าสาวชราก้มลงเก็บเหรียญแยกกัน ตัวละครที่ออกมาก็ดูเหมือนคนละคนทุกครั้งOld manไม่ได้ดูแก่ขนาดนั้น (พร้อมแซวตัวเองเล่น ๆ ว่าอาจเป็นเพราะตัวเองแก่แล้วก็ได้)