- ทีม Seed ของ ByteDance เปิดตัว โมเดลสร้างวิดีโอมัลติโหมดรุ่นถัดไป ที่รองรับอินพุตแบบข้อความ·ภาพ·เสียง·วิดีโอแบบครบวงจร
- ความแม่นยำทางฟิสิกส์และความสมจริง ได้รับการยกระดับ ทำให้คงเสถียรภาพและความสอดคล้องได้สูงแม้ในฉากการโต้ตอบของตัวละครที่ซับซ้อนและฉากการเคลื่อนไหว
- รองรับการป้อนข้อมูลพร้อมกันสูงสุด ภาพ 9 ภาพ·วิดีโอ 3 รายการ·เสียง 3 รายการ เพื่อสะท้อนองค์ประกอบด้านคอมโพสิชัน·การเคลื่อนไหว·เอฟเฟกต์พิเศษ·เสียง และสามารถ ควบคุมได้อย่างละเอียด ผ่านความสามารถแก้ไขและขยายวิดีโอ
- รองรับ เอาต์พุตหลายกล้องคุณภาพสูงความยาว 15 วินาที และ เสียงสเตอริโอ ช่วยเพิ่ม ประสิทธิภาพการผลิตคอนเทนต์ระดับอุตสาหกรรม อย่างมากสำหรับภาพยนตร์·โฆษณา·เกม และงานอื่น ๆ
- ในการประเมินภาพรวมทำผลงานได้ในระดับ คุณภาพการสร้างและการทำตามพรอมป์ต์ชั้นนำของอุตสาหกรรม และมีแผนจะปรับปรุงเสถียรภาพในรายละเอียดรวมถึงความสอดคล้องของหลายตัวละครต่อไป
ภาพรวมของ Seedance 2.0
- Seedance 2.0 ที่เปิดตัวเมื่อวันที่ 12 กุมภาพันธ์ 2026 เป็น โมเดลสร้างเสียงและวิดีโอมัลติโหมดแบบบูรณาการ ของ ByteDance
- ประมวลผลอินพุต 4 ประเภทพร้อมกัน ได้แก่ ข้อความ ภาพ เสียง และวิดีโอ
- เมื่อเทียบกับเวอร์ชัน 1.5 เดิม ทั้งคุณภาพการสร้าง ความแม่นยำทางฟิสิกส์ ความสมจริง และความสามารถในการควบคุม ล้วนดีขึ้น
- มุ่งเป้าไปที่การผลิตวิดีโอระดับอุตสาหกรรม โดยรองรับ ความยาววิดีโอ 15 วินาที, หลายกล้อง, และ เสียงสเตอริโอ
- ขณะนี้สามารถทดลองใช้งานได้บนแพลตฟอร์มอย่าง Jimeng AI, Doubao(豆包) เป็นต้น
ฟีเจอร์หลักและจุดเด่นทางเทคนิค
- เสริมความเสถียรของการเคลื่อนไหวและการโต้ตอบที่ซับซ้อน
- จำลองการเคลื่อนไหวของหลายตัวละครและกฎทางฟิสิกส์ได้อย่างเป็นธรรมชาติ
- ตัวอย่างเช่น ใน ฉากฟิกเกอร์สเก็ตของคนสองคน สามารถถ่ายทอดการกระโดด·หมุน·ลงพื้นได้อย่างสมจริง
- ขยายอินพุตมัลติโหมด
- รองรับการป้อนแบบผสมได้สูงสุด 9 ภาพ, 3 วิดีโอ, 3 เสียง และคำสั่งภาษาธรรมชาติ
- สร้างผลลัพธ์โดยสะท้อน องค์ประกอบด้านองค์ประกอบภาพ·การเคลื่อนไหว·การเคลื่อนกล้อง·เอฟเฟกต์พิเศษ·เสียง จากข้อมูลอินพุต
- การควบคุมอย่างละเอียดและความสามารถในการแก้ไข
- ปรับปรุงความสอดคล้องกับพรอมป์ต์ และถ่ายทอดสคริปต์ที่ซับซ้อนได้อย่างแม่นยำ
- ด้วยฟังก์ชัน ขยายวิดีโอ·แก้ไขบางส่วน จึงสามารถปรับฉาก·ตัวละคร·การกระทำได้
- การสร้างเสียงคุณภาพสูง
- สร้างเสียงบรรยากาศ·เอฟเฟกต์เสียง·คำบรรยายได้พร้อมกันในรูปแบบ สเตอริโอสองแชนเนล
- สามารถถ่ายทอดเนื้อสัมผัสของเสียงอย่างละเอียดและซิงก์กับภาพได้ในฉากอย่าง ASMR·ฉากกำลังภายใน
- ความสามารถในการประยุกต์ใช้ในอุตสาหกรรมโดยรวม
- รองรับสภาพแวดล้อมการผลิตที่หลากหลาย เช่น โฆษณา ภาพยนตร์ เกม และวิดีโอบรรยาย
- ด้วย AI ช่วย ลดต้นทุนเอฟเฟกต์พิเศษ·การถ่ายทำ และย่นระยะเวลาการผลิต
การประเมินประสิทธิภาพ
- คุณภาพการสร้างวิดีโอ
- อยู่ในระดับแนวหน้าของอุตสาหกรรมในด้านเสถียรภาพของการเคลื่อนไหว การทำตามพรอมป์ต์ และความสมบูรณ์ทางสุนทรียะ
- แสดงการเคลื่อนไหวที่ซับซ้อน สีหน้า และการกำกับกล้องได้อย่างละเอียดแม่นยำ
- ยังมีบางจุดที่ต้องปรับปรุงในด้านเสถียรภาพเชิงรายละเอียดและความมีชีวิตชีวาแบบไดนามิก
- คุณภาพการสร้างเสียง
- ปรับปรุง มิติความลึกของเสียงสเตอริโอ และเสียงที่เหมาะกับฉาก
- เพิ่มความสอดคล้องทางภาพของบทพูด·ดนตรี·เอฟเฟกต์เสียง
- ยังมีข้อจำกัดบางส่วนในเรื่องการซิงก์รูปปากของหลายตัวละครและการบิดเบือนของเสียงพูด
- การสร้างแบบอ้างอิงมัลติโหมด
- เข้าใจและสะท้อนการผสมผสานอินพุตที่หลากหลายได้อย่างแม่นยำ
- รักษาความสอดคล้องและความสมจริงได้สูงในงาน แก้ไข·ขยาย
- ยังต้องปรับปรุงเพิ่มเติมในด้านความสอดคล้องของหลายตัวละครและความแม่นยำในการถ่ายทอดข้อความ
การประเมินโดยรวมและทิศทางในอนาคต
- Seedance 2.0 พัฒนาจาก “การสร้างเสียง-ภาพแบบซิงก์กัน” ไปสู่ “การสร้างมัลติโหมดแบบบูรณาการ”
- แก้ปัญหาเรื่อง การปฏิบัติตามกฎฟิสิกส์·ความสอดคล้องระยะยาว พร้อมขยายอิสระในการสร้างสรรค์ให้กับครีเอเตอร์
- ในอนาคตมีแผนพัฒนาเป็น เครื่องมือสร้างวิดีโอ AI ที่มีประสิทธิภาพและสร้างสรรค์ยิ่งขึ้น ผ่านการ ทำให้คุณภาพมีเสถียรภาพในรายละเอียด และ การจัดแนวด้วยฟีดแบ็กจากมนุษย์
3 ความคิดเห็น
สุดท้ายคงต้องลองเองถึงจะรู้ แต่หน้าโฮมเพจน่าประทับใจมาก
เห็นที่คุณโพสต์แล้วเกิดกิเลสเลยถึงขั้นสมัครดูด้วย,
แต่เอาเข้าจริงกลับลองใช้ฟรีไม่ได้เลยครับ
ไม่แน่ใจว่าเขาซ่อนโมเดลนี้ไว้ชั่วคราวหรือเปล่า เพราะด้วยเครดิตฟรี 3 เครดิตแล้วทำอะไรไม่ได้เลย..... ฮือ
ช่วงนี้มีวิดีโอ
seedance 2.0ตัวนี้ถูกแชร์กันเต็มไปหมด และตอนนี้ก็เปิดตัวอย่างเป็นทางการแล้วครับพอค้นหา
seedanceใน Hacker News ก็เห็นแต่เว็บไซต์เสียเงินสารพัดเต็มไปหมดเลย ดูท่าจะทำเงินได้เหมือนกันนะครับในบล็อกทางการตอนนี้ก็ยังมีแค่โพสต์ภาษาจีนอยู่เหมือนเดิม ที่นั่นมีวิดีโอมากกว่าอีกนิดหน่อย
https://seed.bytedance.com/en/blog/…