โอเพนซอร์สสำหรับการตัดต่อวิดีโอแบบ Training-Free

(github.com/KyujinHan)

4 คะแนน โดย kyujin 2025-08-28 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

แชร์ทั้งวิธีการและโค้ดแบบโอเพนซอร์ส(open-source) เพื่อให้สามารถทำ video editing ได้อย่างอิสระแบบไม่ต้องฝึก (training-free) 🌱

Video Editing: หมายถึงการสร้างวิดีโอโดยเพิ่มสิ่งที่ผู้ใช้ต้องการลงในวิดีโออินพุตผ่าน text prompt (กล่าวคือ ความสอดคล้อง ระหว่างวิดีโออินพุตและเอาต์พุตเป็นสิ่งสำคัญ)
Training-Free Video Editing: โดยไม่ต้องฝึกเพิ่มเติม จะเป็นการปรับแต่ง latent vector ภายใน diffusion model ระหว่างกระบวนการ inference เพื่อ ชี้นำให้วิดีโอถูกสร้างตาม text prompt ที่ผู้ใช้ต้องการ 🐬

ได้พัฒนาโค้ดสำหรับทำ video-editing บนพื้นฐานของโมเดล WAN2.1-T2V-1.3B ซึ่งกำลังได้รับความสนใจในวงการ video generation ช่วงนี้ 🔮

นำ training-free methods ที่เคยใช้ใน Image Editing มาประยุกต์กับ WAN2.1
- FlowEdit & FlowAlign
โฆษณา

ยิ่งไปกว่านั้น ผู้เขียนยังเสนอวิธีการชื่อ WANAlign2.1 🌠 🛠️

เป็นวิธีที่ทำ masking เฉพาะบริเวณที่จะทำการแก้ไขใน attention map เพื่อ เพิ่มความสอดคล้องกับวิดีโออินพุตให้ดียิ่งขึ้น

🌟🌟หวังว่าจะนำไปใช้งานกันได้อย่างอิสระ และถ้าสนใจก็กดดาวให้ด้วย🌟🌟!!

บทความที่เกี่ยวข้อง