- มิวสิกวิดีโอเพลงใหม่ ‘Helicopter’ ของ A$AP Rocky เป็นงานที่สร้างการแสดงของตัวละครเกือบทั้งหมดด้วย volumetric capture และ Gaussian Splatting
- การถ่ายทำใช้ ชุดกล้อง RGB-D 56 ตัวของ Evercoast เพื่อบันทึกการแสดงจริงเป็น 3D และในขั้นตอนโพสต์โปรดักชันเรนเดอร์ด้วย Houdini·OctaneRender
- ผ่าน GSOPs ของ CG Nomads และ เครื่องมือภายในของ WildCapture สำหรับจัดลำดับข้อมูลสแปลต ปรับแสงใหม่ และจัดการปฏิสัมพันธ์ทางกายภาพ
- แม้ว่าวิดีโอจะให้ความรู้สึกเหนือจริง แต่ทุกฉากสร้างขึ้นจาก การแสดงทางกายภาพของนักแสดงจริง
- โปรเจ็กต์นี้เป็น กรณีใช้งานจริงของ dynamic Gaussian Splatting ในวิดีโอเพลงกระแสหลัก และแสดงให้เห็นความเป็นไปได้ของการผลิตวิดีโอ 3D แบบเรียลไทม์ในอนาคต
ภาพรวมการสร้างมิวสิกวิดีโอ Helicopter
- ‘Helicopter’ ของ A$AP Rocky เป็นมิวสิกวิดีโอที่ใช้ เทคโนโลยี Radiance Fields โดย การแสดงของตัวละครเกือบทั้งหมด ถูกแคปเจอร์ด้วยวิธี volumetric
- วิดีโอโดดเด่นด้วยการเคลื่อนไหวที่ชุลมุนและพลังแบบ MTV ยุคแรก
- ตัวละครถูกเรนเดอร์ในรูปแบบ Dynamic Splat เพื่อสร้างมิติของพื้นที่
- โปรเจ็กต์นี้มี Evercoast, Grin Machine, WildCapture, Fitsū.ai และทีมอื่น ๆ เข้าร่วม
- Evercoast รับผิดชอบการแคปเจอร์เพอร์ฟอร์แมนซ์ และ Chris Rutledge จาก Grin Machine เข้าร่วมในฐานะ CG supervisor
- Wilfred Driscoll จาก WildCapture ให้การสนับสนุนด้านเทคนิคสำหรับ temporal consistency และ motion transition
การถ่ายทำแบบ volumetric และองค์ประกอบทางเทคนิค
- การถ่ายทำดำเนินการใน ลอสแอนเจลิส เมื่อเดือนสิงหาคม 2025 โดยใช้ กล้อง RGB-D 56 ตัว ของ Evercoast และ เวิร์กสเตชัน Dell สองเครื่อง ที่ซิงก์กัน
- นักแสดงห้อยอยู่กับลวดหรือบาร์บนเพดานเพื่อทำ สตันต์ทางกายภาพ
- ใบพัดเฮลิคอปเตอร์หรือพร็อพบางชิ้นถูกแทนด้วยโครงสร้างไม้จริงเพื่อถ่ายทำในสภาพแวดล้อมที่สมจริง
- มีการเก็บ ข้อมูลดิบรวม 10TB และเรนเดอร์ออกมาเป็นภาพสแปลตราว 30 นาที
- ผลลัพธ์สุดท้ายถูกเอาต์พุตเป็น ลำดับไฟล์ PLY ขนาดประมาณ 1TB
ไปป์ไลน์โพสต์โปรดักชัน
- งานโพสต์โปรดักชันดำเนินการใน Houdini โดยใช้ GSOPs ของ CG Nomads เพื่อจัดการและจัดลำดับข้อมูลสแปลต
- ใช้ OctaneRender ของ OTOY สำหรับเรนเดอร์ขั้นสุดท้ายและรองรับ การปรับแสงใหม่ (relighting)
- การผสาน Octane เข้ากับ Houdini มีความสมบูรณ์มากขึ้น ทำให้สามารถแสดงผล เงาและมิติความลึก ได้
- Blender ถูกใช้ในขั้นตอนเลย์เอาต์และพรีวิชวล
- มีการแปลงลำดับสแปลตเป็น proxy cache แบบเบาเพื่อใช้วางแผนฉาก
- เครื่องมือภายในของ WildCapture สร้าง pose-estimation skeleton เพื่อรองรับ การชนกันและการจำลองฟิสิกส์
พรีวิวแบบเรียลไทม์และประสิทธิภาพในการผลิต
- ระบบของ Evercoast ให้ ฟีดแบ็กเชิงพื้นที่แบบเรียลไทม์ในกองถ่าย
- ผู้กำกับสามารถตรวจดู พรีวิวแบบ mesh-based ได้ทันทีหลังถ่ายทำ และต่อมาสามารถตรวจสอบการเรนเดอร์สแปลตเต็มรูปแบบผ่าน เว็บเพลเยอร์
- ก่อนดาวน์โหลดข้อมูลขนาดใหญ่ สามารถเลือกเฉพาะฉากที่ต้องการเพื่อนำไปโพสต์โปรเซสต่อได้
- เวิร์กโฟลว์นี้เป็นวิธีทำงานที่ ใกล้เคียงการจำลองมากกว่าการผลิตวิดีโอแบบดั้งเดิม ช่วยให้สร้างงานได้รวดเร็วและคุ้มค่าใช้จ่าย
การแสดงจริงและภาพลวงตาทางสายตา
- ผู้ชมบางส่วนเข้าใจผิดว่าวิดีโอนี้เป็น งานที่สร้างด้วย AI แต่ทุกฉากล้วนสร้างจาก การแสดงทางกายภาพของนักแสดงจริง
- ไม่ว่าจะเป็นสตันต์ การกระโดด หรือการตก ทุกการเคลื่อนไหวเกิดขึ้นจริงในพื้นที่จริง
- ด้วย volumetric capture จึงสามารถ จัดวางมุมกล้องใหม่ และ ทำลายความต่อเนื่องของพื้นที่ ได้อย่างอิสระ จนก่อให้เกิดความรู้สึกเหมือนสิ่งที่ถูกสร้างขึ้น
- เทคโนโลยี Radiance Field ไม่ได้มาแทนที่ความจริง แต่ทำหน้าที่ รักษาการเคลื่อนไหวและพื้นที่ของโลกจริง
ความร่วมมือก่อนหน้าระหว่าง A$AP Rocky กับ Radiance Fields
- A$AP Rocky เคยใช้ NeRF และ Instant-NGP GUI ในมิวสิกวิดีโอ ‘Shittin’ Me’ เมื่อปี 2023
- ‘Helicopter’ ครั้งนี้จึงถูกมองว่าเป็นส่วนต่อเนื่อง และเป็น กรณีใช้งานจริงขนาดใหญ่ของ dynamic Gaussian Splatting
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ลิงก์วิดีโอ YouTube
น่าเสียดายที่เขาไม่ได้รับความสนใจมากนัก ตามที่คุยกันใน Discord ศิลปินจำนวนมากเกินไปกลับมาจ้างให้ทำแต่มิวสิกวิดีโอสไตล์นี้ จนสุดท้ายเขาเลิกโปรเจกต์นี้ไปแทนที่จะได้ร่วมงานด้านดนตรี
มิวสิกวิดีโอตัวนี้ทำขึ้นด้วยการผสาน GSOPs กับ OTOY OctaneRender
ถ้าสนใจด้านเทคนิค ดูได้ที่ เว็บไซต์ทางการ หรือ GitHub repository
ถ้าใช้เทคโนโลยีนี้ในเครื่องมืออย่าง Houdini ศิลปินก็จะขยับกล้องเสมือนได้อย่างอิสระ
ดูเหมือนว่าด้วย งานวิจัยหลัก ในปี 2023 รวมถึงความก้าวหน้าของ GPU และ differentiable programming ทำให้ตอนนี้มันพร้อมใช้งานในงานจริงแล้ว
ส่วนที่ว่า “นำข้อมูลเข้า Houdini จัดการด้วย GSOPs แล้วเรนเดอร์สุดท้ายด้วย OctaneRender” นี่ประทับใจเป็นพิเศษ
รวมผลงานของผม
ถ้าต้องปรับแสงหรือเงาใหม่ หรือแก้ไขบางส่วนของฉาก จะยังรักษา ความสมจริง เดิมไว้ได้ไหม?
ช่วงนี้การทำหนังดูเหมือนจะมุ่งไปทางถ่ายหลายมุมแล้วไปจัดการหนัก ๆ ในโพสต์โปรดักชัน สุดท้ายเราอาจไปถึงยุคที่มนุษย์ใช้ Gaussian splat ส่วนฉากหลังใช้ กรีนสกรีน ก็ได้
ถึงอย่างนั้นเทคโนโลยีก็กำลังพัฒนาอย่างรวดเร็ว และ volumetric capture น่าจะยืนระยะได้แน่
สำหรับสภาพแวดล้อมแบบนิ่ง คุณภาพสูงมากได้อย่าง ตัวอย่างนี้
ถ้าเพลงไม่ใช่แนวคุณ ก็ปิดเสียงแล้วดูได้
ลิงก์วิดีโอ