- งานวิจัยเรื่อง "การสังเคราะห์มุมมอง 4D แบบเรียลไทม์" ที่แก้ปัญหาความเร็วในการเรนเดอร์ที่ช้าเมื่อต้องสร้างมุมมองความละเอียดสูงแบบไดนามิกจากมุมที่แตกต่างกัน
- 4K4D ใช้การแทนข้อมูลแบบ 4D point cloud ที่รองรับ hardware rasterization เพื่อเพิ่มความเร็วในการเรนเดอร์
- การแทนข้อมูลแบบ 4D point cloud อาศัย 4D feature grid ที่ช่วยทำ normalization ของ point และเปิดทางให้ทำ optimization ที่มีประสิทธิภาพสูง
- มีการออกแบบโมเดล appearance แบบ hybrid ใหม่เพื่อยกระดับคุณภาพการเรนเดอร์โดยยังคงประสิทธิภาพไว้
- ทีมงานยังได้พัฒนาอัลกอริทึม Differentiable Depth Peeling เพื่อฝึกโมเดลที่เสนอนี้จากวิดีโอ RGB ได้อย่างมีประสิทธิภาพ
- ผลการทดลองแสดงให้เห็นว่า การแทนข้อมูล 4K4D สามารถเรนเดอร์ได้มากกว่า 400 FPS ที่ความละเอียด 1080p บนชุดข้อมูล DNA-Rendering และ 80 FPS ที่ความละเอียด 4K บนชุดข้อมูล ENeRF-Outdoor โดยใช้ GPU RTX 4090
- เร็วกว่าวิธีการก่อนหน้าถึง 30 เท่า พร้อมบรรลุคุณภาพการเรนเดอร์ระดับล้ำสมัย
- วิธีการ 4K4D ฝึกจากวิดีโอ RGB แบบหลายมุมมองผ่านอัลกอริทึม Differentiable Depth Peeling
- ในงานวิจัยมีผลลัพธ์เชิงคุณภาพจากชุดข้อมูลหลากหลายชุดและเดโมแบบเรียลไทม์
- ผู้เขียนงานวิจัยมาจาก Zhejiang University, Image Derivative Inc. และ Ant Group
4 ความคิดเห็น
"ผู้ใช้คาดเดาว่าเทคโนโลยีนี้อาจถูกนำไปใช้ในวงการบันเทิงสำหรับผู้ใหญ่ เพื่อให้เกิดการโต้ตอบที่ปรับแต่งได้มากขึ้น"
อ๋อ อย่างที่คิดเลยว่าความก้าวหน้าทางเทคโนโลยีนี่ฝั่งนั้นเป็นผู้นำ..
ว้าว.. ถ้าเอาอันนี้ไปใช้กับอะไรอย่างวิดีโอ ก็น่าจะพอดูได้บนอะไรอย่างชุดหูฟัง VR นะครับ
ความเห็นจาก Hacker News