- สร้างแอสเซ็ต 3D คุณภาพสูงจากภาพเดียวได้ในเวลาเพียง 0.5 วินาที
- พัฒนาบนพื้นฐานของ TripoSR โดยมีการปรับปรุงสถาปัตยกรรมครั้งใหญ่และความสามารถที่ดีขึ้น
- นำไปประยุกต์ใช้ได้ไม่เพียงกับนักพัฒนาเกมและโลกเสมือนจริงเท่านั้น แต่ยังรวมถึงผู้เชี่ยวชาญด้านค้าปลีก สถาปัตยกรรม การออกแบบ และงานอื่น ๆ ที่ใช้กราฟิกเข้มข้น
- โมเดลมีให้ใช้งานบน Hugging Face และเผยแพร่ภายใต้ Stability AI Community License
- เข้าถึงโมเดลได้ง่ายผ่าน Stability AI API และแชตบอต Stable Assistant พร้อมแชร์ผลงาน 3D ผ่าน 3D viewer และลองใช้งานใน Augmented Reality ได้
- ทดลองใช้งานได้ด้วยเวอร์ชันทดลองฟรี
วิธีการทำงาน
- ผู้ใช้เริ่มต้นด้วยการอัปโหลดภาพเดี่ยวของวัตถุ
- Stable Fast 3D จะสร้างแอสเซ็ต 3D แบบสมบูรณ์อย่างรวดเร็ว ซึ่งรวมถึง UV unwrapped mesh, material parameters, albedo color ที่ลดแสงเงาออกแล้ว และองค์ประกอบอื่น ๆ
- สามารถเลือกทำการสร้างใหม่แบบ quad หรือ triangle ได้ โดยเพิ่มเวลาในการประมวลผลเพียง 100-200ms
กรณีการใช้งาน
- ใช้เวลาอนุมานที่รวดเร็วสำหรับการทดลองซึ่งเป็นหัวใจสำคัญในช่วง pre-production
- แอสเซ็ตแบบ static สำหรับเกม (วัตถุฉากหลัง ของกระจุกกระจิก เฟอร์นิเจอร์)
- โมเดล 3D สำหรับอีคอมเมิร์ซ
- การสร้างโมเดลอย่างรวดเร็วสำหรับ AR/VR
เมื่อความเร็วและคุณภาพมาบรรจบกัน
- เหนือกว่าคู่แข่งในหลายด้านสำคัญ
- สร้างแอสเซ็ต 3D ได้รวดเร็วถึง 0.5 วินาทีต่อชิ้นบน GPU ที่มี VRAM 7GB
- UV unwrap mesh และ material parameters คุณภาพสูง
- ลดการปะปนของแสงใน texture
- สามารถสร้าง material parameters เพิ่มเติมและ normal map ได้
การวิจัยและพัฒนา
- แม้จะอิงจาก TripoSR แต่เป็นโมเดลที่ฝึกใหม่ทั้งหมดและมีการเปลี่ยนแปลงสถาปัตยกรรมที่สำคัญ
- การปรับปรุงรวมถึงการสร้าง mesh แบบชัดเจนและเทคนิคใหม่สำหรับการสร้าง texture mesh อย่างรวดเร็ว
- รายงานทางเทคนิคเน้นวิธีบรรลุความเร็วในการอนุมานสูงด้วย baked lighting ที่ลดลงและ material parameters
การเปิดให้ใช้งาน
- โค้ดโมเดล Stable Fast 3D มีให้ใช้งานบน Github และ Hugging Face
- อนุญาตให้ใช้งานแบบไม่เชิงพาณิชย์ และใช้งานเชิงพาณิชย์ได้สำหรับรายได้ต่อปีสูงสุด $1M ภายใต้ Stability AI Community License
- เข้าถึงโมเดลได้ผ่าน API และ Stable Assistant
ความเห็นของ GN⁺
- เทคโนโลยีการสร้างโมเดล 3D นี้เป็นเทคโนโลยีที่น่าสนใจ เพราะสามารถนำไปใช้ได้ในหลากหลายสาขา เช่น เกม โลกเสมือน/โลกเสริม การออกแบบ และสถาปัตยกรรม โดยเฉพาะความสามารถในการสร้างแอสเซ็ต 3D คุณภาพสูงอย่างรวดเร็วจากภาพเดียว ซึ่งน่าจะช่วยเพิ่มประสิทธิภาพการทำงานได้
- อย่างไรก็ตาม เมื่อโมเดลที่ขับเคลื่อนด้วย AI ลักษณะนี้แพร่หลายมากขึ้น ก็อาจส่งผลกระทบต่ออาชีพของบุคลากรเฉพาะทาง เช่น กราฟิกดีไซเนอร์หรือโมเดลเลอร์ได้ เพราะแอสเซ็ต 3D ที่เคยต้องสร้างด้วยมืออาจถูกทำให้เป็นอัตโนมัติ แม้ AI อาจยังแทนที่มนุษย์ได้ไม่ทั้งหมด แต่การลดบทบาทลงบางส่วนก็ดูจะหลีกเลี่ยงได้ยาก
- นอกจากนี้ ยังควรพิจารณาประเด็นลิขสิทธิ์ของโมเดล 3D ที่ถูกสร้างขึ้นด้วย ควรมีการชดเชยหรือให้เครดิตที่เหมาะสมต่อภาพที่ใช้ในการฝึก และดูเหมือนว่าจะจำเป็นต้องมีการกำหนดกฎระเบียบทางกฎหมายและแนวทางปฏิบัติสำหรับสิ่งที่สร้างโดย AI
- เทคโนโลยีที่คล้ายกัน ได้แก่ Nvidia Instant Nerf และ RealityScan ของ Epic Games ซึ่งมีความสามารถในการสร้างโมเดล 3D จากภาพถ่ายหรือการสแกน จุดเด่นคือความเข้ากันได้สูงกับ game engine อย่างไรก็ตาม ในด้านความเร็วในการสร้างผลลัพธ์คุณภาพสูงจากภาพเดียวแบบ Stable Fast 3D ดูเหมือนว่ายังตามไม่ทัน
- โดยสรุป Stable Fast 3D น่าจะช่วยยกระดับประสิทธิภาพการผลิตในงานกราฟิก 3D เช่น เกมและ XR ด้วยจุดเด่นด้านความเร็วและคุณภาพ แต่ก็จำเป็นต้องมีการหาฉันทามติทางสังคมเกี่ยวกับประเด็นจริยธรรมและกฎหมายควบคู่กันไป
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
แม้จะมีความคาดหวังต่อ LLMs อย่างมาก แต่การสร้างภาพและแอสเซ็ตกราฟิกมีแนวโน้มจะเป็นผู้ชนะระยะยาวของ AI ในปัจจุบันมากกว่า
ในภาพที่ใช้ทดสอบเป็นภาพที่สาม AI 3D ทั้งหมดดูเหมือนเรนเดอร์ 2D ของโมเดล 3D
ยังไม่สมบูรณ์แบบ แต่ค่อนข้างเจ๋ง
แทบรอไม่ไหวให้เทคโนโลยีนี้พัฒนาขึ้น
ใช้เวลา 0.5 วินาทีในการสร้างแอสเซ็ต 3D บน GPU ที่มี 7GB VRAM
หวังว่าจะได้เห็นความสำเร็จจริง ๆ ในสายงานนี้
วางแผนจะพิมพ์ 3D ของสนุก ๆ มากมายด้วยเทคโนโลยีนี้
ดูเหมือนจะใช้กลยุทธ์แบบอินโฟเมอร์เชียลคลาสสิก คือทำให้ภาพที่ใช้เปรียบเทียบสีซีดลงเพื่อให้ของตัวเองดูดีกว่า
สามารถโต้ตอบกับโมเดลได้บนหน้าโปรเจกต์
กระตุ้นความหลงใหลในการเพนต์มินิเอเจอร์