NVIDIA เปิดตัว 'Perfusion' โมเดลสร้างภาพแบบปรับให้เป็นส่วนบุคคลที่มีขนาดโมเดล 100kB
(research.nvidia.com)NVIDIA ได้เปิดเผย 'Perfusion' โมเดลที่สามารถสร้างภาพแบบปรับให้เป็นส่วนบุคคลได้ โดยผ่านงาน 'Key_Locked Rank One Editing for Text-to-Image Personalization' ซึ่งเพิ่งได้รับการตอบรับในงาน SIGGRAPH 2023 โดยใช้การฝึกเพียงราว 4 นาทีและมีขนาดเพียง 100kB
ไม่ใช่วิธีสร้างภาพทั้งหมดจาก text ล้วน ๆ แต่เป็นวิธีที่ให้ป้อนภาพตัวอย่างจำนวนหนึ่งเพื่อระบุ concept จากนั้นเมื่อป้อน text ที่มี concept นั้นอยู่ ก็จะสร้างภาพที่สอดคล้องกับข้อความดังกล่าว
ผลงานตัวอย่างที่อยู่ในหน้าแนะนำและในบทความวิจัยดูยอดเยี่ยมมาก
โค้ดมีกำหนดจะเปิดเผยในเร็ว ๆ นี้
1 ความคิดเห็น
คงไม่ใช่ว่าใช้เวลาแค่ 4 นาทีบน A100 อะไรประมาณนั้นหรอก...?