8 คะแนน โดย lostdest 2023-08-03 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

NVIDIA ได้เปิดเผย 'Perfusion' โมเดลที่สามารถสร้างภาพแบบปรับให้เป็นส่วนบุคคลได้ โดยผ่านงาน 'Key_Locked Rank One Editing for Text-to-Image Personalization' ซึ่งเพิ่งได้รับการตอบรับในงาน SIGGRAPH 2023 โดยใช้การฝึกเพียงราว 4 นาทีและมีขนาดเพียง 100kB

ไม่ใช่วิธีสร้างภาพทั้งหมดจาก text ล้วน ๆ แต่เป็นวิธีที่ให้ป้อนภาพตัวอย่างจำนวนหนึ่งเพื่อระบุ concept จากนั้นเมื่อป้อน text ที่มี concept นั้นอยู่ ก็จะสร้างภาพที่สอดคล้องกับข้อความดังกล่าว

ผลงานตัวอย่างที่อยู่ในหน้าแนะนำและในบทความวิจัยดูยอดเยี่ยมมาก
โค้ดมีกำหนดจะเปิดเผยในเร็ว ๆ นี้

1 ความคิดเห็น

 
hhkkkk 2023-08-03

คงไม่ใช่ว่าใช้เวลาแค่ 4 นาทีบน A100 อะไรประมาณนั้นหรอก...?