Imagen - โมเดล diffusion แบบ text-to-image ของ Google

xguru · 2022-05-25T09:32:41+09:00

โมเดล AI ที่สร้างภาพสมจริงได้จากการทำความเข้าใจภาษาในระดับลึก ในการประเมินโดยมนุษย์ สามารถสร้างภาพที่ได้รับความนิยมมากกว่า DALL-E 2 ของ OpenAI → ทั้งในด้านคุณภาพและการจัดแนวระหว่างภาพกับข้อความ เปิดเผยเฉพาะงานวิจัยและภาพตัวอย่าง → ตัดสินใจไม่เปิดเดโมเวอร์ชันที่ใช้งานได้จากภายนอก เนื่องจากปัญหาด้านจริยธรรม เป็นต้น

(imagen.research.google)

10 คะแนน โดย xguru 2022-05-25 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

โมเดล AI ที่สร้างภาพสมจริงได้จากการทำความเข้าใจภาษาในระดับลึก
ในการประเมินโดยมนุษย์ สามารถสร้างภาพที่ได้รับความนิยมมากกว่า DALL-E 2 ของ OpenAI
→ ทั้งในด้านคุณภาพและการจัดแนวระหว่างภาพกับข้อความ
เปิดเผยเฉพาะงานวิจัยและภาพตัวอย่าง
→ ตัดสินใจไม่เปิดเดโมเวอร์ชันที่ใช้งานได้จากภายนอก เนื่องจากปัญหาด้านจริยธรรม เป็นต้น

2 ความคิดเห็น

kunggom 2022-05-25

เมื่อวานฉันเห็นหนังสือ Alice in Wonderland ที่ร้านหนังสือ ซึ่งแทรกภาพนิ่งจากแอนิเมชันของ Disney เป็นภาพประกอบอยู่ เลยสงสัยว่าถ้านำแต่ละฉากของ Alice in Wonderland ไปป้อนให้โมเดลแบบนั้น ผลลัพธ์ที่ออกมาจะเป็นอย่างไร

xguru 2022-05-25

DALL·E 2 เปิดตัวแล้ว
DALL-E 2 ทำงานอย่างไร?

Imagen - โมเดล diffusion แบบ text-to-image ของ Google

บทความที่เกี่ยวข้อง

2 ความคิดเห็น