- รองรับการเชื่อมต่อระหว่าง ChatGPT กับ Visual Foundation Model เพื่อส่งและรับรูปภาพระหว่างการแชต
- ChatGPT เรียนรู้บนพื้นฐานของภาษา จึงไม่สามารถประมวลผลหรือสร้างภาพได้
- VFM สามารถเข้าใจและประมวลผลภาพได้ แต่รองรับเพียงอินพุตและเอาต์พุตแบบครั้งเดียว
- เมื่อนำทั้งสองอย่างมาเชื่อมกัน จะสามารถสร้างภาพ, แก้ไขภาพที่สร้างขึ้น, ลบหรือเปลี่ยนวัตถุบางอย่างในภาพที่ส่งมาได้
- สามารถส่งภาพพร้อมกับภาษาได้
- ให้โมเดล AI หลายขั้นตอนทำงานร่วมกันผ่านคำถามเชิงภาพที่ซับซ้อนหรือคำสั่งแก้ไข
- รวมถึงการให้ฟีดแบ็กต่อผลลัพธ์ที่แก้ไขแล้ว
1 ความคิดเห็น
พอเปิดทางได้ครั้งหนึ่งแล้ว การพัฒนาก็เกิดขึ้นอย่างรวดเร็วจริง ๆ