- Google เปิดตัว ฟีเจอร์สร้างภาพผ่านโมเดล Gemini 2.0 Flash ในรูปแบบพรีวิวสำหรับนักพัฒนา
- สามารถใช้คำสั่งแบบข้อความเพื่อ สร้างภาพ แก้ไขภาพ และแก้ไขเฉพาะบางส่วน ได้ พร้อมทั้งปรับปรุงคุณภาพด้านภาพและการเรนเดอร์ข้อความ
- แนะนำกรณีการใช้งานที่หลากหลาย เช่น การเปลี่ยนสกินสินค้า การสร้าง SKU และการแก้ไขร่วมกันแบบเรียลไทม์
- สามารถทดสอบได้ทันทีผ่าน [Google AI Studio] และ [Vertex AI] พร้อมทั้ง ปรับเพิ่มขีดจำกัดการใช้งาน API
เปิดพรีวิวฟีเจอร์สร้างภาพของ Gemini 2.0 Flash
- ตามฟีดแบ็กจากนักพัฒนา Google จึงเปิดให้ใช้งาน ฟีเจอร์สร้างภาพผ่านโมเดล Gemini 2.0 Flash ในเวอร์ชันพรีวิว
- ผู้ใช้สามารถใช้งานได้ผ่าน Google AI Studio หรือ Vertex AI
การปรับปรุงหลัก
- คุณภาพด้านภาพดีขึ้น (เมื่อเทียบกับเวอร์ชันทดลองก่อนหน้า)
- ความแม่นยำของการเรนเดอร์ข้อความดีขึ้น
- อัตราการถูกบล็อกโดยฟิลเตอร์ลดลง
ตัวอย่างความสามารถด้านการสร้างภาพที่นำไปใช้ได้
- การเปลี่ยนพื้นหลังภาพสินค้า: สามารถ จัดองค์ประกอบภาพสินค้าเดิมใหม่ด้วยพื้นหลังและสภาพแวดล้อมที่หลากหลาย
- การแก้ไขร่วมกันแบบเรียลไทม์: ใน แอป Gemini Co-Drawing รองรับ การแก้ไขภาพแบบเรียลไทม์โดยผู้ใช้หลายคน
- การแก้ไขเฉพาะบางส่วนของภาพแบบโต้ตอบ: สามารถ แก้ไขเฉพาะบางพื้นที่ด้วยคำสั่งแบบโต้ตอบได้โดยไม่ต้องเปลี่ยนทั้งภาพ
- การสร้าง SKU สินค้าแบบไดนามิก: ผสานภาพและข้อความเพื่อ สร้างรูปแบบสินค้ารุ่นย่อยใหม่โดยอัตโนมัติ (เช่น สี ฉลาก เป็นต้น)
- การระดมไอเดียร่วมกับ Gemini: ใช้การผสานข้อความ+ภาพเพื่อ สร้างสถานการณ์ใช้งานที่หลากหลาย เช่น การทำอาหาร สินค้า และการวางแผน
ตัวอย่างการใช้งาน API (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
แผนต่อไป
- Google มีแผนจะขยายความสามารถนี้อย่างต่อเนื่องผ่าน คุณภาพที่สูงขึ้น ฟีเจอร์เพิ่มเติม ความเร็วที่ดีขึ้น และการปรับปรุงแพ็กเกจราคา
- ดูรายละเอียดเพิ่มเติมได้ที่ คู่มือการสร้างภาพของ Gemini API
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News