- เปรียบเทียบ 3 โมเดลด้วยพรอมป์ต์เดียวกันในด้านความแม่นยำของหัวข้อ ความแม่นยำของสไตล์ ความสอดคล้องโดยรวม และจริยธรรม (Ethics)
Photography: Humans
- ปัจจุบันในด้านการถ่ายภาพ Midjourney ยังเป็นผู้นำ แต่ Firefly 2 ตามมาติด ๆ ด้วยช่องว่างเพียงเล็กน้อย
- หากต้องการภาพเฮดช็อตที่มีการปรุงแต่งสไตล์น้อยกว่าและดูเป็นธรรมชาติมากกว่า ต่อจากนี้ควรพิจารณา Firefly 2
- สำหรับงานภาพถ่าย ไม่แนะนำให้ใช้ DALL-E 3
Photography: Stylistic humans
- ช่วงนี้มีการสร้างภาพคนแบบมีสไตล์จำนวนมาก
- พรอมป์ต์เหล่านี้ถูกปรับแต่งมาโดยเฉพาะสำหรับ Midjourney จึงอาจมีอคติอยู่บ้าง
- แต่มีประเด็นสำคัญบางข้อ:
- Midjourney ทำงานได้ดีที่สุดเมื่อได้รับพรอมป์ต์ที่ซับซ้อนกว่า และแสดงความสอดคล้องที่แข็งแกร่ง
- Midjourney โดดเด่นในการสร้างการผสมผสานที่ซับซ้อนของสื่อ องค์ประกอบภาพ และแสง
- DALL-E ดูเหมือนจะมีปัญหาในการผสานแสงสำหรับผู้มีสีผิวหลากหลาย ทำให้ความแม่นยำของผลลัพธ์ลดลง
- Firefly สร้างผลลัพธ์ที่หลากหลายที่สุดเมื่อไม่ได้ระบุให้ต้องมีความหลากหลายอย่างชัดเจน
- หากใช้แทนงานถ่ายภาพที่สร้างสรรค์มากขึ้น ทั้ง Firefly และ DALL-E 3 อาจมีปัญหาในการไปให้ถึงระดับคุณภาพและความสอดคล้องที่ต้องการ
Photography: Objects
- ฉันคิดว่าโดยรวมแล้ว Midjourney สร้างความสอดคล้องของวัตถุที่สมจริงที่สุด
- Firefly และ DALL-E กำลังไล่ตามมา แต่ความชอบด้านสไตล์ของโมเดลเหล่านี้จะส่งผลต่อผลลัพธ์อย่างไม่ต้องสงสัย
Illustration
- ในด้านอิลลัสเตรชัน ทุกตัวพัฒนาไปมากแล้ว แต่หากต้องการผลลัพธ์ที่มีความละเอียดอ่อนและมีชั้นเชิง Midjourney ก็ยังเป็นตัวเลือกที่ดีที่สุด
- อย่างไรก็ตาม ควรทดลองหลายโมเดลและปรับให้เข้ากับสไตล์เฉพาะของตนเอง
Typography
- ความสามารถในการสร้างคำที่ถูกต้องเพิ่งกลายเป็นสิ่งที่ทำได้ในช่วงไม่นานมานี้
- จากการทดสอบทั้งหมดที่ทำมา มีเพียง DALL-E 3 เท่านั้นที่เรนเดอร์คำเป็นวัตถุที่สมบูรณ์ได้อย่างแม่นยำ
- คำในกรณีพิเศษนี้คือ "ดีไซน์" และความสม่ำเสมอก็ถูกรักษาไว้ได้อย่างต่อเนื่องในทุกการทดลอง
บทสรุป
- ภูมิทัศน์กำลังเปลี่ยนแปลงอย่างชัดเจน แต่ประเด็นหลักที่อยากเน้นคือ:
- Adobe กำลังไล่บี้ช่องว่างในด้านภาพถ่ายอย่างชัดเจน และกำลังก้าวขึ้นมาเป็นคู่แข่งที่แข็งแกร่ง
- DALL-E 3 เป็นเจเนอเรเตอร์เพียงตัวเดียว (ไม่นับ Ideogram) ที่สามารถสร้างงานไทโปกราฟีได้ดีในระดับสมเหตุสมผล
- DALL-E 3 โดดเด่นในการสร้างอิลลัสเตรชัน และเมื่อรวมกับความสามารถในการสร้างคำ ก็น่าจะมีศักยภาพในการเป็น "เครื่องสร้างภาพสำหรับคลิปอาร์ต" ในแง่ของสเกลและสไตล์ที่ทำให้เป็นมาตรฐานทั่วไป
- เหมาะกับการสร้างภาพพื้นฐานหรือการสร้างภาพระหว่างทำกิจกรรมอื่น ๆ (ผ่าน ChatGPT) แต่ยังไม่น่าจะกลายเป็นเครื่องมือออกแบบที่ประณีตอย่างมากในเร็ว ๆ นี้
- Midjourney ยังคงสร้างภาพถ่ายที่สมจริงและสอดคล้องกันมากที่สุดต่อไป
- ในด้านการควบคุมเชิงสร้างสรรค์ Midjourney ยังไม่มีใครเทียบได้
2 ความคิดเห็น
ทำไมถึงตัด StableDiffusion ออกล่ะ
เพราะ Midjourney เหรอ
ตอนที่ได้ลองใช้ DALL-E 3 ผม/ฉันทึ่งมากที่มันแสดงตัวอักษรได้ชัดเจนมาก
แต่ดูเหมือนว่าตอนนี้ในแง่คุณภาพ Midjourney ยังดีที่สุดอยู่