19 คะแนน โดย xguru 2023-10-30 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • เปรียบเทียบ 3 โมเดลด้วยพรอมป์ต์เดียวกันในด้านความแม่นยำของหัวข้อ ความแม่นยำของสไตล์ ความสอดคล้องโดยรวม และจริยธรรม (Ethics)

Photography: Humans

  • ปัจจุบันในด้านการถ่ายภาพ Midjourney ยังเป็นผู้นำ แต่ Firefly 2 ตามมาติด ๆ ด้วยช่องว่างเพียงเล็กน้อย
  • หากต้องการภาพเฮดช็อตที่มีการปรุงแต่งสไตล์น้อยกว่าและดูเป็นธรรมชาติมากกว่า ต่อจากนี้ควรพิจารณา Firefly 2
  • สำหรับงานภาพถ่าย ไม่แนะนำให้ใช้ DALL-E 3

Photography: Stylistic humans

  • ช่วงนี้มีการสร้างภาพคนแบบมีสไตล์จำนวนมาก
  • พรอมป์ต์เหล่านี้ถูกปรับแต่งมาโดยเฉพาะสำหรับ Midjourney จึงอาจมีอคติอยู่บ้าง
  • แต่มีประเด็นสำคัญบางข้อ:
    • Midjourney ทำงานได้ดีที่สุดเมื่อได้รับพรอมป์ต์ที่ซับซ้อนกว่า และแสดงความสอดคล้องที่แข็งแกร่ง
    • Midjourney โดดเด่นในการสร้างการผสมผสานที่ซับซ้อนของสื่อ องค์ประกอบภาพ และแสง
    • DALL-E ดูเหมือนจะมีปัญหาในการผสานแสงสำหรับผู้มีสีผิวหลากหลาย ทำให้ความแม่นยำของผลลัพธ์ลดลง
    • Firefly สร้างผลลัพธ์ที่หลากหลายที่สุดเมื่อไม่ได้ระบุให้ต้องมีความหลากหลายอย่างชัดเจน
    • หากใช้แทนงานถ่ายภาพที่สร้างสรรค์มากขึ้น ทั้ง Firefly และ DALL-E 3 อาจมีปัญหาในการไปให้ถึงระดับคุณภาพและความสอดคล้องที่ต้องการ

Photography: Objects

  • ฉันคิดว่าโดยรวมแล้ว Midjourney สร้างความสอดคล้องของวัตถุที่สมจริงที่สุด
  • Firefly และ DALL-E กำลังไล่ตามมา แต่ความชอบด้านสไตล์ของโมเดลเหล่านี้จะส่งผลต่อผลลัพธ์อย่างไม่ต้องสงสัย

Illustration

  • ในด้านอิลลัสเตรชัน ทุกตัวพัฒนาไปมากแล้ว แต่หากต้องการผลลัพธ์ที่มีความละเอียดอ่อนและมีชั้นเชิง Midjourney ก็ยังเป็นตัวเลือกที่ดีที่สุด
  • อย่างไรก็ตาม ควรทดลองหลายโมเดลและปรับให้เข้ากับสไตล์เฉพาะของตนเอง

Typography

  • ความสามารถในการสร้างคำที่ถูกต้องเพิ่งกลายเป็นสิ่งที่ทำได้ในช่วงไม่นานมานี้
  • จากการทดสอบทั้งหมดที่ทำมา มีเพียง DALL-E 3 เท่านั้นที่เรนเดอร์คำเป็นวัตถุที่สมบูรณ์ได้อย่างแม่นยำ
  • คำในกรณีพิเศษนี้คือ "ดีไซน์" และความสม่ำเสมอก็ถูกรักษาไว้ได้อย่างต่อเนื่องในทุกการทดลอง

บทสรุป

  • ภูมิทัศน์กำลังเปลี่ยนแปลงอย่างชัดเจน แต่ประเด็นหลักที่อยากเน้นคือ:
  • Adobe กำลังไล่บี้ช่องว่างในด้านภาพถ่ายอย่างชัดเจน และกำลังก้าวขึ้นมาเป็นคู่แข่งที่แข็งแกร่ง
  • DALL-E 3 เป็นเจเนอเรเตอร์เพียงตัวเดียว (ไม่นับ Ideogram) ที่สามารถสร้างงานไทโปกราฟีได้ดีในระดับสมเหตุสมผล
    • DALL-E 3 โดดเด่นในการสร้างอิลลัสเตรชัน และเมื่อรวมกับความสามารถในการสร้างคำ ก็น่าจะมีศักยภาพในการเป็น "เครื่องสร้างภาพสำหรับคลิปอาร์ต" ในแง่ของสเกลและสไตล์ที่ทำให้เป็นมาตรฐานทั่วไป
    • เหมาะกับการสร้างภาพพื้นฐานหรือการสร้างภาพระหว่างทำกิจกรรมอื่น ๆ (ผ่าน ChatGPT) แต่ยังไม่น่าจะกลายเป็นเครื่องมือออกแบบที่ประณีตอย่างมากในเร็ว ๆ นี้
  • Midjourney ยังคงสร้างภาพถ่ายที่สมจริงและสอดคล้องกันมากที่สุดต่อไป
    • ในด้านการควบคุมเชิงสร้างสรรค์ Midjourney ยังไม่มีใครเทียบได้

2 ความคิดเห็น

 
hhkkkk 2023-10-30

ทำไมถึงตัด StableDiffusion ออกล่ะ
เพราะ Midjourney เหรอ

 
kuroneko 2023-10-30

ตอนที่ได้ลองใช้ DALL-E 3 ผม/ฉันทึ่งมากที่มันแสดงตัวอักษรได้ชัดเจนมาก
แต่ดูเหมือนว่าตอนนี้ในแง่คุณภาพ Midjourney ยังดีที่สุดอยู่