• โมเดลสร้างภาพรุ่นล่าสุด Gemini 3 Pro Image (โค้ดเนม "Nano Banana Pro") กำลังก่อทั้งความตื่นเต้นและความกังวลไปพร้อมกันในวงการวิชวลไลซ์งานสถาปัตยกรรม
  • จุดเด่นสำคัญที่ทำให้ต่างจากเครื่องมือ AI เดิมคือ ความสามารถในการอ่านแบบ (blueprint literacy) โดยตีความผังพื้นไม่ใช่เป็นเส้นนามธรรม แต่เป็นคำสั่งทางสถาปัตยกรรม
  • Midjourney คือ "นักฝัน", DALL-E 3 คือ "นักสื่อสาร" ส่วน Nano Banana Pro คือ "วิศวกร" ซึ่งสะท้อนบทบาทที่แตกต่างกันของแต่ละตัว
  • ในชุมชน Reddit อย่าง r/ArchViz ความเห็นหลักคือ AI มีประโยชน์กับงานคอนเซปต์อาร์ต แต่ยังไม่แม่นยำพอในระดับเอกสารก่อสร้าง
  • ณ ตอนนี้มันยังเป็นเครื่องมือสำหรับการหาไอเดีย มากกว่าจะใช้แทนงานเอกสาร และในอีก 5 ปีข้างหน้า AI literacy อาจกลายเป็นทักษะพื้นฐานของวงการสถาปัตยกรรมเหมือน AutoCAD และ Revit

ปฏิกิริยาจากชุมชน: ตื่นเต้น vs. กังวล

  • ในชุมชน Reddit อย่าง r/GeminiAI และ r/ArchViz มีเธรดเกี่ยวกับ Nano Banana Pro คึกคักมาก ทั้งการแชร์เวิร์กโฟลว์และการตั้งคำถามชวนอึดอัดว่า "ศิลปินมนุษย์กำลังจะล้าสมัยหรือเปล่า"
  • ผู้ใช้คนหนึ่งใน r/ArchViz ให้ความเห็นแบบมีมิติว่า AI มีพลังมาก แต่ ยังขาดความแม่นยำที่จำเป็นสำหรับงานวิชาชีพความเสี่ยงสูง
    • "เวลาต้องขออนุมัติจากสภา ประชุมกับผู้มีส่วนได้ส่วนเสีย หรือยื่นเอกสารต่อท้องถิ่น ต้องอธิบายบริบทโดยรอบให้ถูกต้อง และรายละเอียดกับการควบคุมระดับนี้ AI ยังทำไม่ได้"
    • Hallucination ของ AI (ปรากฏการณ์ที่โมเดลสร้างรายละเอียดที่ไม่มีอยู่จริง) อาจยอมรับได้ในงานคอนเซปต์อาร์ต แต่เป็นปัญหาร้ายแรงสำหรับเอกสารก่อสร้าง
  • สำหรับนักออกแบบภายในที่ต้องระบุผ้าจากผู้ผลิตรายใดรายหนึ่งหรือรายละเอียดของรอยต่อเฉพาะ การที่ AI แค่ "เดาไปก่อน" นั้นยังไม่เพียงพอ

มุมมองผู้เชี่ยวชาญ: ความสามารถในการอ่านแบบ

  • Ismail Seleit สถาปนิกและผู้สนับสนุน AI แชร์ผลการทดลองบน LinkedIn
    • เขาประทับใจกับคุณภาพกราฟิกอย่างมาก และแปลกใจที่โมเดลซึ่งไม่ได้อิงเวกเตอร์สามารถตีความแบบได้แบบนี้
    • Nano Banana Pro ไม่ได้แค่สร้างภาพสวย แต่ตีความแบบในลักษณะที่ สร้างการหาไอเดียทางสถาปัตยกรรมได้จริง
  • ผู้ใช้ X (Twitter) @ai_for_success ก็มีปฏิกิริยาคล้ายกัน
    • "ผมแปลงแบบนี้เป็นภาพ 3D สมจริง และมันไม่ใช่แค่การสร้างภาพ แต่เป็นการ อ่านแบบให้เข้าใจก่อนจริง ๆ แล้วค่อยสร้างผลลัพธ์สุดท้ายที่สะท้อนรายละเอียดทั้งหมด"
  • หัวใจที่ทำให้ AI ยุคนี้ต่างออกไปไม่ใช่แค่การ "ฝัน" แต่คือความสามารถในการ "อ่าน"

การทดลอง: ทดสอบตามสูตร

  • มีการทดลองใช้งาน Nano Banana Pro โดยตรง ตั้งแต่คอนเซปต์ดิบไปจนถึงเรนเดอร์
  • สูตรพรอมต์ ที่ผู้ใช้จำนวนมากแนะนำคือ: Subject + Action + Environment + Style + Lighting + Details

Step 1: คอนเซปต์

  • ขอให้ Gemini สร้างผังแนวคิดของพิพิธภัณฑ์จากข้อความ
    • ชั้น 1: โถงล็อบบี้เอเทรียมกลาง บันไดใหญ่ ห้องจัดแสดงขนาดใหญ่ คาเฟ่ ร้านขายของที่ระลึก
    • ชั้น 2: ห้องจัดแสดงรอง ห้องเรียน สำนักงานพนักงาน
    • ภายนอก: สวนที่มีทางเดินคดเคี้ยวอย่างเป็นธรรมชาติ

Step 2: เปลี่ยนเป็น "วิศวกร"

  • เมื่อขอ "ภาพด้านหน้า" โมเดลกลับแสดงอาการ รักษาความสอดคล้องได้ยาก
  • เมื่อนำแบบไปอัปโหลดแล้วขอเรนเดอร์ Nano Banana Pro ตอบว่า "ไม่สามารถสร้างไฟล์เรนเดอร์โดยตรงได้ แต่สามารถทำหน้าที่เป็น วิศวกรพรอมต์ ได้"
  • กระบวนการนี้แสดงให้เห็นว่า "human in the loop" ยังคงจำเป็น — AI แปลงข้อมูลภาพให้เป็นพรอมต์เชิงบรรยายได้ แต่ยังต้องการการชี้นำและการอนุมัติจากมนุษย์

Step 3: การลงมือทำ

  • มีการรวมสูตรจากชุมชนเข้ากับข้อเสนอของ "วิศวกรพรอมต์" เพื่อประกอบเป็นพรอมต์สุดท้าย
    • Subject: พิพิธภัณฑ์ศิลปะร่วมสมัย 2 ชั้น หลังคาแบน กรุด้วยหินปูน
    • Environment: สวนที่มีทางเดินคดเคี้ยวและประติมากรรมโลหะแบบนามธรรม
    • Style: เรนเดอร์สถาปัตยกรรมแบบโฟโตรีเอลิสติก ความละเอียด 8K มุมกว้างแบบภาพยนตร์
    • Lighting: ช่วงโกลเดนอะวร์ พร้อมแสงประดิษฐ์โทนอุ่นที่ส่องออกมาจากหน้าต่าง
    • Details: ร่องรอยการผุกร่อนของหิน ยูนิต HVAC บนดาดฟ้า และเงาร่างคนเพื่อใช้อ้างอิงสเกล

ผลลัพธ์

  • ผลลัพธ์ที่ได้คือ "ดี แต่ยังไม่สมบูรณ์แบบ"
  • หากขอภาพจากมุมอื่นหรือไดอะแกรมสถาปัตยกรรมเฉพาะทาง (เช่น isometric cutaway) โมเดลมักจะ หลุดทิศทาง
  • ต้อง รีพรอมต์ อย่างต่อเนื่องเพื่อรักษาความสม่ำเสมอของตำแหน่งสวนประติมากรรมและรูปแบบของคิ้วยึดกระจกหน้าต่าง

Nano Banana Pro vs. Midjourney vs. DALL-E

  • การมาของ Nano Banana Pro ทำให้ 3 ยักษ์ใหญ่ของภาพวิชวลที่สร้างด้วย AI มีบทบาทแยกกันชัดเจน
  • Midjourney: "นักฝัน" — เด่นด้านแสงแบบภาพยนตร์ รายละเอียดเชิงศิลป์ และบรรยากาศ
  • DALL-E 3: "นักสื่อสาร" — เด่นด้านใช้งานง่ายและทำตามพรอมต์ได้ดี แต่ยังขาดความสมจริงในระดับปลายทาง
  • Nano Banana Pro (Gemini): "วิศวกร" — กำลังบุกเบิกพื้นที่เฉพาะทางที่มีความเป็นเทคนิคมากกว่า
    • มีศักยภาพสูงกว่าชัดเจนทั้งในด้านภาพวิชวลสมจริงและการแก้ไขแบบละเอียด
    • สามารถถ่ายทอด พื้นผิวจริง อย่างการผุกร่อนเฉพาะแบบของหินปูนหรือการสะท้อนแสงของกระจกได้แม่นยำ ให้ผลลัพธ์ที่ใกล้ภาพถ่ายมากกว่าภาพวาด
  • จุดต่างสำคัญคือ ความสามารถในการอ่านแบบ (blueprint literacy)
    • Midjourney มองผังพื้นเป็นชุดของเส้นนามธรรม จึงมักให้การตีความเชิง "ศิลป์" ที่ไม่สอดคล้องกับโครงสร้างจริง
    • Nano Banana Pro ตีความเส้นเหล่านั้นเป็น คำสั่งทางสถาปัตยกรรม ทำให้ผลลัพธ์เคารพตรรกะของพื้นที่ตามที่ตั้งใจไว้

สรุป: เป็นเครื่องมือสร้างแรงบันดาลใจ ไม่ใช่ตัวแทนทดแทน

  • ในเวลานี้ ตำแหน่งของนักออกแบบยังปลอดภัย Nano Banana Pro เป็น เอนจินสำหรับการหาไอเดีย ที่ยอดเยี่ยม แต่ยังแทนที่การทำเอกสารไม่ได้
  • ในอีก 5 ปีข้างหน้า มีความเป็นไปได้ว่าในวงการสถาปัตยกรรมและก่อสร้าง AI literacy จะกลายเป็นทักษะมาตรฐานเหมือนการใช้ AutoCAD หรือ Revit
    • เวิร์กโฟลว์มีแนวโน้มจะขยับไปสู่รูปแบบไฮบริด ใช้ AI วนสำรวจ "มู้ด" และ "บรรยากาศ" ในช่วงต้นทาง แล้วจัดการความแม่นยำที่จำเป็นต่อการก่อสร้างจริงด้วย ซอฟต์แวร์ BIM แบบดั้งเดิม
  • คำถามสำคัญที่การทดลองนี้ยังไม่ได้แตะคือ ต้นทุนด้านสิ่งแวดล้อม ของการฝึกโมเดลขนาดใหญ่ และพลังงานที่ใช้ต่อการสร้างผลลัพธ์แต่ละครั้ง
  • Nano Banana Pro ไม่ใช่สถาปนิกหรือดีไซเนอร์ แต่เป็น "กระจก" — มันสะท้อนความคิดให้คมชัดและสว่างขึ้น แต่ก็ยังต้องการ มือมนุษย์ ที่มั่นคงคอยประคอง

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น