- โมเดลสร้างภาพรุ่นล่าสุด Gemini 3 Pro Image (โค้ดเนม "Nano Banana Pro") กำลังก่อทั้งความตื่นเต้นและความกังวลไปพร้อมกันในวงการวิชวลไลซ์งานสถาปัตยกรรม
- จุดเด่นสำคัญที่ทำให้ต่างจากเครื่องมือ AI เดิมคือ ความสามารถในการอ่านแบบ (blueprint literacy) โดยตีความผังพื้นไม่ใช่เป็นเส้นนามธรรม แต่เป็นคำสั่งทางสถาปัตยกรรม
- Midjourney คือ "นักฝัน", DALL-E 3 คือ "นักสื่อสาร" ส่วน Nano Banana Pro คือ "วิศวกร" ซึ่งสะท้อนบทบาทที่แตกต่างกันของแต่ละตัว
- ในชุมชน Reddit อย่าง r/ArchViz ความเห็นหลักคือ AI มีประโยชน์กับงานคอนเซปต์อาร์ต แต่ยังไม่แม่นยำพอในระดับเอกสารก่อสร้าง
- ณ ตอนนี้มันยังเป็นเครื่องมือสำหรับการหาไอเดีย มากกว่าจะใช้แทนงานเอกสาร และในอีก 5 ปีข้างหน้า AI literacy อาจกลายเป็นทักษะพื้นฐานของวงการสถาปัตยกรรมเหมือน AutoCAD และ Revit
ปฏิกิริยาจากชุมชน: ตื่นเต้น vs. กังวล
- ในชุมชน Reddit อย่าง r/GeminiAI และ r/ArchViz มีเธรดเกี่ยวกับ Nano Banana Pro คึกคักมาก ทั้งการแชร์เวิร์กโฟลว์และการตั้งคำถามชวนอึดอัดว่า "ศิลปินมนุษย์กำลังจะล้าสมัยหรือเปล่า"
- ผู้ใช้คนหนึ่งใน r/ArchViz ให้ความเห็นแบบมีมิติว่า AI มีพลังมาก แต่ ยังขาดความแม่นยำที่จำเป็นสำหรับงานวิชาชีพความเสี่ยงสูง
- "เวลาต้องขออนุมัติจากสภา ประชุมกับผู้มีส่วนได้ส่วนเสีย หรือยื่นเอกสารต่อท้องถิ่น ต้องอธิบายบริบทโดยรอบให้ถูกต้อง และรายละเอียดกับการควบคุมระดับนี้ AI ยังทำไม่ได้"
- Hallucination ของ AI (ปรากฏการณ์ที่โมเดลสร้างรายละเอียดที่ไม่มีอยู่จริง) อาจยอมรับได้ในงานคอนเซปต์อาร์ต แต่เป็นปัญหาร้ายแรงสำหรับเอกสารก่อสร้าง
- สำหรับนักออกแบบภายในที่ต้องระบุผ้าจากผู้ผลิตรายใดรายหนึ่งหรือรายละเอียดของรอยต่อเฉพาะ การที่ AI แค่ "เดาไปก่อน" นั้นยังไม่เพียงพอ
มุมมองผู้เชี่ยวชาญ: ความสามารถในการอ่านแบบ
- Ismail Seleit สถาปนิกและผู้สนับสนุน AI แชร์ผลการทดลองบน LinkedIn
- เขาประทับใจกับคุณภาพกราฟิกอย่างมาก และแปลกใจที่โมเดลซึ่งไม่ได้อิงเวกเตอร์สามารถตีความแบบได้แบบนี้
- Nano Banana Pro ไม่ได้แค่สร้างภาพสวย แต่ตีความแบบในลักษณะที่ สร้างการหาไอเดียทางสถาปัตยกรรมได้จริง
- ผู้ใช้ X (Twitter) @ai_for_success ก็มีปฏิกิริยาคล้ายกัน
- "ผมแปลงแบบนี้เป็นภาพ 3D สมจริง และมันไม่ใช่แค่การสร้างภาพ แต่เป็นการ อ่านแบบให้เข้าใจก่อนจริง ๆ แล้วค่อยสร้างผลลัพธ์สุดท้ายที่สะท้อนรายละเอียดทั้งหมด"
- หัวใจที่ทำให้ AI ยุคนี้ต่างออกไปไม่ใช่แค่การ "ฝัน" แต่คือความสามารถในการ "อ่าน"
การทดลอง: ทดสอบตามสูตร
- มีการทดลองใช้งาน Nano Banana Pro โดยตรง ตั้งแต่คอนเซปต์ดิบไปจนถึงเรนเดอร์
- สูตรพรอมต์ ที่ผู้ใช้จำนวนมากแนะนำคือ: Subject + Action + Environment + Style + Lighting + Details
Step 1: คอนเซปต์
- ขอให้ Gemini สร้างผังแนวคิดของพิพิธภัณฑ์จากข้อความ
- ชั้น 1: โถงล็อบบี้เอเทรียมกลาง บันไดใหญ่ ห้องจัดแสดงขนาดใหญ่ คาเฟ่ ร้านขายของที่ระลึก
- ชั้น 2: ห้องจัดแสดงรอง ห้องเรียน สำนักงานพนักงาน
- ภายนอก: สวนที่มีทางเดินคดเคี้ยวอย่างเป็นธรรมชาติ
Step 2: เปลี่ยนเป็น "วิศวกร"
- เมื่อขอ "ภาพด้านหน้า" โมเดลกลับแสดงอาการ รักษาความสอดคล้องได้ยาก
- เมื่อนำแบบไปอัปโหลดแล้วขอเรนเดอร์ Nano Banana Pro ตอบว่า "ไม่สามารถสร้างไฟล์เรนเดอร์โดยตรงได้ แต่สามารถทำหน้าที่เป็น วิศวกรพรอมต์ ได้"
- กระบวนการนี้แสดงให้เห็นว่า "human in the loop" ยังคงจำเป็น — AI แปลงข้อมูลภาพให้เป็นพรอมต์เชิงบรรยายได้ แต่ยังต้องการการชี้นำและการอนุมัติจากมนุษย์
Step 3: การลงมือทำ
- มีการรวมสูตรจากชุมชนเข้ากับข้อเสนอของ "วิศวกรพรอมต์" เพื่อประกอบเป็นพรอมต์สุดท้าย
- Subject: พิพิธภัณฑ์ศิลปะร่วมสมัย 2 ชั้น หลังคาแบน กรุด้วยหินปูน
- Environment: สวนที่มีทางเดินคดเคี้ยวและประติมากรรมโลหะแบบนามธรรม
- Style: เรนเดอร์สถาปัตยกรรมแบบโฟโตรีเอลิสติก ความละเอียด 8K มุมกว้างแบบภาพยนตร์
- Lighting: ช่วงโกลเดนอะวร์ พร้อมแสงประดิษฐ์โทนอุ่นที่ส่องออกมาจากหน้าต่าง
- Details: ร่องรอยการผุกร่อนของหิน ยูนิต HVAC บนดาดฟ้า และเงาร่างคนเพื่อใช้อ้างอิงสเกล
ผลลัพธ์
- ผลลัพธ์ที่ได้คือ "ดี แต่ยังไม่สมบูรณ์แบบ"
- หากขอภาพจากมุมอื่นหรือไดอะแกรมสถาปัตยกรรมเฉพาะทาง (เช่น isometric cutaway) โมเดลมักจะ หลุดทิศทาง
- ต้อง รีพรอมต์ อย่างต่อเนื่องเพื่อรักษาความสม่ำเสมอของตำแหน่งสวนประติมากรรมและรูปแบบของคิ้วยึดกระจกหน้าต่าง
Nano Banana Pro vs. Midjourney vs. DALL-E
- การมาของ Nano Banana Pro ทำให้ 3 ยักษ์ใหญ่ของภาพวิชวลที่สร้างด้วย AI มีบทบาทแยกกันชัดเจน
- Midjourney: "นักฝัน" — เด่นด้านแสงแบบภาพยนตร์ รายละเอียดเชิงศิลป์ และบรรยากาศ
- DALL-E 3: "นักสื่อสาร" — เด่นด้านใช้งานง่ายและทำตามพรอมต์ได้ดี แต่ยังขาดความสมจริงในระดับปลายทาง
- Nano Banana Pro (Gemini): "วิศวกร" — กำลังบุกเบิกพื้นที่เฉพาะทางที่มีความเป็นเทคนิคมากกว่า
- มีศักยภาพสูงกว่าชัดเจนทั้งในด้านภาพวิชวลสมจริงและการแก้ไขแบบละเอียด
- สามารถถ่ายทอด พื้นผิวจริง อย่างการผุกร่อนเฉพาะแบบของหินปูนหรือการสะท้อนแสงของกระจกได้แม่นยำ ให้ผลลัพธ์ที่ใกล้ภาพถ่ายมากกว่าภาพวาด
- จุดต่างสำคัญคือ ความสามารถในการอ่านแบบ (blueprint literacy)
- Midjourney มองผังพื้นเป็นชุดของเส้นนามธรรม จึงมักให้การตีความเชิง "ศิลป์" ที่ไม่สอดคล้องกับโครงสร้างจริง
- Nano Banana Pro ตีความเส้นเหล่านั้นเป็น คำสั่งทางสถาปัตยกรรม ทำให้ผลลัพธ์เคารพตรรกะของพื้นที่ตามที่ตั้งใจไว้
สรุป: เป็นเครื่องมือสร้างแรงบันดาลใจ ไม่ใช่ตัวแทนทดแทน
- ในเวลานี้ ตำแหน่งของนักออกแบบยังปลอดภัย Nano Banana Pro เป็น เอนจินสำหรับการหาไอเดีย ที่ยอดเยี่ยม แต่ยังแทนที่การทำเอกสารไม่ได้
- ในอีก 5 ปีข้างหน้า มีความเป็นไปได้ว่าในวงการสถาปัตยกรรมและก่อสร้าง AI literacy จะกลายเป็นทักษะมาตรฐานเหมือนการใช้ AutoCAD หรือ Revit
- เวิร์กโฟลว์มีแนวโน้มจะขยับไปสู่รูปแบบไฮบริด ใช้ AI วนสำรวจ "มู้ด" และ "บรรยากาศ" ในช่วงต้นทาง แล้วจัดการความแม่นยำที่จำเป็นต่อการก่อสร้างจริงด้วย ซอฟต์แวร์ BIM แบบดั้งเดิม
- คำถามสำคัญที่การทดลองนี้ยังไม่ได้แตะคือ ต้นทุนด้านสิ่งแวดล้อม ของการฝึกโมเดลขนาดใหญ่ และพลังงานที่ใช้ต่อการสร้างผลลัพธ์แต่ละครั้ง
- Nano Banana Pro ไม่ใช่สถาปนิกหรือดีไซเนอร์ แต่เป็น "กระจก" — มันสะท้อนความคิดให้คมชัดและสว่างขึ้น แต่ก็ยังต้องการ มือมนุษย์ ที่มั่นคงคอยประคอง
ยังไม่มีความคิดเห็น