10 คะแนน โดย GN⁺ 2026-02-27 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ผสานฟีเจอร์ขั้นสูงของ Nano Banana Pro เข้ากับความเร็วของ Gemini Flash ทำให้สามารถ สร้างภาพและวนรอบการแก้ไขได้อย่างรวดเร็ว
  • มอบความสามารถระดับโปรด้วยความเร็วสูง เช่น การเรนเดอร์บนฐานความรู้ของโลก, การแสดงผลและการแปลข้อความอย่างแม่นยำ, การรักษาความสอดคล้องของวัตถุหรือหัวข้อ, รองรับความละเอียด 4K
  • นำไปใช้ครอบคลุมทั่วทั้งแอปของ Google: แอป Gemini, Search, AI Studio และ Gemini API, Flow, Google Ads เป็นต้น
  • ผสาน SynthID กับ C2PA Content Credentials เพื่อเสริมความสามารถในการ ระบุและตรวจสอบที่มาของคอนเทนต์ที่สร้างโดย AI
  • Google กำลังพัฒนา Nano Banana 2 ไปในทิศทางที่ช่วยยกระดับทั้ง ความน่าเชื่อถือ และ การนำไปใช้งานจริง ของสื่อเชิงกำเนิด

ภาพรวมของ Nano Banana 2

  • Nano Banana 2 (Gemini 3.1 Flash Image) ที่ Google DeepMind เปิดตัว เป็นโมเดลที่รวมความสามารถขั้นสูงของ Nano Banana Pro เข้ากับความเร็วของ Gemini Flash
    • โมเดลก่อนหน้าอย่าง Nano Banana ได้รับความสนใจจากการนิยามวิธีสร้างและแก้ไขภาพขึ้นมาใหม่ ส่วน Nano Banana Pro มอบความสามารถในการควบคุมระดับสตูดิโอ
    • เวอร์ชันนี้รวมจุดเด่นของทั้งสองโมเดลเข้าด้วยกัน ทำให้ได้ทั้ง การสร้างภาพคุณภาพสูง และ ความเร็วในการประมวลผลที่รวดเร็ว พร้อมกัน
  • Nano Banana 2 มีจุดเด่นด้าน ความรู้โลกขั้นสูง, การเรนเดอร์ข้อความอย่างแม่นยำ, ความสอดคล้องของวัตถุหรือหัวข้อ, และ รองรับสเปกสำหรับงานโปรดักชัน

ความฉลาดและคุณภาพภาพระดับ Flash

  • Nano Banana 2 นำ ความฉลาดความเร็วสูงของ Gemini Flash มาใช้กับการสร้างภาพ เพื่อรองรับการแก้ไขและการทำงานแบบวนซ้ำได้อย่างรวดเร็ว
    • ความรู้โลกขั้นสูง: ใช้ข้อมูลแบบเรียลไทม์ของ Gemini และข้อมูลจากภาพบนเว็บเพื่อถ่ายทอดหัวข้อเฉพาะได้แม่นยำยิ่งขึ้น
    • ทำให้สามารถสร้าง อินโฟกราฟิก, ไดอะแกรม, การแสดงข้อมูลเป็นภาพ ได้
  • ด้วยความสามารถด้าน การเรนเดอร์และการแปลข้อความอย่างแม่นยำ จึงสามารถสร้างข้อความที่คมชัดสำหรับม็อกอัปทางการตลาดหรือการทำการ์ด และแปลหรือโลคัลไลซ์ข้อความภายในภาพได้

ความสามารถในการควบคุมเชิงสร้างสรรค์ที่ดีขึ้น

  • Nano Banana 2 ลดช่องว่างระหว่างความเร็วกับความสมจริงของภาพ ทำให้สร้าง ภาพคุณภาพสูงและสมจริง ได้อย่างรวดเร็ว
    • ความสอดคล้องของวัตถุหรือหัวข้อ: รักษาความสม่ำเสมอของตัวละครได้สูงสุด 5 ตัวและวัตถุ 14 ชิ้นภายในเวิร์กโฟลว์เดียวกัน
    • ทำตามคำสั่งได้แม่นยำ: ถ่ายทอดรายละเอียดและนัยสำคัญของคำขอที่ซับซ้อนได้อย่างครบถ้วน
    • สเปกสำหรับงานโปรดักชัน: รองรับความละเอียดตั้งแต่ 512px ถึง 4K และอัตราส่วนหลากหลาย ตั้งแต่โพสต์โซเชียลไปจนถึงภาพพื้นหลังแบบกว้าง
    • อัปเกรดความสมจริงของภาพ: ให้พื้นผิว แสง และรายละเอียดที่สมบูรณ์ยิ่งขึ้น

การผสานเข้ากับผลิตภัณฑ์และการเข้าถึง

  • Nano Banana 2 กำลังทยอยนำไปใช้ทั่วทั้ง Google
    • แอป Gemini: Nano Banana 2 ถูกรวมมาเป็นค่าเริ่มต้นในโมเดล Fast, Thinking และ Pro ขณะที่ผู้สมัครสมาชิก Pro และ Ultra ยังสามารถใช้โมเดล Pro ต่อได้
    • Search: ใช้งานได้บนมือถือและเดสก์ท็อปผ่าน AI Mode และ Lens พร้อมรองรับเพิ่มอีก 141 ประเทศและ 8 ภาษา
    • AI Studio และ Gemini API: เปิดให้ใช้ในเวอร์ชันพรีวิว และใช้งานได้บน Vertex AI ด้วย
    • Flow: ตั้งเป็นโมเดลสร้างภาพพื้นฐานที่เปิดให้ผู้ใช้ทุกคนใช้ฟรี
    • Google Ads: นำไปใช้กับฟีเจอร์แนะนำภาพระหว่างสร้างแคมเปญโฆษณา

การตรวจสอบแหล่งที่มาและการเสริมความน่าเชื่อถือ

  • Google ผสาน SynthID เข้ากับ C2PA Content Credentials เพื่อเพิ่มความน่าเชื่อถือของสื่อเชิงกำเนิด
    • การผสานนี้ช่วยให้ทราบไม่เพียงแค่ว่ามีการใช้ AI หรือไม่ แต่ยังให้ ข้อมูลบริบทเกี่ยวกับวิธีที่ AI ถูกนำมาใช้ ด้วย
    • ฟังก์ชันตรวจสอบของ SynthID ถูกใช้งานไปแล้วมากกว่า 20 ล้านครั้งนับตั้งแต่เปิดตัว และถูกใช้ระบุภาพ วิดีโอ และเสียงที่สร้างโดย AI
    • เร็ว ๆ นี้ แอป Gemini จะเพิ่มความสามารถในการตรวจสอบแบบ C2PA ด้วย

สรุป

  • Nano Banana 2 คือโมเดลสร้างภาพรุ่นล่าสุดของ Google ที่มีครบทั้ง ความเร็ว ความแม่นยำ และคุณภาพ
  • ด้วยการผสานเข้ากับระบบนิเวศของ Gemini อย่างทั่วถึง จึงเปิดโอกาสให้ นักพัฒนา นักออกแบบ และนักการตลาด นำไปใช้ได้ทันที
  • เป็นตัวอย่างของพัฒนาการเชิงกลยุทธ์ของ Google ที่มุ่งทั้ง ความโปร่งใสของคอนเทนต์ AI และ การยกระดับผลิตภาพเชิงสร้างสรรค์ ไปพร้อมกัน

1 ความคิดเห็น

 
GN⁺ 2026-02-27
ความเห็นจาก Hacker News
  • ลองคาดการณ์บางอย่างเกี่ยวกับผลกระทบที่เครื่องมือสร้างภาพด้วย AI จะมีต่อศิลปะ

    1. ต่อจากนี้ เรื่องเล่าและชีวิตของศิลปิน จะยิ่งสำคัญมากขึ้น ไม่ใช่แค่สร้างผลงานอย่างเดียว แต่ต้องสร้างเรื่องราวและโลกทัศน์ของตัวเองไปพร้อมกัน
    2. คุณค่าของ ความเป็นต้นฉบับ จะสูงขึ้น AI ทำได้แค่ผสมของเดิมเข้าด้วยกัน และเพราะไม่มีประสบการณ์ที่มีชีวิต จึงสร้างความใหม่อย่างแท้จริงไม่ได้
    3. คนที่เรียนทักษะศิลปะจริงจังจะไปได้ไกลกว่าคนที่แค่เขียนพรอมป์ต์มาก คนที่ทุ่มเทจะยิ่งโดดเด่นขึ้น
    4. สุดท้ายแล้ว “รสนิยม” จะยังเป็นปัจจัยที่สำคัญที่สุด งานศิลปะจาก AI ส่วนใหญ่ไม่ดีนัก และนี่ไม่ใช่ปัญหาด้านเทคนิค แต่เป็นปัญหาด้านเซนส์
    5. ศิลปะที่ทำจากวัสดุจริง เช่น ประติมากรรมหรืออินสตอลเลชันอาร์ต ที่แปลงเป็นดิจิทัลได้ยาก จะได้รับความนิยม AI art ยากจะกลายเป็นกระแสหลักเพราะมัน ‘ไม่คูล(uncool)’
    • ไม่เห็นด้วยกับข้ออ้างส่วนใหญ่ ตัวอย่างเช่น มนุษย์เองก็สุดท้ายเป็นสิ่งมีชีวิตที่ คัดลอกและนำมาจัดเรียงใหม่ จากของเดิมอยู่ดี “ความเป็นต้นฉบับ” ไม่ใช่พลังระดับพระเจ้า
      เมื่อเทคโนโลยีพัฒนาไป แม้แต่ “รสนิยม” ก็อาจแก้ได้ด้วยเทคนิค ตอนนี้คนยังบอกว่า AI “ไม่คูล” แต่ก็น่าจะเป็นแค่ปัญหาในช่วงพัฒนาการเท่านั้น
      เหมือนกรณีของ SpaceX การใช้เป้าหมายที่ยังทำไม่สำเร็จมาเป็นเหตุผลเพื่อลดค่าภาพรวมทั้งหมดถือเป็นคำวิจารณ์ที่ผิด
    • เราผ่านยุค โพสต์โมเดิร์นนิสม์มาแล้ว 50 ปี ดังนั้นคงยากที่เรื่องเล่าของศิลปินจะสำคัญขึ้นไปกว่านี้
      ผมคิดว่าเทรนด์ถัดไปน่าจะเป็น ‘emergent design’ มากกว่า ตัวอย่างเช่น Czinger แสดงให้เห็นแนวทางการค้นหารูปทรงผ่านการเพิ่มประสิทธิภาพเชิงความน่าจะเป็น
    • ผมคิดว่า สารที่งานส่งออกมา สำคัญกว่าชีวิตของศิลปิน
      ตัวอย่างเช่น ต่อให้ Sora สร้างวิดีโอฟุตบอลที่สมบูรณ์แบบได้ แฟน ๆ ก็ยังจะดูการแข่งขันจริงอยู่ดี เหตุผลที่เราชื่นชมศิลปะคือ ความเชื่อมโยงทางอารมณ์ ที่มันเป็นสิ่งซึ่งมนุษย์สร้างขึ้น
      เพราะงั้นผมเลยอยากถามคนที่บอกว่า “AI art เท่ดี” — “แล้วศิลปะมีไว้เพื่ออะไร?”
    • ในอนาคต ‘ข้อมูล’ ว่างานชิ้นนั้นทำโดย AI หรือมนุษย์ จะกลายเป็นประเด็นสำคัญ ในบริบทธุรกิจ การแยกแยะนี้มีโอกาสสูงที่จะถูกกำกับด้วยกฎหมาย
    • ผมคิดว่าแก่นของศิลปะคือ ไอเดีย ไม่ใช่สื่อ เครื่องมือที่ใช้ง่ายไม่ได้รับประกันผลลัพธ์ที่ดี
      ผมเห็นงานเจ๋ง ๆ ที่ศิลปินจริงใช้ AI ทำมาแล้วมากมาย และก็ตื่นเต้นว่าจะมีการทดลองสร้างสรรค์อะไรออกมาจากเครื่องมือนี้อีก
  • ตอนนี้กำลังสร้างบ้านอยู่ และโมเดลภาพของ Nano Banana เปลี่ยนเกมในกระบวนการออกแบบไปเลย
    เรนเดอร์กันหลายร้อยครั้งเพื่อหาดีไซน์ที่ถูกใจ แล้วเอาไปสะท้อนในแบบของนักออกแบบภายใน
    CAD แสดงเส้นโค้งหรือองค์ประกอบตกแต่งได้ยาก แต่ Nano Banana ทำ ดีไซน์แบบออร์แกนิก ได้ดีมาก
    ผลลัพธ์คือบ้านออกมาสวยกว่ามาก

    • แก่นของการออกแบบภายในก็คือ ทำให้ภาพกลายเป็นของจริง เลยอยากรู้ว่าแปลงเรนเดอร์จาก Nano Banana ไปเป็นวัสดุจริง งานผิวจริง และโค้ดสีได้อย่างไร
    • สงสัยว่านี่เป็นจุดแข็งเฉพาะของ Nano Banana หรือว่าโมเดลอื่นอย่าง Klein หรือ ZIT ก็ทำได้เหมือนกัน
    • NB Pro น่าประทับใจมากในด้านการแก้ไขภาพภายในอาคาร ตัวอย่างเช่น ถ้าเปลี่ยนหน้าต่างเป็นกระจก ก็ยังถ่ายทอดเงาสะท้อนในห้องได้อย่างถูกต้อง แม้จะไม่สมบูรณ์แบบแต่ก็ยังน่าทึ่ง
      ดูตัวอย่างที่เกี่ยวข้องได้ในบล็อกนี้
    • ผมก็มีประสบการณ์คล้ายกัน ผมใช้ Gemini ออกแบบลานหลังบ้านใหม่ ตั้งแต่การแนะนำวัสดุไปจนถึงการจัดวาง แทบจะสมบูรณ์แบบ
      ยกเว้นไอเดียแปลกใหม่บางอย่างที่นักออกแบบเสนอ ส่วนใหญ่แล้ว Gemini ทำได้ดีกว่า
    • ผมเคยลองทำ แอป visualization สำหรับอินทีเรียร์ ด้วยตัวเอง และรู้สึกว่าความสามารถของโมเดลพวกนี้ยังถูกประเมินต่ำเกินไปในหมู่คนทั่วไป
      การที่สามารถเปลี่ยนสี เฟอร์นิเจอร์ และเลย์เอาต์ได้ภายในไม่กี่วินาทีนั้นยังน่าทึ่งอยู่เสมอ
  • ช่วงนี้ภาพ AI สมจริง มากจนคนทั่วไปมักเข้าใจผิดว่าเป็นภาพถ่ายจริง
    เช่น รูปอาหารบน Facebook หรือภาพโมเดลปลอม
    แม้พลังในการแสดงออกจะดีขึ้น แต่ขณะเดียวกันก็รู้สึกถึง ด้านที่น่าขนลุก ด้วย

    • ในทางปฏิบัติ คนแทบทุกคนที่ใช้อินเทอร์เน็ตคงเคย เห็นภาพ AI โดยคิดว่าเป็นของจริง มาแล้ว
      บางกรณีชัดเจน แต่ส่วนใหญ่แยกไม่ออก
    • ผมกลับคิดว่าเป็นเรื่องดี สมัยก่อนการแต่งภาพมีค่าใช้จ่ายสูงเกินไป คนส่วนใหญ่เลยเชื่อว่าภาพถ่ายคือ “ของจริง”
      ตอนนี้ใคร ๆ ก็สร้างภาพปลอมได้ ทำให้คนเริ่มเรียนรู้เรื่อง การตรวจสอบแหล่งที่มาและการตัดสินความน่าเชื่อถือ โดยธรรมชาติ
    • อีกไม่นานแม้แต่ โมเดล OnlyFans ตัวจริง ก็อาจตกงานได้ เพราะจะสามารถสร้างคอนเทนต์ตามรสนิยมส่วนบุคคลด้วยพรอมป์ต์ได้
    • ถึงอย่างนั้น ความต้องการคอนเทนต์จาก คนจริง ก็จะไม่หายไป
    • ถ้ามีวิดีโอดัดแปลงใบหน้าของผมแพร่กระจายออกไป ผมกลับคิดว่า ผมจะปล่อยดีปเฟกของตัวเองเพิ่ม เพื่อกลบของจริงไปเลย
  • ในระยะยาว ภาพจะกลายเป็น สินค้าโภคภัณฑ์และสูญเสียคุณค่าทางอารมณ์
    เมื่อก่อนรูปถ่ายหนึ่งใบมีค่า แต่ตอนนี้มันเป็นแค่หนึ่งในหลายพันใบ
    AI art ก็เช่นกัน ถ้ามีมากเกินไป ความรู้สึกประทับใจก็จะลดลง

    • ด้วยเหตุนี้ผมจึงรู้สึกว่าเกิด การหวนกลับมาของสื่อแอนะล็อก
      ผมถ่ายภาพงานแต่ง และในช่วง 2 ปีที่ผ่านมา คำขอถ่ายด้วยฟิล์มเพิ่มขึ้นอย่างมาก
      ความนิยมของแผ่นเสียงไวนิลหรือกล้องดิจิทัลรุ่นเก่าก็อยู่ในบริบทเดียวกัน
    • แต่ผมก็คิดว่าถ้าคัดเลือกและรวบรวมภาพดี ๆ ไว้ ความ ลึกทางอารมณ์ ก็ยังคงอยู่
    • ตอนนี้เป็นยุคที่การเปลี่ยนแปลงเกิดขึ้นเร็วเกินไป ในฐานะผู้ชมมันน่าสนใจ แต่สำหรับ คนที่ลงไปเล่นเอง มันก็เป็นช่วงเวลาที่น่ากลัวเช่นกัน
    • เหมือน Star Wars ถ้าคอนเทนต์ถูกป้อนมากเกินไป ความประทับใจจะถูกเจือจาง ฉากที่เคยเป็นสัญลักษณ์ในอดีต ตอนนี้กลับรู้สึกธรรมดา
    • สำหรับผม AI ช่วยคัดเลือกรูปให้อัตโนมัติ ดังนั้นสุดท้ายแล้ว จำนวนรูปดี ๆ ก็ยังใกล้เคียงกับเมื่อก่อน
  • ตัวอย่างของโมเดลใหม่ที่แสดงสไตล์ ‘cubism’ ค่อนข้างน่าผิดหวัง
    แก่นของลัทธิเหลี่ยมจัดคือการรวมหลายมุมมอง เวลา และสไตล์ไว้ในภาพเดียว
    แต่ AI แค่เลียนแบบ การแบ่งรูปทรงแบบเรขาคณิต เท่านั้น ยังให้ความรู้สึกว่าเลียนแบบแค่ ‘รูปทรง’ มากกว่า ‘ความหมาย’

    • ผมก็รู้สึกคล้ายกัน แต่เดโมครั้งนี้น่าจะมีเป้าหมายเพื่อแสดง ความแม่นยำของโครงสร้างทางกายภาพ มากกว่าสไตล์ศิลปะ
      ก่อนหน้านี้มันสร้างอาคารแบบสุ่ม แต่ตอนนี้ค้นหาข้อมูลจริงมาใช้อ้างอิงแล้ว
      ดูตัวอย่างเพิ่มเติมได้ที่ หน้า DeepMind Gemini Image Flash
  • ถ้าในอดีตมี AI แบบนี้อยู่ ผลงานอย่าง Mona Lisa หรือภาพเพดานโบสถ์น้อยซิสทีน อาจไม่ถือกำเนิดขึ้นก็ได้
    เพราะน่าจะสร้างด้วยพรอมป์ต์ได้ถูกกว่า

    • ผมกลับคิดว่าตรงกันข้าม ศิลปินสร้างงานไม่ใช่เพราะเงิน แต่เพราะ ความปรารถนาที่จะก้าวข้ามขีดจำกัด
      AI คือเครื่องมือที่จะยกขีดจำกัดนั้นให้สูงขึ้นอีก
    • ที่โมเดลแบบนี้เกิดขึ้นได้ ก็เพราะมี ศิลปะอันยิ่งใหญ่ในอดีต รองรับอยู่
    • ผมมองว่า AI สุดท้ายจะ ไปด้วยกันไม่ได้กับทุนนิยม
      ยิ่งเทคโนโลยีพัฒนา “ความหายาก” ก็ยิ่งหายไป และคุณค่าที่แท้จริงจะไปกระจุกอยู่ใน ระบบควบคุม
      อดีตเหล่าปรมาจารย์ยังถูกจดจำได้เพราะมีผู้อุปถัมภ์ แต่ครีเอเตอร์ยุคนี้กลับถูกกลบเพราะปัญหาปากท้อง
      อย่างที่ Terence McKenna เคยพูดไว้ อนาคตจะยิ่งมุ่งไปในทิศทางที่ ประหลาดและขัดแย้ง มากขึ้น
      ดูวิดีโอที่เกี่ยวข้องได้ที่ลิงก์นี้
    • ถ้าวาด Mona Lisa ด้วย Illustrator ในปี 2015 มันจะดีกว่าหรือเปล่า? ผมอยากโยนคำถามนี้กลับไป
    • AI สุดท้ายก็ทำได้แค่ ผสมแนวคิดที่มีอยู่แล้ว
      ตัวอย่างเช่น “ภาพพระเยซูปักธงบนดวงจันทร์” ทำได้ แต่ “ภาพ jacquesm ปักธงบนดวงจันทร์” กลับออกมาเละเทะ
  • มีการทดสอบผลลัพธ์ของ gemini-3.1-flash-image-preview (NB 2) ใน GenAI Showdown
    การพัฒนาจาก NB → NB Pro นั้นชัดเจนมาก แต่จาก NB Pro → NB Pro 2 ไม่ได้ดีขึ้นมากนัก
    โดยเฉพาะคุณภาพด้าน localization กลับแย่ลงด้วยซ้ำ
    ดูการเปรียบเทียบอย่างละเอียดได้ที่ลิงก์นี้

    • เป็นการทดสอบที่ดี แต่ชื่อเรียกคือ NB Pro กับ NB 2 ไม่ใช่ NB Pro 2
    • ผมชอบเว็บไซต์และผลงานของคุณมากจริง ๆ
  • ผมลองใช้ NB Pro 2 แป๊บหนึ่งแล้ว รู้สึกว่าใกล้เคียงกับ การปรับปรุงแบบค่อยเป็นค่อยไปมากกว่าการก้าวกระโดดด้านฟังก์ชัน
    ถึงอย่างนั้นการที่มันผ่าน ‘King Louie jump rope test’ ได้ก็น่าทึ่งมาก
    ดูผลการทดสอบได้ที่หน้านี้

  • สำหรับการแต่งภาพส่วนตัว ข้อจำกัดเรื่อง การตรวจจับคนดัง ยังเข้มเกินไป
    คนแทบทุกคนถูกตรวจว่า “หน้าคล้ายคนดัง” จนแก้ไขภาพไม่ได้

    • ข้อจำกัดนี้มีเฉพาะในยุโรป ถ้าใช้ US VPN หรือ Vertex AI ก็สามารถสร้างบุคคลได้อย่างอิสระ
  • ในมุมวิศวกรรม มันเป็นเทคโนโลยีที่เจ๋ง แต่ก็ยังสงสัยว่ามี เหตุผลเชิงธุรกิจที่ชอบธรรม สำหรับการใช้งานหรือไม่
    ส่วนใหญ่ดูเหมือนใช้เพราะ “ไม่อยากจ่ายเงินให้ศิลปิน”
    เวลาบริษัทใหญ่ปล่อยคอนเทนต์จำนวนมหาศาล ผลกระทบด้านลบอาจยิ่งรุนแรง

    • เหมือนเครื่องถ่ายเอกสารหรืออีเมล เทคโนโลยีมีบทบาทเรื่อง ลดต้นทุนและทดแทน มาตลอด ครั้งนี้ก็ไม่ต่างกัน
    • โดยเฉพาะในวงการโฆษณา มันช่วย ธุรกิจขนาดเล็กที่มีงบน้อย ได้มาก
    • มีประโยชน์กับ การทำไดอะแกรม เหตุที่เอกสารมักขาดภาพประกอบ ก็เพราะมันทำยาก
    • ผมเองก็ใช้ NB แทน Photoshop ในโปรเจกต์ส่วนตัว งานที่เคยใช้เวลาเป็นชั่วโมง เหลือแค่ 3 นาที
      ประสิทธิภาพแบบนี้เอาไปใช้กับธุรกิจขนาดเล็กได้มากพออยู่แล้ว
    • ผมไม่เห็นด้วยกับสมมติฐานที่ว่าทุกคนควรต้อง ยอมรับความไม่มีประสิทธิภาพ เพื่อรักษาปากท้องของศิลปิน