15 คะแนน โดย GN⁺ 2025-04-13 | 8 ความคิดเห็น | แชร์ทาง WhatsApp
  • Google กำลังกุมความเป็นผู้นำในทุกด้านของ AI โดยเหนือกว่าคู่แข่งทั้งในเรื่องประสิทธิภาพของโมเดล AI ความคุ้มค่าด้านราคา และการผสานเข้ากับผลิตภัณฑ์
  • โดยมี Gemini 2.5 Pro เป็นแกนหลัก Google กำลังนำเสนอเทคโนโลยี generative AI ที่หลากหลาย ทั้งข้อความ ภาพ เพลง วิดีโอ เสียง และเอเจนต์ พร้อมเร่งผสานสิ่งเหล่านี้เข้ากับ ecosystem ของ Google อย่างรวดเร็ว
  • ด้วยทั้งโครงสร้างพื้นฐานคลาวด์ ฮาร์ดแวร์เฉพาะทางสำหรับ AI และสมาร์ตโฟน Google จึงอยู่ในตำแหน่งที่ได้เปรียบกว่า OpenAI หรือ Anthropic มาก และกำลังเป็นผู้นำในยุค AI

การคืนชีพของ DeepMind และความได้เปรียบรอบด้านของ Google

  • ผู้เขียนเป็นแฟนของ DeepMind มานาน และย้อนรำลึกว่า AlphaGo กับ AlphaZero คือช่วงเวลาที่น่าหลงใหลของ AI อย่างแท้จริง มากกว่า ChatGPT
  • Google เคยมีโอกาสทิ้งห่างได้มากก่อนการเปิดตัว ChatGPT แต่กลับพลาดโอกาสไปเพราะระมัดระวังมากเกินไปเพื่อปกป้องรายได้จากโฆษณาในการค้นหา
  • อย่างไรก็ตาม หลังจากนั้น Google และ DeepMind ก็ไม่ได้ทำพลาดซ้ำอีก และตอนนี้กำลังนำหน้าในภาพรวมของวงการ AI

ประสิทธิภาพที่ไม่เคยมีมาก่อนของ Gemini 2.5 Pro

  • Gemini 2.5 Pro Experimental กำลังครองอันดับ 1 ทั้งใน benchmark แบบเปิดเผยและไม่เปิดเผยหลายรายการ

    • เช่น LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (คณิตศาสตร์), Aider Polyglot (การเขียนโค้ด), Live Bench (ความหลากหลาย) เป็นต้น
    • มีความสามารถในการเล่น Pokémon เหนือกว่า Claude Sonnet และกำลังไต่อันดับอย่างรวดเร็วใน Minecraft Bench
    • ยังแสดงผลลัพธ์โดดเด่นในงานเขียนเชิงสร้างสรรค์และความเข้าใจข้อความยาว
  • ในการประเมินจากผู้ใช้ Gemini 2.5 Pro ก็ถูกมองอย่างกว้างขวางว่าเป็นตัวที่ดีที่สุดในอุตสาหกรรม

    • มีผู้ใช้จำนวนมากบน Reddit, X และแพลตฟอร์มอื่น ๆ แชร์ประสบการณ์ใช้งานจริงเพื่อยืนยันความยอดเยี่ยม
  • โดดเด่นในทุกมิติทั้งความเร็ว ราคา และความสามารถ

    • เร็ว ราคาถูก และให้ context window ขนาด 1 ล้านโทเค็น
    • มีแผนผสานเข้ากับชุดผลิตภัณฑ์ของ Google (Gmail, Docs, Maps เป็นต้น)

โมเดลขนาดเบา Gemini Flash และ Gemma 3 แบบโอเพนซอร์ส

  • Gemini 2.5 Flash เป็นโมเดลขนาดเบาที่เหมาะกับสภาพแวดล้อมบนมือถือและ edge
    • เร็วและราคาถูกมาก อีกทั้งยังคุ้มค่าเมื่อเทียบกับ Flash, Flash Lite และ Flash Thinking เวอร์ชันก่อนหน้า
  • Gemma 3 เป็นโมเดลโอเพนซอร์สของ Google ที่สามารถแข่งขันกับ Llama 4 และ DeepSeek-V3 ได้

สมดุลที่ลงตัวระหว่างราคาและประสิทธิภาพ

  • Google ครอง Pareto Frontier ทั้งในฝั่งโมเดลประสิทธิภาพสูงและโมเดลต้นทุนต่ำ
    • โมเดลสมรรถนะสูงก็ยังคุ้มค่า ส่วนโมเดลราคาประหยัดก็ยังให้ประสิทธิภาพที่ดีเพียงพอ

ความเหนือกว่าในทุกแขนงของ generative AI

  • นอกจากโมเดลข้อความแล้ว Gemini ยังอยู่ในระดับแนวหน้าด้านเพลง (Lyria), ภาพ (Imagen 3), วิดีโอ (Veo 2) และเสียง (Chirp 3)
    • Veo 2 ถูกประเมินว่ามีความพร้อมใช้งานจริงสูงกว่า Sora ของ OpenAI

ระบบเอเจนต์และเทคโนโลยีอินเทอร์เฟซ

  • โหมด Deep Research ของ Gemini 2.5 Pro เหนือกว่า OpenAI อยู่สองเท่า
  • กำลังเดินหน้าโครงการหลากหลาย เช่น Project Astra (เอเจนต์ผู้ช่วย) และ Project Mariner (อินเทอร์เฟซคอมพิวเตอร์)
  • มีแผนรองรับทั้ง Agent2Agent protocol และ Model Context Protocol

ผลงานวิจัยต่อเนื่องและการมีส่วนร่วมทางวิชาการ

  • Google DeepMind เผยแพร่งานวิจัยอย่างต่อเนื่องในเวทีระดับโลก เช่น Nature, ICLR และ NeurIPS
  • ยังเข้าหา AGI และ AI สำหรับอุตสาหกรรมด้วยความรับผิดชอบในระดับสูง

ecosystem ของ Google และการผสาน AI

  • Google เป็นทั้งบริษัท AI และบริษัทซอฟต์แวร์สำหรับผู้บริโภค จึงสามารถผสาน AI เข้ากับผลิตภัณฑ์ทั้งหมดได้
    • มีแผนติดตั้ง AI ใน 7 ผลิตภัณฑ์ที่มีผู้ใช้ต่อเดือน 2 พันล้านคน ได้แก่ Search, YouTube, Android, Gmail, Chrome และอื่น ๆ
    • หาก Gemini ถูกผสานเข้ากับ ecosystem ทั้งหมดของ Google ก็จะกลายเป็น AI ที่ดีที่สุดซึ่งถูกติดตั้งมาให้โดยค่าเริ่มต้นสำหรับผู้ใช้หลายพันล้านคน

ความสามารถในการแข่งขันด้านคลาวด์และโครงสร้างพื้นฐานฮาร์ดแวร์

  • Google ให้เช่าชิปสำหรับโมเดล AI ผ่าน Google Cloud และยังพัฒนาชิป TPU ของตนเอง (Ironwood v7)
    • Microsoft สนับสนุน OpenAI ผ่านคลาวด์ ส่วน Amazon สนับสนุน Anthropic แต่ Google สามารถรองรับทุกอย่างได้ภายใน ecosystem ของตนเอง
    • ในด้านฮาร์ดแวร์ AI ก็ยังกำลังแข่งขันกับ Nvidia

รุกเข้าสู่ตลาดสมาร์ตโฟนด้วย

  • Google ติดตั้ง Gemini มาเป็นค่าเริ่มต้นใน Pixel 9 ทำให้สามารถแข่งขันกับ Apple และ Samsung ได้
    • ฟีเจอร์ AI อย่างการแชร์หน้าจอและการควบคุมกล้องถูกนำมาใช้งานจริงแล้ว
    • ขณะที่ AI wearable/อุปกรณ์จากบริษัทอื่นที่พยายามทำมาก่อนหน้านี้กำลังล้มเหลว

บทสรุป: ความได้เปรียบชี้ขาดของ Google + DeepMind

  • ผู้เขียนถึงกับประหลาดใจต่อความเหนือกว่ารอบด้านของ Google จนย้อนมองว่าก่อนหน้านี้ตนเองไปคาดหวังกับ OpenAI, Anthropic และ Meta ได้อย่างไร
  • แม้จะยังต้องจับตาการโต้กลับจากคู่แข่งต่อไป แต่ในตอนนี้ก็ชัดเจนว่า Google คือผู้ชนะอย่างเด็ดขาดในสงคราม AI

8 ความคิดเห็น

 
phoon 2025-04-14

แม้จะไม่มีโมเดลที่เอาชนะ GPT-4.5 ได้ในแง่สเปกอยู่บ้างก็จริง... แต่แค่ลองให้แปลธรรมดา ๆ ก็ยังเห็นได้ว่าความสามารถในการเรียบเรียงประโยคของทั้งสองฝั่งนั้นไม่ได้ใกล้เคียงกันเลย (GPT ชนะขาด)
ตอนนี้คงถึงเวลาที่ต้องมีการถกเถียงกันแล้วว่าจะออกแบบ benchmark หรือ test set กันอย่างไร
แถมก็ได้ยินคำวิจารณ์อยู่เรื่อย ๆ ว่าประสิทธิภาพของตัว LLM เองในงานทั่วไปยังต่ำกว่าที่คาดไว้...

 
guitarhero 2025-04-14

"ผู้เขียนเป็นแฟนของ DeepMind มาอย่างยาวนาน"

 
smboy86 2025-04-13

ผมลอง 2.5 อยู่แป๊บหนึ่งเหมือนกัน อืม.. สุดท้ายก็รู้สึกว่า gpt ดีกว่าอยู่ดีไหมนะ; หรือว่าแล้วแต่คน

 
mssmss 2025-04-14

ตอนนี้ผมเองก็ใช้ Gemini มากขึ้นแล้วเหมือนกัน เป็นประสบการณ์ที่ยิ่งใช้ก็ยิ่งเห็นช่องว่างชัดขึ้นเรื่อย ๆ

 
kandk 2025-04-14

ผมก็รู้สึกว่า GPT ดีกว่านิดหน่อยเหมือนกัน..

 
3xplore 2025-04-14

ผมรู้สึกว่า gemini 2.5 ให้คำตอบที่มีคุณภาพสูงกว่า gpt, claude และ grok3 มากครับ
โดยเฉพาะช่วงหลัง ๆ gpt ช้าลงมากจนใช้งานได้ไม่สะดวกครับ

 
GN⁺ 2025-04-13
ความคิดเห็นจาก Hacker News
  • ในฐานะอดีตพนักงาน OpenAI มีบุคลากร ML ระดับหลักจำนวนมากออกจาก OpenAI ไปยังสตาร์ทอัพอื่น แอป ChatGPT เป็นผลิตภัณฑ์ที่ประสบความสำเร็จหลักของ OpenAI แต่รายได้ที่ทำได้จากค่าสมัครสมาชิกมีขีดจำกัด คาดว่าอีกไม่นานจะมีการให้บริการฟรี และโฆษณาจะกลายเป็นทางเลือกหลักในการสร้างรายได้ Google รู้สึกไม่สบายใจกับกลยุทธ์การหาผู้ใช้ของ OpenAI และต้องส่งมอบนวัตกรรมให้ผู้ใช้ได้อย่างรวดเร็ว

  • บทความนี้ไม่ได้พูดถึง TPU เลย ระบบนิเวศ JAX + TPU ของ Google ยอดเยี่ยมมาก Google มีโซลูชันการประมวลผลของตัวเอง จึงได้เปรียบในการแข่งขัน บริษัท AI ต้องตอบคำถามว่า "พวกเขาทำอะไรได้บ้างที่ที่อื่นทำไม่ได้?" และความได้เปรียบด้านฮาร์ดแวร์ของ Google ก็มอบคำตอบที่เป็นรูปธรรมให้กับคำถามนี้

  • ความเห็นเกี่ยวกับผู้นำในสาย ML เปลี่ยนบ่อยมาก ไม่กี่เดือนก่อนยังคิดว่า Google ล้มเหลว แต่ตอนนี้ OpenAI กำลังเสียความนิยม แม้ตอนนี้ Google จะทำได้ดี แต่ไม่กี่เดือนข้างหน้าสถานการณ์ก็อาจเปลี่ยนไปอย่างสิ้นเชิง

  • Google มีจุดอ่อนด้านการตลาด ความน่าเชื่อถือ ความปลอดภัย และส่วนแบ่งตลาด อย่างไรก็ตาม โมเดล Gemini Pro 2.5 นั้นยอดเยี่ยมมาก

  • มีความเห็นว่า LLMs สามารถขับเคลื่อนด้วยโฆษณาได้ "adsense" แบบอิง LLM อาจทำงานได้อย่างแนบเนียนและแยบยลมาก โดยสามารถแทรกโฆษณาเข้าไปในบทสนทนาได้อย่างเป็นธรรมชาติ

  • ผู้ใช้ Claude ลองใช้ Gemini 2.5 แล้วพอใจกับระบบนิเวศที่บูรณาการของ Google ทำให้ Google ประสบความสำเร็จอีกครั้ง

  • นอกจาก Gemini 2.5 Pro แล้ว Gemini 2.0 Flash ก็เป็นโมเดลที่อเนกประสงค์ ราคาถูก รองรับมัลติโหมด และให้ความเร็วที่เชื่อถือได้ อีกทั้งยังมี real-time API ด้วย

  • Gemini 2.5 Pro เหนือกว่า Deep Research ของ OpenAI ถึงสองเท่า Deep Research ของ Google ลึกกว่า ครบถ้วนกว่า และเฉียบคมกว่า

  • Gemini 2.5 Pro ทรงพลังมาก แต่ก็ยังใช้ Claude Sonnet 3.7 อยู่เพราะมีปัญหากับเว็บ UI Google กำลังใช้ประโยชน์จากเสิร์ชเอนจินที่ใหญ่ที่สุดและ YouTube ในการพัฒนา AI

  • ตราบใดที่ Google ยังจำกัดตัวเองด้วยการเซ็นเซอร์ ก็ไม่สามารถใช้ผลิตภัณฑ์ของพวกเขาได้ Gemini 2.5 Pro ตอบคำถามบางอย่างไม่ได้ แต่ ChatGPT 4o ให้คำตอบที่ถูกต้อง

 
iolothebard 2025-04-22

เหมือนได้ติวข้อสอบแบบจับประเด็นสไตล์เกาหลีมา… เลยทำข้อสอบได้เก่งมาก
แต่พอคุยกันจริงๆ… กลับดูเปิ่นๆ