Google กำลังชนะในทุกด้านของ AI
(thealgorithmicbridge.com)- Google กำลังกุมความเป็นผู้นำในทุกด้านของ AI โดยเหนือกว่าคู่แข่งทั้งในเรื่องประสิทธิภาพของโมเดล AI ความคุ้มค่าด้านราคา และการผสานเข้ากับผลิตภัณฑ์
- โดยมี Gemini 2.5 Pro เป็นแกนหลัก Google กำลังนำเสนอเทคโนโลยี generative AI ที่หลากหลาย ทั้งข้อความ ภาพ เพลง วิดีโอ เสียง และเอเจนต์ พร้อมเร่งผสานสิ่งเหล่านี้เข้ากับ ecosystem ของ Google อย่างรวดเร็ว
- ด้วยทั้งโครงสร้างพื้นฐานคลาวด์ ฮาร์ดแวร์เฉพาะทางสำหรับ AI และสมาร์ตโฟน Google จึงอยู่ในตำแหน่งที่ได้เปรียบกว่า OpenAI หรือ Anthropic มาก และกำลังเป็นผู้นำในยุค AI
การคืนชีพของ DeepMind และความได้เปรียบรอบด้านของ Google
- ผู้เขียนเป็นแฟนของ DeepMind มานาน และย้อนรำลึกว่า AlphaGo กับ AlphaZero คือช่วงเวลาที่น่าหลงใหลของ AI อย่างแท้จริง มากกว่า ChatGPT
- Google เคยมีโอกาสทิ้งห่างได้มากก่อนการเปิดตัว ChatGPT แต่กลับพลาดโอกาสไปเพราะระมัดระวังมากเกินไปเพื่อปกป้องรายได้จากโฆษณาในการค้นหา
- อย่างไรก็ตาม หลังจากนั้น Google และ DeepMind ก็ไม่ได้ทำพลาดซ้ำอีก และตอนนี้กำลังนำหน้าในภาพรวมของวงการ AI
ประสิทธิภาพที่ไม่เคยมีมาก่อนของ Gemini 2.5 Pro
-
Gemini 2.5 Pro Experimental กำลังครองอันดับ 1 ทั้งใน benchmark แบบเปิดเผยและไม่เปิดเผยหลายรายการ
- เช่น LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (คณิตศาสตร์), Aider Polyglot (การเขียนโค้ด), Live Bench (ความหลากหลาย) เป็นต้น
- มีความสามารถในการเล่น Pokémon เหนือกว่า Claude Sonnet และกำลังไต่อันดับอย่างรวดเร็วใน Minecraft Bench
- ยังแสดงผลลัพธ์โดดเด่นในงานเขียนเชิงสร้างสรรค์และความเข้าใจข้อความยาว
-
ในการประเมินจากผู้ใช้ Gemini 2.5 Pro ก็ถูกมองอย่างกว้างขวางว่าเป็นตัวที่ดีที่สุดในอุตสาหกรรม
- มีผู้ใช้จำนวนมากบน Reddit, X และแพลตฟอร์มอื่น ๆ แชร์ประสบการณ์ใช้งานจริงเพื่อยืนยันความยอดเยี่ยม
-
โดดเด่นในทุกมิติทั้งความเร็ว ราคา และความสามารถ
- เร็ว ราคาถูก และให้ context window ขนาด 1 ล้านโทเค็น
- มีแผนผสานเข้ากับชุดผลิตภัณฑ์ของ Google (Gmail, Docs, Maps เป็นต้น)
โมเดลขนาดเบา Gemini Flash และ Gemma 3 แบบโอเพนซอร์ส
- Gemini 2.5 Flash เป็นโมเดลขนาดเบาที่เหมาะกับสภาพแวดล้อมบนมือถือและ edge
- เร็วและราคาถูกมาก อีกทั้งยังคุ้มค่าเมื่อเทียบกับ Flash, Flash Lite และ Flash Thinking เวอร์ชันก่อนหน้า
- Gemma 3 เป็นโมเดลโอเพนซอร์สของ Google ที่สามารถแข่งขันกับ Llama 4 และ DeepSeek-V3 ได้
สมดุลที่ลงตัวระหว่างราคาและประสิทธิภาพ
- Google ครอง Pareto Frontier ทั้งในฝั่งโมเดลประสิทธิภาพสูงและโมเดลต้นทุนต่ำ
- โมเดลสมรรถนะสูงก็ยังคุ้มค่า ส่วนโมเดลราคาประหยัดก็ยังให้ประสิทธิภาพที่ดีเพียงพอ
ความเหนือกว่าในทุกแขนงของ generative AI
- นอกจากโมเดลข้อความแล้ว Gemini ยังอยู่ในระดับแนวหน้าด้านเพลง (Lyria), ภาพ (Imagen 3), วิดีโอ (Veo 2) และเสียง (Chirp 3)
- Veo 2 ถูกประเมินว่ามีความพร้อมใช้งานจริงสูงกว่า Sora ของ OpenAI
ระบบเอเจนต์และเทคโนโลยีอินเทอร์เฟซ
- โหมด Deep Research ของ Gemini 2.5 Pro เหนือกว่า OpenAI อยู่สองเท่า
- กำลังเดินหน้าโครงการหลากหลาย เช่น Project Astra (เอเจนต์ผู้ช่วย) และ Project Mariner (อินเทอร์เฟซคอมพิวเตอร์)
- มีแผนรองรับทั้ง Agent2Agent protocol และ Model Context Protocol
ผลงานวิจัยต่อเนื่องและการมีส่วนร่วมทางวิชาการ
- Google DeepMind เผยแพร่งานวิจัยอย่างต่อเนื่องในเวทีระดับโลก เช่น Nature, ICLR และ NeurIPS
- ยังเข้าหา AGI และ AI สำหรับอุตสาหกรรมด้วยความรับผิดชอบในระดับสูง
ecosystem ของ Google และการผสาน AI
- Google เป็นทั้งบริษัท AI และบริษัทซอฟต์แวร์สำหรับผู้บริโภค จึงสามารถผสาน AI เข้ากับผลิตภัณฑ์ทั้งหมดได้
- มีแผนติดตั้ง AI ใน 7 ผลิตภัณฑ์ที่มีผู้ใช้ต่อเดือน 2 พันล้านคน ได้แก่ Search, YouTube, Android, Gmail, Chrome และอื่น ๆ
- หาก Gemini ถูกผสานเข้ากับ ecosystem ทั้งหมดของ Google ก็จะกลายเป็น AI ที่ดีที่สุดซึ่งถูกติดตั้งมาให้โดยค่าเริ่มต้นสำหรับผู้ใช้หลายพันล้านคน
ความสามารถในการแข่งขันด้านคลาวด์และโครงสร้างพื้นฐานฮาร์ดแวร์
- Google ให้เช่าชิปสำหรับโมเดล AI ผ่าน Google Cloud และยังพัฒนาชิป TPU ของตนเอง (Ironwood v7)
- Microsoft สนับสนุน OpenAI ผ่านคลาวด์ ส่วน Amazon สนับสนุน Anthropic แต่ Google สามารถรองรับทุกอย่างได้ภายใน ecosystem ของตนเอง
- ในด้านฮาร์ดแวร์ AI ก็ยังกำลังแข่งขันกับ Nvidia
รุกเข้าสู่ตลาดสมาร์ตโฟนด้วย
- Google ติดตั้ง Gemini มาเป็นค่าเริ่มต้นใน Pixel 9 ทำให้สามารถแข่งขันกับ Apple และ Samsung ได้
- ฟีเจอร์ AI อย่างการแชร์หน้าจอและการควบคุมกล้องถูกนำมาใช้งานจริงแล้ว
- ขณะที่ AI wearable/อุปกรณ์จากบริษัทอื่นที่พยายามทำมาก่อนหน้านี้กำลังล้มเหลว
บทสรุป: ความได้เปรียบชี้ขาดของ Google + DeepMind
- ผู้เขียนถึงกับประหลาดใจต่อความเหนือกว่ารอบด้านของ Google จนย้อนมองว่าก่อนหน้านี้ตนเองไปคาดหวังกับ OpenAI, Anthropic และ Meta ได้อย่างไร
- แม้จะยังต้องจับตาการโต้กลับจากคู่แข่งต่อไป แต่ในตอนนี้ก็ชัดเจนว่า Google คือผู้ชนะอย่างเด็ดขาดในสงคราม AI
8 ความคิดเห็น
แม้จะไม่มีโมเดลที่เอาชนะ GPT-4.5 ได้ในแง่สเปกอยู่บ้างก็จริง... แต่แค่ลองให้แปลธรรมดา ๆ ก็ยังเห็นได้ว่าความสามารถในการเรียบเรียงประโยคของทั้งสองฝั่งนั้นไม่ได้ใกล้เคียงกันเลย (GPT ชนะขาด)
ตอนนี้คงถึงเวลาที่ต้องมีการถกเถียงกันแล้วว่าจะออกแบบ benchmark หรือ test set กันอย่างไร
แถมก็ได้ยินคำวิจารณ์อยู่เรื่อย ๆ ว่าประสิทธิภาพของตัว LLM เองในงานทั่วไปยังต่ำกว่าที่คาดไว้...
"ผู้เขียนเป็นแฟนของ DeepMind มาอย่างยาวนาน"
ผมลอง 2.5 อยู่แป๊บหนึ่งเหมือนกัน อืม.. สุดท้ายก็รู้สึกว่า gpt ดีกว่าอยู่ดีไหมนะ; หรือว่าแล้วแต่คน
ตอนนี้ผมเองก็ใช้ Gemini มากขึ้นแล้วเหมือนกัน เป็นประสบการณ์ที่ยิ่งใช้ก็ยิ่งเห็นช่องว่างชัดขึ้นเรื่อย ๆ
ผมก็รู้สึกว่า GPT ดีกว่านิดหน่อยเหมือนกัน..
ผมรู้สึกว่า gemini 2.5 ให้คำตอบที่มีคุณภาพสูงกว่า gpt, claude และ grok3 มากครับ
โดยเฉพาะช่วงหลัง ๆ gpt ช้าลงมากจนใช้งานได้ไม่สะดวกครับ
ความคิดเห็นจาก Hacker News
ในฐานะอดีตพนักงาน OpenAI มีบุคลากร ML ระดับหลักจำนวนมากออกจาก OpenAI ไปยังสตาร์ทอัพอื่น แอป ChatGPT เป็นผลิตภัณฑ์ที่ประสบความสำเร็จหลักของ OpenAI แต่รายได้ที่ทำได้จากค่าสมัครสมาชิกมีขีดจำกัด คาดว่าอีกไม่นานจะมีการให้บริการฟรี และโฆษณาจะกลายเป็นทางเลือกหลักในการสร้างรายได้ Google รู้สึกไม่สบายใจกับกลยุทธ์การหาผู้ใช้ของ OpenAI และต้องส่งมอบนวัตกรรมให้ผู้ใช้ได้อย่างรวดเร็ว
บทความนี้ไม่ได้พูดถึง TPU เลย ระบบนิเวศ JAX + TPU ของ Google ยอดเยี่ยมมาก Google มีโซลูชันการประมวลผลของตัวเอง จึงได้เปรียบในการแข่งขัน บริษัท AI ต้องตอบคำถามว่า "พวกเขาทำอะไรได้บ้างที่ที่อื่นทำไม่ได้?" และความได้เปรียบด้านฮาร์ดแวร์ของ Google ก็มอบคำตอบที่เป็นรูปธรรมให้กับคำถามนี้
ความเห็นเกี่ยวกับผู้นำในสาย ML เปลี่ยนบ่อยมาก ไม่กี่เดือนก่อนยังคิดว่า Google ล้มเหลว แต่ตอนนี้ OpenAI กำลังเสียความนิยม แม้ตอนนี้ Google จะทำได้ดี แต่ไม่กี่เดือนข้างหน้าสถานการณ์ก็อาจเปลี่ยนไปอย่างสิ้นเชิง
Google มีจุดอ่อนด้านการตลาด ความน่าเชื่อถือ ความปลอดภัย และส่วนแบ่งตลาด อย่างไรก็ตาม โมเดล Gemini Pro 2.5 นั้นยอดเยี่ยมมาก
มีความเห็นว่า LLMs สามารถขับเคลื่อนด้วยโฆษณาได้ "adsense" แบบอิง LLM อาจทำงานได้อย่างแนบเนียนและแยบยลมาก โดยสามารถแทรกโฆษณาเข้าไปในบทสนทนาได้อย่างเป็นธรรมชาติ
ผู้ใช้ Claude ลองใช้ Gemini 2.5 แล้วพอใจกับระบบนิเวศที่บูรณาการของ Google ทำให้ Google ประสบความสำเร็จอีกครั้ง
นอกจาก Gemini 2.5 Pro แล้ว Gemini 2.0 Flash ก็เป็นโมเดลที่อเนกประสงค์ ราคาถูก รองรับมัลติโหมด และให้ความเร็วที่เชื่อถือได้ อีกทั้งยังมี real-time API ด้วย
Gemini 2.5 Pro เหนือกว่า Deep Research ของ OpenAI ถึงสองเท่า Deep Research ของ Google ลึกกว่า ครบถ้วนกว่า และเฉียบคมกว่า
Gemini 2.5 Pro ทรงพลังมาก แต่ก็ยังใช้ Claude Sonnet 3.7 อยู่เพราะมีปัญหากับเว็บ UI Google กำลังใช้ประโยชน์จากเสิร์ชเอนจินที่ใหญ่ที่สุดและ YouTube ในการพัฒนา AI
ตราบใดที่ Google ยังจำกัดตัวเองด้วยการเซ็นเซอร์ ก็ไม่สามารถใช้ผลิตภัณฑ์ของพวกเขาได้ Gemini 2.5 Pro ตอบคำถามบางอย่างไม่ได้ แต่ ChatGPT 4o ให้คำตอบที่ถูกต้อง
เหมือนได้ติวข้อสอบแบบจับประเด็นสไตล์เกาหลีมา… เลยทำข้อสอบได้เก่งมาก
แต่พอคุยกันจริงๆ… กลับดูเปิ่นๆ