เปิดตัวพรีวิว Gemini 2.5 Pro - โมเดล AI ของ Google ที่ทรงพลังด้านโค้ดยิ่งขึ้น

(developers.googleblog.com)

8 คะแนน โดย GN⁺ 2025-05-07 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

Google เปิดตัว Gemini 2.5 Pro Preview (I/O Edition) ล่วงหน้าก่อนงาน I/O อย่างเป็นทางการ เพื่อสะท้อนฟีดแบ็กจากนักพัฒนาและปรับปรุงประสิทธิภาพ
ทำผลงานได้โดดเด่นเป็นพิเศษในด้าน การพัฒนาฟรอนต์เอนด์และ UI พร้อมความสามารถด้าน การแปลงโค้ด การแก้ไข และการตัดสินเชิงนามธรรม ที่ดีขึ้น
จากประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME ทำให้สามารถ สร้างแอปการเรียนรู้แบบอัตโนมัติจากวิดีโอ ได้
สามารถสร้าง UI ให้เข้ากับสไตล์ที่ต้องการและเพิ่มฟังก์ชันได้ง่ายผ่านการให้เหตุผลด้านดีไซน์
เวอร์ชันเดิมวันที่ 25 มีนาคมจะอัปเดตเป็นเวอร์ชันวันที่ 6 พฤษภาคมโดยอัตโนมัติ ทำให้ ใช้งานโมเดลที่ดีขึ้นได้โดยไม่ต้องทำอะไรเพิ่ม

ประสิทธิภาพที่โดดเด่นในการพัฒนาฟรอนต์เอนด์

Gemini 2.5 Pro ขึ้นเป็น อันดับ 1 บนลีดเดอร์บอร์ด WebDev Arena
พิสูจน์ ประสิทธิภาพระดับสูงสุดในการประเมินความชอบของมนุษย์ โดยพิจารณาจาก UI ที่สวยงามและความสมบูรณ์ด้านการใช้งาน
ผ่านความร่วมมือกับ Cognition และ Replit กำลังขยาย ความเป็นไปได้ของการเขียนโปรแกรมแบบเอเจนต์

การผสานระหว่างความเข้าใจโค้ดและความสามารถในการให้เหตุผล

ฟีเจอร์ วิดีโอ → โค้ด
- ด้วย ประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME จึงมีความสามารถเข้าใจวิดีโอในระดับ SOTA
- สามารถ สร้างแอปการเรียนรู้แบบอินเทอร์แอกทีฟอัตโนมัติ จากวิดีโอ YouTube
- ให้ผลลัพธ์ที่ ปรับปรุงทั้ง UI โดยรวมและระดับการโต้ตอบ เมื่อเทียบกับเวอร์ชันก่อนหน้า
ระบบอัตโนมัติสำหรับการพัฒนาฟังก์ชัน
- ก่อนหน้านี้ต้องเปิดไฟล์ดีไซน์แล้ว แปลงสี ฟอนต์ มาร์จิน ฯลฯ เป็น CSS ด้วยตนเอง
- Gemini 2.5 Pro สามารถ สร้างคอมโพเนนต์อัตโนมัติให้ตรงกับสไตล์ ได้
- ตัวอย่าง: สามารถทำระบบอัตโนมัติในการเพิ่ม ฟีเจอร์วิดีโอเพลเยอร์ ที่มีสไตล์สอดคล้องกับแอป Gemini 95
จากไอเดีย → สร้างแอปได้เร็วขึ้น
- เช่นกรณีของ dictation starter app สามารถสร้างแอปโดยคำนึงถึงทั้ง ฟังก์ชัน + ความสมบูรณ์ด้านความสวยงาม พร้อมกันได้
- สร้างองค์ประกอบ UI ละเอียดอย่างแอนิเมชัน waveform, responsive design, เอฟเฟกต์ mouseover ฯลฯ ได้อัตโนมัติ
- แม้ผู้ใช้จะไม่ได้ออกแบบเอง ก็ยัง สร้างผลลัพธ์ที่มีความสวยงามได้เป็นค่าเริ่มต้น

การสะท้อนฟีดแบ็กจากนักพัฒนาและวิธีใช้งาน

เมื่อเทียบกับเวอร์ชันเดิม มีการ ลดอัตราความผิดพลาดของการเรียกฟังก์ชัน และ ปรับปรุงทริกเกอร์การเรียกใช้
เวอร์ชัน 03-25 เดิมจะชี้ไปยังเวอร์ชัน 05-06 โดยอัตโนมัติ → มีผลโดยไม่ต้องอัปเดตแยก
ใช้งานได้ทันทีใน Google AI Studio และ Vertex AI
การ์ดโมเดล ได้อัปเดตเป็นข้อมูลล่าสุดแล้ว
ระบบจะอัปเดตเป็นเวอร์ชันล่าสุดโดยอัตโนมัติ และให้ใช้งานโดยไม่มีการเปลี่ยนแปลงราคา

การใช้งานและความคาดหวัง

Replit, Cursor, Cognition และรายอื่น ๆ กำลังพิจารณาหรือนำไปใช้เป็น โค้ดดิ้งเอเจนต์รุ่นถัดไป
คาดว่าจะช่วยผลักดันการขยายตัวของ เวิร์กโฟลว์การพัฒนาแบบเอเจนต์ ตั้งแต่นักพัฒนารายบุคคลไปจนถึงองค์กร

1 ความคิดเห็น

GN⁺ 2025-05-07

ความคิดเห็นบน Hacker News

ตอนใช้โมเดลพวกนี้เพื่อเขียนโปรแกรมในอดีต สิ่งที่น่ารำคาญที่สุดคือมันมักจะมโน API ที่ไม่มีอยู่จริงขึ้นมาเอง Gemini 2.5 โดยเฉพาะรุ่น Pro และ Flash มีปัญหานี้น้อยกว่าโมเดลอื่น
- แต่ก็ยังมีข้อจำกัดอยู่มาก และตอนนี้โมเดลก็ยังไม่สามารถจัดการกับ abstraction และ architecture แบบมนุษย์ได้
- อย่างไรก็ตาม โมเดล Gemini มาถึงจุดที่สามารถแทนการค้นหาและ Stack Overflow ในงานเขียนโปรแกรมประจำวันได้แล้ว
Gemini 2.5 Pro ขึ้นอันดับ 1 บนลีดเดอร์บอร์ดของ WebDev Arena
- ดูเหมือนว่าควรเปลี่ยนชื่อ WebDev Arena เป็น React/Tailwind Arena มากกว่า
- system prompt บังคับให้ใช้เทคโนโลยีเหล่านี้ และถ้าขอ vanilla JS หรือเฟรมเวิร์กอื่น เครื่องมือทั้งชุดจะใช้งานไม่ได้เลย
- การให้โมเดลมาแข่งกันภายใต้นิยามที่แคบของเว็บดีเวลอปเมนต์เป็นเรื่องมีปัญหา
เวลาให้ Gemini 2.5 เขียนโค้ด มันแสดงคอมเมนต์ออกมาเยอะเกินไป
- มีคอมเมนต์มากเกินจำเป็นทั้งแบบคั่นส่วน แบบอธิบายขั้นตอน แบบบล็อก และแบบอินไลน์
Gemini 2.5 เก่งมากกับงานแบบเอเจนต์ แต่ก็ยังลำบากในการสร้าง diff ที่สมบูรณ์แบบสำหรับการแก้ไขโค้ด
- Gemini 2.5 รุ่นเก่าสร้าง diff ที่เหมาะสมได้ด้วยความแม่นยำ 92%
- คาดว่าสัดส่วนนี้จะเพิ่มขึ้นเป็น 95-98%
คำถามถึงทีม Google: อยากรู้ว่า Gemini-2.5-pro-exp (เวอร์ชันฟรี) ได้อัปเดตด้วยหรือไม่ หรือว่าจะหายไปเลย
- ตามโพสต์ในบล็อก เวอร์ชันก่อนหน้า (03-25) ตอนนี้ชี้ไปที่เวอร์ชันล่าสุด (05-06) แล้ว และไม่ต้องทำอะไรเพิ่มเพื่อใช้โมเดลที่ปรับปรุงแล้ว
- เลยสงสัยว่า Gemini-2.5-pro-preview-03-25 ตอนนี้ใช้ 05-06 แล้วหรือยัง และ Gemini-2.5-pro-exp-03-25 ก็เป็นแบบเดียวกันหรือไม่
เมื่อเทียบเบนช์มาร์กระหว่างรุ่นทดลอง 03-25 กับรุ่นทดลอง 05-06 รุ่นใหม่ได้คะแนนต่ำกว่าเล็กน้อยในทุกอย่างยกเว้น LiveCodeBench
ใช้ Gemini แทบจะกับทุกอย่าง แต่ model card กลับเทียบกับแค่ o3-mini
- บนเบนช์มาร์กที่เป็นที่รู้จัก o3 ยังนำอยู่
Gemini 2.5 pro ยอดเยี่ยม แต่ UI ยังมีปัญหาเรื่องการเลื่อนที่ใช้งานยากอยู่
- ควรรอสักสองสามนาทีหลังจากที่ AI สร้างผลลัพธ์เสร็จ
- หรือจะเปิด dev tools หา element ms-code-block แล้วดู $0.textContext ก็เชื่อถือได้เช่นกัน
Gemini 2.5 pro ยอดเยี่ยม แต่ต้นทุนแพงมากและให้ข้อมูลเชิงลึกเรื่องค่าใช้จ่ายแบบไม่โปร่งใส
- ช่วงหลังมีหลายคนได้รับบิลที่ไม่คาดคิด และบางรายโดนค่าใช้จ่ายถึง $500 จากการใช้งานปกติ
- ฉันก็โดนเหมือนกันเลยเอา API key ออกจากเครื่องมือ
โมเดลนี้มีประสิทธิภาพแย่กว่า 03-25 ใน 10 จาก 12 เบนช์มาร์ก
- น่าจะเป็นเพราะฝึกเรื่องโค้ดต่อไปเรื่อย ๆ จนทุกอย่างแย่ลง แล้วพยายามปิดเรื่องนี้ไว้เพราะต้นทุนจม
สงสัยว่าทำไมถึงใช้คำว่า "พรีวิวใหม่" แทนที่จะใช้หมายเลขเวอร์ชันไม่ได้
- เช่น จะเรียกว่า Gemini Pro 2.5.1 ก็น่าจะดี

เปิดตัวพรีวิว Gemini 2.5 Pro - โมเดล AI ของ Google ที่ทรงพลังด้านโค้ดยิ่งขึ้น

ประสิทธิภาพที่โดดเด่นในการพัฒนาฟรอนต์เอนด์

การผสานระหว่างความเข้าใจโค้ดและความสามารถในการให้เหตุผล

ฟีเจอร์ วิดีโอ → โค้ด

ระบบอัตโนมัติสำหรับการพัฒนาฟังก์ชัน

จากไอเดีย → สร้างแอปได้เร็วขึ้น

การสะท้อนฟีดแบ็กจากนักพัฒนาและวิธีใช้งาน

การใช้งานและความคาดหวัง

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News