- Google เปิดตัว Gemini 2.5 Pro Preview (I/O Edition) ล่วงหน้าก่อนงาน I/O อย่างเป็นทางการ เพื่อสะท้อนฟีดแบ็กจากนักพัฒนาและปรับปรุงประสิทธิภาพ
- ทำผลงานได้โดดเด่นเป็นพิเศษในด้าน การพัฒนาฟรอนต์เอนด์และ UI พร้อมความสามารถด้าน การแปลงโค้ด การแก้ไข และการตัดสินเชิงนามธรรม ที่ดีขึ้น
- จากประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME ทำให้สามารถ สร้างแอปการเรียนรู้แบบอัตโนมัติจากวิดีโอ ได้
- สามารถสร้าง UI ให้เข้ากับสไตล์ที่ต้องการและเพิ่มฟังก์ชันได้ง่ายผ่านการให้เหตุผลด้านดีไซน์
- เวอร์ชันเดิมวันที่ 25 มีนาคมจะอัปเดตเป็นเวอร์ชันวันที่ 6 พฤษภาคมโดยอัตโนมัติ ทำให้ ใช้งานโมเดลที่ดีขึ้นได้โดยไม่ต้องทำอะไรเพิ่ม
ประสิทธิภาพที่โดดเด่นในการพัฒนาฟรอนต์เอนด์
- Gemini 2.5 Pro ขึ้นเป็น อันดับ 1 บนลีดเดอร์บอร์ด WebDev Arena
- พิสูจน์ ประสิทธิภาพระดับสูงสุดในการประเมินความชอบของมนุษย์ โดยพิจารณาจาก UI ที่สวยงามและความสมบูรณ์ด้านการใช้งาน
- ผ่านความร่วมมือกับ Cognition และ Replit กำลังขยาย ความเป็นไปได้ของการเขียนโปรแกรมแบบเอเจนต์
การผสานระหว่างความเข้าใจโค้ดและความสามารถในการให้เหตุผล
-
ฟีเจอร์ วิดีโอ → โค้ด
- ด้วย ประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME จึงมีความสามารถเข้าใจวิดีโอในระดับ SOTA
- สามารถ สร้างแอปการเรียนรู้แบบอินเทอร์แอกทีฟอัตโนมัติ จากวิดีโอ YouTube
- ให้ผลลัพธ์ที่ ปรับปรุงทั้ง UI โดยรวมและระดับการโต้ตอบ เมื่อเทียบกับเวอร์ชันก่อนหน้า
-
ระบบอัตโนมัติสำหรับการพัฒนาฟังก์ชัน
- ก่อนหน้านี้ต้องเปิดไฟล์ดีไซน์แล้ว แปลงสี ฟอนต์ มาร์จิน ฯลฯ เป็น CSS ด้วยตนเอง
- Gemini 2.5 Pro สามารถ สร้างคอมโพเนนต์อัตโนมัติให้ตรงกับสไตล์ ได้
- ตัวอย่าง: สามารถทำระบบอัตโนมัติในการเพิ่ม ฟีเจอร์วิดีโอเพลเยอร์ ที่มีสไตล์สอดคล้องกับแอป Gemini 95
-
จากไอเดีย → สร้างแอปได้เร็วขึ้น
- เช่นกรณีของ dictation starter app สามารถสร้างแอปโดยคำนึงถึงทั้ง ฟังก์ชัน + ความสมบูรณ์ด้านความสวยงาม พร้อมกันได้
- สร้างองค์ประกอบ UI ละเอียดอย่างแอนิเมชัน waveform, responsive design, เอฟเฟกต์ mouseover ฯลฯ ได้อัตโนมัติ
- แม้ผู้ใช้จะไม่ได้ออกแบบเอง ก็ยัง สร้างผลลัพธ์ที่มีความสวยงามได้เป็นค่าเริ่มต้น
การสะท้อนฟีดแบ็กจากนักพัฒนาและวิธีใช้งาน
- เมื่อเทียบกับเวอร์ชันเดิม มีการ ลดอัตราความผิดพลาดของการเรียกฟังก์ชัน และ ปรับปรุงทริกเกอร์การเรียกใช้
- เวอร์ชัน 03-25 เดิมจะชี้ไปยังเวอร์ชัน 05-06 โดยอัตโนมัติ → มีผลโดยไม่ต้องอัปเดตแยก
- ใช้งานได้ทันทีใน Google AI Studio และ Vertex AI
- การ์ดโมเดล ได้อัปเดตเป็นข้อมูลล่าสุดแล้ว
- ระบบจะอัปเดตเป็นเวอร์ชันล่าสุดโดยอัตโนมัติ และให้ใช้งานโดยไม่มีการเปลี่ยนแปลงราคา
การใช้งานและความคาดหวัง
- Replit, Cursor, Cognition และรายอื่น ๆ กำลังพิจารณาหรือนำไปใช้เป็น โค้ดดิ้งเอเจนต์รุ่นถัดไป
- คาดว่าจะช่วยผลักดันการขยายตัวของ เวิร์กโฟลว์การพัฒนาแบบเอเจนต์ ตั้งแต่นักพัฒนารายบุคคลไปจนถึงองค์กร
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ตอนใช้โมเดลพวกนี้เพื่อเขียนโปรแกรมในอดีต สิ่งที่น่ารำคาญที่สุดคือมันมักจะมโน API ที่ไม่มีอยู่จริงขึ้นมาเอง Gemini 2.5 โดยเฉพาะรุ่น Pro และ Flash มีปัญหานี้น้อยกว่าโมเดลอื่น
Gemini 2.5 Pro ขึ้นอันดับ 1 บนลีดเดอร์บอร์ดของ WebDev Arena
เวลาให้ Gemini 2.5 เขียนโค้ด มันแสดงคอมเมนต์ออกมาเยอะเกินไป
Gemini 2.5 เก่งมากกับงานแบบเอเจนต์ แต่ก็ยังลำบากในการสร้าง diff ที่สมบูรณ์แบบสำหรับการแก้ไขโค้ด
คำถามถึงทีม Google: อยากรู้ว่า Gemini-2.5-pro-exp (เวอร์ชันฟรี) ได้อัปเดตด้วยหรือไม่ หรือว่าจะหายไปเลย
เมื่อเทียบเบนช์มาร์กระหว่างรุ่นทดลอง 03-25 กับรุ่นทดลอง 05-06 รุ่นใหม่ได้คะแนนต่ำกว่าเล็กน้อยในทุกอย่างยกเว้น LiveCodeBench
ใช้ Gemini แทบจะกับทุกอย่าง แต่ model card กลับเทียบกับแค่ o3-mini
Gemini 2.5 pro ยอดเยี่ยม แต่ UI ยังมีปัญหาเรื่องการเลื่อนที่ใช้งานยากอยู่
ms-code-blockแล้วดู$0.textContextก็เชื่อถือได้เช่นกันGemini 2.5 pro ยอดเยี่ยม แต่ต้นทุนแพงมากและให้ข้อมูลเชิงลึกเรื่องค่าใช้จ่ายแบบไม่โปร่งใส
โมเดลนี้มีประสิทธิภาพแย่กว่า 03-25 ใน 10 จาก 12 เบนช์มาร์ก
สงสัยว่าทำไมถึงใช้คำว่า "พรีวิวใหม่" แทนที่จะใช้หมายเลขเวอร์ชันไม่ได้