8 คะแนน โดย GN⁺ 2025-05-07 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Google เปิดตัว Gemini 2.5 Pro Preview (I/O Edition) ล่วงหน้าก่อนงาน I/O อย่างเป็นทางการ เพื่อสะท้อนฟีดแบ็กจากนักพัฒนาและปรับปรุงประสิทธิภาพ
  • ทำผลงานได้โดดเด่นเป็นพิเศษในด้าน การพัฒนาฟรอนต์เอนด์และ UI พร้อมความสามารถด้าน การแปลงโค้ด การแก้ไข และการตัดสินเชิงนามธรรม ที่ดีขึ้น
  • จากประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME ทำให้สามารถ สร้างแอปการเรียนรู้แบบอัตโนมัติจากวิดีโอ ได้
  • สามารถสร้าง UI ให้เข้ากับสไตล์ที่ต้องการและเพิ่มฟังก์ชันได้ง่ายผ่านการให้เหตุผลด้านดีไซน์
  • เวอร์ชันเดิมวันที่ 25 มีนาคมจะอัปเดตเป็นเวอร์ชันวันที่ 6 พฤษภาคมโดยอัตโนมัติ ทำให้ ใช้งานโมเดลที่ดีขึ้นได้โดยไม่ต้องทำอะไรเพิ่ม

ประสิทธิภาพที่โดดเด่นในการพัฒนาฟรอนต์เอนด์

  • Gemini 2.5 Pro ขึ้นเป็น อันดับ 1 บนลีดเดอร์บอร์ด WebDev Arena
  • พิสูจน์ ประสิทธิภาพระดับสูงสุดในการประเมินความชอบของมนุษย์ โดยพิจารณาจาก UI ที่สวยงามและความสมบูรณ์ด้านการใช้งาน
  • ผ่านความร่วมมือกับ Cognition และ Replit กำลังขยาย ความเป็นไปได้ของการเขียนโปรแกรมแบบเอเจนต์

การผสานระหว่างความเข้าใจโค้ดและความสามารถในการให้เหตุผล

  • ฟีเจอร์ วิดีโอ → โค้ด

    • ด้วย ประสิทธิภาพ 84.8% บนเบนช์มาร์ก VideoMME จึงมีความสามารถเข้าใจวิดีโอในระดับ SOTA
    • สามารถ สร้างแอปการเรียนรู้แบบอินเทอร์แอกทีฟอัตโนมัติ จากวิดีโอ YouTube
    • ให้ผลลัพธ์ที่ ปรับปรุงทั้ง UI โดยรวมและระดับการโต้ตอบ เมื่อเทียบกับเวอร์ชันก่อนหน้า
  • ระบบอัตโนมัติสำหรับการพัฒนาฟังก์ชัน

    • ก่อนหน้านี้ต้องเปิดไฟล์ดีไซน์แล้ว แปลงสี ฟอนต์ มาร์จิน ฯลฯ เป็น CSS ด้วยตนเอง
    • Gemini 2.5 Pro สามารถ สร้างคอมโพเนนต์อัตโนมัติให้ตรงกับสไตล์ ได้
    • ตัวอย่าง: สามารถทำระบบอัตโนมัติในการเพิ่ม ฟีเจอร์วิดีโอเพลเยอร์ ที่มีสไตล์สอดคล้องกับแอป Gemini 95
  • จากไอเดีย → สร้างแอปได้เร็วขึ้น

    • เช่นกรณีของ dictation starter app สามารถสร้างแอปโดยคำนึงถึงทั้ง ฟังก์ชัน + ความสมบูรณ์ด้านความสวยงาม พร้อมกันได้
    • สร้างองค์ประกอบ UI ละเอียดอย่างแอนิเมชัน waveform, responsive design, เอฟเฟกต์ mouseover ฯลฯ ได้อัตโนมัติ
    • แม้ผู้ใช้จะไม่ได้ออกแบบเอง ก็ยัง สร้างผลลัพธ์ที่มีความสวยงามได้เป็นค่าเริ่มต้น

การสะท้อนฟีดแบ็กจากนักพัฒนาและวิธีใช้งาน

  • เมื่อเทียบกับเวอร์ชันเดิม มีการ ลดอัตราความผิดพลาดของการเรียกฟังก์ชัน และ ปรับปรุงทริกเกอร์การเรียกใช้
  • เวอร์ชัน 03-25 เดิมจะชี้ไปยังเวอร์ชัน 05-06 โดยอัตโนมัติ → มีผลโดยไม่ต้องอัปเดตแยก
  • ใช้งานได้ทันทีใน Google AI Studio และ Vertex AI
  • การ์ดโมเดล ได้อัปเดตเป็นข้อมูลล่าสุดแล้ว
  • ระบบจะอัปเดตเป็นเวอร์ชันล่าสุดโดยอัตโนมัติ และให้ใช้งานโดยไม่มีการเปลี่ยนแปลงราคา

การใช้งานและความคาดหวัง

  • Replit, Cursor, Cognition และรายอื่น ๆ กำลังพิจารณาหรือนำไปใช้เป็น โค้ดดิ้งเอเจนต์รุ่นถัดไป
  • คาดว่าจะช่วยผลักดันการขยายตัวของ เวิร์กโฟลว์การพัฒนาแบบเอเจนต์ ตั้งแต่นักพัฒนารายบุคคลไปจนถึงองค์กร

1 ความคิดเห็น

 
GN⁺ 2025-05-07
ความคิดเห็นบน Hacker News
  • ตอนใช้โมเดลพวกนี้เพื่อเขียนโปรแกรมในอดีต สิ่งที่น่ารำคาญที่สุดคือมันมักจะมโน API ที่ไม่มีอยู่จริงขึ้นมาเอง Gemini 2.5 โดยเฉพาะรุ่น Pro และ Flash มีปัญหานี้น้อยกว่าโมเดลอื่น

    • แต่ก็ยังมีข้อจำกัดอยู่มาก และตอนนี้โมเดลก็ยังไม่สามารถจัดการกับ abstraction และ architecture แบบมนุษย์ได้
    • อย่างไรก็ตาม โมเดล Gemini มาถึงจุดที่สามารถแทนการค้นหาและ Stack Overflow ในงานเขียนโปรแกรมประจำวันได้แล้ว
  • Gemini 2.5 Pro ขึ้นอันดับ 1 บนลีดเดอร์บอร์ดของ WebDev Arena

    • ดูเหมือนว่าควรเปลี่ยนชื่อ WebDev Arena เป็น React/Tailwind Arena มากกว่า
    • system prompt บังคับให้ใช้เทคโนโลยีเหล่านี้ และถ้าขอ vanilla JS หรือเฟรมเวิร์กอื่น เครื่องมือทั้งชุดจะใช้งานไม่ได้เลย
    • การให้โมเดลมาแข่งกันภายใต้นิยามที่แคบของเว็บดีเวลอปเมนต์เป็นเรื่องมีปัญหา
  • เวลาให้ Gemini 2.5 เขียนโค้ด มันแสดงคอมเมนต์ออกมาเยอะเกินไป

    • มีคอมเมนต์มากเกินจำเป็นทั้งแบบคั่นส่วน แบบอธิบายขั้นตอน แบบบล็อก และแบบอินไลน์
  • Gemini 2.5 เก่งมากกับงานแบบเอเจนต์ แต่ก็ยังลำบากในการสร้าง diff ที่สมบูรณ์แบบสำหรับการแก้ไขโค้ด

    • Gemini 2.5 รุ่นเก่าสร้าง diff ที่เหมาะสมได้ด้วยความแม่นยำ 92%
    • คาดว่าสัดส่วนนี้จะเพิ่มขึ้นเป็น 95-98%
  • คำถามถึงทีม Google: อยากรู้ว่า Gemini-2.5-pro-exp (เวอร์ชันฟรี) ได้อัปเดตด้วยหรือไม่ หรือว่าจะหายไปเลย

    • ตามโพสต์ในบล็อก เวอร์ชันก่อนหน้า (03-25) ตอนนี้ชี้ไปที่เวอร์ชันล่าสุด (05-06) แล้ว และไม่ต้องทำอะไรเพิ่มเพื่อใช้โมเดลที่ปรับปรุงแล้ว
    • เลยสงสัยว่า Gemini-2.5-pro-preview-03-25 ตอนนี้ใช้ 05-06 แล้วหรือยัง และ Gemini-2.5-pro-exp-03-25 ก็เป็นแบบเดียวกันหรือไม่
  • เมื่อเทียบเบนช์มาร์กระหว่างรุ่นทดลอง 03-25 กับรุ่นทดลอง 05-06 รุ่นใหม่ได้คะแนนต่ำกว่าเล็กน้อยในทุกอย่างยกเว้น LiveCodeBench

  • ใช้ Gemini แทบจะกับทุกอย่าง แต่ model card กลับเทียบกับแค่ o3-mini

    • บนเบนช์มาร์กที่เป็นที่รู้จัก o3 ยังนำอยู่
  • Gemini 2.5 pro ยอดเยี่ยม แต่ UI ยังมีปัญหาเรื่องการเลื่อนที่ใช้งานยากอยู่

    • ควรรอสักสองสามนาทีหลังจากที่ AI สร้างผลลัพธ์เสร็จ
    • หรือจะเปิด dev tools หา element ms-code-block แล้วดู $0.textContext ก็เชื่อถือได้เช่นกัน
  • Gemini 2.5 pro ยอดเยี่ยม แต่ต้นทุนแพงมากและให้ข้อมูลเชิงลึกเรื่องค่าใช้จ่ายแบบไม่โปร่งใส

    • ช่วงหลังมีหลายคนได้รับบิลที่ไม่คาดคิด และบางรายโดนค่าใช้จ่ายถึง $500 จากการใช้งานปกติ
    • ฉันก็โดนเหมือนกันเลยเอา API key ออกจากเครื่องมือ
  • โมเดลนี้มีประสิทธิภาพแย่กว่า 03-25 ใน 10 จาก 12 เบนช์มาร์ก

    • น่าจะเป็นเพราะฝึกเรื่องโค้ดต่อไปเรื่อย ๆ จนทุกอย่างแย่ลง แล้วพยายามปิดเรื่องนี้ไว้เพราะต้นทุนจม
  • สงสัยว่าทำไมถึงใช้คำว่า "พรีวิวใหม่" แทนที่จะใช้หมายเลขเวอร์ชันไม่ได้

    • เช่น จะเรียกว่า Gemini Pro 2.5.1 ก็น่าจะดี