เปิดตัว Gemini 2.0 ให้ผู้ใช้ทั่วโลก

(blog.google)

2 คะแนน โดย GN⁺ 2025-02-07 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การเปิดให้ใช้งานทั่วไปของ Gemini 2.0
- โมเดลตระกูล Flash ที่เปิดตัวครั้งแรกในงาน I/O 2024 เป็นโมเดลทรงพลังที่เหมาะสำหรับงานปริมาณมากและความถี่สูง จึงได้รับความนิยมในหมู่นักพัฒนา
- ตอนนี้ 2.0 Flash เปิดให้ใช้งานทั่วไปสำหรับผู้ใช้มากขึ้นแล้ว และมีประสิทธิภาพดีขึ้นในเบนช์มาร์กสำคัญ
- ฟีเจอร์สร้างภาพและแปลงเสียงจะถูกเพิ่มเข้ามาในเร็ว ๆ นี้
โมเดลทดลอง 2.0 Pro: ประสิทธิภาพด้านการเขียนโค้ดสูงสุดและการจัดการพรอมป์ต์ที่ซับซ้อน
- Gemini 2.0 Pro เป็นโมเดลที่โดดเด่นที่สุดด้านประสิทธิภาพการเขียนโค้ดและความสามารถในการจัดการพรอมป์ต์ที่ซับซ้อน โดยมีความเข้าใจความรู้ของโลกและความสามารถในการให้เหตุผลที่ดีขึ้น
- ให้ context window ที่ใหญ่ที่สุดถึง 2 ล้านโทเค็น จึงสามารถวิเคราะห์และทำความเข้าใจข้อมูลจำนวนมหาศาลได้อย่างครอบคลุม
- เปิดให้นักพัฒนาใช้งานเป็นโมเดลทดลองใน Google AI Studio และ Vertex AI และผู้ใช้ Gemini Advanced ก็ใช้งานได้เช่นกัน
2.0 Flash-Lite: โมเดลที่คุ้มค่าที่สุดด้านต้นทุน
- จากเสียงตอบรับเชิงบวกต่อราคาและความเร็วของ 1.5 Flash ทำให้ 2.0 Flash-Lite มอบคุณภาพที่ดีกว่าในความเร็วและต้นทุนเท่าเดิม
- เหนือกว่า 1.5 Flash ในเบนช์มาร์กส่วนใหญ่ และรองรับ context window 1 ล้านโทเค็นพร้อมอินพุตแบบมัลติโหมด
- เปิดให้ใช้งานในสถานะพรีวิวสาธารณะบน Google AI Studio และ Vertex AI
งานด้านความรับผิดชอบและความปลอดภัย
- เมื่อโมเดลตระกูล Gemini ทรงพลังมากขึ้น ก็ยังคงลงทุนต่อเนื่องในมาตรการที่เข้มแข็งเพื่อการใช้งานที่ปลอดภัยและมั่นคง
- ใช้เทคนิค reinforcement learning แบบใหม่เพื่อให้ Gemini วิจารณ์คำตอบของตัวเอง จึงให้ฟีดแบ็กที่แม่นยำและมุ่งเป้าหมายมากขึ้น
- ใช้ automated red teaming เพื่อประเมินความเสี่ยงของการโจมตีด้านความมั่นคงปลอดภัยไซเบอร์ เช่น indirect prompt injection

1 ความคิดเห็น

GN⁺ 2025-02-07

ความคิดเห็นบน Hacker News

ข้อมูลเกี่ยวกับโมเดล Gemini ที่ชัดเจนมีไม่มาก ทำให้สับสน และข้อมูลเกี่ยวกับ Gemini Advanced ที่รวมอยู่ในการสมัครใช้ Google Workspace ก็มีน้อยเช่นกัน
- มีเพียงชื่อว่า "Gemini Advanced" แต่ไม่มีตัวเลือกให้เลือกโมเดล
- Google AI Studio เน้นการสร้างแอปครอบ LLM แต่ไม่เหมาะกับผู้ใช้ที่แค่อยากถามคำถามแล้วรับคำตอบ
- ข้อมูลที่ได้จากการค้นหายังไม่แน่นอน และมีข้อมูลว่า Gemini Advanced รวมอยู่ในแพ็กเกจสมัครใช้ Workspace
- หน้า gemini.google.com ไม่มีข้อมูลเกี่ยวกับโมเดลเลย และตัวเลือกการตั้งค่ามีแค่เปลี่ยนเป็นโหมดมืดได้เท่านั้น
สามารถเข้าถึง Gemini API ได้ผ่าน Google AI Studio และ Vertex AI
- มีหลายโมเดล เช่น Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash และ Gemini 2.0 Flash Lite
- การทำ benchmark เปรียบเทียบกับโมเดลของตัวเองเท่านั้น
มีข้อจำกัดเกี่ยวกับหัวข้อการเมืองระหว่างแชตด้วยเสียง
- ตอนที่ผู้ใช้พูดถึงการวางแผนทำอาหาร กลับถูกเข้าใจผิดว่าเป็นหัวข้อการเมืองและถูกจำกัดการสนทนา
ชื่อของโมเดล AI ทำให้สับสน
- กฎการตั้งชื่ออย่าง Flash, Flash-Lite เป็นต้น เข้าใจได้ยาก
- มีความเห็นว่าคุณภาพของโมเดลจาก Google ต่ำกว่าผู้ให้บริการรายใหญ่อื่น ๆ
ประสิทธิภาพต่อราคาสำหรับการแยกวิเคราะห์ PDF ดีมาก
- Gemini Flash-Lite คุ้มค่าใช้จ่าย และอยากเห็น benchmark ของเวอร์ชัน Lite
สามารถลองใช้โมเดลใหม่ ๆ ได้ใน AI Studio
- สนทนาแบบเรียลไทม์ได้ผ่านโหมด Live และสามารถมองเห็นโลกผ่านกล้องได้
ราคา Gemini 2.0 Flash-Lite ถูกกว่า GPT-4o mini ของ OpenAI
- ราคาสำหรับอินพุตข้อความ/ภาพและอินพุตเสียงค่อนข้างถูกกว่า
โมเดล Gemini Pro 2.0 น่าประทับใจ
- เหมาะกับงานรับรู้ทั่วไป เช่น การวิจัย การวิเคราะห์ และการเขียน
- แนะนำให้ใช้งานผ่าน AI Studio เพราะแอป Gemini มีตัวกรองจำนวนมาก ทำให้ตอบหัวข้อที่อาจเป็นประเด็นถกเถียงได้อย่างจำกัด
Gemini 2.0 Flash โดดเด่นในงานมัลติโหมด
- เหมาะกับงานเอกสารและการตรวจจับวัตถุ และมีประสิทธิภาพต่อราคาดีมาก
- โมเดล Qwen2.5 VL 72B และ 7B ให้ประสิทธิภาพดีกว่าในงานภาพเอกสาร
โมเดล Gemini 2.0 Pro Experimental กำลังได้รับความสนใจ
- โดดเด่นในการจัดการพรอมป์ต์ที่ซับซ้อนและมีประสิทธิภาพด้านการเขียนโค้ดสูง พร้อมหน้าต่างคอนเท็กซ์ขนาด 2 ล้านโทเคน

เปิดตัว Gemini 2.0 ให้ผู้ใช้ทั่วโลก

การเปิดให้ใช้งานทั่วไปของ Gemini 2.0

โมเดลทดลอง 2.0 Pro: ประสิทธิภาพด้านการเขียนโค้ดสูงสุดและการจัดการพรอมป์ต์ที่ซับซ้อน

2.0 Flash-Lite: โมเดลที่คุ้มค่าที่สุดด้านต้นทุน

งานด้านความรับผิดชอบและความปลอดภัย

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News