2 คะแนน โดย GN⁺ 2025-02-07 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • การเปิดให้ใช้งานทั่วไปของ Gemini 2.0

    • โมเดลตระกูล Flash ที่เปิดตัวครั้งแรกในงาน I/O 2024 เป็นโมเดลทรงพลังที่เหมาะสำหรับงานปริมาณมากและความถี่สูง จึงได้รับความนิยมในหมู่นักพัฒนา
    • ตอนนี้ 2.0 Flash เปิดให้ใช้งานทั่วไปสำหรับผู้ใช้มากขึ้นแล้ว และมีประสิทธิภาพดีขึ้นในเบนช์มาร์กสำคัญ
    • ฟีเจอร์สร้างภาพและแปลงเสียงจะถูกเพิ่มเข้ามาในเร็ว ๆ นี้
  • โมเดลทดลอง 2.0 Pro: ประสิทธิภาพด้านการเขียนโค้ดสูงสุดและการจัดการพรอมป์ต์ที่ซับซ้อน

    • Gemini 2.0 Pro เป็นโมเดลที่โดดเด่นที่สุดด้านประสิทธิภาพการเขียนโค้ดและความสามารถในการจัดการพรอมป์ต์ที่ซับซ้อน โดยมีความเข้าใจความรู้ของโลกและความสามารถในการให้เหตุผลที่ดีขึ้น
    • ให้ context window ที่ใหญ่ที่สุดถึง 2 ล้านโทเค็น จึงสามารถวิเคราะห์และทำความเข้าใจข้อมูลจำนวนมหาศาลได้อย่างครอบคลุม
    • เปิดให้นักพัฒนาใช้งานเป็นโมเดลทดลองใน Google AI Studio และ Vertex AI และผู้ใช้ Gemini Advanced ก็ใช้งานได้เช่นกัน
  • 2.0 Flash-Lite: โมเดลที่คุ้มค่าที่สุดด้านต้นทุน

    • จากเสียงตอบรับเชิงบวกต่อราคาและความเร็วของ 1.5 Flash ทำให้ 2.0 Flash-Lite มอบคุณภาพที่ดีกว่าในความเร็วและต้นทุนเท่าเดิม
    • เหนือกว่า 1.5 Flash ในเบนช์มาร์กส่วนใหญ่ และรองรับ context window 1 ล้านโทเค็นพร้อมอินพุตแบบมัลติโหมด
    • เปิดให้ใช้งานในสถานะพรีวิวสาธารณะบน Google AI Studio และ Vertex AI
  • งานด้านความรับผิดชอบและความปลอดภัย

    • เมื่อโมเดลตระกูล Gemini ทรงพลังมากขึ้น ก็ยังคงลงทุนต่อเนื่องในมาตรการที่เข้มแข็งเพื่อการใช้งานที่ปลอดภัยและมั่นคง
    • ใช้เทคนิค reinforcement learning แบบใหม่เพื่อให้ Gemini วิจารณ์คำตอบของตัวเอง จึงให้ฟีดแบ็กที่แม่นยำและมุ่งเป้าหมายมากขึ้น
    • ใช้ automated red teaming เพื่อประเมินความเสี่ยงของการโจมตีด้านความมั่นคงปลอดภัยไซเบอร์ เช่น indirect prompt injection

1 ความคิดเห็น

 
GN⁺ 2025-02-07
ความคิดเห็นบน Hacker News
  • ข้อมูลเกี่ยวกับโมเดล Gemini ที่ชัดเจนมีไม่มาก ทำให้สับสน และข้อมูลเกี่ยวกับ Gemini Advanced ที่รวมอยู่ในการสมัครใช้ Google Workspace ก็มีน้อยเช่นกัน

    • มีเพียงชื่อว่า "Gemini Advanced" แต่ไม่มีตัวเลือกให้เลือกโมเดล
    • Google AI Studio เน้นการสร้างแอปครอบ LLM แต่ไม่เหมาะกับผู้ใช้ที่แค่อยากถามคำถามแล้วรับคำตอบ
    • ข้อมูลที่ได้จากการค้นหายังไม่แน่นอน และมีข้อมูลว่า Gemini Advanced รวมอยู่ในแพ็กเกจสมัครใช้ Workspace
    • หน้า gemini.google.com ไม่มีข้อมูลเกี่ยวกับโมเดลเลย และตัวเลือกการตั้งค่ามีแค่เปลี่ยนเป็นโหมดมืดได้เท่านั้น
  • สามารถเข้าถึง Gemini API ได้ผ่าน Google AI Studio และ Vertex AI

    • มีหลายโมเดล เช่น Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash และ Gemini 2.0 Flash Lite
    • การทำ benchmark เปรียบเทียบกับโมเดลของตัวเองเท่านั้น
  • มีข้อจำกัดเกี่ยวกับหัวข้อการเมืองระหว่างแชตด้วยเสียง

    • ตอนที่ผู้ใช้พูดถึงการวางแผนทำอาหาร กลับถูกเข้าใจผิดว่าเป็นหัวข้อการเมืองและถูกจำกัดการสนทนา
  • ชื่อของโมเดล AI ทำให้สับสน

    • กฎการตั้งชื่ออย่าง Flash, Flash-Lite เป็นต้น เข้าใจได้ยาก
    • มีความเห็นว่าคุณภาพของโมเดลจาก Google ต่ำกว่าผู้ให้บริการรายใหญ่อื่น ๆ
  • ประสิทธิภาพต่อราคาสำหรับการแยกวิเคราะห์ PDF ดีมาก

    • Gemini Flash-Lite คุ้มค่าใช้จ่าย และอยากเห็น benchmark ของเวอร์ชัน Lite
  • สามารถลองใช้โมเดลใหม่ ๆ ได้ใน AI Studio

    • สนทนาแบบเรียลไทม์ได้ผ่านโหมด Live และสามารถมองเห็นโลกผ่านกล้องได้
  • ราคา Gemini 2.0 Flash-Lite ถูกกว่า GPT-4o mini ของ OpenAI

    • ราคาสำหรับอินพุตข้อความ/ภาพและอินพุตเสียงค่อนข้างถูกกว่า
  • โมเดล Gemini Pro 2.0 น่าประทับใจ

    • เหมาะกับงานรับรู้ทั่วไป เช่น การวิจัย การวิเคราะห์ และการเขียน
    • แนะนำให้ใช้งานผ่าน AI Studio เพราะแอป Gemini มีตัวกรองจำนวนมาก ทำให้ตอบหัวข้อที่อาจเป็นประเด็นถกเถียงได้อย่างจำกัด
  • Gemini 2.0 Flash โดดเด่นในงานมัลติโหมด

    • เหมาะกับงานเอกสารและการตรวจจับวัตถุ และมีประสิทธิภาพต่อราคาดีมาก
    • โมเดล Qwen2.5 VL 72B และ 7B ให้ประสิทธิภาพดีกว่าในงานภาพเอกสาร
  • โมเดล Gemini 2.0 Pro Experimental กำลังได้รับความสนใจ

    • โดดเด่นในการจัดการพรอมป์ต์ที่ซับซ้อนและมีประสิทธิภาพด้านการเขียนโค้ดสูง พร้อมหน้าต่างคอนเท็กซ์ขนาด 2 ล้านโทเคน