Gemma - โมเดลโอเพนล้ำสมัยของ Google
(blog.google)- Google เชื่อมั่นในการสร้าง AI ที่เป็นประโยชน์สำหรับทุกคน และได้มีส่วนร่วมผลักดันนวัตกรรมให้กับชุมชนโอเพนมาอย่างต่อเนื่อง เช่น Transformers, TensorFlow, BERT, T5, JAX, AlphaFold และ AlphaCode
- Gemma คือชุดโมเดลโอเพนน้ำหนักเบาระดับล้ำสมัยที่สร้างขึ้นบนพื้นฐานงานวิจัยและเทคโนโลยีเดียวกันกับที่ใช้สร้างโมเดล Gemini
- พัฒนาโดย Google DeepMind และทีมอื่น ๆ โดยได้แรงบันดาลใจจากคำว่า
gemmaในภาษาละตินที่แปลว่า "อัญมณี"
- พัฒนาโดย Google DeepMind และทีมอื่น ๆ โดยได้แรงบันดาลใจจากคำว่า
- พร้อมใช้งานแล้วตั้งแต่วันนี้ทั่วโลก โดยมาพร้อมน้ำหนักโมเดล เครื่องมือที่ช่วยสนับสนุนนวัตกรรมของนักพัฒนา เครื่องมือส่งเสริมการทำงานร่วมกัน และเครื่องมือที่ช่วยแนะนำการใช้งาน Gemma อย่างมีความรับผิดชอบ
- ด้วยการใช้เทคโนโลยีและองค์ประกอบโครงสร้างพื้นฐานร่วมกับ Gemini ทำให้ Gemma 2B และ 7B มอบประสิทธิภาพระดับสูงสุดเมื่อเทียบกับขนาดของโมเดลเมื่อเทียบกับโอเพนโมเดลอื่น ๆ
- สามารถรันได้โดยตรงบนแล็ปท็อปหรือเดสก์ท็อปของนักพัฒนา และยังทำผลงานได้เหนือกว่าโมเดลที่มีขนาดใหญ่กว่ามากในเบนช์มาร์กสำคัญ พร้อมยึดตามมาตรฐานที่เข้มงวดเพื่อให้ได้ผลลัพธ์ที่ปลอดภัยและมีความรับผิดชอบ
- มี toolchain สำหรับการทำ inference และ SFT (การปรับจูนแบบมีผู้กำกับ) ครอบคลุมทุกเฟรมเวิร์กหลัก เช่น JAX, PyTorch และ TensorFlow ผ่าน Native Keras 3.0
- เริ่มต้นใช้งาน Gemma ได้ง่ายผ่านการผสานรวมกับ Colab และ Kaggle notebooks รวมถึงเครื่องมือยอดนิยมอย่าง Hugging Face, MaxText, NVIDIA NeMo และ TensorRT-LLM
- โมเดล Gemma ที่ผ่านการ pre-train และ instruction-tune แล้ว สามารถนำไป deploy บน Vertex AI และ Google Kubernetes Engine (GKE) ได้อย่างง่ายดาย เพื่อรันบนโน้ตบุ๊ก เวิร์กสเตชัน หรือ Google Cloud
- รับประกันประสิทธิภาพระดับแนวหน้าของอุตสาหกรรมด้วยการปรับแต่งให้เหมาะกับแพลตฟอร์มฮาร์ดแวร์ AI หลายประเภท รวมถึง NVIDIA GPU และ Google Cloud TPU
- อนุญาตให้องค์กรทุกขนาดใช้งานเชิงพาณิชย์และเผยแพร่ได้ภายใต้ข้อกำหนดการใช้งาน
รับผิดชอบตั้งแต่การออกแบบ
- Gemma ถูกออกแบบโดยให้หลักการ AI เป็นสิ่งสำคัญสูงสุด และใช้เทคนิคอัตโนมัติในการกรองข้อมูลส่วนบุคคลและข้อมูลอ่อนไหวอื่น ๆ ออกจากชุดฝึก
- นอกจากนี้ยังใช้การเรียนรู้เสริมกำลังจากฟีดแบ็กของมนุษย์ (RLHF) อย่างกว้างขวาง สำหรับโมเดลที่ผ่านการ instruction-tune เพื่อให้สอดคล้องกับพฤติกรรมที่มีความรับผิดชอบ
- มีการประเมินอย่างเข้มข้นเพื่อทำความเข้าใจและลดโปรไฟล์ความเสี่ยงของโมเดล Gemma เช่น manual red teaming, การทดสอบแบบ adversarial อัตโนมัติ และการประเมินความสามารถของโมเดลต่อกิจกรรมอันตราย
ปรับแต่งให้เหมาะสมครอบคลุมเฟรมเวิร์ก เครื่องมือ และฮาร์ดแวร์
- โมเดล Gemma สามารถ fine-tune ด้วยข้อมูลของตนเองให้เหมาะกับความต้องการของแอปพลิเคชันเฉพาะ และรองรับเครื่องมือและระบบที่หลากหลาย
- เครื่องมือแบบ multi-framework: ใช้งานได้กับเฟรมเวิร์กที่ต้องการ เช่น Keras 3.0, native PyTorch, JAX และ Hugging Face Transformers พร้อมมี reference implementation ให้
- ความเข้ากันได้ข้ามอุปกรณ์: รันได้บนอุปกรณ์ยอดนิยมรวมถึงแล็ปท็อป เดสก์ท็อป IoT มือถือ และคลาวด์
- แพลตฟอร์มฮาร์ดแวร์ล้ำสมัย: ผ่านความร่วมมือกับ NVIDIA มีการปรับแต่งสำหรับ NVIDIA GPU ตั้งแต่ดาต้าเซ็นเตอร์ไปจนถึงคลาวด์และ RTX AI PC ภายในองค์กร เพื่อให้ได้ประสิทธิภาพระดับแนวหน้าของอุตสาหกรรมและการผสานรวมกับเทคโนโลยีล้ำสมัย
- ปรับแต่งบน Google Cloud: ใช้ Vertex AI เพื่อเข้าถึงชุดเครื่องมือ MLOps ที่ครอบคลุมและตัวเลือกการปรับจูนที่หลากหลาย พร้อมการ deploy แบบคลิกเดียวด้วยการปรับแต่ง inference ที่มีมาในตัว
เครดิตฟรีสำหรับการวิจัยและพัฒนา
- Gemma ถูกสร้างขึ้นเพื่อชุมชนนักพัฒนาและนักวิจัยที่ขับเคลื่อนนวัตกรรม AI โดยสามารถเริ่มใช้งานได้ตั้งแต่วันนี้ผ่านการเข้าถึงฟรีบน Kaggle, free tier ของ Colab notebooks และเครดิต $300 สำหรับผู้ใช้ Google Cloud ครั้งแรก
- นักวิจัยสามารถสมัครรับ Google Cloud เครดิตมูลค่าสูงสุด $500,000 เพื่อเร่งโครงการของตนเองได้
2 ความคิดเห็น
ตอนนี้กลายเป็นว่ามีแค่ OpenAI ที่ปิดอยู่สินะ
ความคิดเห็นบน Hacker News