ชื่อสรุป: แนะนำ 'Gemini' โมเดล AI ใหม่จาก Google และ DeepMind
- ซุนดาร์ พิชัย CEO ของ Google และ Alphabet เชื่อว่า AI จะนำมาซึ่งการเปลี่ยนแปลงที่ยิ่งใหญ่กว่าการเปลี่ยนผ่านสู่มือถือหรือเว็บ
- Google ในฐานะบริษัทที่ขับเคลื่อนด้วย AI ได้เดินทางบนเส้นทางนี้มา 8 ปี และด้วย generative AI ผู้ใช้จึงสามารถร่วมมือและสร้างสรรค์ในรูปแบบใหม่ได้
- Google มุ่งแสวงหาทั้งความทะเยอทะยานด้านการวิจัยและศักยภาพในการสร้างประโยชน์อย่างมากต่อสังคม พร้อมทั้งทำงานร่วมกับรัฐบาลและผู้เชี่ยวชาญเพื่อรับมือกับความเสี่ยงของ AI
แนะนำ Gemini
- เดมิส ฮัสซาบิส CEO และผู้ร่วมก่อตั้งของ Google DeepMind เชื่อว่า AI จะนำประโยชน์อันน่าทึ่งมาสู่มนุษย์
- Gemini เป็นโมเดลที่มีความสามารถมากที่สุดซึ่งสร้างขึ้นจากความร่วมมือขนาดใหญ่ระหว่างทีมต่างๆ ของ Google โดยสามารถเข้าใจและจัดการข้อมูลได้หลากหลายประเภท เช่น ข้อความ โค้ด เสียง ภาพ และวิดีโอ
- Gemini 1.0 ได้รับการปรับแต่งมา 3 ขนาด เพื่อให้ทำงานได้อย่างมีประสิทธิภาพตั้งแต่ดาต้าเซ็นเตอร์ไปจนถึงอุปกรณ์พกพา
ประสิทธิภาพระดับแนวหน้า
- โมเดล Gemini แสดงประสิทธิภาพที่เหนือกว่าผลลัพธ์ระดับแนวหน้าปัจจุบันในงานหลากหลายประเภท
- Gemini Ultra ทำคะแนนได้ 90.0% ใน MMLU ซึ่งสูงกว่าผู้เชี่ยวชาญมนุษย์
- ในเบนช์มาร์กด้านภาพ Gemini ก็ทำผลงานได้เหนือกว่าโมเดลก่อนหน้า และแสดงให้เห็นสัญญาณเริ่มต้นของความสามารถในการให้เหตุผลที่ซับซ้อน
ความสามารถแห่งยุคถัดไป
- Gemini เป็นมัลติโมดัลโดยกำเนิด และมีความสามารถด้านความเข้าใจและการให้เหตุผลข้ามโมดัลที่เหนือกว่าโมเดลเดิมอย่างมาก
- Gemini 1.0 โดดเด่นเป็นพิเศษในการดึงความรู้จากเอกสารที่ซับซ้อน และในการอธิบายเหตุผลในหัวข้อที่ซับซ้อนอย่างคณิตศาสตร์และฟิสิกส์
- Gemini สามารถเข้าใจและสร้างโค้ดคุณภาพสูงได้ และเป็นหนึ่งใน foundation model ชั้นนำสำหรับการทำงานข้ามภาษาโปรแกรมและการให้เหตุผลกับข้อมูลที่ซับซ้อน
เชื่อถือได้มากขึ้น ขยายได้มากขึ้น และมีประสิทธิภาพมากขึ้น
- Gemini 1.0 ได้รับการฝึกในระดับขนาดใหญ่โดยใช้อินฟราสตรักเจอร์ที่ปรับให้เหมาะกับ AI ของ Google รวมถึง TPU v4 และ v5e
- Gemini ทำงานได้เร็วกว่าโมเดลก่อนหน้า และเป็น AI accelerator แบบกำหนดเองที่มีบทบาทสำคัญต่อผลิตภัณฑ์ AI ของ Google
- Google ได้ประกาศ Cloud TPU v5p เพื่อเร่งการพัฒนา Gemini และช่วยให้นักพัฒนาสามารถฝึกโมเดล AI ขนาดใหญ่ได้รวดเร็วยิ่งขึ้น
สร้างโดยยึดความรับผิดชอบและความปลอดภัยเป็นแกนหลัก
- Google ได้เพิ่มมาตรการป้องกันใหม่โดยคำนึงถึงความสามารถแบบมัลติโมดัลของ Gemini และพิจารณาความเสี่ยงที่อาจเกิดขึ้นในทุกขั้นตอนของการพัฒนา
- Gemini ได้รับการประเมินด้านความปลอดภัยที่ครอบคลุมที่สุดในบรรดาโมเดล AI ของ Google และมีการทำงานร่วมกับผู้เชี่ยวชาญภายนอกเพื่อระบุจุดบอดของวิธีการประเมินภายใน
- Gemini ใช้ safety classifier และฟิลเตอร์ที่แข็งแกร่งเพื่อระบุและจัดประเภทเนื้อหา เช่น ความรุนแรงหรือภาพเหมารวมเชิงลบ
นำ Gemini สู่ผู้ใช้ทั่วโลก
- Gemini 1.0 กำลังถูกนำเข้าสู่ผลิตภัณฑ์และแพลตฟอร์มของ Google โดย Bard ใช้ Gemini Pro เวอร์ชันขั้นสูงเพื่อมอบความสามารถด้านการให้เหตุผลและความเข้าใจที่ล้ำหน้ามากขึ้น
- นักพัฒนาและลูกค้าองค์กรสามารถเข้าถึง Gemini Pro ได้ผ่าน Google AI Studio หรือ Google Cloud Vertex AI
- Gemini Ultra จะถูกเปิดให้ลูกค้า นักพัฒนา พาร์ตเนอร์ และผู้เชี่ยวชาญที่ได้รับคัดเลือกใช้งานเพื่อรับฟีดแบ็กในระยะแรก หลังผ่านการตรวจสอบด้านความน่าเชื่อถือและความปลอดภัยแล้ว
ความเห็นของ GN⁺
สิ่งสำคัญที่สุดในบทความนี้คือ Google และ DeepMind ได้พัฒนาโมเดล AI ใหม่ชื่อ Gemini เพื่อเปิดยุคใหม่ของเทคโนโลยี AI โดย Gemini มีความสามารถแบบมัลติโมดัล จึงเข้าใจและประมวลผลข้อมูลได้หลากหลายรูปแบบ ทั้งข้อความ ภาพ และเสียง ซึ่งเปิดโอกาสให้นักพัฒนาและภาคธุรกิจสร้างผลิตภัณฑ์และบริการที่มีนวัตกรรมมากขึ้น เหตุผลที่บทความนี้น่าสนใจคือมันยกตัวอย่างอย่างเป็นรูปธรรมว่าเทคโนโลยี AI สามารถเปลี่ยนชีวิตมนุษย์ได้อย่างไร และยังแสดงให้เห็นแนวทางของ Google ว่าความก้าวหน้าทางเทคโนโลยีเช่นนี้ควรถูกพัฒนาอย่างมีความรับผิดชอบอย่างไร
1 ความคิดเห็น
โพสต์นี้ซ้ำกับที่ฝั่ง HN เช่นกัน ดังนั้นขอให้ดูที่ Google เปิดตัว AI model Gemini ที่ผมโพสต์แยกไว้ใน GeekNews แทนครับ