Google เปิดตัวโมเดล AI Gemini
(blog.google)- Gemini เป็นโมเดล AI ตัวแรกที่ทำคะแนน 90% บน MMLU และเหนือกว่าผู้เชี่ยวชาญมนุษย์
- เป็นโมเดล AI แบบมัลติโมดัล และเหนือกว่า GPT-4V และ Whisper ในเบนช์มาร์กหลายโหมดทั้งภาพ/วิดีโอ/เสียง
- ปรับแต่งตามขนาดเป็น 3 รุ่น
- Ultra : โมเดลที่ใหญ่ที่สุดและทรงประสิทธิภาพที่สุดสำหรับงานที่ซับซ้อน
- Pro : ขยายใช้งานได้ครอบคลุมงานหลากหลาย
- Nano : โมเดลที่มีประสิทธิภาพสูงสุดสำหรับงานแบบ on-device
- เข้าใจ อธิบาย และสร้างโค้ดคุณภาพสูงได้ในภาษาโปรแกรมที่ใช้กันแพร่หลายที่สุดในโลก เช่น Python, Java, C++, Go
- เปิดตัว AlphaCode 2 สำหรับ Competitive Programming ที่ใช้ Gemini ด้วย
- ฝึก Gemini 1.0 ในระดับขนาดใหญ่บนโครงสร้างพื้นฐานที่ปรับแต่งสำหรับ AI โดยใช้ TPU v4 และ v5e
- มีความเสถียร ขยายขนาดได้ และมีประสิทธิภาพมากขึ้น
- ให้ความสำคัญกับ Responsibility และ Safety
- ดำเนินการประเมินด้านความปลอดภัยอย่างครอบคลุม
- ใช้งาน Gemini Pro ได้ทันทีใน Google Bard
- ใช้งานได้ใน 170 ประเทศสำหรับภาษาอังกฤษ และจะรองรับ modality อื่น ๆ และภาษาใหม่เพิ่มเติมในเร็ว ๆ นี้
- จะนำ Gemini Nano ไปใช้ใน Pixel 8 Pro
- ภายในไม่กี่เดือนจะนำ Gemini ไปใช้กับ Search, Ads, Chrome และ Duet AI ด้วย
- ตั้งแต่วันที่ 13 ธันวาคม เป็นต้นไป นักพัฒนาและลูกค้าองค์กรจะใช้งาน Gemini API ได้ผ่าน Google AI Studio และ Google Cloud Vertex AI (เฉพาะ Pro)
- Gemini Ultra จะพร้อมใช้งานในเร็ว ๆ นี้
- กำลังดำเนินการตรวจสอบด้านความน่าเชื่อถือและความปลอดภัยอย่างครอบคลุม รวมถึงการทดสอบ red team โดยหน่วยงานภายนอกที่เชื่อถือได้ และกำลังปรับแต่งโมเดลให้ละเอียดยิ่งขึ้นผ่านการ fine-tuning และ reinforcement learning from human feedback (RLHF) ก่อนเปิดเผยในวงกว้าง
- มีแผนให้ Gemini Ultra แก่ลูกค้าบางส่วน นักพัฒนา พันธมิตร และผู้เชี่ยวชาญด้านความปลอดภัยและความรับผิดชอบ เพื่อทดลองใช้งานและรับข้อเสนอแนะเบื้องต้น ก่อนเปิดให้แก่นักพัฒนาและลูกค้าองค์กรในช่วงต้นปีหน้า
- ช่วงต้นปีหน้ามีแผนเปิดตัว Bard Advanced ซึ่งเป็นประสบการณ์ AI ล้ำสมัยแบบใหม่ที่ให้ใช้งานโมเดลและความสามารถระดับสูงสุด โดยเริ่มจาก Gemini Ultra
7 ความคิดเห็น
พอดูวิดีโอแล้วก็คิดว่า 'Bard ก็ไม่ได้ดีขนาดนั้นไม่ใช่เหรอ แล้วนี่แซงไปหมดแล้วงั้นเหรอ?'
แต่เห็นว่ามันเป็นวิดีโอที่จัดฉากขึ้นมา แบบนี้ไม่ใช่การหลอกลวงเหรอ..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
จำทวีตนั้นได้เลยว่า "บางคนคิดว่า Google กำลังตามหลังในด้าน AI แต่จริง ๆ แล้วพวกเขาอยู่กันคนละระดับเลย"
วันนี้หุ้น Google ขึ้นเยอะเลยนะ
ดูเหมือนว่า nano จะใช้งานได้บน Pixel 8 Pro เท่านั้น.... https://blog.google/products/pixel/pixel-feature-drop-december-2023/
ในขอบเขตการใช้งานก็มีแค่ Voice Recorder ที่ไม่รองรับภาษาเกาหลี และ gboard ที่ต้อง opt-in แยกต่างหากในสถานะ beta เท่านั้นครับ
งั้นนี่คงเป็นเหตุผลที่ไม่ขาย Pixel ในเกาหลีใช่ไหมครับ..? 555
ผมยังเก็บ Pixel 1 เครื่องนั้นไว้อยู่เลย T_T
ในที่สุดก็ออกมาแล้วนะครับ ถ้านำไปใช้กับผลิตภัณฑ์ของ Google อย่างครอบคลุม จะออกมาเป็นแบบไหนก็น่าตื่นเต้นดีครับ
วิดีโอที่น่าสนใจที่สุดคือ Hands-on with Gemini: Interacting with multimodal AI
ยาวประมาณ 6 นาที จึงอยากให้ลองดูกันสักครั้ง ถ้า multimodal AI พัฒนาขึ้น เราก็คงได้เห็น Jarvis ที่เคยเห็นในภาพยนตร์กลายเป็นจริงครับ
GPT-4 Vision ก็น่าทึ่งมากอยู่แล้ว แต่ดูเหมือนว่ายุคของ Jarvis ตัวจริงกำลังจะมาถึงแล้ว... +_+