- เปิดตัวโมเดล Grok-2 และ Grok-2 mini ให้ผู้ใช้ Grok บนแพลตฟอร์ม X
- Grok-2 มีความสามารถด้านแชต การเขียนโค้ด และการให้เหตุผลที่พัฒนาขึ้นอย่างมากจากโมเดลก่อนหน้าอย่าง Grok-1.5
- Grok-2 เวอร์ชันเริ่มต้นที่ถูกทดสอบบนกระดานผู้นำ LMSYS ภายใต้ชื่อ
sus-column-r แสดงประสิทธิภาพที่เหนือกว่า Claude 3.5 Sonnet และ GPT-4-Turbo
โมเดลภาษาและความสามารถด้านแชตของ Grok-2
- ได้ส่ง Grok-2 เวอร์ชันเริ่มต้นไปยัง LMSYS Chatbot Arena (เครื่องมือเบนช์มาร์กการแข่งขัน LLM ที่มีชื่อเสียง) ภายใต้ชื่อ sus-column-r
- เหนือกว่า Claude และ GPT-4 ในแง่คะแนน Elo โดยรวมของโมเดล
เบนช์มาร์ก
- ได้ประเมินโมเดล Grok-2 ด้วยชุดเบนช์มาร์กเชิงวิชาการด้านการให้เหตุผล การอ่านจับใจความ คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
- Grok-2 และ Grok-2 mini แสดงให้เห็นการปรับปรุงอย่างมีนัยสำคัญเมื่อเทียบกับโมเดลก่อนหน้าอย่าง Grok-1.5
- ทำผลงานได้แข่งขันกับโมเดลล้ำสมัยอื่น ๆ ในด้านความรู้วิทยาศาสตร์ระดับบัณฑิตศึกษา (GPQA), ความรู้ทั่วไป (MMLU, MMLU-Pro), และโจทย์คณิตศาสตร์แข่งขัน (MATH)
- Grok-2 แสดงประสิทธิภาพระดับแนวหน้าบนงานการให้เหตุผลทางคณิตศาสตร์จากภาพ (MathVista) และการถามตอบบนเอกสาร (DocVQA)
สัมผัส Grok ด้วยข้อมูลเรียลไทม์บน X
- ได้ปรับปรุง Grok บนแพลตฟอร์ม X อย่างต่อเนื่อง
- ผู้ใช้ X Premium และ Premium+ สามารถเข้าถึงโมเดลใหม่สองรุ่นคือ Grok-2 และ Grok-2 mini
- Grok-2 สามารถใช้งานได้ผ่านแท็บ Grok ในแอป X และเป็น AI assistant ระดับแนวหน้าที่มีความสามารถขั้นสูงทั้งด้านข้อความและความเข้าใจภาพ
- Grok-2 mini เป็นโมเดลขนาดเล็กแต่มีความสามารถ ซึ่งให้สมดุลระหว่างความเร็วกับคุณภาพของคำตอบ
- กำลังทดลองใช้โมเดล FLUX.1 ร่วมกับ Black Forest Labs เพื่อขยายความสามารถของ Grok บน X
สร้างด้วย Grok ผ่าน Enterprise API
- มีแผนเปิดตัว Grok-2 และ Grok-2 mini ให้แก่นักพัฒนาผ่านแพลตฟอร์ม Enterprise API ใหม่ภายในปลายเดือนนี้
- API ใหม่นี้สร้างขึ้นบนเทคโนโลยีสแตกแบบกำหนดเองใหม่ ที่รองรับการดีพลอย inference แบบหลายภูมิภาคเพื่อให้เข้าถึงได้ด้วย latency ต่ำทั่วโลก
- มาพร้อมฟีเจอร์ความปลอดภัยที่ยกระดับขึ้น เช่น การยืนยันตัวตนหลายปัจจัยแบบบังคับ สถิติทราฟฟิกแบบละเอียด และการวิเคราะห์การเรียกเก็บเงินขั้นสูง
- มี Admin API สำหรับผสานการจัดการทีม ผู้ใช้ และการเรียกเก็บเงินเข้ากับเครื่องมือและบริการภายในที่มีอยู่
อะไรต่อไป?
- Grok-2 และ Grok-2 mini กำลังเปิดตัวบน X
- คาดหวังอย่างมากกับความสามารถที่ขับเคลื่อนด้วย AI หลากหลายรูปแบบ เช่น ความสามารถด้านการค้นหาที่ดีขึ้นของ Grok ข้อมูลเชิงลึกที่ลึกขึ้นเกี่ยวกับโพสต์บน X และความสามารถในการตอบกลับที่ได้รับการปรับปรุง
- เร็ว ๆ นี้จะเปิดพรีวิวความเข้าใจแบบหลายโมดัลในฐานะส่วนสำคัญของประสบการณ์ Grok ทั้งบน X และ API
- นับตั้งแต่การประกาศ Grok-1 ในเดือนพฤศจิกายน 2023, X.AI ได้เดินหน้าอย่างรวดเร็วอย่างมหาศาลภายใต้การนำของทีมขนาดเล็กแต่มีความหนาแน่นของบุคลากรที่มีความสามารถสูงที่สุด
- การเปิดตัว Grok-2 ทำให้บริษัทก้าวขึ้นมายืนอยู่แนวหน้าของการพัฒนา AI
- กำลังมุ่งเน้นไปที่การพัฒนาความสามารถหลักด้านการให้เหตุผลด้วยคลัสเตอร์คอมพิวต์ใหม่
- จะมีการแบ่งปันความคืบหน้าเพิ่มเติมอีกมากในอีกไม่กี่เดือนข้างหน้า
- "กำลังมองหาบุคคลที่จะเข้าร่วมทีมขนาดเล็กที่มุ่งมั่นและโฟกัส ซึ่งทุ่มเทเพื่อสร้างนวัตกรรมที่ทรงอิทธิพลที่สุดสำหรับอนาคตของมนุษยชาติ"
ยังไม่มีความคิดเห็น