เปิดตัว Grok-2 เวอร์ชันเบตา

xguru · 2024-08-16T10:33:01+09:00

เปิดตัวโมเดล Grok-2 และ Grok-2 mini ให้ผู้ใช้ Grok บนแพลตฟอร์ม X Grok-2 มีความสามารถด้านแชต การเขียนโค้ด และการให้เหตุผลที่พัฒนาขึ้นอย่างมากจากโมเดลก่อนหน้าอย่าง Grok-1.5 Grok-2 เวอร์ชันเริ่มต้นที่ถูกทดสอบบนกระดานผู้นำ LMSYS ภายใต้ชื่อ sus-column-r แสดงประสิทธิภาพที่เหนือกว่า Claude 3.5 Sonnet และ GPT-4-Turbo โมเดลภาษาและความสามารถด้านแชตของ Grok-2 ได้ส่ง Grok-2 เวอร์ชันเริ่มต้นไปยัง LMSYS Chatbot Arena (เครื่องมือเบนช์มาร์กการแข่งขัน LLM ที่มีชื่อเสียง) ภายใต้ชื่อ sus-column-r เหนือกว่า Claude และ GPT-4 ในแง่คะแนน Elo โดยรวมของโมเดล เบนช์มาร์ก ได้ประเมินโมเดล Grok-2 ด้วยชุดเบนช์มาร์กเชิงวิชาการด้านการให้เหตุผล การอ่านจับใจความ คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด Grok-2 และ Grok-2 mini แสดงให้เห็นการปรับปรุงอย่างมีนัยสำคัญเมื่อเทียบกับโมเดลก่อนหน้าอย่าง Grok-1.5 ทำผลงานได้แข่งขันกับโมเดลล้ำสมัยอื่น ๆ ในด้านความรู้วิทยาศาสตร์ระดับบัณฑิตศึกษา (GPQA), ความรู้ทั่วไป (MMLU, MMLU-Pro), และโจทย์คณิตศาสตร์แข่งขัน (MATH) Grok-2 แสดงประสิทธิภาพระดับแนวหน้าบนงานการให้เหตุผลทางคณิตศาสตร์จากภาพ (MathVista) และการถามตอบบนเอกสาร (DocVQA) สัมผัส Grok ด้วยข้อมูลเรียลไทม์บน X ได้ปรับปรุง Grok บนแพลตฟอร์ม X อย่างต่อเนื่อง ผู้ใช้ X Premium และ Premium+ สามารถเข้าถึงโมเดลใหม่สองรุ่นคือ Grok-2 และ Grok-2 mini Grok-2 สามารถใช้งานได้ผ่านแท็บ Grok ในแอป X และเป็น AI assistant ระดับแนวหน้าที่มีความสามารถขั้นสูงทั้งด้านข้อความและความเข้าใจภาพ Grok-2 mini เป็นโมเดลขนาดเล็กแต่มีความสามารถ ซึ่งให้สมดุลระหว่างความเร็วกับคุณภาพของคำตอบ กำลังทดลองใช้โมเดล FLUX.1 ร่วมกับ Black Forest Labs เพื่อขยายความสามารถของ Grok บน X สร้างด้วย Grok ผ่าน Enterprise API มีแผนเปิดตัว Grok-2 และ Grok-2 mini ให้แก่นักพัฒนาผ่านแพลตฟอร์ม Enterprise API ใหม่ภายในปลายเดือนนี้ API ใหม่นี้สร้างขึ้นบนเทคโนโลยีสแตกแบบกำหนดเองใหม่ ที่รองรับการดีพลอย inference แบบหลายภูมิภาคเพื่อให้เข้าถึงได้ด้วย latency ต่ำทั่วโลก มาพร้อมฟีเจอร์ความปลอดภัยที่ยกระดับขึ้น เช่น การยืนยันตัวตนหลายปัจจัยแบบบังคับ สถิติทราฟฟิกแบบละเอียด และการวิเคราะห์การเรียกเก็บเงินขั้นสูง มี Admin API สำหรับผสานการจัดการทีม ผู้ใช้ และการเรียกเก็บเงินเข้ากับเครื่องมือและบริการภายในที่มีอยู่ อะไรต่อไป? Grok-2 และ Grok-2 mini กำลังเปิดตัวบน X คาดหวังอย่างมากกับความสามารถที่ขับเคลื่อนด้วย AI หลากหลายรูปแบบ เช่น ความสามารถด้านการค้นหาที่ดีขึ้นของ Grok ข้อมูลเชิงลึกที่ลึกขึ้นเกี่ยวกับโพสต์บน X และความสามารถในการตอบกลับที่ได้รับการปรับปรุง เร็ว ๆ นี้จะเปิดพรีวิวความเข้าใจแบบหลายโมดัลในฐานะส่วนสำคัญของประสบการณ์ Grok ทั้งบน X และ API นับตั้งแต่การประกาศ Grok-1 ในเดือนพฤศจิกายน 2023, X.AI ได้เดินหน้าอย่างรวดเร็วอย่างมหาศาลภายใต้การนำของทีมขนาดเล็กแต่มีความหนาแน่นของบุคลากรที่มีความสามารถสูงที่สุด การเปิดตัว Grok-2 ทำให้บริษัทก้าวขึ้นมายืนอยู่แนวหน้าของการพัฒนา AI กำลังมุ่งเน้นไปที่การพัฒนาความสามารถหลักด้านการให้เหตุผลด้วยคลัสเตอร์คอมพิวต์ใหม่ จะมีการแบ่งปันความคืบหน้าเพิ่มเติมอีกมากในอีกไม่กี่เดือนข้างหน้า "กำลังมองหาบุคคลที่จะเข้าร่วมทีมขนาดเล็กที่มุ่งมั่นและโฟกัส ซึ่งทุ่มเทเพื่อสร้างนวัตกรรมที่ทรงอิทธิพลที่สุดสำหรับอนาคตของมนุษยชาติ"

(x.ai)

2 คะแนน โดย xguru 2024-08-16 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

เปิดตัวโมเดล Grok-2 และ Grok-2 mini ให้ผู้ใช้ Grok บนแพลตฟอร์ม X
Grok-2 มีความสามารถด้านแชต การเขียนโค้ด และการให้เหตุผลที่พัฒนาขึ้นอย่างมากจากโมเดลก่อนหน้าอย่าง Grok-1.5
Grok-2 เวอร์ชันเริ่มต้นที่ถูกทดสอบบนกระดานผู้นำ LMSYS ภายใต้ชื่อ sus-column-r แสดงประสิทธิภาพที่เหนือกว่า Claude 3.5 Sonnet และ GPT-4-Turbo

โมเดลภาษาและความสามารถด้านแชตของ Grok-2

ได้ส่ง Grok-2 เวอร์ชันเริ่มต้นไปยัง LMSYS Chatbot Arena (เครื่องมือเบนช์มาร์กการแข่งขัน LLM ที่มีชื่อเสียง) ภายใต้ชื่อ sus-column-r
เหนือกว่า Claude และ GPT-4 ในแง่คะแนน Elo โดยรวมของโมเดล

เบนช์มาร์ก

ได้ประเมินโมเดล Grok-2 ด้วยชุดเบนช์มาร์กเชิงวิชาการด้านการให้เหตุผล การอ่านจับใจความ คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
Grok-2 และ Grok-2 mini แสดงให้เห็นการปรับปรุงอย่างมีนัยสำคัญเมื่อเทียบกับโมเดลก่อนหน้าอย่าง Grok-1.5
ทำผลงานได้แข่งขันกับโมเดลล้ำสมัยอื่น ๆ ในด้านความรู้วิทยาศาสตร์ระดับบัณฑิตศึกษา (GPQA), ความรู้ทั่วไป (MMLU, MMLU-Pro), และโจทย์คณิตศาสตร์แข่งขัน (MATH)
Grok-2 แสดงประสิทธิภาพระดับแนวหน้าบนงานการให้เหตุผลทางคณิตศาสตร์จากภาพ (MathVista) และการถามตอบบนเอกสาร (DocVQA)

สัมผัส Grok ด้วยข้อมูลเรียลไทม์บน X

ได้ปรับปรุง Grok บนแพลตฟอร์ม X อย่างต่อเนื่อง
ผู้ใช้ X Premium และ Premium+ สามารถเข้าถึงโมเดลใหม่สองรุ่นคือ Grok-2 และ Grok-2 mini
Grok-2 สามารถใช้งานได้ผ่านแท็บ Grok ในแอป X และเป็น AI assistant ระดับแนวหน้าที่มีความสามารถขั้นสูงทั้งด้านข้อความและความเข้าใจภาพ
Grok-2 mini เป็นโมเดลขนาดเล็กแต่มีความสามารถ ซึ่งให้สมดุลระหว่างความเร็วกับคุณภาพของคำตอบ
กำลังทดลองใช้โมเดล FLUX.1 ร่วมกับ Black Forest Labs เพื่อขยายความสามารถของ Grok บน X

สร้างด้วย Grok ผ่าน Enterprise API

มีแผนเปิดตัว Grok-2 และ Grok-2 mini ให้แก่นักพัฒนาผ่านแพลตฟอร์ม Enterprise API ใหม่ภายในปลายเดือนนี้
API ใหม่นี้สร้างขึ้นบนเทคโนโลยีสแตกแบบกำหนดเองใหม่ ที่รองรับการดีพลอย inference แบบหลายภูมิภาคเพื่อให้เข้าถึงได้ด้วย latency ต่ำทั่วโลก
มาพร้อมฟีเจอร์ความปลอดภัยที่ยกระดับขึ้น เช่น การยืนยันตัวตนหลายปัจจัยแบบบังคับ สถิติทราฟฟิกแบบละเอียด และการวิเคราะห์การเรียกเก็บเงินขั้นสูง
มี Admin API สำหรับผสานการจัดการทีม ผู้ใช้ และการเรียกเก็บเงินเข้ากับเครื่องมือและบริการภายในที่มีอยู่

อะไรต่อไป?

Grok-2 และ Grok-2 mini กำลังเปิดตัวบน X
- คาดหวังอย่างมากกับความสามารถที่ขับเคลื่อนด้วย AI หลากหลายรูปแบบ เช่น ความสามารถด้านการค้นหาที่ดีขึ้นของ Grok ข้อมูลเชิงลึกที่ลึกขึ้นเกี่ยวกับโพสต์บน X และความสามารถในการตอบกลับที่ได้รับการปรับปรุง
เร็ว ๆ นี้จะเปิดพรีวิวความเข้าใจแบบหลายโมดัลในฐานะส่วนสำคัญของประสบการณ์ Grok ทั้งบน X และ API
นับตั้งแต่การประกาศ Grok-1 ในเดือนพฤศจิกายน 2023, X.AI ได้เดินหน้าอย่างรวดเร็วอย่างมหาศาลภายใต้การนำของทีมขนาดเล็กแต่มีความหนาแน่นของบุคลากรที่มีความสามารถสูงที่สุด
การเปิดตัว Grok-2 ทำให้บริษัทก้าวขึ้นมายืนอยู่แนวหน้าของการพัฒนา AI
กำลังมุ่งเน้นไปที่การพัฒนาความสามารถหลักด้านการให้เหตุผลด้วยคลัสเตอร์คอมพิวต์ใหม่
จะมีการแบ่งปันความคืบหน้าเพิ่มเติมอีกมากในอีกไม่กี่เดือนข้างหน้า
"กำลังมองหาบุคคลที่จะเข้าร่วมทีมขนาดเล็กที่มุ่งมั่นและโฟกัส ซึ่งทุ่มเทเพื่อสร้างนวัตกรรมที่ทรงอิทธิพลที่สุดสำหรับอนาคตของมนุษยชาติ"