• เปิดตัวโมเดล Grok-2 และ Grok-2 mini ให้ผู้ใช้ Grok บนแพลตฟอร์ม X
  • Grok-2 มีความสามารถด้านแชต การเขียนโค้ด และการให้เหตุผลที่พัฒนาขึ้นอย่างมากจากโมเดลก่อนหน้าอย่าง Grok-1.5
  • Grok-2 เวอร์ชันเริ่มต้นที่ถูกทดสอบบนกระดานผู้นำ LMSYS ภายใต้ชื่อ sus-column-r แสดงประสิทธิภาพที่เหนือกว่า Claude 3.5 Sonnet และ GPT-4-Turbo

โมเดลภาษาและความสามารถด้านแชตของ Grok-2

  • ได้ส่ง Grok-2 เวอร์ชันเริ่มต้นไปยัง LMSYS Chatbot Arena (เครื่องมือเบนช์มาร์กการแข่งขัน LLM ที่มีชื่อเสียง) ภายใต้ชื่อ sus-column-r
  • เหนือกว่า Claude และ GPT-4 ในแง่คะแนน Elo โดยรวมของโมเดล

เบนช์มาร์ก

  • ได้ประเมินโมเดล Grok-2 ด้วยชุดเบนช์มาร์กเชิงวิชาการด้านการให้เหตุผล การอ่านจับใจความ คณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
  • Grok-2 และ Grok-2 mini แสดงให้เห็นการปรับปรุงอย่างมีนัยสำคัญเมื่อเทียบกับโมเดลก่อนหน้าอย่าง Grok-1.5
  • ทำผลงานได้แข่งขันกับโมเดลล้ำสมัยอื่น ๆ ในด้านความรู้วิทยาศาสตร์ระดับบัณฑิตศึกษา (GPQA), ความรู้ทั่วไป (MMLU, MMLU-Pro), และโจทย์คณิตศาสตร์แข่งขัน (MATH)
  • Grok-2 แสดงประสิทธิภาพระดับแนวหน้าบนงานการให้เหตุผลทางคณิตศาสตร์จากภาพ (MathVista) และการถามตอบบนเอกสาร (DocVQA)

สัมผัส Grok ด้วยข้อมูลเรียลไทม์บน X

  • ได้ปรับปรุง Grok บนแพลตฟอร์ม X อย่างต่อเนื่อง
  • ผู้ใช้ X Premium และ Premium+ สามารถเข้าถึงโมเดลใหม่สองรุ่นคือ Grok-2 และ Grok-2 mini
  • Grok-2 สามารถใช้งานได้ผ่านแท็บ Grok ในแอป X และเป็น AI assistant ระดับแนวหน้าที่มีความสามารถขั้นสูงทั้งด้านข้อความและความเข้าใจภาพ
  • Grok-2 mini เป็นโมเดลขนาดเล็กแต่มีความสามารถ ซึ่งให้สมดุลระหว่างความเร็วกับคุณภาพของคำตอบ
  • กำลังทดลองใช้โมเดล FLUX.1 ร่วมกับ Black Forest Labs เพื่อขยายความสามารถของ Grok บน X

สร้างด้วย Grok ผ่าน Enterprise API

  • มีแผนเปิดตัว Grok-2 และ Grok-2 mini ให้แก่นักพัฒนาผ่านแพลตฟอร์ม Enterprise API ใหม่ภายในปลายเดือนนี้
  • API ใหม่นี้สร้างขึ้นบนเทคโนโลยีสแตกแบบกำหนดเองใหม่ ที่รองรับการดีพลอย inference แบบหลายภูมิภาคเพื่อให้เข้าถึงได้ด้วย latency ต่ำทั่วโลก
  • มาพร้อมฟีเจอร์ความปลอดภัยที่ยกระดับขึ้น เช่น การยืนยันตัวตนหลายปัจจัยแบบบังคับ สถิติทราฟฟิกแบบละเอียด และการวิเคราะห์การเรียกเก็บเงินขั้นสูง
  • มี Admin API สำหรับผสานการจัดการทีม ผู้ใช้ และการเรียกเก็บเงินเข้ากับเครื่องมือและบริการภายในที่มีอยู่

อะไรต่อไป?

  • Grok-2 และ Grok-2 mini กำลังเปิดตัวบน X
    • คาดหวังอย่างมากกับความสามารถที่ขับเคลื่อนด้วย AI หลากหลายรูปแบบ เช่น ความสามารถด้านการค้นหาที่ดีขึ้นของ Grok ข้อมูลเชิงลึกที่ลึกขึ้นเกี่ยวกับโพสต์บน X และความสามารถในการตอบกลับที่ได้รับการปรับปรุง
  • เร็ว ๆ นี้จะเปิดพรีวิวความเข้าใจแบบหลายโมดัลในฐานะส่วนสำคัญของประสบการณ์ Grok ทั้งบน X และ API
  • นับตั้งแต่การประกาศ Grok-1 ในเดือนพฤศจิกายน 2023, X.AI ได้เดินหน้าอย่างรวดเร็วอย่างมหาศาลภายใต้การนำของทีมขนาดเล็กแต่มีความหนาแน่นของบุคลากรที่มีความสามารถสูงที่สุด
  • การเปิดตัว Grok-2 ทำให้บริษัทก้าวขึ้นมายืนอยู่แนวหน้าของการพัฒนา AI
  • กำลังมุ่งเน้นไปที่การพัฒนาความสามารถหลักด้านการให้เหตุผลด้วยคลัสเตอร์คอมพิวต์ใหม่
  • จะมีการแบ่งปันความคืบหน้าเพิ่มเติมอีกมากในอีกไม่กี่เดือนข้างหน้า
  • "กำลังมองหาบุคคลที่จะเข้าร่วมทีมขนาดเล็กที่มุ่งมั่นและโฟกัส ซึ่งทุ่มเทเพื่อสร้างนวัตกรรมที่ทรงอิทธิพลที่สุดสำหรับอนาคตของมนุษยชาติ"

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น