• Grok-1.5V ซึ่งเป็นโมเดลมัลติโหมดรุ่นแรก ตอนนี้นอกจากความสามารถด้านข้อความอันทรงพลังแล้ว ยังสามารถประมวลผลข้อมูลภาพได้อย่างกว้างขวาง รวมถึงเอกสาร ไดอะแกรม แผนภูมิ ภาพหน้าจอ และภาพถ่าย

• Grok-1.5V เหนือกว่าโมเดลมัลติโหมดที่มีอยู่เดิมในหลากหลายด้าน เช่น การให้เหตุผลแบบสหวิทยาการ การทำความเข้าใจเอกสาร ไดอะแกรมทางวิทยาศาสตร์ แผนภูมิ ภาพหน้าจอ และภาพถ่าย และแสดงให้เห็นถึงความสามารถอันยอดเยี่ยมในการทำความเข้าใจโลกทางกายภาพ

• ขอแนะนำ RealWorldQA เบนช์มาร์กใหม่สำหรับประเมินความสามารถพื้นฐานในการทำความเข้าใจพื้นที่จริงของโมเดลมัลติโหมด ซึ่งประกอบด้วยภาพมากกว่า 700 ภาพ พร้อมคำถามและคำตอบที่ตรวจสอบได้ง่าย

• Grok-1.5V จะพร้อมให้ใช้งานเร็ว ๆ นี้สำหรับผู้ทดสอบกลุ่มแรกและผู้ใช้ Grok เดิม และกำลังขยายความสามารถมัลติโหมดอย่างต่อเนื่องครอบคลุมสื่อหลากหลายรูปแบบ เช่น ภาพ เสียง และวิดีโอ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น