Grok-1.5 Vision Preview: เปิดตัวโมเดลมัลติโหมดรุ่นแรกที่มาพร้อมความสามารถการประมวลผลภาพขั้นสูง
(x.ai)• Grok-1.5V ซึ่งเป็นโมเดลมัลติโหมดรุ่นแรก ตอนนี้นอกจากความสามารถด้านข้อความอันทรงพลังแล้ว ยังสามารถประมวลผลข้อมูลภาพได้อย่างกว้างขวาง รวมถึงเอกสาร ไดอะแกรม แผนภูมิ ภาพหน้าจอ และภาพถ่าย
• Grok-1.5V เหนือกว่าโมเดลมัลติโหมดที่มีอยู่เดิมในหลากหลายด้าน เช่น การให้เหตุผลแบบสหวิทยาการ การทำความเข้าใจเอกสาร ไดอะแกรมทางวิทยาศาสตร์ แผนภูมิ ภาพหน้าจอ และภาพถ่าย และแสดงให้เห็นถึงความสามารถอันยอดเยี่ยมในการทำความเข้าใจโลกทางกายภาพ
• ขอแนะนำ RealWorldQA เบนช์มาร์กใหม่สำหรับประเมินความสามารถพื้นฐานในการทำความเข้าใจพื้นที่จริงของโมเดลมัลติโหมด ซึ่งประกอบด้วยภาพมากกว่า 700 ภาพ พร้อมคำถามและคำตอบที่ตรวจสอบได้ง่าย
• Grok-1.5V จะพร้อมให้ใช้งานเร็ว ๆ นี้สำหรับผู้ทดสอบกลุ่มแรกและผู้ใช้ Grok เดิม และกำลังขยายความสามารถมัลติโหมดอย่างต่อเนื่องครอบคลุมสื่อหลากหลายรูปแบบ เช่น ภาพ เสียง และวิดีโอ
ยังไม่มีความคิดเห็น