- Grok 4 Fast ที่ xAI เปิดตัว เป็นโมเดลให้เหตุผลรุ่นถัดไปที่ต่อยอดจากผลลัพธ์การฝึกของ Grok 4 เดิม โดยมุ่งเพิ่ม ความคุ้มค่าด้านต้นทุนและความเร็ว ให้สูงสุด
- โมเดลนี้มาพร้อม หน้าต่างคอนเท็กซ์ 2M โทเค็น, ความสามารถค้นหาเว็บและ X รวมถึง สถาปัตยกรรมแบบรวม reasoning / non-reasoning ทำให้เหมาะกับการใช้งานแบบเรียลไทม์
- ในเบนช์มาร์กให้ประสิทธิภาพใกล้เคียงกับ Grok 4 แต่ใช้โทเค็นน้อยลงเฉลี่ย 40% จึงบรรลุประสิทธิภาพระดับเดียวกันได้ด้วยต้นทุนที่ต่ำกว่ามาก
- นอกจากนี้ยังแสดงประสิทธิภาพสูงในการรันโค้ด การท่องเว็บ และงานอื่น ๆ ผ่าน การเรียนรู้แบบเสริมกำลังสำหรับการใช้เครื่องมือ และครองอันดับ 1 ใน LMArena Search Arena
ความก้าวหน้าของปัญญาที่คุ้มค่าต้นทุน
- Grok 4 Fast ให้ประสิทธิภาพเหนือกว่า Grok 3 Mini พร้อมลดต้นทุนโทเค็นลงอย่างมาก
- โดยเฉลี่ยใช้ 'Thinking Tokens' น้อยกว่า Grok 4 40% แต่ให้ประสิทธิภาพใกล้เคียงกัน
- ตัวอย่างคะแนนเบนช์มาร์ก (pass@1):
- Grok 4 Fast: 85.7%, 92.0%, 93.3%, 20.0%, 80.0%
- ให้ผลลัพธ์ระดับเดียวกันหรือดีกว่าเมื่อเทียบกับโมเดลคู่แข่ง (เช่น GPT-5)
- แสดงผลงานใกล้เคียง Grok 4 ใน เบนช์มาร์กการให้เหตุผล หลากหลายรายการ เช่น GPQA, AIME, HMMT และ LiveCodeBench
- พร้อมกับการปรับปรุงประสิทธิภาพการใช้โทเค็นของ Grok 4 Fast ขึ้น 40% ยังลดราคาต่อโทเค็นลงอย่างมาก
- เมื่อเทียบที่ระดับประสิทธิภาพเท่ากัน ราคาลดลง 98% จาก Grok 4 ทำสถิติเป็น 'อัตราส่วนราคา-ต่อ-ความฉลาดที่ดีที่สุด (SOTA Price-to-Intelligence Ratio)' ในบรรดาโมเดลที่เปิดเผยสู่สาธารณะ
- ได้รับการยืนยันผลการประเมิน ที่โดดเด่น จากหน่วยงานอิสระ Artificial Analysis Intelligence Index
การใช้เครื่องมือแบบเนทีฟและการค้นหาระดับ SOTA
- ฝึกด้วย การเรียนรู้แบบเสริมกำลังสำหรับการใช้เครื่องมือ (RL) ทำให้สามารถรันโค้ดหรือท่องเว็บโดยอัตโนมัติเมื่อจำเป็น
- สามารถค้นหาเว็บและ X แบบเรียลไทม์ รองรับการค้นหาแบบหลายฮอปและสื่ออย่างภาพและวิดีโอ ด้วย ความสามารถด้าน agentic search
- ทำผลงานเหนือกว่า Grok 4 ในเบนช์มาร์กหลายรายการ เช่น BrowseComp, SimpleQA และ X Bench Deepsearch(zh)
ผลลัพธ์ของ post-training ในโดเมนทั่วไป
- ใน Search Arena ของ LMArena, Grok 4 Fast(
menlo) ครองอันดับ 1 ด้วย Elo 1163 นำหน้าโมเดลคู่แข่งอยู่ 17 คะแนน
- ใน Text Arena,
grok-4-fast (โค้ดเนม tahoe) อยู่อันดับ 8 และโดดเด่นอย่างทิ้งห่างเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ (อันดับ 18 หรือต่ำกว่า)
- แสดงประสิทธิภาพในการค้นหาและงานข้อความจริงได้คุ้มค่ากว่าโมเดลขนาดใหญ่
โมเดลแบบรวม Reasoning และ Non-Reasoning
- รวมโหมด reasoning / non-reasoning ที่เดิมต้องใช้คนละโมเดล ให้มาอยู่ใน สถาปัตยกรรมเดียว
- สลับโหมด reasoning (คิดเชิงลึก) และ non-reasoning (ตอบเร็ว) ได้ด้วย system prompt เพียงอย่างเดียว
- เหมาะกับ แอปพลิเคชันเรียลไทม์ เพราะช่วยลดทั้ง latency แบบ end-to-end และต้นทุนโทเค็น
- ใน xAI API นักพัฒนาสามารถปรับระดับความเร็ว/ความลึกได้อย่างละเอียด
การเปิดให้ใช้งานและนโยบายราคา
- Grok 4 Fast พร้อมใช้งานทันที และเปิดให้ใช้ ฟรีชั่วคราว บน OpenRouter และ Vercel AI Gateway
- ใน xAI API ก็มีให้เลือกสองเวอร์ชันคือ
grok-4-fast-reasoning และ grok-4-fast-non-reasoning พร้อมรองรับ หน้าต่างคอนเท็กซ์ 2M โทเค็น
- ราคาเริ่มต้นที่โทเค็นขาเข้า $0.20/1M และโทเค็นขาออก $0.50/1M โดย หากเกิน 128k โทเค็น จะคิดค่าบริการ 2 เท่า
- โทเค็นขาเข้าที่แคชไว้คิดราคา $0.05/1M ช่วยลดต้นทุนได้
แผนในอนาคต
- มีแผนปรับปรุงโมเดลอย่างต่อเนื่องโดยสะท้อนจากฟีดแบ็กของผู้ใช้
- ความสามารถมัลติโหมด และ การเสริมคุณสมบัติแบบ agentic คือเป้าหมายหลักของการอัปเดตครั้งถัดไป
- สามารถดูโมเดลการ์ดและรายละเอียดเพิ่มเติมได้ที่ Grok 4 Fast model card (PDF)
2 ความคิดเห็น
ดูเหมือนว่าจะแพงกว่าและช้ากว่า gpt-oss แต่ก็สงสัยว่าทำไมคนถึงใช้กันเยอะขนาดนี้..
ความเห็นจาก Hacker News