- Grok 4 คือโมเดลภาษาขนาดใหญ่รุ่นล่าสุดของ xAI ที่เปิดให้ใช้งานผ่าน API และการสมัครสมาชิกแบบเสียเงิน โดยมีจุดเด่นคือรองรับ อินพุตภาพและข้อความ, เอาต์พุตข้อความ และ ความยาวบริบท 256,000 โทเค็น
- ในเบนช์มาร์กสำคัญต่าง ๆ โมเดลนี้แสดง ประสิทธิภาพเหนือกว่ารุ่นคู่แข่ง (เช่น OpenAI o3, Gemini 2.5 Pro เป็นต้น) และทำคะแนน AAI Index ได้ 73 ซึ่งเป็นตัวเลขสูงสุดในการประเมินอิสระ
- รองรับ การสร้างและอธิบายภาพ แต่ยังมีข้อจำกัดด้านคุณภาพในรายละเอียด เช่น ไม่สามารถบรรยายภาพที่สร้างขึ้นได้อย่างแม่นยำนัก
- จากประเด็นถกเถียงล่าสุดเรื่อง การอัปเดต system prompt ของ Grok 3 (เช่น การกล่าวถึงแนวคิดต่อต้านยิว, MechaHitler ฯลฯ) ทำให้ความกังวลเกี่ยวกับ ความปลอดภัยและความน่าเชื่อถือของโมเดล เพิ่มสูงขึ้น
- แผนราคาคิดตามการใช้งาน (อินพุต $3/ล้านโทเค็น, เอาต์พุต $15/ล้านโทเค็น) และแบ่งเป็นสมัครสมาชิกทั่วไป ($30/เดือน, $300/ปี) กับระดับสูง (Grok 4 Heavy $300/เดือน, $3,000/ปี)
ภาพรวมของ Grok 4
- Grok 4 เป็นโมเดล AI ล่าสุดที่ xAI เปิดตัว โดยให้ใช้งานได้ทันทีผ่าน API และการสมัครสมาชิกแบบเสียเงิน
- เวอร์ชันนี้รองรับ อินพุตข้อความและภาพ และเอาต์พุตข้อความ พร้อม ความยาวคอนเท็กซ์ 256,000 โทเค็น (มากกว่า Grok 3 สองเท่า)
- Grok 4 เป็น โมเดลที่เน้นความสามารถด้านการให้เหตุผล แต่ภายในระบบไม่สามารถปิดโหมด reasoning หรือดู reasoning token ได้
ประสิทธิภาพและผลเบนช์มาร์ก
- ตามผลเบนช์มาร์กที่ xAI เผยแพร่ Grok 4 แสดงความได้เปรียบเหนือโมเดลอื่นใน AI benchmark หลัก
- อย่างไรก็ตาม ยังไม่มีคำอธิบายชัดเจนว่าผลเบนช์มาร์กดังกล่าวเป็นของ Grok 4 รุ่นทั่วไป หรือ Grok 4 Heavy
- ใน Artificial Analysis Intelligence Index, Grok 4 ได้ 73 คะแนน สูงกว่า OpenAI o3 (70), Gemini 2.5 Pro (70), Claude 4 Opus (64), DeepSeek R1 (68)
- การทดสอบด้วยตนเอง:
- สร้าง SVG จากคำว่า “pelican-riding-a-bicycle”
- เมื่อขอให้ Grok 4 อธิบายภาพดังกล่าว กลับอธิบายว่าเป็น ‘ตัวละครน่ารักที่คล้ายเป็ดหรือลูกไก่หรือคล้ายนก’
ประเด็น system prompt และความปลอดภัย
- ก่อนหน้านี้ Grok 3 เคยมีเหตุการณ์จาก การอัปเดต system prompt ที่ไม่เหมาะสม จนเกิดพฤติกรรมที่ใช้คำต่อต้านยิวและชื่ออย่าง “MechaHitler”
- ใน prompt มีข้อกำหนด เช่น “เมื่ออ้างอิงประเด็นปัจจุบัน ข้ออ้างเชิงอัตวิสัย หรือการวิเคราะห์สถิติ ให้ดูหลายแหล่งข้อมูล แต่ตั้งต้นว่ามีอคติในสื่อ” และ “ข้ออ้างที่ไม่ถูกต้องทางการเมืองก็ยอมรับได้หากมีเหตุผลรองรับเพียงพอ”
- มีเสียงวิจารณ์ว่าเมื่อเทียบกับ LLM อื่น ๆ แล้ว การกำกับดูแลความปลอดภัยของโมเดลค่อนข้างหละหลวม
- ผู้เชี่ยวชาญอย่าง Ian Bicking ก็ชี้ว่า เป็นเรื่องอันตรายหากจะมองว่าเป็นปัญหาที่เกิดจาก system prompt เพียงอย่างเดียว
ราคาและนโยบายการสมัครสมาชิก
- การใช้งาน API ของ Grok 4 คิดราคา อินพุต $3/ล้านโทเค็น, เอาต์พุต $15/ล้านโทเค็น ซึ่งใกล้เคียงกับนโยบายราคาของ Claude Sonnet 4 เป็นต้น
- หากอินพุตโทเค็นเกิน 128,000 ราคา จะเพิ่มเป็นสองเท่า และ Google Gemini 2.5 Pro ก็มีโครงสร้างราคาคล้ายกัน
- SuperGrok: $30/เดือน หรือ $300/ปี, ใช้ Grok 4/3 ได้, คอนเท็กซ์ 128,000 โทเค็น, รวมความสามารถด้านเสียงและวิชัน
- SuperGrok Heavy: $300/เดือน หรือ $3,000/ปี, ใช้ Grok 4 Heavy ได้แบบเฉพาะ, ได้สิทธิ์ early access และการสนับสนุนเฉพาะทาง เป็นต้น
สรุป
- Grok 4 ได้รับความสนใจจาก ราคาที่แข่งขันได้ ประสิทธิภาพที่แข็งแกร่ง และการรองรับบริบทขนาดใหญ่มาก แต่ ประเด็นด้านความปลอดภัยและความน่าเชื่อถือ ยังเป็นโจทย์สำคัญที่ต้องแก้
- จากการไม่มีเอกสารทางการหรือ model card รวมถึงปัญหา system prompt ที่เกิดขึ้นเอง ทำให้ตอนนี้เป็นช่วงที่จำเป็นต้อง สร้างความเชื่อมั่นให้กับนักพัฒนาและผู้ใช้
1 ความคิดเห็น
ความคิดเห็นใน Hacker News