• DeepSeek เปิดตัวโมเดลพรีวิว 2 รุ่นแรกในซีรีส์ V4 คือ DeepSeek-V4-Pro และ DeepSeek-V4-Flash โดยทั้งคู่เป็นโมเดล Mixture of Experts ที่รองรับคอนเท็กซ์ 1 ล้านโทเค็น และเผยแพร่ภายใต้สัญญาอนุญาต MIT
  • DeepSeek-V4-Pro เป็นโมเดลที่มีพารามิเตอร์รวม 1.6T และพารามิเตอร์ที่ทำงานอยู่ 49B ดูเหมือนจะเป็นโมเดลโอเพนน้ำหนักที่ใหญ่ที่สุดรุ่นใหม่ ใหญ่กว่า Kimi K2.6, GLM-5.1 และ DeepSeek V3.2
  • จุดต่างสำคัญของ DeepSeek V4 คือ ราคา โดย Flash คิดค่าบริการอินพุต $0.14 และเอาต์พุต $0.28 ต่อ 1 ล้านโทเค็น ส่วน Pro อยู่ที่อินพุต $1.74 และเอาต์พุต $3.48 ซึ่งต่ำกว่าโมเดลขนาดเล็กและใหญ่ที่ใช้เปรียบเทียบ
  • ราคาที่ต่ำเชื่อมโยงกับ ประสิทธิภาพของคอนเท็กซ์ยาว โดยที่คอนเท็กซ์ 1 ล้านโทเค็น Pro ใช้ FLOPs ต่อโทเค็นเพียง 27% และ KV cache 10% เมื่อเทียบกับ DeepSeek-V3.2 ขณะที่ Flash ลดเหลือ FLOPs 10% และ KV cache 7%
  • ในเบนช์มาร์กภายใน DeepSeek-V4-Pro สามารถแข่งขันกับโมเดลฟรอนเทียร์ได้ แต่ยังตามหลัง GPT-5.4 และ Gemini-3.1-Pro เล็กน้อย และมีเส้นทางการพัฒนาที่ช้ากว่าโมเดลฟรอนเทียร์ล้ำหน้าสุดราว 3~6 เดือน

การเปิดตัวโมเดลและสเปกพื้นฐาน

  • หลังจาก V3.2 และ V3.2 Speciale ในเดือนธันวาคม 2025 DeepSeek ได้เปิดตัว DeepSeek-V4-Pro และ DeepSeek-V4-Flash ซึ่งเป็น โมเดลพรีวิว 2 รุ่นแรกของซีรีส์ V4
  • ทั้งสองรุ่นเป็นโมเดล Mixture of Experts ที่รองรับ คอนเท็กซ์ 1 ล้านโทเค็น และใช้สัญญาอนุญาต MIT มาตรฐาน
  • DeepSeek-V4-Pro มี พารามิเตอร์รวม 1.6T และพารามิเตอร์ที่ทำงานอยู่ 49B ส่วน DeepSeek-V4-Flash มีพารามิเตอร์รวม 284B และพารามิเตอร์ที่ทำงานอยู่ 13B
  • DeepSeek-V4-Pro มีขนาดใหญ่กว่า Kimi K2.6 ที่ 1.1T, GLM-5.1 ที่ 754B และ DeepSeek V3.2 ที่ 685B จึงดูเหมือนจะเป็นโมเดลโอเพนน้ำหนักที่ใหญ่ที่สุดรุ่นใหม่
  • ตามข้อมูลบน Hugging Face ขนาดโมเดลของ Pro อยู่ที่ 865GB และ Flash อยู่ที่ 160GB โดยคาดว่า Flash ที่ถูกควอนไทซ์แบบเบาจะสามารถรันได้บน MacBook Pro M5 ที่มีแรม 128GB
  • โมเดล Pro ก็อาจรันบนเครื่องเดียวกันได้เช่นกัน หากสามารถสตรีมเฉพาะ expert ที่ต้องใช้งานจากดิสก์ได้
  • การทดสอบอย่างง่ายผ่าน OpenRouter

ราคา ประสิทธิภาพ และตำแหน่งด้านสมรรถนะ

  • จุดที่โดดเด่นที่สุดของ DeepSeek V4 คือ ราคา โดยอ้างอิงจาก หน้าราคา DeepSeek Flash มีราคาอินพุต $0.14 ต่อ 1 ล้านโทเค็น และเอาต์พุต $0.28 ต่อ 1 ล้านโทเค็น
  • Pro ตั้งราคาไว้ที่อินพุต $1.74 ต่อ 1 ล้านโทเค็น และเอาต์พุต $3.48 ต่อ 1 ล้านโทเค็น
  • ในตารางเปรียบเทียบ DeepSeek V4 Flash มีราคาต่ำกว่า GPT-5.4 Nano ที่อินพุต $0.20 และเอาต์พุต $1.25 รวมถึง Gemini 3.1 Flash-Lite ที่อินพุต $0.25 และเอาต์พุต $1.50 ทำให้เป็นโมเดลขนาดเล็กที่ถูกที่สุด
  • DeepSeek V4 Pro มีราคาต่ำกว่า Gemini 3.1 Pro ที่อินพุต $2 และเอาต์พุต $12, GPT-5.4 ที่อินพุต $2.50 และเอาต์พุต $15, Claude Sonnet 4.6 ที่อินพุต $3 และเอาต์พุต $15, Claude Opus 4.7 ที่อินพุต $5 และเอาต์พุต $25 และ GPT-5.5 ที่อินพุต $5 และเอาต์พุต $30 ทำให้เป็นโมเดลฟรอนเทียร์ขนาดใหญ่ที่ถูกที่สุด
  • การเพิ่มประสิทธิภาพเป็นปัจจัยรองรับราคาที่ต่ำ

    • บทความวิจัยของ DeepSeek ระบุว่ารีลีสครั้งนี้มุ่งเน้นอย่างมากไปที่ประสิทธิภาพของพรอมป์ต์คอนเท็กซ์ยาว
    • ที่คอนเท็กซ์ 1 ล้านโทเค็น DeepSeek-V4-Pro ใช้ FLOPs ต่อโทเค็นเพียง 27% และมีขนาด KV cache เพียง 10% เมื่อเทียบกับ DeepSeek-V3.2
    • ภายใต้เงื่อนไขเดียวกัน DeepSeek-V4-Flash ลด FLOPs ต่อโทเค็นเหลือ 10% และขนาด KV cache เหลือ 7% เมื่อเทียบกับ DeepSeek-V3.2
  • ในเบนช์มาร์กเข้าใกล้ฟรอนเทียร์ แต่ยังไม่ถึงระดับบนสุด

    • เบนช์มาร์กที่ DeepSeek รายงานเอง แสดงผลว่าโมเดล Pro สามารถแข่งขันกับโมเดลฟรอนเทียร์อื่น ๆ ได้
    • ตามบทความวิจัย DeepSeek-V4-Pro-Max ซึ่งใช้การขยายโทเค็นสำหรับการให้เหตุผล แสดงสมรรถนะสูงกว่า GPT-5.2 และ Gemini-3.0-Pro ในเบนช์มาร์กการให้เหตุผลมาตรฐาน
    • อย่างไรก็ตาม ยังต่ำกว่า GPT-5.4 และ Gemini-3.1-Pro เล็กน้อย และแสดงเส้นทางการพัฒนาที่ช้ากว่าโมเดลฟรอนเทียร์ล้ำหน้าสุดประมาณ 3~6 เดือน
    • มีการคาดหวังว่า huggingface.co/unsloth/models จะเผยแพร่เวอร์ชันควอนไทซ์ของ Unsloth และยังคงน่าจับตาว่าโมเดล Flash จะรันบนเครื่องโลคัลได้ดีเพียงใด

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น