DeepSeek ทำให้ส่วนลดราคา V4 Pro กลายเป็นราคาถาวร

(api-docs.deepseek.com)

3 คะแนน โดย GN⁺ 2026-05-23 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

ราคา API ของ DeepSeek-V4-Pro จะคงอยู่ที่ระดับ 1/4 ของราคาเดิมอย่างเป็นทางการ แม้หลังจากโปรโมชันลดราคา 75% สิ้นสุดลง
การคิดค่าบริการอิงตามราคาต่อ 1 ล้านโทเค็น และหักจากยอดคงเหลือโดยตรงตามปริมาณการใช้ โทเค็นขาเข้าและโทเค็นขาออก
โมเดลที่รองรับคือ DeepSeek-V4-Flash และ DeepSeek-V4-Pro โดยทั้งสองรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ และค่าเริ่มต้นคือโหมดคิดวิเคราะห์
ทั้งสองโมเดลมี ความยาวคอนเท็กซ์ 1M, เอาต์พุตสูงสุด 384K และมีข้อจำกัดด้าน concurrency ต่างกันคือ Flash 2500, Pro 500
ราคา input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับนี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC

เกณฑ์การคิดค่าบริการ

หน่วยราคา คือค่าบริการต่อ 1 ล้านโทเค็น โดยโทเค็นคือหน่วยข้อความที่เล็กที่สุดที่โมเดลรับรู้ได้ ซึ่งอาจเป็นคำ ตัวเลข หรือเครื่องหมายวรรคตอน
เกณฑ์การเรียกเก็บเงิน คือปริมาณรวมของโทเค็นขาเข้าและโทเค็นขาออกของโมเดล
ค่าใช้จ่ายคำนวณจาก จำนวนโทเค็น × ราคา และหักโดยตรงจากยอดเติมเงินหรือยอดเครดิตที่ได้รับ
หากมีทั้งยอดเติมเงินและยอดเครดิตที่ได้รับ ระบบจะใช้ ยอดเครดิตที่ได้รับ ก่อน
ราคาผลิตภัณฑ์อาจมีการเปลี่ยนแปลง และ DeepSeek สงวนสิทธิ์ในการปรับราคา
แนะนำให้เติมเงินตามการใช้งานจริง และตรวจสอบราคาล่าสุดจากหน้านี้เป็นระยะ

โมเดลและราคา

โมเดลที่รองรับ
- มี DeepSeek-V4-Flash และ DeepSeek-V4-Pro
- ทั้งสองโมเดลรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ โดยค่าเริ่มต้นคือโหมดคิดวิเคราะห์
- ชื่อโมเดล deepseek-chat และ deepseek-reasoner จะถูกยกเลิกในอนาคต
- เพื่อความเข้ากันได้ deepseek-chat จะตรงกับโหมดไม่คิดวิเคราะห์ของ deepseek-v4-flash และ deepseek-reasoner จะตรงกับโหมดคิดวิเคราะห์ของ deepseek-v4-flash
เอนด์พอยต์และฟีเจอร์
- Base URL รูปแบบ Anthropic คือ https://api.deepseek.com/anthropic
- วิธีสลับโหมดคิดวิเคราะห์ดูได้ที่ Thinking Mode
- เอกสารฟีเจอร์ที่เกี่ยวข้องมี Json Output, Tool Calls, Chat Prefix Completion（Beta）, FIM Completion（Beta）
คอนเท็กซ์และขีดจำกัดเอาต์พุต
- ความยาวคอนเท็กซ์ คือ 1M
- เอาต์พุตสูงสุด คือ 384K

ราคาต่อ 1 ล้านโทเค็น

รายการ	DeepSeek-V4-Flash	DeepSeek-V4-Pro
โทเค็นขาเข้า, cache hit	$0.0028	$0.003625
โทเค็นขาเข้า, cache miss	$0.14	$0.435
โทเค็นขาออก	$0.28	$0.87
ข้อจำกัด concurrency	2500	500

การปรับส่วนลดของ DeepSeek-V4-Pro
- ราคา DeepSeek-V4-Pro แสดงเป็นราคาหลังส่วนลด 75%
- ราคาโทเค็นขาเข้าแบบ cache hit ลดลงจากเดิม $0.0145 เหลือ $0.003625
- ราคาโทเค็นขาเข้าแบบ cache miss ลดลงจากเดิม $1.74 เหลือ $0.435
- ราคาโทเค็นขาออกลดลงจากเดิม $3.48 เหลือ $0.87
- หลังโปรโมชันลดราคา 75% สิ้นสุดในวันที่ 31 พฤษภาคม 2026 เวลา 15:59 UTC ราคา API ของ DeepSeek-V4-Pro จะถูกปรับอย่างเป็นทางการให้เหลือ 1/4 ของราคาเดิมต่อไป
การลดราคา cache hit
- ราคา input cache hit ของทุกโมเดลถูกลดลงเหลือ 1/10 ของราคาเปิดตัว
- การปรับราคานี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC
ข้อจำกัด concurrency
- ข้อจำกัด concurrency ของ DeepSeek-V4-Flash คือ 2500
- ข้อจำกัด concurrency ของ DeepSeek-V4-Pro คือ 500
- รายละเอียดเพิ่มเติมเกี่ยวกับข้อจำกัด concurrency ดูได้ที่ Rate Limit & Isolation

3 ความคิดเห็น

j2sus91 27 일 전

มีคนบอกว่าถ้าดูข้อกำหนดการใช้งาน จะไม่มีการระบุไว้อย่างชัดเจนว่า API จะไม่ถูกนำไปใช้สำหรับการฝึกโมเดล
คิดว่าน่าจะดีถ้าใช้โดยอ้างอิงจุดนี้ด้วยนะครับ~

myoun 28 일 전

โอ้ ดีเลย

GN⁺ 2026-05-23

ความคิดเห็นจาก Hacker News

ถ้าออก coding agent ของตัวเองมา ผมก็อาจจะเริ่มใช้โมเดล DeepSeek เป็นตัวหลัก
ดูเหมือนพวกเขาจะยังคงทำสิ่งที่ “มาถูกทาง” ต่อไป ทั้งการเปิดซอร์สโมเดล เผยแพร่งานวิจัย และคงราคาต่ำไว้
- ใช้ V4 Pro กับ Claude Code ได้ 1
  ผมลองใช้เองแล้ว ประทับใจมาก
- ใช้กับ OpenCode ก็เข้ากันได้ดีมาก
  ทีมเรามักชน ลิมิต 5 ชั่วโมง ของบริการสมัครสมาชิกอื่นบ่อย ๆ แต่พอมี DeepSeek เป็นตัวสำรองแล้วถือว่าดีมาก
  เติมเงินไว้แค่ 50 ดอลลาร์ แต่รู้สึกเหมือนจะไม่มีวันหมด
  
  มันยังไม่ถึงขั้นแทนที่โมเดลระดับแนวหน้าได้ทั้งหมด แต่ถ้าเป็นตัวสำรองนี่ถือว่ายอดเยี่ยมแน่นอน
- ไม่แน่ใจว่า DeepSeek จำเป็นต้องทำ coding agent เองด้วยหรือเปล่า
  เอาโมเดลไปต่อกับ coding agent ที่มีอยู่แล้วตัวไหนก็ได้
  ส่วนตัวผมชอบ Pi แต่ใครถนัดอันไหนก็ใช้อันนั้นได้
- ต้นสัปดาห์นี้ผมเริ่มทดสอบ โมเดลจีน กับ codebase ของตัวเอง
  ตอนนี้ยังดูพวกการจัดหมวดหมู่ issue, การแก้บั๊กอัตโนมัติ, การวิเคราะห์ log มากกว่างาน coding แบบโต้ตอบ และเอา DeepSeek, Kimi, GLM, Qwen, MiMO ไปเทียบกับ GPT-5.5 high โดยรันทั้งหมดผ่าน Pi harness แบบไม่ต้องติดตั้ง
  
  เท่าที่เห็นตอนนี้ Kimi กับ MiMO ดูมีแววที่สุด
  ยังไม่ได้ทดสอบเข้มงวดพอจะสรุปจริงจัง แต่ความรู้สึกแรกคือสำหรับงานทั่ว ๆ ไปในชีวิตประจำวัน โมเดลพวกนี้อาจไม่ได้ตามหลังอย่างที่คนคิด
  
  แต่ก็ดูจะเป็นแนว “ขยันทำงานมากกว่าทำงานอย่างฉลาด” คือไปถึงผลลัพธ์ใกล้เคียงกันได้แต่ช้ากว่าและใช้โทเคนมากกว่า ทว่าราคาถูกกว่ามาก
- ผมอยากให้ coding agent เป็นอิสระ จากผู้ให้บริการโมเดลพอสมควร
  เพราะผู้ให้บริการเปลี่ยนคุณภาพ ฟีเจอร์ และราคาบ่อยเกินไป จนไม่อยากต้องเปลี่ยน agent ตามทุกครั้ง
  
  หวังว่าสถานการณ์จะค่อย ๆ ช้าลงและนิ่งขึ้น
  ไม่ได้หมายความว่าต้องเป็นตอนนี้ทันที แต่คงดีถ้าไปถึงจุดนั้นได้
ถ้ายังไม่เคยลอง DeepSeek V4 แสดงว่าพลาดของดีไปมาก
มันดีจนน่าเหลือเชื่อเมื่อเทียบกับราคา

chain of thought ของ DeepSeek น่าอ่านมาก
OpenCode ไม่แสดงมัน แต่ถ้าได้อ่านเองอาจจะตกใจว่าโมเดลนี้ถูกประเมินต่ำไปแค่ไหน

ผมใช้โมเดลไม่เยอะ แต่ก็ยังจ่ายเงินให้ DeepSeek ตรง ๆ เป็นประจำ เพื่อขอบคุณที่เปิดซอร์สโมเดลและเพื่อแสดงการสนับสนุนต่อแนวทางที่ผมมองว่าเป็นประโยชน์ต่อสังคมโดยรวม
- มันดีและถูก แต่ถ้าคุย เรื่องการเมือง อาจไปชนกฎการเซ็นเซอร์อะไรบางอย่างได้
  ผมเคยเห็นมันกำลังโชว์กระบวนการคิดอยู่ดี ๆ แล้วลบทั้งหมดทิ้ง ก่อนจะเสนอให้เปลี่ยนไปคุยเรื่องอื่นโดยไม่อธิบายอะไร
  เคยมีครั้งหนึ่งที่มันพ่นข้อความแนวกว้าง ๆ ว่าสื่อมวลชนต้องรับใช้ประชาชนออกมาด้วย
  
  ทั้งสองกรณีไม่ได้เป็นคำขออ่อนไหว ไม่ผิดกฎหมาย และไม่ได้โค่นล้มระบอบอะไร เลยทำให้แปลกใจ
  แต่มันมีเนื้อหาทางการเมืองนิดหน่อย แค่นั้นก็พอแล้ว
  การเซ็นเซอร์แบบตะวันตกมักจะมาแบบแนบเนียนกว่านี้ เลยทั้งน่าขนลุกและแปลกใหม่ในเวลาเดียวกัน
- เห็นด้วย โมเดลดีจริง
  ที่บริษัทผมใช้ Claude ส่วนใช้ส่วนตัวผมใช้ DeepSeek และมันเป็นโมเดลเดียวที่ไม่ได้พยายาม ทำให้ผมล้มละลาย
- ผมชอบ V4 Pro สำหรับงานบางอย่าง แต่ถ้าเป็นงานเขียนโค้ด V4 Flash น่าประทับใจทีเดียว
  มันกระชับ จับประเด็นได้ดี ผิดพลาดน้อย และค่อนข้างเร็ว
- ใน opencode CLI มองเห็นร่องรอยการให้เหตุผลนะ
  อาจเป็นปัญหาการตั้งค่าก็ได้
- ใน opencode เปิดปิด การแสดงการให้เหตุผล ได้
ราคานี้ถูกจนน่าสงสัย
ถ้าโฮสต์โมเดลเดียวกันผ่านผู้ให้บริการรายอื่นจะแพงกว่านี้มาก 0
เพราะงั้นไม่ก็ DeepSeek โฮสต์ได้ถูกกว่าที่อื่นมาก หรือไม่ก็โมเดลธุรกิจต่างกัน ซึ่งผมเดาว่าเป็นอย่างหลัง
โดยเฉพาะเมื่อในนโยบายความเป็นส่วนตัว 1 ระบุว่าสามารถนำข้อมูลส่วนบุคคลรวมถึง “User Input” ไปใช้เพื่อ “ปรับปรุงและพัฒนาบริการ รวมถึงฝึกและปรับปรุงเทคโนโลยี” ได้
- อาจเป็นคำถามงี่เง่า แต่พอดูใน OpenRouter แล้วสงสัยว่าคนให้บริการ DeepSeek มีแค่ สหรัฐฯ สิงคโปร์ และจีน จริง ๆ เหรอ
  มันดูเป็นสินค้าที่ชัดเจนมากจนผู้ให้บริการในยุโรปหรือโลกตะวันตกอื่น ๆ ก็น่าจะเอามาขาย
  ผมมั่นใจว่ามันกระโดดไกลกว่า Mistral มาก
  
  ผมอยากลองใช้โมเดลพวกนี้ แต่ก็อยากเลี่ยงผู้ให้บริการที่เอาข้อมูลผมไปฝึกหรือเก็บไว้เกินกว่าข้อกำหนดทางกฎหมายมาตรฐาน
- มีหลายปัจจัยทำงานร่วมกัน
  ในแง่ ประสิทธิภาพของ inference stack ผู้ให้บริการหลายรายเอา sglang / vllm / trtllm ที่มีอยู่มาใช้แล้วหวังว่าจะได้ผลดีที่สุด แต่ทีม DeepSeek ขึ้นชื่อเรื่องการดันขีดจำกัดของการปรับแต่งให้สุด
  
  sglang กับ vllm เป็นซอฟต์แวร์ที่ยอดเยี่ยม แต่ถ้าดู sparse attention ของ DeepSeek (DSA) มันถูกนำมาใช้ตั้งแต่ 1.5 ปีก่อนแล้ว(https://arxiv.org/abs/2512.02556) และถูกใช้ใน DeepSeek 3.2, GLM 5, DeepSeek V4
  ตอนนี้เอนจิน inference หลัก ๆ เพิ่งเริ่มค่อย ๆ ใส่การปรับแต่งเข้ามา: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 เป็นต้น)
  แน่นอนว่า DS V4 ยังมีการปรับโครงสร้างโมเดลบน DSA เพิ่มอีก และต้องใช้เวลาอีกพักกว่าเอนจิน inference แบบโอเพนซอร์สจะใช้ประโยชน์จากมันได้เต็มที่
  
  ในแง่ความเป็นส่วนตัว ก็มีการเดิมพันว่าคนยอมจ่ายเพิ่มเพื่อรัน inference ที่โฮสต์อยู่นอกจีน
  ยิ่ง DeepSeek ประกาศอย่างโปร่งใสว่าใช้ข้อมูล API เพื่อปรับปรุงโมเดล ก็ยิ่งเป็นแบบนั้น
  
  นอกจากนี้ยังมีปัจจัยอย่างขนาดระบบ (สำคัญมากใน MoE), ความน่าเชื่อถือ, และการผูกมัดลูกค้าองค์กรแบบนุ่มนวล
  
  อีกอย่างก็มีความเป็นไปได้สูงว่าจะมีการฮั้วราคาโดยปริยาย
  ถ้าดูราคา GLM 5 กับ GLM 5.1 ต้นทุนรันจริงเท่ากัน แต่ 5.1 เป็นโมเดลที่ดีกว่ามาก และ Z.AI ก็ขึ้นราคา ทำให้ผู้ให้บริการตั้งราคา 5.1 แพงกว่า
- เห็นชัดเลยว่าพวกเขา ขายขาดทุน
  แต่แล้วจะเป็นไรล่ะ
  การยอมขาดทุนเพื่อแย่งส่วนแบ่งตลาดไม่ใช่สิทธิบัตรเฉพาะของอเมริกา
- คุณอาจยังรู้ไม่พอเกี่ยวกับผู้ก่อตั้ง DeepSeek อย่าง Liang Wenfeng
  เขายังเป็นผู้ก่อตั้ง High-Flyer Quant ด้วย
ผมสนใจเรื่องแคชมากกว่า
เขาบอกว่า “ราคาสำหรับ input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับราคานี้มีผลตั้งแต่ 2026/4/26 12:15 UTC”

ไม่มีวันสิ้นสุดกำกับไว้
ตอนนี้ DeepSeek V4 Flash อยู่ที่ 2% ของราคา input และสำหรับราคา V4 Pro รอบนี้อยู่ที่ 0.8% ซึ่งต่ำจนน่าตกใจเมื่อเทียบกับคู่แข่ง และกระทบต่อ unit economics ด้วย เลยคิดว่าเดิมทีน่าจะเป็นโปรโมชันชั่วคราว

สำหรับ V4 Pro ถ้าคิดเรื่อง caching ด้วย ต้นทุนจริงอยู่ที่ประมาณ $0.04 ต่อ 1 ล้าน input tokens (อ้างอิงตัวเลขจาก OpenRouter: https://openrouter.ai/deepseek/deepseek-v4-pro)
ถูกกว่าแม้แต่โมเดลเล็กของคู่แข่งหลายเจ้าอีก
- KV cache ของ DeepSeek V4 มีประสิทธิภาพมากเพราะโครงสร้าง sparse attention ที่บีบอัดอย่างหนัก
  DeepSeek V3.2 ที่ใช้แค่ DSA เป็นโมเดลเล็กกว่า แต่กลับใช้หน่วยความจำมากกว่า DS V4 Pro ถึง 10 เท่าใน context window ขนาด 1 ล้าน
  
  อีกอย่าง DeepSeek API มีอัตรา cache hit ที่ดีมาก
  สำหรับ workload เดียวกัน ผู้ให้บริการ inference ฝั่งตะวันตกหลัก ๆ ที่ให้โมเดล open weights มักมี KV cache hit ราว 50% แต่ DS API ได้ประมาณ 80%
- จุดใหญ่ของ DeepSeek V4 คือ ขนาด KV cache ลดลงอย่างมาก
- ตัว Flash เองไม่ได้เป็นโมเดลที่แข่งขันได้สุด ๆ และราคาก็อยู่ในช่วงใกล้กับโมเดลอื่นในตลาด
  คู่แข่งตรงที่สุดของ Flash น่าจะประมาณนี้
  
  GPT 5.4 mini
  
  Cache Read
  $0.075
  /M tokens
  
  Gemini 3 flash:
  
  Cache Read
  $0.05
  /M tokens
  
  ดังนั้นมันไม่ได้มีอะไรพิเศษระดับเวทมนตร์หรือพลิกวงการขนาดนั้น
- Sonnet:
  Cache Read
  $0.30
  
  Gemini 3.5 flash:
  Cache Read
  $0.15
คุ้มราคามาก
ผมใช้ GLM 5.1 กับ GLM Coding Plan Max มาพักหนึ่งแล้ว และก็ทดสอบ DeepSeek V4 Pro มาราว 3 สัปดาห์ สำหรับงานโค้ดซับซ้อนผมว่ามันดีกว่า GLM 5.1
ผมใช้ไป 65 ล้านโทเคน ค่าใช้จ่ายออกมา 1.5 ดอลลาร์ในราคานี้ ถูกมากจริง ๆ
- ดูเหมือน DeepSeek จะ ใช้โทเคนมากกว่า โมเดลอื่นพอสมควร
สุดยอด
แบบนี้ DeepSeek V4 Pro ก็ถูกแบบสุดโต่งเมื่อเทียบกับโมเดลอื่นในกลุ่มเดียวกัน
ถ้าดูราคาต่อ 1 ล้าน output tokens จะเป็นแบบนี้

DeepSeek V4 Pro: $0.87

Qwen 3.7 Max: $7.50

Grok 4.3: $2.50

GLM 1.5: $3.08

Opus 4.7: $25.00

GPT-5.5: $30.00
- ถ้ารวมต้นทุน cache read ด้วย ของจริงจะยิ่งถูกกว่าอีก
  ใน workflow แบบ agent ค่าใช้จ่ายตรงนี้อาจเป็นตัวหลักเลยก็ได้ และค่า cache read ของ DeepSeek ต่ำจนเทียบกันแทบไม่ได้
  มันอยู่ที่ $0.003626 ต่อ 1 ล้านโทเคน ขณะที่ตัวที่ถูกที่สุดลำดับถัดไปในลิสต์ยังเกิน $0.2 ต่อ 1 ล้านโทเคน
  ต่างกันเกือบ 100 เท่า
- คราวหน้าถ้ามีใครบอกว่า “อย่ามาบ่นเรื่องลิมิตการใช้งานเลย บริษัทขาดทุนจากค่าสมัครของคุณอยู่แล้ว” ผมจะส่งลิงก์คอมเมนต์นี้ให้
  เพราะมันแปลว่าเราทำ inference อย่างมีประสิทธิภาพ ได้ ถ้าไม่ใช่แค่ปล่อยให้เผาเงินแบบไร้ข้อจำกัด
- และไม่ได้ ทำให้โมเดลแย่ลงหลังจากคุณสมัคร
  ถ้าผ่านไป 2 เดือนแล้วไปลด Opus ให้ห่วยกว่า GPT-3 เพื่อประหยัดต้นทุน ต่อให้ Opus เคยดีแค่ไหนก็ไม่มีความหมาย
- คือ GLM 5.1
ต่อให้คิดส่วนลดของ V4 Pro แล้ว V4 Flash ก็ยังให้ประสิทธิภาพต่อดอลลาร์ดีที่สุด และสำหรับงานสาย agent หรือใช้เครื่องมือเยอะ ๆ ประสิทธิภาพรวมก็ยังดีกว่า
V4 Pro ฉลาดกว่าสำหรับการคิดครั้งเดียวจบ แต่ช้ากว่ามาก
ถ้ารวมประสิทธิภาพ ต้นทุน และความเร็ว V4 Flash คือ flash model ที่ดีที่สุดของเราตอนนี้แบบทิ้งห่าง

ข้อมูลอยู่ที่ https://gertlabs.com/rankings
- สำหรับ use case ของผม ซึ่งส่วนใหญ่เป็น งานสรุปขนาดใหญ่มากและดึงไอเดียออกมา มันสู้ Pro ไม่ค่อยได้
สถาปัตยกรรม MLA ของพวกเขาช่วยลด KV cache ลงได้ประมาณ 5–13 เท่าเมื่อเทียบกับ attention มาตรฐาน
เพราะงั้นมันไม่ใช่แค่สงครามราคาที่ตั้งใจเอาส่วนแบ่งตลาด แต่ต้นทุนการรัน inference จริง ๆ ก็ต่ำกว่าด้วย
- เป็น game changer สำหรับ local inference ด้วย
  ทำให้แพลตฟอร์มคอนซูเมอร์ทั่วไปสามารถมี long context, batch inference และบันทึก KV cache ลงดิสก์ได้
- ใช่เลย
  ส่วนลดรอบนี้อาจเป็นการทดลองตลาดหลังเปิดตัว เพื่อดูว่า caching ทำงานได้มีประสิทธิภาพแค่ไหนในโมเดลเจเนอเรชันใหม่
ผมห่วง การรั่วไหลของข้อมูลโดยไม่ตั้งใจ กับโมเดลที่โฮสต์ในจีนมากกว่าโมเดลที่โฮสต์ในอเมริกา
เช่นกรณีที่ agent ไปอ่านไฟล์ env อะไรแบบนั้น
ผมผิดไหมถ้าจะสงสัยว่ารัฐบาลจีนมีแนวโน้มจะสแกนทุกบทสนทนาและเก็บข้อมูลที่เป็นประโยชน์ไว้ มากกว่ารัฐบาลหรือบริษัทอเมริกัน?

ผมยังลังเลเลยว่าจะเขียนคอมเมนต์นี้ดีไหม เพราะมันอาจฟังดูมีอคติหรือเหมือนเกลียดชาวต่างชาติ
ถ้ามีใครช่วยอธิบายให้ผมเห็นว่าผมคิดผิดก็จะดี
มีใครรู้ไหมว่าบริษัทที่อยู่เบื้องหลังการโฮสต์ DeepSeek เป็นแบบไหน หรือมีประวัติในการเคารพความเป็นส่วนตัวของข้อมูลหรือเปล่า?
- มันไม่ใช่ความกังวลที่ไร้เหตุผล
  นั่นแหละว่าทำไมบริษัทอเมริกันส่วนใหญ่ถึงเลือก AWS Bedrock หรือแล็บ AI ต่าง ๆ และมักขอสัญญาแบบไม่เก็บข้อมูลไว้ด้วย
  แต่ไม่ว่าจะโฮสต์ที่ไหนก็มีความเสี่ยงข้อมูลรั่วอยู่ดี ต่างกันแค่โครงสร้างแรงจูงใจ
  
  เช่นแล็บต่าง ๆ ก็สแกนทุกบทสนทนาเหมือนกัน และใช้ข้อมูลที่ไม่ได้อยู่ภายใต้สัญญา ZDR สำหรับองค์กรไปฝึกโมเดล
  หน่วยงานบังคับใช้กฎหมายก็สามารถขอเข้าถึงข้อมูลผู้ใช้ทั้งหมดได้หากมีหมายที่ถูกต้องหรือในกรณีฉุกเฉิน 1
  
  ถ้าคุณอยากใช้ DeepSeek V4 แบบเป็นส่วนตัว ลองดู Tinfoil(tinfoil.sh) ได้
  มันโฮสต์ทุกโมเดลใน secure hardware enclave ที่ตรวจสอบได้ ทำให้ inference เป็นความลับแบบ end-to-end
  ขอบอกไว้ก่อนว่าผมเป็นหนึ่งในผู้ร่วมก่อตั้ง
  
  1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...
- ใช้ผ่าน Azure ก็ได้
  เขาโฮสต์โมเดลเต็มตัวและให้บริการจากสหรัฐฯ
  น่าจะมีผู้ให้บริการแบบนี้อีกหลายเจ้า
  
  บริษัทเราใช้อยู่แบบนั้น และใช้งานได้ดีมาก
- ต่อให้พวกเขาทำจริง ผมก็คงไม่แปลกใจ
  ถ้าโมเดลที่ตั้งสำนักงานใหญ่ในอเมริกาทำแบบเดียวกันให้รัฐบาลอื่น ผมก็คงไม่แปลกใจมากเหมือนกัน
  ผมไม่ได้คาดหวังเรื่องความลับของข้อมูลไว้สูงนัก
  Microsoft ทำเช็กลิสต์ฝั่งองค์กรได้ครบถ้วน แต่ Azure เองก็ยังโดนเจาะอยู่เป็นพัก ๆ
- ผมคิดว่า ความเป็นไปได้ไม่ใช่ศูนย์
  ปักกิ่งอาจตัดสินใจเมื่อไรก็ได้ว่า DeepSeek ทรงอิทธิพลเกินไปหรือกลายเป็นสินค้าส่งออกสำคัญ แล้วเข้ามาแทรกแซง
  และก็ไม่มีหลักประกันด้วยว่ายังไม่เคยเกิดขึ้นแล้ว
  
  มีรายงานมากมายว่าฝ่ายต่างชาติที่ไม่ได้จำกัดแค่จีนได้เจาะเครือข่ายสำคัญของหลายอุตสาหกรรมในอเมริกาอย่างกว้างขวาง และกำลังรอจังหวะเหมาะเพื่อใช้ประโยชน์
  โมเดลล้ำสมัยก็เป็นอีกหนึ่งช่องทางโจมตี และถ้าคิดดูแล้วก็อาจถูกใช้ในทางที่ผิดได้ง่ายกว่ามาก
  
  เอาจริง ๆ ถ้าเป็นโมเดลที่โฮสต์บนคลาวด์ ที่ไหนก็มีความเป็นไปได้นี้ทั้งนั้น
  ไม่ว่าจะเป็นความตั้งใจของบริษัทผู้สร้างโมเดลเอง หรือผู้ไม่หวังดีใช้ช่องโหว่ก็ตาม
- ผมไม่ได้สำคัญขนาดที่ใครในจีนต้องตั้งใจมาเล่นงานผม
  แล้ว DeepSeek เองก็ต้องรักษาความน่าเชื่อถือไว้พอที่ผู้ใช้จะยังอยู่บนแพลตฟอร์มต่อ
  ถ้ามันทำตัวเหมือน keylogger ที่ไปขโมยกระเป๋าคริปโตของทุกคน ความเชื่อใจก็พังหมด
  
  ถ้าผมทำงานที่รัฐบาลจีนมองว่ามีความสำคัญเชิงยุทธศาสตร์ แน่นอนว่าผมคงกังวล แต่ผมไม่ได้ทำอะไรแบบนั้น
  
  ที่ผมห่วงมากกว่าคือเหล่ามหาเศรษฐีสายเทคในประเทศนี้จะใช้ LLM มาทำโปรไฟล์ผมในวงกว้าง แล้วสร้างอะไรที่ดิสโทเปียยิ่งกว่าระบบคะแนนเครดิตสังคมของจีน ไม่ว่าจะมีอยู่จริงหรือเป็นแค่ภาพในจินตนาการก็ตาม
  คนที่พยายามโน้มน้าวให้คุณซึ่งเป็นบุคคลทั่วไปในอเมริกาต้องกลัวรัฐบาลจีน อาจจะเป็นคนที่คุณควรกลัวจริง ๆ มากกว่า
ถ้าใครอยากเอาไปต่อกับ copilot ผมเคยทำ สคริปต์พร็อกซี ไว้จัดการการเชื่อมต่อ อาจมีประโยชน์: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...

DeepSeek ทำให้ส่วนลดราคา V4 Pro กลายเป็นราคาถาวร

เกณฑ์การคิดค่าบริการ

โมเดลและราคา

โมเดลที่รองรับ

เอนด์พอยต์และฟีเจอร์

คอนเท็กซ์และขีดจำกัดเอาต์พุต

ราคาต่อ 1 ล้านโทเค็น

การปรับส่วนลดของ DeepSeek-V4-Pro

การลดราคา cache hit

ข้อจำกัด concurrency

บทความที่เกี่ยวข้อง

3 ความคิดเห็น

ความคิดเห็นจาก Hacker News