DeepSeek ทำให้ส่วนลดราคา V4 Pro กลายเป็นราคาถาวร
(api-docs.deepseek.com)- ราคา API ของ DeepSeek-V4-Pro จะคงอยู่ที่ระดับ 1/4 ของราคาเดิมอย่างเป็นทางการ แม้หลังจากโปรโมชันลดราคา 75% สิ้นสุดลง
- การคิดค่าบริการอิงตามราคาต่อ 1 ล้านโทเค็น และหักจากยอดคงเหลือโดยตรงตามปริมาณการใช้ โทเค็นขาเข้าและโทเค็นขาออก
- โมเดลที่รองรับคือ DeepSeek-V4-Flash และ DeepSeek-V4-Pro โดยทั้งสองรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ และค่าเริ่มต้นคือโหมดคิดวิเคราะห์
- ทั้งสองโมเดลมี ความยาวคอนเท็กซ์ 1M, เอาต์พุตสูงสุด 384K และมีข้อจำกัดด้าน concurrency ต่างกันคือ Flash 2500, Pro 500
- ราคา input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับนี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC
เกณฑ์การคิดค่าบริการ
- หน่วยราคา คือค่าบริการต่อ 1 ล้านโทเค็น โดยโทเค็นคือหน่วยข้อความที่เล็กที่สุดที่โมเดลรับรู้ได้ ซึ่งอาจเป็นคำ ตัวเลข หรือเครื่องหมายวรรคตอน
- เกณฑ์การเรียกเก็บเงิน คือปริมาณรวมของโทเค็นขาเข้าและโทเค็นขาออกของโมเดล
- ค่าใช้จ่ายคำนวณจาก
จำนวนโทเค็น × ราคาและหักโดยตรงจากยอดเติมเงินหรือยอดเครดิตที่ได้รับ - หากมีทั้งยอดเติมเงินและยอดเครดิตที่ได้รับ ระบบจะใช้ ยอดเครดิตที่ได้รับ ก่อน
- ราคาผลิตภัณฑ์อาจมีการเปลี่ยนแปลง และ DeepSeek สงวนสิทธิ์ในการปรับราคา
- แนะนำให้เติมเงินตามการใช้งานจริง และตรวจสอบราคาล่าสุดจากหน้านี้เป็นระยะ
โมเดลและราคา
-
โมเดลที่รองรับ
- มี DeepSeek-V4-Flash และ DeepSeek-V4-Pro
- ทั้งสองโมเดลรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ โดยค่าเริ่มต้นคือโหมดคิดวิเคราะห์
- ชื่อโมเดล
deepseek-chatและdeepseek-reasonerจะถูกยกเลิกในอนาคต - เพื่อความเข้ากันได้
deepseek-chatจะตรงกับโหมดไม่คิดวิเคราะห์ของdeepseek-v4-flashและdeepseek-reasonerจะตรงกับโหมดคิดวิเคราะห์ของdeepseek-v4-flash
-
เอนด์พอยต์และฟีเจอร์
- Base URL รูปแบบ Anthropic คือ https://api.deepseek.com/anthropic
- วิธีสลับโหมดคิดวิเคราะห์ดูได้ที่ Thinking Mode
- เอกสารฟีเจอร์ที่เกี่ยวข้องมี Json Output, Tool Calls, Chat Prefix Completion(Beta), FIM Completion(Beta)
-
คอนเท็กซ์และขีดจำกัดเอาต์พุต
- ความยาวคอนเท็กซ์ คือ 1M
- เอาต์พุตสูงสุด คือ 384K
ราคาต่อ 1 ล้านโทเค็น
| รายการ | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
|---|---|---|
| โทเค็นขาเข้า, cache hit | $0.0028 | $0.003625 |
| โทเค็นขาเข้า, cache miss | $0.14 | $0.435 |
| โทเค็นขาออก | $0.28 | $0.87 |
| ข้อจำกัด concurrency | 2500 | 500 |
-
การปรับส่วนลดของ DeepSeek-V4-Pro
- ราคา DeepSeek-V4-Pro แสดงเป็นราคาหลังส่วนลด 75%
- ราคาโทเค็นขาเข้าแบบ cache hit ลดลงจากเดิม $0.0145 เหลือ $0.003625
- ราคาโทเค็นขาเข้าแบบ cache miss ลดลงจากเดิม $1.74 เหลือ $0.435
- ราคาโทเค็นขาออกลดลงจากเดิม $3.48 เหลือ $0.87
- หลังโปรโมชันลดราคา 75% สิ้นสุดในวันที่ 31 พฤษภาคม 2026 เวลา 15:59 UTC ราคา API ของ DeepSeek-V4-Pro จะถูกปรับอย่างเป็นทางการให้เหลือ 1/4 ของราคาเดิมต่อไป
-
การลดราคา cache hit
- ราคา input cache hit ของทุกโมเดลถูกลดลงเหลือ 1/10 ของราคาเปิดตัว
- การปรับราคานี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC
-
ข้อจำกัด concurrency
- ข้อจำกัด concurrency ของ DeepSeek-V4-Flash คือ 2500
- ข้อจำกัด concurrency ของ DeepSeek-V4-Pro คือ 500
- รายละเอียดเพิ่มเติมเกี่ยวกับข้อจำกัด concurrency ดูได้ที่ Rate Limit & Isolation
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ถ้าออก coding agent ของตัวเองมา ผมก็อาจจะเริ่มใช้โมเดล DeepSeek เป็นตัวหลัก
ดูเหมือนพวกเขาจะยังคงทำสิ่งที่ “มาถูกทาง” ต่อไป ทั้งการเปิดซอร์สโมเดล เผยแพร่งานวิจัย และคงราคาต่ำไว้
ใช้ V4 Pro กับ Claude Code ได้ 1
ผมลองใช้เองแล้ว ประทับใจมาก
ใช้กับ OpenCode ก็เข้ากันได้ดีมาก
ทีมเรามักชน ลิมิต 5 ชั่วโมง ของบริการสมัครสมาชิกอื่นบ่อย ๆ แต่พอมี DeepSeek เป็นตัวสำรองแล้วถือว่าดีมาก
เติมเงินไว้แค่ 50 ดอลลาร์ แต่รู้สึกเหมือนจะไม่มีวันหมด
มันยังไม่ถึงขั้นแทนที่โมเดลระดับแนวหน้าได้ทั้งหมด แต่ถ้าเป็นตัวสำรองนี่ถือว่ายอดเยี่ยมแน่นอน
ไม่แน่ใจว่า DeepSeek จำเป็นต้องทำ coding agent เองด้วยหรือเปล่า
เอาโมเดลไปต่อกับ coding agent ที่มีอยู่แล้วตัวไหนก็ได้
ส่วนตัวผมชอบ Pi แต่ใครถนัดอันไหนก็ใช้อันนั้นได้
ต้นสัปดาห์นี้ผมเริ่มทดสอบ โมเดลจีน กับ codebase ของตัวเอง
ตอนนี้ยังดูพวกการจัดหมวดหมู่ issue, การแก้บั๊กอัตโนมัติ, การวิเคราะห์ log มากกว่างาน coding แบบโต้ตอบ และเอา DeepSeek, Kimi, GLM, Qwen, MiMO ไปเทียบกับ GPT-5.5 high โดยรันทั้งหมดผ่าน Pi harness แบบไม่ต้องติดตั้ง
เท่าที่เห็นตอนนี้ Kimi กับ MiMO ดูมีแววที่สุด
ยังไม่ได้ทดสอบเข้มงวดพอจะสรุปจริงจัง แต่ความรู้สึกแรกคือสำหรับงานทั่ว ๆ ไปในชีวิตประจำวัน โมเดลพวกนี้อาจไม่ได้ตามหลังอย่างที่คนคิด
แต่ก็ดูจะเป็นแนว “ขยันทำงานมากกว่าทำงานอย่างฉลาด” คือไปถึงผลลัพธ์ใกล้เคียงกันได้แต่ช้ากว่าและใช้โทเคนมากกว่า ทว่าราคาถูกกว่ามาก
ผมอยากให้ coding agent เป็นอิสระ จากผู้ให้บริการโมเดลพอสมควร
เพราะผู้ให้บริการเปลี่ยนคุณภาพ ฟีเจอร์ และราคาบ่อยเกินไป จนไม่อยากต้องเปลี่ยน agent ตามทุกครั้ง
หวังว่าสถานการณ์จะค่อย ๆ ช้าลงและนิ่งขึ้น
ไม่ได้หมายความว่าต้องเป็นตอนนี้ทันที แต่คงดีถ้าไปถึงจุดนั้นได้
ถ้ายังไม่เคยลอง DeepSeek V4 แสดงว่าพลาดของดีไปมาก
มันดีจนน่าเหลือเชื่อเมื่อเทียบกับราคา
chain of thought ของ DeepSeek น่าอ่านมาก
OpenCode ไม่แสดงมัน แต่ถ้าได้อ่านเองอาจจะตกใจว่าโมเดลนี้ถูกประเมินต่ำไปแค่ไหน
ผมใช้โมเดลไม่เยอะ แต่ก็ยังจ่ายเงินให้ DeepSeek ตรง ๆ เป็นประจำ เพื่อขอบคุณที่เปิดซอร์สโมเดลและเพื่อแสดงการสนับสนุนต่อแนวทางที่ผมมองว่าเป็นประโยชน์ต่อสังคมโดยรวม
มันดีและถูก แต่ถ้าคุย เรื่องการเมือง อาจไปชนกฎการเซ็นเซอร์อะไรบางอย่างได้
ผมเคยเห็นมันกำลังโชว์กระบวนการคิดอยู่ดี ๆ แล้วลบทั้งหมดทิ้ง ก่อนจะเสนอให้เปลี่ยนไปคุยเรื่องอื่นโดยไม่อธิบายอะไร
เคยมีครั้งหนึ่งที่มันพ่นข้อความแนวกว้าง ๆ ว่าสื่อมวลชนต้องรับใช้ประชาชนออกมาด้วย
ทั้งสองกรณีไม่ได้เป็นคำขออ่อนไหว ไม่ผิดกฎหมาย และไม่ได้โค่นล้มระบอบอะไร เลยทำให้แปลกใจ
แต่มันมีเนื้อหาทางการเมืองนิดหน่อย แค่นั้นก็พอแล้ว
การเซ็นเซอร์แบบตะวันตกมักจะมาแบบแนบเนียนกว่านี้ เลยทั้งน่าขนลุกและแปลกใหม่ในเวลาเดียวกัน
เห็นด้วย โมเดลดีจริง
ที่บริษัทผมใช้ Claude ส่วนใช้ส่วนตัวผมใช้ DeepSeek และมันเป็นโมเดลเดียวที่ไม่ได้พยายาม ทำให้ผมล้มละลาย
ผมชอบ V4 Pro สำหรับงานบางอย่าง แต่ถ้าเป็นงานเขียนโค้ด V4 Flash น่าประทับใจทีเดียว
มันกระชับ จับประเด็นได้ดี ผิดพลาดน้อย และค่อนข้างเร็ว
ใน opencode CLI มองเห็นร่องรอยการให้เหตุผลนะ
อาจเป็นปัญหาการตั้งค่าก็ได้
ใน opencode เปิดปิด การแสดงการให้เหตุผล ได้
ราคานี้ถูกจนน่าสงสัย
ถ้าโฮสต์โมเดลเดียวกันผ่านผู้ให้บริการรายอื่นจะแพงกว่านี้มาก 0
เพราะงั้นไม่ก็ DeepSeek โฮสต์ได้ถูกกว่าที่อื่นมาก หรือไม่ก็โมเดลธุรกิจต่างกัน ซึ่งผมเดาว่าเป็นอย่างหลัง
โดยเฉพาะเมื่อในนโยบายความเป็นส่วนตัว 1 ระบุว่าสามารถนำข้อมูลส่วนบุคคลรวมถึง “User Input” ไปใช้เพื่อ “ปรับปรุงและพัฒนาบริการ รวมถึงฝึกและปรับปรุงเทคโนโลยี” ได้
อาจเป็นคำถามงี่เง่า แต่พอดูใน OpenRouter แล้วสงสัยว่าคนให้บริการ DeepSeek มีแค่ สหรัฐฯ สิงคโปร์ และจีน จริง ๆ เหรอ
มันดูเป็นสินค้าที่ชัดเจนมากจนผู้ให้บริการในยุโรปหรือโลกตะวันตกอื่น ๆ ก็น่าจะเอามาขาย
ผมมั่นใจว่ามันกระโดดไกลกว่า Mistral มาก
ผมอยากลองใช้โมเดลพวกนี้ แต่ก็อยากเลี่ยงผู้ให้บริการที่เอาข้อมูลผมไปฝึกหรือเก็บไว้เกินกว่าข้อกำหนดทางกฎหมายมาตรฐาน
มีหลายปัจจัยทำงานร่วมกัน
ในแง่ ประสิทธิภาพของ inference stack ผู้ให้บริการหลายรายเอา sglang / vllm / trtllm ที่มีอยู่มาใช้แล้วหวังว่าจะได้ผลดีที่สุด แต่ทีม DeepSeek ขึ้นชื่อเรื่องการดันขีดจำกัดของการปรับแต่งให้สุด
sglang กับ vllm เป็นซอฟต์แวร์ที่ยอดเยี่ยม แต่ถ้าดู sparse attention ของ DeepSeek (DSA) มันถูกนำมาใช้ตั้งแต่ 1.5 ปีก่อนแล้ว(https://arxiv.org/abs/2512.02556) และถูกใช้ใน DeepSeek 3.2, GLM 5, DeepSeek V4
ตอนนี้เอนจิน inference หลัก ๆ เพิ่งเริ่มค่อย ๆ ใส่การปรับแต่งเข้ามา: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 เป็นต้น)
แน่นอนว่า DS V4 ยังมีการปรับโครงสร้างโมเดลบน DSA เพิ่มอีก และต้องใช้เวลาอีกพักกว่าเอนจิน inference แบบโอเพนซอร์สจะใช้ประโยชน์จากมันได้เต็มที่
ในแง่ความเป็นส่วนตัว ก็มีการเดิมพันว่าคนยอมจ่ายเพิ่มเพื่อรัน inference ที่โฮสต์อยู่นอกจีน
ยิ่ง DeepSeek ประกาศอย่างโปร่งใสว่าใช้ข้อมูล API เพื่อปรับปรุงโมเดล ก็ยิ่งเป็นแบบนั้น
นอกจากนี้ยังมีปัจจัยอย่างขนาดระบบ (สำคัญมากใน MoE), ความน่าเชื่อถือ, และการผูกมัดลูกค้าองค์กรแบบนุ่มนวล
อีกอย่างก็มีความเป็นไปได้สูงว่าจะมีการฮั้วราคาโดยปริยาย
ถ้าดูราคา GLM 5 กับ GLM 5.1 ต้นทุนรันจริงเท่ากัน แต่ 5.1 เป็นโมเดลที่ดีกว่ามาก และ Z.AI ก็ขึ้นราคา ทำให้ผู้ให้บริการตั้งราคา 5.1 แพงกว่า
เห็นชัดเลยว่าพวกเขา ขายขาดทุน
แต่แล้วจะเป็นไรล่ะ
การยอมขาดทุนเพื่อแย่งส่วนแบ่งตลาดไม่ใช่สิทธิบัตรเฉพาะของอเมริกา
คุณอาจยังรู้ไม่พอเกี่ยวกับผู้ก่อตั้ง DeepSeek อย่าง Liang Wenfeng
เขายังเป็นผู้ก่อตั้ง High-Flyer Quant ด้วย
ผมสนใจเรื่องแคชมากกว่า
เขาบอกว่า “ราคาสำหรับ input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับราคานี้มีผลตั้งแต่ 2026/4/26 12:15 UTC”
ไม่มีวันสิ้นสุดกำกับไว้
ตอนนี้ DeepSeek V4 Flash อยู่ที่ 2% ของราคา input และสำหรับราคา V4 Pro รอบนี้อยู่ที่ 0.8% ซึ่งต่ำจนน่าตกใจเมื่อเทียบกับคู่แข่ง และกระทบต่อ unit economics ด้วย เลยคิดว่าเดิมทีน่าจะเป็นโปรโมชันชั่วคราว
สำหรับ V4 Pro ถ้าคิดเรื่อง caching ด้วย ต้นทุนจริงอยู่ที่ประมาณ $0.04 ต่อ 1 ล้าน input tokens (อ้างอิงตัวเลขจาก OpenRouter: https://openrouter.ai/deepseek/deepseek-v4-pro)
ถูกกว่าแม้แต่โมเดลเล็กของคู่แข่งหลายเจ้าอีก
KV cache ของ DeepSeek V4 มีประสิทธิภาพมากเพราะโครงสร้าง sparse attention ที่บีบอัดอย่างหนัก
DeepSeek V3.2 ที่ใช้แค่ DSA เป็นโมเดลเล็กกว่า แต่กลับใช้หน่วยความจำมากกว่า DS V4 Pro ถึง 10 เท่าใน context window ขนาด 1 ล้าน
อีกอย่าง DeepSeek API มีอัตรา cache hit ที่ดีมาก
สำหรับ workload เดียวกัน ผู้ให้บริการ inference ฝั่งตะวันตกหลัก ๆ ที่ให้โมเดล open weights มักมี KV cache hit ราว 50% แต่ DS API ได้ประมาณ 80%
จุดใหญ่ของ DeepSeek V4 คือ ขนาด KV cache ลดลงอย่างมาก
ตัว Flash เองไม่ได้เป็นโมเดลที่แข่งขันได้สุด ๆ และราคาก็อยู่ในช่วงใกล้กับโมเดลอื่นในตลาด
คู่แข่งตรงที่สุดของ Flash น่าจะประมาณนี้
GPT 5.4 mini
Cache Read
$0.075
/M tokens
Gemini 3 flash:
Cache Read
$0.05
/M tokens
ดังนั้นมันไม่ได้มีอะไรพิเศษระดับเวทมนตร์หรือพลิกวงการขนาดนั้น
Sonnet:
Cache Read
$0.30
Gemini 3.5 flash:
Cache Read
$0.15
คุ้มราคามาก
ผมใช้ GLM 5.1 กับ GLM Coding Plan Max มาพักหนึ่งแล้ว และก็ทดสอบ DeepSeek V4 Pro มาราว 3 สัปดาห์ สำหรับงานโค้ดซับซ้อนผมว่ามันดีกว่า GLM 5.1
ผมใช้ไป 65 ล้านโทเคน ค่าใช้จ่ายออกมา 1.5 ดอลลาร์ในราคานี้ ถูกมากจริง ๆ
สุดยอด
แบบนี้ DeepSeek V4 Pro ก็ถูกแบบสุดโต่งเมื่อเทียบกับโมเดลอื่นในกลุ่มเดียวกัน
ถ้าดูราคาต่อ 1 ล้าน output tokens จะเป็นแบบนี้
DeepSeek V4 Pro: $0.87
Qwen 3.7 Max: $7.50
Grok 4.3: $2.50
GLM 1.5: $3.08
Opus 4.7: $25.00
GPT-5.5: $30.00
ใน workflow แบบ agent ค่าใช้จ่ายตรงนี้อาจเป็นตัวหลักเลยก็ได้ และค่า cache read ของ DeepSeek ต่ำจนเทียบกันแทบไม่ได้
มันอยู่ที่ $0.003626 ต่อ 1 ล้านโทเคน ขณะที่ตัวที่ถูกที่สุดลำดับถัดไปในลิสต์ยังเกิน $0.2 ต่อ 1 ล้านโทเคน
ต่างกันเกือบ 100 เท่า
เพราะมันแปลว่าเราทำ inference อย่างมีประสิทธิภาพ ได้ ถ้าไม่ใช่แค่ปล่อยให้เผาเงินแบบไร้ข้อจำกัด
ถ้าผ่านไป 2 เดือนแล้วไปลด Opus ให้ห่วยกว่า GPT-3 เพื่อประหยัดต้นทุน ต่อให้ Opus เคยดีแค่ไหนก็ไม่มีความหมาย
ต่อให้คิดส่วนลดของ V4 Pro แล้ว V4 Flash ก็ยังให้ประสิทธิภาพต่อดอลลาร์ดีที่สุด และสำหรับงานสาย agent หรือใช้เครื่องมือเยอะ ๆ ประสิทธิภาพรวมก็ยังดีกว่า
V4 Pro ฉลาดกว่าสำหรับการคิดครั้งเดียวจบ แต่ช้ากว่ามาก
ถ้ารวมประสิทธิภาพ ต้นทุน และความเร็ว V4 Flash คือ flash model ที่ดีที่สุดของเราตอนนี้แบบทิ้งห่าง
ข้อมูลอยู่ที่ https://gertlabs.com/rankings
สถาปัตยกรรม MLA ของพวกเขาช่วยลด KV cache ลงได้ประมาณ 5–13 เท่าเมื่อเทียบกับ attention มาตรฐาน
เพราะงั้นมันไม่ใช่แค่สงครามราคาที่ตั้งใจเอาส่วนแบ่งตลาด แต่ต้นทุนการรัน inference จริง ๆ ก็ต่ำกว่าด้วย
ทำให้แพลตฟอร์มคอนซูเมอร์ทั่วไปสามารถมี long context, batch inference และบันทึก KV cache ลงดิสก์ได้
ส่วนลดรอบนี้อาจเป็นการทดลองตลาดหลังเปิดตัว เพื่อดูว่า caching ทำงานได้มีประสิทธิภาพแค่ไหนในโมเดลเจเนอเรชันใหม่
ผมห่วง การรั่วไหลของข้อมูลโดยไม่ตั้งใจ กับโมเดลที่โฮสต์ในจีนมากกว่าโมเดลที่โฮสต์ในอเมริกา
เช่นกรณีที่ agent ไปอ่านไฟล์ env อะไรแบบนั้น
ผมผิดไหมถ้าจะสงสัยว่ารัฐบาลจีนมีแนวโน้มจะสแกนทุกบทสนทนาและเก็บข้อมูลที่เป็นประโยชน์ไว้ มากกว่ารัฐบาลหรือบริษัทอเมริกัน?
ผมยังลังเลเลยว่าจะเขียนคอมเมนต์นี้ดีไหม เพราะมันอาจฟังดูมีอคติหรือเหมือนเกลียดชาวต่างชาติ
ถ้ามีใครช่วยอธิบายให้ผมเห็นว่าผมคิดผิดก็จะดี
มีใครรู้ไหมว่าบริษัทที่อยู่เบื้องหลังการโฮสต์ DeepSeek เป็นแบบไหน หรือมีประวัติในการเคารพความเป็นส่วนตัวของข้อมูลหรือเปล่า?
มันไม่ใช่ความกังวลที่ไร้เหตุผล
นั่นแหละว่าทำไมบริษัทอเมริกันส่วนใหญ่ถึงเลือก AWS Bedrock หรือแล็บ AI ต่าง ๆ และมักขอสัญญาแบบไม่เก็บข้อมูลไว้ด้วย
แต่ไม่ว่าจะโฮสต์ที่ไหนก็มีความเสี่ยงข้อมูลรั่วอยู่ดี ต่างกันแค่โครงสร้างแรงจูงใจ
เช่นแล็บต่าง ๆ ก็สแกนทุกบทสนทนาเหมือนกัน และใช้ข้อมูลที่ไม่ได้อยู่ภายใต้สัญญา ZDR สำหรับองค์กรไปฝึกโมเดล
หน่วยงานบังคับใช้กฎหมายก็สามารถขอเข้าถึงข้อมูลผู้ใช้ทั้งหมดได้หากมีหมายที่ถูกต้องหรือในกรณีฉุกเฉิน 1
ถ้าคุณอยากใช้ DeepSeek V4 แบบเป็นส่วนตัว ลองดู Tinfoil(tinfoil.sh) ได้
มันโฮสต์ทุกโมเดลใน secure hardware enclave ที่ตรวจสอบได้ ทำให้ inference เป็นความลับแบบ end-to-end
ขอบอกไว้ก่อนว่าผมเป็นหนึ่งในผู้ร่วมก่อตั้ง
1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...
ใช้ผ่าน Azure ก็ได้
เขาโฮสต์โมเดลเต็มตัวและให้บริการจากสหรัฐฯ
น่าจะมีผู้ให้บริการแบบนี้อีกหลายเจ้า
บริษัทเราใช้อยู่แบบนั้น และใช้งานได้ดีมาก
ต่อให้พวกเขาทำจริง ผมก็คงไม่แปลกใจ
ถ้าโมเดลที่ตั้งสำนักงานใหญ่ในอเมริกาทำแบบเดียวกันให้รัฐบาลอื่น ผมก็คงไม่แปลกใจมากเหมือนกัน
ผมไม่ได้คาดหวังเรื่องความลับของข้อมูลไว้สูงนัก
Microsoft ทำเช็กลิสต์ฝั่งองค์กรได้ครบถ้วน แต่ Azure เองก็ยังโดนเจาะอยู่เป็นพัก ๆ
ผมคิดว่า ความเป็นไปได้ไม่ใช่ศูนย์
ปักกิ่งอาจตัดสินใจเมื่อไรก็ได้ว่า DeepSeek ทรงอิทธิพลเกินไปหรือกลายเป็นสินค้าส่งออกสำคัญ แล้วเข้ามาแทรกแซง
และก็ไม่มีหลักประกันด้วยว่ายังไม่เคยเกิดขึ้นแล้ว
มีรายงานมากมายว่าฝ่ายต่างชาติที่ไม่ได้จำกัดแค่จีนได้เจาะเครือข่ายสำคัญของหลายอุตสาหกรรมในอเมริกาอย่างกว้างขวาง และกำลังรอจังหวะเหมาะเพื่อใช้ประโยชน์
โมเดลล้ำสมัยก็เป็นอีกหนึ่งช่องทางโจมตี และถ้าคิดดูแล้วก็อาจถูกใช้ในทางที่ผิดได้ง่ายกว่ามาก
เอาจริง ๆ ถ้าเป็นโมเดลที่โฮสต์บนคลาวด์ ที่ไหนก็มีความเป็นไปได้นี้ทั้งนั้น
ไม่ว่าจะเป็นความตั้งใจของบริษัทผู้สร้างโมเดลเอง หรือผู้ไม่หวังดีใช้ช่องโหว่ก็ตาม
ผมไม่ได้สำคัญขนาดที่ใครในจีนต้องตั้งใจมาเล่นงานผม
แล้ว DeepSeek เองก็ต้องรักษาความน่าเชื่อถือไว้พอที่ผู้ใช้จะยังอยู่บนแพลตฟอร์มต่อ
ถ้ามันทำตัวเหมือน keylogger ที่ไปขโมยกระเป๋าคริปโตของทุกคน ความเชื่อใจก็พังหมด
ถ้าผมทำงานที่รัฐบาลจีนมองว่ามีความสำคัญเชิงยุทธศาสตร์ แน่นอนว่าผมคงกังวล แต่ผมไม่ได้ทำอะไรแบบนั้น
ที่ผมห่วงมากกว่าคือเหล่ามหาเศรษฐีสายเทคในประเทศนี้จะใช้ LLM มาทำโปรไฟล์ผมในวงกว้าง แล้วสร้างอะไรที่ดิสโทเปียยิ่งกว่าระบบคะแนนเครดิตสังคมของจีน ไม่ว่าจะมีอยู่จริงหรือเป็นแค่ภาพในจินตนาการก็ตาม
คนที่พยายามโน้มน้าวให้คุณซึ่งเป็นบุคคลทั่วไปในอเมริกาต้องกลัวรัฐบาลจีน อาจจะเป็นคนที่คุณควรกลัวจริง ๆ มากกว่า
ถ้าใครอยากเอาไปต่อกับ copilot ผมเคยทำ สคริปต์พร็อกซี ไว้จัดการการเชื่อมต่อ อาจมีประโยชน์: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...