1 คะแนน โดย GN⁺ 4 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ราคา API ของ DeepSeek-V4-Pro จะคงอยู่ที่ระดับ 1/4 ของราคาเดิมอย่างเป็นทางการ แม้หลังจากโปรโมชันลดราคา 75% สิ้นสุดลง
  • การคิดค่าบริการอิงตามราคาต่อ 1 ล้านโทเค็น และหักจากยอดคงเหลือโดยตรงตามปริมาณการใช้ โทเค็นขาเข้าและโทเค็นขาออก
  • โมเดลที่รองรับคือ DeepSeek-V4-Flash และ DeepSeek-V4-Pro โดยทั้งสองรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ และค่าเริ่มต้นคือโหมดคิดวิเคราะห์
  • ทั้งสองโมเดลมี ความยาวคอนเท็กซ์ 1M, เอาต์พุตสูงสุด 384K และมีข้อจำกัดด้าน concurrency ต่างกันคือ Flash 2500, Pro 500
  • ราคา input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับนี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC

เกณฑ์การคิดค่าบริการ

  • หน่วยราคา คือค่าบริการต่อ 1 ล้านโทเค็น โดยโทเค็นคือหน่วยข้อความที่เล็กที่สุดที่โมเดลรับรู้ได้ ซึ่งอาจเป็นคำ ตัวเลข หรือเครื่องหมายวรรคตอน
  • เกณฑ์การเรียกเก็บเงิน คือปริมาณรวมของโทเค็นขาเข้าและโทเค็นขาออกของโมเดล
  • ค่าใช้จ่ายคำนวณจาก จำนวนโทเค็น × ราคา และหักโดยตรงจากยอดเติมเงินหรือยอดเครดิตที่ได้รับ
  • หากมีทั้งยอดเติมเงินและยอดเครดิตที่ได้รับ ระบบจะใช้ ยอดเครดิตที่ได้รับ ก่อน
  • ราคาผลิตภัณฑ์อาจมีการเปลี่ยนแปลง และ DeepSeek สงวนสิทธิ์ในการปรับราคา
  • แนะนำให้เติมเงินตามการใช้งานจริง และตรวจสอบราคาล่าสุดจากหน้านี้เป็นระยะ

โมเดลและราคา

  • โมเดลที่รองรับ

    • มี DeepSeek-V4-Flash และ DeepSeek-V4-Pro
    • ทั้งสองโมเดลรองรับทั้งโหมดไม่คิดวิเคราะห์และโหมดคิดวิเคราะห์ โดยค่าเริ่มต้นคือโหมดคิดวิเคราะห์
    • ชื่อโมเดล deepseek-chat และ deepseek-reasoner จะถูกยกเลิกในอนาคต
    • เพื่อความเข้ากันได้ deepseek-chat จะตรงกับโหมดไม่คิดวิเคราะห์ของ deepseek-v4-flash และ deepseek-reasoner จะตรงกับโหมดคิดวิเคราะห์ของ deepseek-v4-flash
  • เอนด์พอยต์และฟีเจอร์

  • คอนเท็กซ์และขีดจำกัดเอาต์พุต

    • ความยาวคอนเท็กซ์ คือ 1M
    • เอาต์พุตสูงสุด คือ 384K

ราคาต่อ 1 ล้านโทเค็น

รายการ DeepSeek-V4-Flash DeepSeek-V4-Pro
โทเค็นขาเข้า, cache hit $0.0028 $0.003625
โทเค็นขาเข้า, cache miss $0.14 $0.435
โทเค็นขาออก $0.28 $0.87
ข้อจำกัด concurrency 2500 500
  • การปรับส่วนลดของ DeepSeek-V4-Pro

    • ราคา DeepSeek-V4-Pro แสดงเป็นราคาหลังส่วนลด 75%
    • ราคาโทเค็นขาเข้าแบบ cache hit ลดลงจากเดิม $0.0145 เหลือ $0.003625
    • ราคาโทเค็นขาเข้าแบบ cache miss ลดลงจากเดิม $1.74 เหลือ $0.435
    • ราคาโทเค็นขาออกลดลงจากเดิม $3.48 เหลือ $0.87
    • หลังโปรโมชันลดราคา 75% สิ้นสุดในวันที่ 31 พฤษภาคม 2026 เวลา 15:59 UTC ราคา API ของ DeepSeek-V4-Pro จะถูกปรับอย่างเป็นทางการให้เหลือ 1/4 ของราคาเดิมต่อไป
  • การลดราคา cache hit

    • ราคา input cache hit ของทุกโมเดลถูกลดลงเหลือ 1/10 ของราคาเปิดตัว
    • การปรับราคานี้มีผลตั้งแต่ 26 เมษายน 2026 เวลา 12:15 UTC
  • ข้อจำกัด concurrency

    • ข้อจำกัด concurrency ของ DeepSeek-V4-Flash คือ 2500
    • ข้อจำกัด concurrency ของ DeepSeek-V4-Pro คือ 500
    • รายละเอียดเพิ่มเติมเกี่ยวกับข้อจำกัด concurrency ดูได้ที่ Rate Limit & Isolation

1 ความคิดเห็น

 
GN⁺ 4 시간 전
ความคิดเห็นจาก Hacker News
  • ถ้าออก coding agent ของตัวเองมา ผมก็อาจจะเริ่มใช้โมเดล DeepSeek เป็นตัวหลัก
    ดูเหมือนพวกเขาจะยังคงทำสิ่งที่ “มาถูกทาง” ต่อไป ทั้งการเปิดซอร์สโมเดล เผยแพร่งานวิจัย และคงราคาต่ำไว้

    • ใช้ V4 Pro กับ Claude Code ได้ 1
      ผมลองใช้เองแล้ว ประทับใจมาก

    • ใช้กับ OpenCode ก็เข้ากันได้ดีมาก
      ทีมเรามักชน ลิมิต 5 ชั่วโมง ของบริการสมัครสมาชิกอื่นบ่อย ๆ แต่พอมี DeepSeek เป็นตัวสำรองแล้วถือว่าดีมาก
      เติมเงินไว้แค่ 50 ดอลลาร์ แต่รู้สึกเหมือนจะไม่มีวันหมด

      มันยังไม่ถึงขั้นแทนที่โมเดลระดับแนวหน้าได้ทั้งหมด แต่ถ้าเป็นตัวสำรองนี่ถือว่ายอดเยี่ยมแน่นอน

    • ไม่แน่ใจว่า DeepSeek จำเป็นต้องทำ coding agent เองด้วยหรือเปล่า
      เอาโมเดลไปต่อกับ coding agent ที่มีอยู่แล้วตัวไหนก็ได้
      ส่วนตัวผมชอบ Pi แต่ใครถนัดอันไหนก็ใช้อันนั้นได้

    • ต้นสัปดาห์นี้ผมเริ่มทดสอบ โมเดลจีน กับ codebase ของตัวเอง
      ตอนนี้ยังดูพวกการจัดหมวดหมู่ issue, การแก้บั๊กอัตโนมัติ, การวิเคราะห์ log มากกว่างาน coding แบบโต้ตอบ และเอา DeepSeek, Kimi, GLM, Qwen, MiMO ไปเทียบกับ GPT-5.5 high โดยรันทั้งหมดผ่าน Pi harness แบบไม่ต้องติดตั้ง

      เท่าที่เห็นตอนนี้ Kimi กับ MiMO ดูมีแววที่สุด
      ยังไม่ได้ทดสอบเข้มงวดพอจะสรุปจริงจัง แต่ความรู้สึกแรกคือสำหรับงานทั่ว ๆ ไปในชีวิตประจำวัน โมเดลพวกนี้อาจไม่ได้ตามหลังอย่างที่คนคิด

      แต่ก็ดูจะเป็นแนว “ขยันทำงานมากกว่าทำงานอย่างฉลาด” คือไปถึงผลลัพธ์ใกล้เคียงกันได้แต่ช้ากว่าและใช้โทเคนมากกว่า ทว่าราคาถูกกว่ามาก

    • ผมอยากให้ coding agent เป็นอิสระ จากผู้ให้บริการโมเดลพอสมควร
      เพราะผู้ให้บริการเปลี่ยนคุณภาพ ฟีเจอร์ และราคาบ่อยเกินไป จนไม่อยากต้องเปลี่ยน agent ตามทุกครั้ง

      หวังว่าสถานการณ์จะค่อย ๆ ช้าลงและนิ่งขึ้น
      ไม่ได้หมายความว่าต้องเป็นตอนนี้ทันที แต่คงดีถ้าไปถึงจุดนั้นได้

  • ถ้ายังไม่เคยลอง DeepSeek V4 แสดงว่าพลาดของดีไปมาก
    มันดีจนน่าเหลือเชื่อเมื่อเทียบกับราคา

    chain of thought ของ DeepSeek น่าอ่านมาก
    OpenCode ไม่แสดงมัน แต่ถ้าได้อ่านเองอาจจะตกใจว่าโมเดลนี้ถูกประเมินต่ำไปแค่ไหน

    ผมใช้โมเดลไม่เยอะ แต่ก็ยังจ่ายเงินให้ DeepSeek ตรง ๆ เป็นประจำ เพื่อขอบคุณที่เปิดซอร์สโมเดลและเพื่อแสดงการสนับสนุนต่อแนวทางที่ผมมองว่าเป็นประโยชน์ต่อสังคมโดยรวม

    • มันดีและถูก แต่ถ้าคุย เรื่องการเมือง อาจไปชนกฎการเซ็นเซอร์อะไรบางอย่างได้
      ผมเคยเห็นมันกำลังโชว์กระบวนการคิดอยู่ดี ๆ แล้วลบทั้งหมดทิ้ง ก่อนจะเสนอให้เปลี่ยนไปคุยเรื่องอื่นโดยไม่อธิบายอะไร
      เคยมีครั้งหนึ่งที่มันพ่นข้อความแนวกว้าง ๆ ว่าสื่อมวลชนต้องรับใช้ประชาชนออกมาด้วย

      ทั้งสองกรณีไม่ได้เป็นคำขออ่อนไหว ไม่ผิดกฎหมาย และไม่ได้โค่นล้มระบอบอะไร เลยทำให้แปลกใจ
      แต่มันมีเนื้อหาทางการเมืองนิดหน่อย แค่นั้นก็พอแล้ว
      การเซ็นเซอร์แบบตะวันตกมักจะมาแบบแนบเนียนกว่านี้ เลยทั้งน่าขนลุกและแปลกใหม่ในเวลาเดียวกัน

    • เห็นด้วย โมเดลดีจริง
      ที่บริษัทผมใช้ Claude ส่วนใช้ส่วนตัวผมใช้ DeepSeek และมันเป็นโมเดลเดียวที่ไม่ได้พยายาม ทำให้ผมล้มละลาย

    • ผมชอบ V4 Pro สำหรับงานบางอย่าง แต่ถ้าเป็นงานเขียนโค้ด V4 Flash น่าประทับใจทีเดียว
      มันกระชับ จับประเด็นได้ดี ผิดพลาดน้อย และค่อนข้างเร็ว

    • ใน opencode CLI มองเห็นร่องรอยการให้เหตุผลนะ
      อาจเป็นปัญหาการตั้งค่าก็ได้

    • ใน opencode เปิดปิด การแสดงการให้เหตุผล ได้

  • ราคานี้ถูกจนน่าสงสัย
    ถ้าโฮสต์โมเดลเดียวกันผ่านผู้ให้บริการรายอื่นจะแพงกว่านี้มาก 0
    เพราะงั้นไม่ก็ DeepSeek โฮสต์ได้ถูกกว่าที่อื่นมาก หรือไม่ก็โมเดลธุรกิจต่างกัน ซึ่งผมเดาว่าเป็นอย่างหลัง
    โดยเฉพาะเมื่อในนโยบายความเป็นส่วนตัว 1 ระบุว่าสามารถนำข้อมูลส่วนบุคคลรวมถึง “User Input” ไปใช้เพื่อ “ปรับปรุงและพัฒนาบริการ รวมถึงฝึกและปรับปรุงเทคโนโลยี” ได้

    • อาจเป็นคำถามงี่เง่า แต่พอดูใน OpenRouter แล้วสงสัยว่าคนให้บริการ DeepSeek มีแค่ สหรัฐฯ สิงคโปร์ และจีน จริง ๆ เหรอ
      มันดูเป็นสินค้าที่ชัดเจนมากจนผู้ให้บริการในยุโรปหรือโลกตะวันตกอื่น ๆ ก็น่าจะเอามาขาย
      ผมมั่นใจว่ามันกระโดดไกลกว่า Mistral มาก

      ผมอยากลองใช้โมเดลพวกนี้ แต่ก็อยากเลี่ยงผู้ให้บริการที่เอาข้อมูลผมไปฝึกหรือเก็บไว้เกินกว่าข้อกำหนดทางกฎหมายมาตรฐาน

    • มีหลายปัจจัยทำงานร่วมกัน
      ในแง่ ประสิทธิภาพของ inference stack ผู้ให้บริการหลายรายเอา sglang / vllm / trtllm ที่มีอยู่มาใช้แล้วหวังว่าจะได้ผลดีที่สุด แต่ทีม DeepSeek ขึ้นชื่อเรื่องการดันขีดจำกัดของการปรับแต่งให้สุด

      sglang กับ vllm เป็นซอฟต์แวร์ที่ยอดเยี่ยม แต่ถ้าดู sparse attention ของ DeepSeek (DSA) มันถูกนำมาใช้ตั้งแต่ 1.5 ปีก่อนแล้ว(https://arxiv.org/abs/2512.02556) และถูกใช้ใน DeepSeek 3.2, GLM 5, DeepSeek V4
      ตอนนี้เอนจิน inference หลัก ๆ เพิ่งเริ่มค่อย ๆ ใส่การปรับแต่งเข้ามา: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 เป็นต้น)
      แน่นอนว่า DS V4 ยังมีการปรับโครงสร้างโมเดลบน DSA เพิ่มอีก และต้องใช้เวลาอีกพักกว่าเอนจิน inference แบบโอเพนซอร์สจะใช้ประโยชน์จากมันได้เต็มที่

      ในแง่ความเป็นส่วนตัว ก็มีการเดิมพันว่าคนยอมจ่ายเพิ่มเพื่อรัน inference ที่โฮสต์อยู่นอกจีน
      ยิ่ง DeepSeek ประกาศอย่างโปร่งใสว่าใช้ข้อมูล API เพื่อปรับปรุงโมเดล ก็ยิ่งเป็นแบบนั้น

      นอกจากนี้ยังมีปัจจัยอย่างขนาดระบบ (สำคัญมากใน MoE), ความน่าเชื่อถือ, และการผูกมัดลูกค้าองค์กรแบบนุ่มนวล

      อีกอย่างก็มีความเป็นไปได้สูงว่าจะมีการฮั้วราคาโดยปริยาย
      ถ้าดูราคา GLM 5 กับ GLM 5.1 ต้นทุนรันจริงเท่ากัน แต่ 5.1 เป็นโมเดลที่ดีกว่ามาก และ Z.AI ก็ขึ้นราคา ทำให้ผู้ให้บริการตั้งราคา 5.1 แพงกว่า

    • เห็นชัดเลยว่าพวกเขา ขายขาดทุน
      แต่แล้วจะเป็นไรล่ะ
      การยอมขาดทุนเพื่อแย่งส่วนแบ่งตลาดไม่ใช่สิทธิบัตรเฉพาะของอเมริกา

    • คุณอาจยังรู้ไม่พอเกี่ยวกับผู้ก่อตั้ง DeepSeek อย่าง Liang Wenfeng
      เขายังเป็นผู้ก่อตั้ง High-Flyer Quant ด้วย

  • ผมสนใจเรื่องแคชมากกว่า
    เขาบอกว่า “ราคาสำหรับ input cache hit ของทุกโมเดลลดลงเหลือ 1/10 ของราคาเปิดตัว และการปรับราคานี้มีผลตั้งแต่ 2026/4/26 12:15 UTC”

    ไม่มีวันสิ้นสุดกำกับไว้
    ตอนนี้ DeepSeek V4 Flash อยู่ที่ 2% ของราคา input และสำหรับราคา V4 Pro รอบนี้อยู่ที่ 0.8% ซึ่งต่ำจนน่าตกใจเมื่อเทียบกับคู่แข่ง และกระทบต่อ unit economics ด้วย เลยคิดว่าเดิมทีน่าจะเป็นโปรโมชันชั่วคราว

    สำหรับ V4 Pro ถ้าคิดเรื่อง caching ด้วย ต้นทุนจริงอยู่ที่ประมาณ $0.04 ต่อ 1 ล้าน input tokens (อ้างอิงตัวเลขจาก OpenRouter: https://openrouter.ai/deepseek/deepseek-v4-pro)
    ถูกกว่าแม้แต่โมเดลเล็กของคู่แข่งหลายเจ้าอีก

    • KV cache ของ DeepSeek V4 มีประสิทธิภาพมากเพราะโครงสร้าง sparse attention ที่บีบอัดอย่างหนัก
      DeepSeek V3.2 ที่ใช้แค่ DSA เป็นโมเดลเล็กกว่า แต่กลับใช้หน่วยความจำมากกว่า DS V4 Pro ถึง 10 เท่าใน context window ขนาด 1 ล้าน

      อีกอย่าง DeepSeek API มีอัตรา cache hit ที่ดีมาก
      สำหรับ workload เดียวกัน ผู้ให้บริการ inference ฝั่งตะวันตกหลัก ๆ ที่ให้โมเดล open weights มักมี KV cache hit ราว 50% แต่ DS API ได้ประมาณ 80%

    • จุดใหญ่ของ DeepSeek V4 คือ ขนาด KV cache ลดลงอย่างมาก

    • ตัว Flash เองไม่ได้เป็นโมเดลที่แข่งขันได้สุด ๆ และราคาก็อยู่ในช่วงใกล้กับโมเดลอื่นในตลาด
      คู่แข่งตรงที่สุดของ Flash น่าจะประมาณนี้

      GPT 5.4 mini

      Cache Read
      $0.075
      /M tokens

      Gemini 3 flash:

      Cache Read
      $0.05
      /M tokens

      ดังนั้นมันไม่ได้มีอะไรพิเศษระดับเวทมนตร์หรือพลิกวงการขนาดนั้น

    • Sonnet:
      Cache Read
      $0.30

      Gemini 3.5 flash:
      Cache Read
      $0.15

  • คุ้มราคามาก
    ผมใช้ GLM 5.1 กับ GLM Coding Plan Max มาพักหนึ่งแล้ว และก็ทดสอบ DeepSeek V4 Pro มาราว 3 สัปดาห์ สำหรับงานโค้ดซับซ้อนผมว่ามันดีกว่า GLM 5.1
    ผมใช้ไป 65 ล้านโทเคน ค่าใช้จ่ายออกมา 1.5 ดอลลาร์ในราคานี้ ถูกมากจริง ๆ

    • ดูเหมือน DeepSeek จะ ใช้โทเคนมากกว่า โมเดลอื่นพอสมควร
  • สุดยอด
    แบบนี้ DeepSeek V4 Pro ก็ถูกแบบสุดโต่งเมื่อเทียบกับโมเดลอื่นในกลุ่มเดียวกัน
    ถ้าดูราคาต่อ 1 ล้าน output tokens จะเป็นแบบนี้

    DeepSeek V4 Pro: $0.87

    Qwen 3.7 Max: $7.50

    Grok 4.3: $2.50

    GLM 1.5: $3.08

    Opus 4.7: $25.00

    GPT-5.5: $30.00

    • ถ้ารวมต้นทุน cache read ด้วย ของจริงจะยิ่งถูกกว่าอีก
      ใน workflow แบบ agent ค่าใช้จ่ายตรงนี้อาจเป็นตัวหลักเลยก็ได้ และค่า cache read ของ DeepSeek ต่ำจนเทียบกันแทบไม่ได้
      มันอยู่ที่ $0.003626 ต่อ 1 ล้านโทเคน ขณะที่ตัวที่ถูกที่สุดลำดับถัดไปในลิสต์ยังเกิน $0.2 ต่อ 1 ล้านโทเคน
      ต่างกันเกือบ 100 เท่า
    • คราวหน้าถ้ามีใครบอกว่า “อย่ามาบ่นเรื่องลิมิตการใช้งานเลย บริษัทขาดทุนจากค่าสมัครของคุณอยู่แล้ว” ผมจะส่งลิงก์คอมเมนต์นี้ให้
      เพราะมันแปลว่าเราทำ inference อย่างมีประสิทธิภาพ ได้ ถ้าไม่ใช่แค่ปล่อยให้เผาเงินแบบไร้ข้อจำกัด
    • และไม่ได้ ทำให้โมเดลแย่ลงหลังจากคุณสมัคร
      ถ้าผ่านไป 2 เดือนแล้วไปลด Opus ให้ห่วยกว่า GPT-3 เพื่อประหยัดต้นทุน ต่อให้ Opus เคยดีแค่ไหนก็ไม่มีความหมาย
    • คือ GLM 5.1
  • ต่อให้คิดส่วนลดของ V4 Pro แล้ว V4 Flash ก็ยังให้ประสิทธิภาพต่อดอลลาร์ดีที่สุด และสำหรับงานสาย agent หรือใช้เครื่องมือเยอะ ๆ ประสิทธิภาพรวมก็ยังดีกว่า
    V4 Pro ฉลาดกว่าสำหรับการคิดครั้งเดียวจบ แต่ช้ากว่ามาก
    ถ้ารวมประสิทธิภาพ ต้นทุน และความเร็ว V4 Flash คือ flash model ที่ดีที่สุดของเราตอนนี้แบบทิ้งห่าง

    ข้อมูลอยู่ที่ https://gertlabs.com/rankings

    • สำหรับ use case ของผม ซึ่งส่วนใหญ่เป็น งานสรุปขนาดใหญ่มากและดึงไอเดียออกมา มันสู้ Pro ไม่ค่อยได้
  • สถาปัตยกรรม MLA ของพวกเขาช่วยลด KV cache ลงได้ประมาณ 5–13 เท่าเมื่อเทียบกับ attention มาตรฐาน
    เพราะงั้นมันไม่ใช่แค่สงครามราคาที่ตั้งใจเอาส่วนแบ่งตลาด แต่ต้นทุนการรัน inference จริง ๆ ก็ต่ำกว่าด้วย

    • เป็น game changer สำหรับ local inference ด้วย
      ทำให้แพลตฟอร์มคอนซูเมอร์ทั่วไปสามารถมี long context, batch inference และบันทึก KV cache ลงดิสก์ได้
    • ใช่เลย
      ส่วนลดรอบนี้อาจเป็นการทดลองตลาดหลังเปิดตัว เพื่อดูว่า caching ทำงานได้มีประสิทธิภาพแค่ไหนในโมเดลเจเนอเรชันใหม่
  • ผมห่วง การรั่วไหลของข้อมูลโดยไม่ตั้งใจ กับโมเดลที่โฮสต์ในจีนมากกว่าโมเดลที่โฮสต์ในอเมริกา
    เช่นกรณีที่ agent ไปอ่านไฟล์ env อะไรแบบนั้น
    ผมผิดไหมถ้าจะสงสัยว่ารัฐบาลจีนมีแนวโน้มจะสแกนทุกบทสนทนาและเก็บข้อมูลที่เป็นประโยชน์ไว้ มากกว่ารัฐบาลหรือบริษัทอเมริกัน?

    ผมยังลังเลเลยว่าจะเขียนคอมเมนต์นี้ดีไหม เพราะมันอาจฟังดูมีอคติหรือเหมือนเกลียดชาวต่างชาติ
    ถ้ามีใครช่วยอธิบายให้ผมเห็นว่าผมคิดผิดก็จะดี
    มีใครรู้ไหมว่าบริษัทที่อยู่เบื้องหลังการโฮสต์ DeepSeek เป็นแบบไหน หรือมีประวัติในการเคารพความเป็นส่วนตัวของข้อมูลหรือเปล่า?

    • มันไม่ใช่ความกังวลที่ไร้เหตุผล
      นั่นแหละว่าทำไมบริษัทอเมริกันส่วนใหญ่ถึงเลือก AWS Bedrock หรือแล็บ AI ต่าง ๆ และมักขอสัญญาแบบไม่เก็บข้อมูลไว้ด้วย
      แต่ไม่ว่าจะโฮสต์ที่ไหนก็มีความเสี่ยงข้อมูลรั่วอยู่ดี ต่างกันแค่โครงสร้างแรงจูงใจ

      เช่นแล็บต่าง ๆ ก็สแกนทุกบทสนทนาเหมือนกัน และใช้ข้อมูลที่ไม่ได้อยู่ภายใต้สัญญา ZDR สำหรับองค์กรไปฝึกโมเดล
      หน่วยงานบังคับใช้กฎหมายก็สามารถขอเข้าถึงข้อมูลผู้ใช้ทั้งหมดได้หากมีหมายที่ถูกต้องหรือในกรณีฉุกเฉิน 1

      ถ้าคุณอยากใช้ DeepSeek V4 แบบเป็นส่วนตัว ลองดู Tinfoil(tinfoil.sh) ได้
      มันโฮสต์ทุกโมเดลใน secure hardware enclave ที่ตรวจสอบได้ ทำให้ inference เป็นความลับแบบ end-to-end
      ขอบอกไว้ก่อนว่าผมเป็นหนึ่งในผู้ร่วมก่อตั้ง

      1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...

    • ใช้ผ่าน Azure ก็ได้
      เขาโฮสต์โมเดลเต็มตัวและให้บริการจากสหรัฐฯ
      น่าจะมีผู้ให้บริการแบบนี้อีกหลายเจ้า

      บริษัทเราใช้อยู่แบบนั้น และใช้งานได้ดีมาก

    • ต่อให้พวกเขาทำจริง ผมก็คงไม่แปลกใจ
      ถ้าโมเดลที่ตั้งสำนักงานใหญ่ในอเมริกาทำแบบเดียวกันให้รัฐบาลอื่น ผมก็คงไม่แปลกใจมากเหมือนกัน
      ผมไม่ได้คาดหวังเรื่องความลับของข้อมูลไว้สูงนัก
      Microsoft ทำเช็กลิสต์ฝั่งองค์กรได้ครบถ้วน แต่ Azure เองก็ยังโดนเจาะอยู่เป็นพัก ๆ

    • ผมคิดว่า ความเป็นไปได้ไม่ใช่ศูนย์
      ปักกิ่งอาจตัดสินใจเมื่อไรก็ได้ว่า DeepSeek ทรงอิทธิพลเกินไปหรือกลายเป็นสินค้าส่งออกสำคัญ แล้วเข้ามาแทรกแซง
      และก็ไม่มีหลักประกันด้วยว่ายังไม่เคยเกิดขึ้นแล้ว

      มีรายงานมากมายว่าฝ่ายต่างชาติที่ไม่ได้จำกัดแค่จีนได้เจาะเครือข่ายสำคัญของหลายอุตสาหกรรมในอเมริกาอย่างกว้างขวาง และกำลังรอจังหวะเหมาะเพื่อใช้ประโยชน์
      โมเดลล้ำสมัยก็เป็นอีกหนึ่งช่องทางโจมตี และถ้าคิดดูแล้วก็อาจถูกใช้ในทางที่ผิดได้ง่ายกว่ามาก

      เอาจริง ๆ ถ้าเป็นโมเดลที่โฮสต์บนคลาวด์ ที่ไหนก็มีความเป็นไปได้นี้ทั้งนั้น
      ไม่ว่าจะเป็นความตั้งใจของบริษัทผู้สร้างโมเดลเอง หรือผู้ไม่หวังดีใช้ช่องโหว่ก็ตาม

    • ผมไม่ได้สำคัญขนาดที่ใครในจีนต้องตั้งใจมาเล่นงานผม
      แล้ว DeepSeek เองก็ต้องรักษาความน่าเชื่อถือไว้พอที่ผู้ใช้จะยังอยู่บนแพลตฟอร์มต่อ
      ถ้ามันทำตัวเหมือน keylogger ที่ไปขโมยกระเป๋าคริปโตของทุกคน ความเชื่อใจก็พังหมด

      ถ้าผมทำงานที่รัฐบาลจีนมองว่ามีความสำคัญเชิงยุทธศาสตร์ แน่นอนว่าผมคงกังวล แต่ผมไม่ได้ทำอะไรแบบนั้น

      ที่ผมห่วงมากกว่าคือเหล่ามหาเศรษฐีสายเทคในประเทศนี้จะใช้ LLM มาทำโปรไฟล์ผมในวงกว้าง แล้วสร้างอะไรที่ดิสโทเปียยิ่งกว่าระบบคะแนนเครดิตสังคมของจีน ไม่ว่าจะมีอยู่จริงหรือเป็นแค่ภาพในจินตนาการก็ตาม
      คนที่พยายามโน้มน้าวให้คุณซึ่งเป็นบุคคลทั่วไปในอเมริกาต้องกลัวรัฐบาลจีน อาจจะเป็นคนที่คุณควรกลัวจริง ๆ มากกว่า

  • ถ้าใครอยากเอาไปต่อกับ copilot ผมเคยทำ สคริปต์พร็อกซี ไว้จัดการการเชื่อมต่อ อาจมีประโยชน์: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...