1 คะแนน โดย GN⁺ 5 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ในงานสายเทคนิค open LLM ยังมีต้นทุนด้านประสิทธิภาพ ความเข้ากันได้ และความน่าเชื่อถืออยู่ แต่ช่วงหลังช่องว่างนี้แคบลง ทำให้มีโอกาสลดการพึ่งพาโมเดลปิดอย่าง Claude หรือ GPT ได้มากขึ้น
  • ในอดีต Linux มีความเสี่ยงต่อการทำงานระดับมืออาชีพเพราะปัญหาความเข้ากันได้กับ MS Office, รูปแบบไฟล์เฉพาะทาง และระบบนิเวศโอเพนซอร์สที่ยังไม่สุกงอม แต่เมื่อเว็บแอปแพร่หลายและระบบนิเวศเติบโตขึ้น สิ่งที่ต้องเสียสละก็ลดลงมาก
  • ณ วันที่ 21 มิถุนายน 2026 อันดับบนของ Artificial Analysis intelligence leaderboard ยังเป็นโมเดล API แบบปิดอย่าง Claude และ GPT และ Claude code กับ API หลักก็ยังนำหน้าในด้านความสะดวกในการใช้งานและความไว้วางใจภายในองค์กร
  • โมเดลเปิดสามารถใช้งานผ่านผู้ให้บริการหรือบุคคลที่สามอย่าง OpenRouter ได้ แต่มี ความกังวลเรื่องความเป็นส่วนตัวและการแชร์ข้อมูล และหากรันเอง แม้ความเป็นส่วนตัวจะดีขึ้น แต่ก็มีภาระด้านต้นทุน ความซับซ้อน และความเร็ว
  • การนำ ID verification ของ Claude มาใช้ ทำให้ต้องกลับมาประเมินต้นทุนของการหยุดใช้โมเดลระดับบนอีกครั้ง แต่เมื่อโมเดลเปิดไล่จี้ผู้นำจนต่างกันเพียงไม่กี่เดือนแล้ว การลดลงของผลิตภาพในระยะสั้นอาจไม่ใช่อุปสรรคชี้ขาด

ตำแหน่งปัจจุบันของ open LLM เมื่อมองผ่านต้นทุนการย้ายไป Linux

  • ในอดีต การใช้ Linux อาจสร้าง ความเสี่ยงทางวิชาชีพ ได้แม้ในงานสายเทคนิค
    • อาจเรนเดอร์เอกสาร Word หรือ PowerPoint ได้ไม่ถูกต้อง
    • อาจต้องเชื่อใจผลการส่งออกจาก Open Office
    • อาจเปิดรูปแบบไฟล์เฉพาะทางได้ไม่สะดวก ทำให้การทำงานร่วมกันยากขึ้น
    • โปรเจ็กต์โอเพนซอร์สที่พยายามไล่ตามฟีเจอร์ของซอฟต์แวร์กระแสหลักมักยังมีส่วนที่หยาบอยู่มาก
  • ตอนนี้ซอฟต์แวร์ด้านผลิตภาพจำนวนมากให้บริการเป็นเว็บแอป และ Linux กับซอฟต์แวร์โอเพนซอร์สก็เติบโตเต็มที่ขึ้นจนช่องว่างแคบลง
    • ซอฟต์แวร์เฉพาะทางบางด้าน เช่น CAD อาจยังต้องใช้ Windows
    • อย่างไรก็ตาม Linux และโอเพนซอร์สไม่ได้บังคับให้ต้อง เสียสละ มากในงานทั่วไปเหมือนเมื่อก่อนอีกแล้ว

ต้นทุนที่ผู้ใช้โมเดลเปิดยังต้องยอมรับ

  • สำหรับผู้ใช้ open LLM ยังมี บทลงโทษ ที่ชัดเจนหลงเหลืออยู่
    • ณ วันที่ 21 มิถุนายน 2026 Claude และ GPT อยู่บนอันดับสูงของ Artificial Analysis intelligence leaderboard
    • ไม่ใช่แค่ประสิทธิภาพ แต่ Claude code และ API หลักยังแข็งแกร่งในด้านความเข้ากันได้และความสะดวกในการใช้งานด้วย
    • การส่งคำถาม LLM ไปยัง OpenAI และ Anthropic ได้รับความไว้วางใจในระดับที่คนจำนวนมากยอมรับได้
  • เส้นทางการใช้โมเดลเปิดผ่าน API มักมาพร้อมปัญหาเรื่องความไว้วางใจ
    • อาจเป็นการเสิร์ฟโดยผู้ให้บริการโมเดลโดยตรง หรือโดยบุคคลที่สามอย่าง OpenRouter
    • การส่ง API call ที่มีข้อมูลฝั่งไคลเอนต์หรือข้อมูลลับรวมอยู่ด้วย ทำให้รู้สึกกังวลมากกว่าในด้านความเป็นส่วนตัวและการแชร์ข้อมูล
    • หากส่งคำขอไปยัง Deepseek หรือ OpenRouter ก็อาจเกิดความกังวลมากขึ้น ไม่ว่าความเสี่ยงที่แท้จริงจะเป็นอย่างไรก็ตาม
  • การรันเองช่วยลดปัญหาความเป็นส่วนตัว แต่เพิ่มภาระด้าน ต้นทุน ความซับซ้อน และความเร็ว
    • สามารถรันได้ทั้งแบบโลคัลหรือบนคลาวด์
    • การรันเองมักมาพร้อมปัญหาอย่างน้อยสองข้อในสามข้อ คือ แพง ซับซ้อน หรือค่อนข้างช้า

Claude ID verification ที่กลายเป็นจุดเปลี่ยน

  • การนำ identity verification ของ Claude มาใช้ ทำให้การตัดสินใจย้ายเกิดเร็วขึ้น
    • มาตรการป้องกันใหม่ ๆ (safeguards) ของโมเดลรุ่นล่าสุดและสถานการณ์ที่เกี่ยวข้องกับ Mythos ก็ถูกมองว่าเป็นสัญญาณว่าประสบการณ์ผู้ใช้กำลังจะแย่ลง
    • เมื่อไม่ยอมรับ ID verification ประเด็นสำคัญจึงยังคงเป็นความสูญเสียทางอาชีพจากการไม่สามารถใช้โมเดลระดับบนได้
  • การย้ายไปใช้โมเดลเปิดถูกประเมินว่าอยู่ในสถานการณ์ที่ใกล้เคียงกันมากกว่าช่องว่างระหว่าง Linux กับ Windows ในปี 2008
    • มีสภาพแวดล้อมที่สามารถรันโมเดลเปิดหลายตัวได้แล้วทั้งแบบโลคัลและบนคลาวด์
    • มี coding harness สำหรับโมเดลเปิดอยู่แล้ว
    • โมเดลเปิดเข้าใกล้โมเดลผู้นำอย่างมาก และโดยปกติช้ากว่าเพียงไม่กี่เดือน
    • ผลิตภาพอาจลดลงในระยะสั้น แต่ผู้เขียนมองว่าไม่ใช่อุปสรรคชี้ขาด เหมือนกับตอนเปลี่ยนจาก Matlab ไป GNU Octave ในช่วงทำวิจัย

1 ความคิดเห็น

 
GN⁺ 5 시간 전
ความคิดเห็นจาก Hacker News
  • นั่นแหละคือเหตุผลที่สำหรับทุกคำขอใน eurouter.ai ผมใช้กฎการจัดเส้นทางด้านล่างนี้

    {  
    "model": "glm-5.2",  
    "models": [  
    "deepseek-v4-pro",  
    "deepseek-v4-flash"  
    ],  
    "provider": {  
    "allow_fallbacks": true,  
    "data_collection": "deny",  
    "data_residency": "EU",  
    "max_retention_days": 0,  
    "eu_owned": true  
    }  
    }  
    

    มันแพงก็จริง แต่อย่างน้อยในทางกฎหมายก็ถือว่า ความเป็นส่วนตัวของข้อมูล ได้รับการคุ้มครอง ผมไว้ใจมันมากกว่า Anthropic, OpenAI และ OpenRouter
    โดยส่วนตัวแล้วผมรู้สึกว่ายอมรับการใช้เครื่องมือ AI ของสหรัฐฯ ในเชิงศีลธรรมได้ยาก และไม่อยากจ่ายเงินให้พวกเขาเพื่อนำไปสนับสนุนอาชญากรรมที่พวกเขาเกี่ยวข้อง[1]
    [1]: https://news.ycombinator.com/item?id=48512339

  • จุดที่ติดเรดไลน์ของ Anthropic คือคำว่า "of Americans" งั้นก็หมายความว่ากับโลกที่มีอารยธรรมที่เหลือจะทำอะไรก็ได้อย่างนั้นหรือ? จะทำให้ประเทศพันธมิตรนอกสหรัฐฯ ไร้เสถียรภาพด้วยการทดสอบที่ถูกบิดเบือนหรือข้อมูลรั่วไหลในกระบวนการแมชชีนเลิร์นนิงก็ได้อย่างนั้นหรือ?
    ที่แปลกยิ่งกว่าคือพวกเขาอ้างว่าโมเดลปฏิบัติตาม https://www.anthropic.com/constitution และมีเนื้อหานั้นฝังอยู่ในตัวโมเดลแล้ว แต่ system prompt ของ Claude Code และ cowork กลับย้ำรายการเหล่านี้ซ้ำอีก ถ้ามันฝังอยู่จริงก็ไม่น่าจำเป็นต้องทำแบบนั้น
    ถ้าทำ prompt engineering กับ Claude เวอร์ชัน API มากพอ คุณสามารถทำให้มันแสดงตัวเหมือนผู้สนับสนุนฮิตเลอร์ได้ ซึ่งขัดแย้งกับคำกล่าวอ้างของพวกเขาโดยตรง โดยเฉพาะ Opus 4.7 เคยยอมสร้างสื่อโฆษณาชวนเชื่อที่มุ่งเป้าไปยังกลุ่มชนกลุ่มน้อยบางกลุ่มอย่างเต็มใจ แต่ใน 4.8 ผมยังไม่เห็นความสำเร็จแบบเดียวกัน ตอนนี้ผมสนใจเรื่องการนำความสามารถด้านไซเบอร์ของโมเดลไปใช้ในทางที่ผิดมากกว่า เลยไม่ได้ไล่ลึกไปในทิศทางนั้น
    สรุปตั้งแต่แรกคือ กลยุทธ์ของ Anthropic เป็นแค่ การจัดการภาพลักษณ์ ล้วน ๆ และเมื่อเห็นว่ามีคนสนับสนุนบริษัทหลั่งไหลเข้ามา ก็ถือว่าพวกเขาทำสำเร็จพอสมควร

  • ผมลองดู eurouter.ai แล้ว ข้อเสนอดูแย่มาก
    ราคาแบบ บวกราคา 15% สำหรับบัญชีฟรีก็ฟังไม่ขึ้นอยู่แล้ว แถมถ้าไม่จ่าย 40€ ต่อเดือนก็จะติดลิมิต 1000 คำขอต่อเดือนอีก แต่ผมไม่แน่ใจเลยว่ามันให้คุณค่าอะไรอย่างชัดเจน
    DeepSeek-V4-Pro มีผู้ให้บริการแค่รายเดียวคือ TensorX และค่าการอ่านแคชก็แพงกว่า DeepSeek มากกว่า 100 เท่า ($0.44 เทียบกับ $0.003625) โดยเฉพาะใน eurouter.ai ผมหาข้อมูลค่าใช้จ่ายของ cache token ไม่เจอ จนต้องไปดูที่เว็บไซต์ของ TensorX เอง

  • คำว่า "อาชญากรรม" ยังเบาไปด้วยซ้ำ
    "AI-assisted targeting in the Gaza Strip" - https://en.wikipedia.org/wiki/AI-assisted_targeting_in_the_G...
    "Palantir allegedly enables Israel's AI targeting in Gaza, raising concerns over war crimes" - https://www.business-humanrights.org/de/neuste-meldungen/pal...
    "What The Wounds Are Telling Us" - https://www.volkskrant.nl/kijkverder/v/2025/gunshot-palestin...

  • ผมเริ่มสงสัยว่ามีทางเลือกอื่นอะไรบ้างนอกจาก OpenRouter เลยลองค้นดูนิดหน่อย
    EURouter(อัมสเตอร์ดัม): https://www.eurouter.ai/pricing
    Eden AI(ฝรั่งเศส): https://www.edenai.co/pricing
    nexos.ai(ลิทัวเนีย): https://nexos.ai/pricing/
    Requesty(เยอรมนี): https://www.requesty.ai/pricing
    Cortecs(ออสเตรีย): https://cortecs.ai/pricing
    Nordference(เอสโตเนีย): https://nordference.ai/pricing
    ดูเหมือนจะผุดขึ้นมาราวกับดอกเห็ดจริง ๆ แม้ผมจะยังไม่ได้ลองใช้เองจึงไม่ได้แนะนำที่ไหนเป็นพิเศษ แต่ก็ดูเหมือนว่าจะมี ตัวเลือก สำหรับคนที่ต้องการ

  • ถ้า ความปลอดภัยของข้อมูล คือความกังวลจริง ๆ สุดท้ายแล้วก็ดูเหมือนจะไม่มีทางออกอื่นนอกจากยอมรับภาระแล้วโฮสต์เอง

  • น่าสนใจที่ผู้คนตัดโมเดลแบบเปิดน้ำหนักทิ้งเพียงเพราะมัน “ตามหลังอยู่ไม่กี่เดือน” เมื่อเทียบกับโมเดลปิด
    ผมรู้ดีว่าความก้าวหน้าของ LLM เร็วมาก แต่ถ้า Opus และ GPT เมื่อไม่กี่เดือนก่อนอยู่ในระดับเดียวกับโมเดลแบบเปิดน้ำหนักในตอนนี้จริง ๆ ก็ไม่มีเหตุผลอะไรที่จะไม่ย้ายไปใช้ โดยเฉพาะถ้าคุณเองก็ใช้โมเดลเหล่านั้นมาตั้งแต่ไม่กี่เดือนก่อน
    โค้ดเบสก็ไม่ได้เปลี่ยนไปไหน ดังนั้นก็ใช้โมเดลแบบเปิดน้ำหนักได้เลย อย่าขยับเสาประตู

    • โมเดลปิดตัวใหม่มักถูกโปรโมตทุกครั้งว่า “พลิกวงการ” และ “แก้งาน X ที่โมเดลอื่นทำไม่ได้” แต่พอผ่านไปเดือนเดียวก็ถูกเรียกว่าเป็น โมเดลรุ่นก่อนที่ไม่ค่อยดี
      เพราะงั้นการใช้ Kimi-2.7, GLM-5.2, Deepseek-v4 ก็ไม่มีปัญหาอะไรเลย มันแตะเพดานมาไกลพอสมควรแล้ว และตอนนี้การพัฒนาส่วนใหญ่น่าจะมาจากการปรับปรุงฮาร์เนสให้การให้เหตุผลหรือการเรียกใช้เครื่องมือดีขึ้นเล็กน้อย รวมถึงการทำ reinforcement learning ที่ดีขึ้นอีกนิด
    • ผมลองทดลองกับโมเดลเปิดมามาก แต่เริ่มเหนื่อยกับคำพูดที่ว่า “ก็แค่ตามหลังไม่กี่เดือน”
      ผมยังไม่มั่นใจเลยว่าแม้แต่โมเดลแบบเปิดน้ำหนักที่ดีที่สุดตอนนี้จะเทียบกับ Opus เมื่อไม่กี่เดือนก่อนแล้วได้ ผมรู้ว่า benchmark บอกอะไรไว้และก็เคยคาดหวังสูง แต่ประสบการณ์ใช้งานจริงไม่สอดคล้องกับ benchmark
      ผมทำงานหลายอย่างที่แม้แต่ Opus 4.8 ก็ยังลำบาก ในเมื่อ LLM ระดับล้ำหน้าสุดยังไปไม่ถึงเต็มที่ ก็ไม่มีแรงจูงใจให้ย้ายไปใช้โมเดลที่ยิ่งตามหลังมากกว่าเดิม
    • เหตุผลเดียวที่ผมกำลังอ่านโพสต์นี้บน HN อยู่ตอนนี้ก็เพราะ Anthropic API ล่ม ดังนั้นนี่ก็เป็นอีกหนึ่งคะแนนให้ฝั่งโฮสต์เอง
    • ถ้าจะพูดให้แม่นกว่า “ตามหลังไม่กี่เดือน” เกณฑ์สำคัญอาจเป็นก่อนหรือหลัง Claude Opus 4.5 วันที่ 24 พฤศจิกายน 2025 มากกว่า โมเดลนั้นแหละที่ก่อกระแส OpenClaw ช่วงคริสต์มาส
    • ที่บริษัทเราใช้ผู้ให้บริการ Deepseek V4 flash ซึ่งจัดการงานจริงได้ 95% ด้วยต้นทุนเพียงหนึ่งในสิบ แม้บางครั้งจะเรียกใช้โมเดลที่แรงกว่าบ้าง แต่ก็เป็นหลังจากคิดทบทวนอีกรอบแล้ว
      moat มันแบนมาก แทบจะให้แค่ food +1, production +1 เท่านั้น ถ้ามีถนนก็ได้ gold +1
  • สิ่งที่น่าทึ่งเกี่ยวกับโมเดลพวกนี้คือ มันเหมือนกลั่นอินเทอร์เน็ตทั้งก้อนให้อยู่ในรูปแบบที่ ใส่ลงเครื่องโลคัลได้ และถามด้วยภาษาธรรมชาติได้
    เทคโนโลยีกับฮาร์ดแวร์กำลังพัฒนาเร็วกว่าอัตราการเพิ่มขึ้นของฐานความรู้ที่ต้องกลั่นเสียอีก ดังนั้นการมีโมเดลโลคัลที่ใช้งานได้จริงก็ดูเป็นสิ่งที่เลี่ยงไม่พ้น

  • ท่าทีของบทความนี้ทำให้ผมแปลกใจพอสมควร ด้านหนึ่งมันเริ่มจากเรื่องการยอมรับ Linux และซอฟต์แวร์เสรี/โอเพนซอร์สอื่น ๆ ซึ่งแก่นของ FOSS คือทำให้ผู้ใช้เข้าใจและแก้ไขซอฟต์แวร์ที่ตัวเองรันอยู่ได้
    แต่ส่วนที่เหลือกลับเป็นเรื่องของการใช้ LLM ซึ่งเป็นเครื่องมือที่ผู้เขียนไม่มีทางแก้ไขและไม่มีทางทำความเข้าใจได้ เมทริกซ์เลขทศนิยมลอยตัวขนาดมหึมานั้น ต่อให้มองในแง่ดีก็ยังเทียบได้แค่กับโค้ดที่คอมไพล์แล้ว และในความเป็นจริง บางครั้งการ decompile ซอฟต์แวร์ปิดเพื่อทำความเข้าใจยังง่ายกว่าเสียอีก
    แถมในกรณีส่วนใหญ่ ต่อให้จะรันโมเดล “เปิด” ก็ยังต้องใช้ฮาร์ดแวร์ที่แบกรับไม่ไหวอยู่ดี ผมไม่เข้าใจจริง ๆ ว่าจากพื้นที่ที่เคยสรรเสริญเสรีภาพของซอฟต์แวร์ เรามาถึงจุดนี้กันได้อย่างไร

  • ชื่อเรื่องพูดอย่างฟันธง แต่ในเนื้อหากลับเขียนว่า “หวังว่าจะทำให้เหลือน้อยที่สุด”
    ผมใช้หลาย subscription ทดลองผู้ให้บริการ LLM หลายรายผ่าน OpenRouter แบบคิดตามโทเค็น และก็รันโมเดลแบบเปิดน้ำหนักในเครื่องโลคัลด้วย
    ตอนนี้ผมยังเห็นด้วยได้ยาก โมเดลของ Anthropic และ OpenAI ดีกว่าตัวอื่นอย่างชัดเจนจริง ๆ โมเดลแบบเปิดน้ำหนักโดยรวมดูเหมือนจะ ปรับจูนเพื่อ benchmark มากเกินไป และประสบการณ์จริงต่างจากสิ่งที่ benchmark ชวนให้คิดมาก
    เวลาพูดถึงประสบการณ์แบบนี้ก็มักโดน downvote เพราะมันไม่ใช่ความจริงที่คนอยากได้ยินตอนนี้ แต่สำหรับงานซับซ้อน มันเป็นแบบนั้นจริง
    ผมคิดว่าถ้าผู้ใช้มีความชำนาญ งานง่าย ๆ จำนวนมากก็ให้โมเดลแบบเปิดน้ำหนักจัดการได้สบาย ถ้าเป็นงานระดับที่มีคนคอยกำกับนิดหน่อยแล้วมอบให้ junior ทำได้ ไม่ว่าโมเดลไหนก็น่าจะไหว
    แต่ในงานหลายอย่างที่ผมทำ แม้แต่ Opus 4.8 Max ก็ยังต้องคอยจับตาอย่างต่อเนื่อง ต้องช่วยกำหนดทิศทาง และต้องตรวจทาน Fable ก็คล้ายกันแต่เบากว่า
    พอลองใช้โมเดลแบบเปิดน้ำหนักขนาดใหญ่ ในเครื่องโลคัลก็มักไม่ได้ความเร็วที่สมเหตุสมผลด้วยระดับ quantization ที่พอทนได้ เลยต้องไปใช้แบบโฮสต์แทน แต่สำหรับงานใหญ่ ๆ ก็ยิ่งรู้สึกว่าต้องเผาเวลาไปกับการรอผลลัพธ์ที่สุดท้ายอาจต้องทิ้ง พร้อมกับเผาโทเค็นไปด้วย อยากให้มันถึงระดับนั้นแล้ว แต่ตอนนี้ยังไม่ใช่

    • มีตัวอย่างไหม?
  • Claude เริ่มใช้งานด้านเขียนโค้ดได้จริงตั้งแต่ไปถึง 4.6 หลังจากนั้นก็ยังมีฟีเจอร์เสริมที่มีก็ดี แต่ถ้า 4.6 Sonnet กับ Opus เป็นแบบเปิดน้ำหนัก ผมคงไม่ต้องการอะไรเพิ่มแล้ว
    พอได้ลองใช้ Fable บ้าง ความคิดนี้ก็ยิ่งชัดขึ้น

  • ผมอยากคุ้นเคยกับการทำ local inference มากขึ้น แต่ไม่มีฮาร์ดแวร์ เลยทำให้นึกถึงอะไรอย่าง สหกรณ์โลคัล ซึ่งแทบไม่เห็นมีใครพูดถึง
    ถ้ามองเรื่องความคุ้มค่า การที่หลายคนรวมกันเพื่อใช้ฮาร์ดแวร์ดี ๆ และรันโมเดลเปิดก็ดูอาจมีเหตุผลอยู่บ้าง แต่ผมไม่เคยเห็นใครพูดถึงเรื่องนี้เลย เลยสงสัยว่าตัวเองพลาดอะไรไปหรือเปล่า
    ถ้ามีบริการที่ช่วยให้คนที่อยากเข้าร่วมแนวทางแบบนี้หาเจอกันได้ ก็น่าจะเจ๋งไม่น้อย

    • ที่ไม่ค่อยเห็นแนวคิดนี้ก็เพราะคนส่วนใหญ่คำนวณดูแล้ว พบว่ามันไม่คุ้ม เลยเลิกกันไป
      ตอนนี้บน /r/localllama ก็มีโพสต์เรื่องการคำนวณแบบนี้ปักอยู่ด้านบนพอดี: https://www.reddit.com/r/LocalLLaMA/comments/1ubrcwj/tokenom...
      สรุปคือการรัน GLM 5.2 ต้องใช้เงินอย่างน้อยราว 20,000 ดอลลาร์ และยังจะช้าจนน่าทรมานเมื่อเทียบกับเวอร์ชันโฮสต์บนคลาวด์ แม้จะสมมติว่าเซิร์ฟเวอร์คำนวณโทเค็นตลอด 24 ชั่วโมง ก็ยังต้องใช้เวลาหลายปีกว่าจะคุ้มทุน
      เหตุผลเดียวที่จะรันแบบโลคัลก็คือกรณีที่ความเป็นส่วนตัวของข้อมูลแบบสมบูรณ์คือสิ่งสำคัญสูงสุดเท่านั้น ซึ่งก็เท่ากับยอมจ่ายพรีเมียมสูงเพื่อสิ่งนั้น
    • มีหลายที่ที่ให้บริการโมเดลเปิดในราคาถูกมาก โดยทั่วไปผมแนะนำให้ดู OpenRouter ซึ่งติดตามตัวชี้วัดหลายแบบจากผู้ให้บริการหลายราย
    • https://news.ycombinator.com/item?id=48524387
    • โมเดลเปิดที่โฮสต์อยู่บนคลาวด์???
  • ก็จริง แต่ OpenAI ก็ราคาเท่ากัน ทำไมต้องจ่าย z.ai เดือนละ 18 ดอลลาร์ ในเมื่อ OpenAI เดือนละ 20 ดอลลาร์?

    • ข้อได้เปรียบใหญ่ข้อหนึ่งที่ผมเห็นคือ คนเรามักผูกพันกับโมเดล ผมเองก็เป็นแบบนั้น ถ้าเป็นโมเดลเปิด คุณสามารถหาโมเดลที่เหมาะกับตัวเองอย่างสมบูรณ์แบบได้ แล้วถ้าเวอร์ชันถัดไปไม่ดี คุณก็ยังรันเวอร์ชันเก่าได้ตลอดไป ไม่ว่าจะทำเองหรือให้คนอื่นทำแทนก็ได้
    • เหตุผลหนึ่งอาจเป็นเรื่อง ขีดจำกัดคำขอ OpenAI ChatGPT Plus w/Codex (20 ดอลลาร์/เดือน) ในกรณีแย่ที่สุดมีขีดจำกัดคำขอ 5 ชั่วโมงคือ GPT-5.5 15 ครั้ง, GPT-5.4 20 ครั้ง, GPT-5.4-Mini 60 ครั้ง
      ขณะที่ Z.ai Lite (18 ดอลลาร์/เดือน) ให้ได้ราว 80 ครั้งสำหรับ GLM 5.2 ในกรณีแย่ที่สุด โดยอิงช่วง off-peak และช่วง peak คือเวลา 02:00–06:00 น. ตามเวลานิวยอร์ก ดังนั้น Z.ai จึงอาจให้ลิมิตสูงกว่าในราคาที่ถูกกว่า
      (https://codeberg.org/mutablecc/calculate-ai-cost/src/branch/...)
    • https://news.ycombinator.com/item?id=48618455
    • OpenCode Go ราคา 10 ดอลลาร์/เดือน และลิมิตก็ใจกว้างกว่าพวกนั้นหรือ Codex มาก
    • ดูเหมือนว่าจะไม่ได้ระบุไว้ในหน้าราคาแล้ว แต่แผนโค้ดดิ้งของ z.ai เคยอ้างว่าใช้งานได้ 3 เท่า ของแผน Claude ที่อยู่ในช่วงราคาเดียวกัน ผมไม่แน่ใจว่าถูกต้องแค่ไหน แต่ดูจากราคา API อย่างเดียว GLM ก็ถูกกว่ามากอยู่แล้ว
  • ในยุคที่ Linux มีความสามารถชัดเจนแต่ยังต้องอาศัยการแฮ็กและความพยายามเพิ่มเพื่อขัดเกลาให้ใช้งานสะดวก มันเคยเป็นเรื่องง่ายที่จะใช้ Linux แบบคนหัวขบถ
    แต่จากประสบการณ์ของผม โมเดลเปิดยัง ไปไม่ถึงจุดนั้น ทั้งในแง่ความสามารถหรือข้อกำหนดด้านการรัน แม้ GLM5.2 จะดูมีความสามารถ แต่ถ้าจะรันให้เก่งระดับนั้นก็น่าจะต้องใช้ GPU cluster ขนาดมหึมา
    ถ้าคุณจะเข้าถึงโมเดลเปิดผ่าน hosting API มันก็แทบไม่ต่างจากการใช้โมเดลปิดผ่าน hosting API เลย เมื่อเทียบกับตอนใช้ Linux เมื่อ 15 ปีก่อน แรงจูงใจแบบนั้นก็พังทลายไป
    อย่าเข้าใจผมผิดนะ ผมอยากรันโมเดลโลคัลแล้วพอใจกับมันได้ แต่ตอนนี้ยังไม่ใช่เวลา

    • ข้อความที่ว่า “ถ้าคุณจะเข้าถึงโมเดลเปิดผ่าน hosting API มันก็เหมือนใช้โมเดลปิดผ่าน hosting API” นั้นไม่จริง
      ประเด็นสำคัญคือไม่มีผู้เล่นรายเดียวควบคุม จึงไม่สามารถถูก enshittification ได้ มันเคยเกิดขึ้นแล้ว กำลังเกิดขึ้นอยู่ และจะเกิดขึ้นต่อไป
      ถ้าเป็น open weights ก็จะไม่ถูกลากไปง่าย ๆ ไม่ถูกล็อกอิน ไม่ถูกปิดกั้นการเข้าถึง แม้บริษัทหนึ่งจะพยายามทำแบบนั้น ก็ยังมีคนอื่นที่มี server farm รับคุณเป็นลูกค้าได้ และสิ่งที่ต้องเปลี่ยนใน workflow ก็มีแค่ API URL กับคีย์เท่านั้น
      คุณก็ยังได้คุยกับโมเดลเดิมตัวเดิม ที่มีลักษณะนิสัยและองค์ความรู้แบบเดิม
  • ผมเห็นด้วยกับทิศทางใหญ่ ๆ ของบทความอยู่บ้าง แต่มีอยู่สองข้อ
    อย่างแรก จากการทดสอบของผม โมเดลเปิดยังไม่ถึงระดับที่จะสู้กับ Claude Opus ได้ อย่างน้อยในงานพัฒนาซอฟต์แวร์ วิศวกรรม และงานใกล้เคียง
    อย่างที่สอง ก็ต้องสนุกกับมันตราบเท่าที่ยังทำได้ ผมจะประหลาดใจมากถ้าภายในปลายปีนี้ โมเดลเปิดพวกนี้ยังไม่ถูกประกาศว่า “ผิดกฎหมาย” โดยอ้างเหตุผลเรื่องความปลอดภัย ที่ผมเรียกว่าข้ออ้างก็เพราะแรงผลักดันหลักน่าจะมาจากการยึดกุมกฎระเบียบและลัทธิปกป้องอุตสาหกรรม

    • ถ้าสหรัฐฯ แบนโมเดล ก็มีแต่จะทำให้ รัฐคู่แข่ง อย่างจีนแข็งแกร่งขึ้น