1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ขณะที่ ราคา API ของ frontier lab ในสหรัฐฯ ปรับขึ้นอย่างต่อเนื่อง การผสมผสานระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลโอเพนซอร์สอย่าง DeepSeek กำลังกลายเป็น ทางเลือกที่คุ้มค่ากว่า
  • โมเดล frontier รุ่นล่าสุดอย่าง GPT-5.5, Gemini 3.5 Flash และ Opus-4.7 ได้มีการ ขึ้นราคา 2~3 เท่า หรือเพิ่มปริมาณการใช้โทเค็น
  • เมื่อเทียบตามเกณฑ์ blended token พบว่า Anthropic·OpenAI อยู่ที่ราว $2.80/M ขณะที่ DeepSeek อยู่ที่ $0.094/M ซึ่งต่างกันประมาณ 30 เท่า
  • แม้โมเดล frontier จะทรงพลังกว่า แต่สำหรับ งานเขียนโค้ด โมเดล OSS ก็มีคุณภาพดีเพียงพอแล้ว และเมื่อจับคู่กับวิศวกรที่มีความสามารถก็สามารถชดเชยช่องว่างนั้นได้
  • เหตุผลที่การขึ้นราคาไม่อาจดำเนินต่อไปได้ไม่สิ้นสุด คือ การจับคู่ระหว่างเอาต์ซอร์ส+LocalAI จะทำหน้าที่เป็นเพดานราคา

แนวโน้มต้นทุน inference ที่เพิ่มขึ้นของ frontier lab

  • ตรงกันข้ามกับความเชื่อทั่วไปที่ว่าต้นทุน inference กำลังลดลง ราคาของ frontier lab ในสหรัฐฯ กำลังอยู่ใน แนวโน้มขาขึ้นอย่างชัดเจน
  • การเปิดตัว GPT-5.5 ($5/$30) เกิดขึ้นเพียง 2 เดือนหลังการเปิดตัว GPT-5.4 และทำให้ ราคา API โดยรวมเพิ่มขึ้น 2 เท่า
    • เทียบกับ GPT-5 ($1.25/$10) เมื่อ 8 เดือนก่อน ก็ แพงขึ้นมากกว่า 3 เท่า
  • Gemini 3.5 Flash ($1.50/$9.00) มีราคา เพิ่มขึ้น 3 เท่า จากรุ่นก่อนหน้า Gemini-3-flash-preview ($0.50/$3.00)
    • และ Gemini-3-flash-preview เองก็มีราคาสูงกว่า 2.5 Flash ($0.30/$2.50) อยู่แล้ว
  • Anthropic Opus-4.7 ใช้ tokenizer ใหม่ ทำให้ การใช้โทเค็นเพิ่มขึ้น 32~47% ส่งผลให้ต้นทุนจริงสูงขึ้นเมื่อเทียบกับ Opus-4.6 รุ่นก่อนหน้า

เปรียบเทียบโมเดลปิดแบบ frontier กับโมเดลโอเพนซอร์ส

  • เปรียบเทียบโดยอิง อัตราการใช้ blended token: สมมติให้ต่อโทเค็น input(+cache) 1M มี output 50k โทเค็น (ต่ำกว่าประมาณ 5%)
    • agent loop ขนาดใหญ่มีจำนวนเทิร์นมากและมีสัดส่วนการอ่านสูง จึงเป็นการประเมินแบบอนุรักษ์นิยม
  • เปรียบเทียบราคา blended เฉลี่ยหลังสะท้อนการทำ cache ของแต่ละผู้ให้บริการ (ที่มา: openrouter.ai)
  • เปรียบเทียบราคาตามผู้ให้บริการ

    • Anthropic: input $1.57 / output $25.00 / อัตรา cache hit 79.6% → blended $2.82
    • OpenAI: input $1.30 / output $30.22 / อัตรา cache hit 84.8% → blended $2.80
    • DeepSeek: input $0.055 / output $0.870 / อัตรา cache hit 88.1% → blended $0.094
  • ปัจจุบันโมเดลปิดแบบ frontier ยังทรงพลังกว่าโมเดลล่าสุดของ DeepSeek แต่ก็ยังน่าสงสัยว่าช่องว่างนั้นมากพอจะอธิบาย ส่วนต่างราคาที่สูงถึง 30 เท่า หรือไม่
  • OSS LLM ไม่จำเป็นต้องไปถึงระดับ frontier ขอเพียงมี ประสิทธิภาพเพียงพอสำหรับงานเขียนโค้ด ก็เพียงพอ ซึ่งตอนนี้ก็มาถึงระดับนั้นแล้ว

แนวโน้มการใช้โทเค็นที่เพิ่มขึ้น

  • เทรนด์ tokenmaxxing กำลังเร่งตัวขึ้นในช่วงหลายเดือนและหลายปีที่ผ่านมา (อ้างอิงบล็อก Pragmatic Engineer)
  • ในหมู่วิศวกรฝีมือดีมีความเห็นร่วมกันว่า การตั้ง tokenmaxxing เป็นเป้าหมายเป็นเรื่องไม่ฉลาด แม้จะเป็นอีกประเด็นหนึ่งต่างหาก
  • การเพิ่มขึ้นอย่างมากของปริมาณการใช้โทเค็นยังสะท้อนผ่าน ภาวะขาดแคลน GPU อย่างต่อเนื่อง
  • การใช้โทเค็นที่เพิ่มขึ้นและการขึ้นราคาต่อโทเค็นกำลังเกิดขึ้นพร้อมกัน และเชื่อมโยงกับกลยุทธ์การจับมูลค่าของ frontier lab ในสหรัฐฯ

(มนุษย์ + LLM ระดับเกือบ frontier) vs frontier LLM

  • มี บทวิเคราะห์แยกต่างหากที่เปรียบเทียบวิศวกรมนุษย์กับ AI agent ใน 12 มิติ (signalbloom.ai)
  • ข้อสรุปคือ AI agent ได้ แซงหน้ามนุษย์ในงานเขียนโค้ดไปแล้ว และมีแนวโน้มจะแซงในงานดีบักที่มีขอบเขตจำกัดในไม่ช้า
  • อย่างไรก็ตาม ความสามารถหลักอื่น ๆ ที่จำเป็นต่อการทำวิศวกรรมที่ดี AI ยังตามหลังอยู่มาก
    • ความจำระยะยาว (long-term memory)
    • เมตาความจำ (Meta memory): ความสามารถในการแยกแยะอย่างชัดเจนว่าตนเองรู้อะไรและไม่รู้อะไร
    • การประเมินความเพียงพอของหลักฐาน (Evidential Sufficiency Assessment): การตัดสินว่ามีหลักฐานเพียงพอสำหรับการลงมือทำหรือไม่
  • สถาปัตยกรรมเชิงสถิติในปัจจุบันจำเป็นต้องได้รับการเสริมหรือถูกแทนที่ด้วยแนวทางทะลุข้อจำกัดแบบอื่น
  • ความสามารถในการจัดการงานกับความเป็นอิสระของ AI ไม่ใช่เรื่องเดียวกัน

สถานการณ์จุดตัดด้านต้นทุน

  • การเปรียบเทียบหลัก

    • วิเคราะห์ช่วงเวลาที่การจับคู่ระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลที่มีความสามารถเพียงพอ จะมี ความคุ้มค่าต่อราคาสูงกว่า โมเดล frontier ระดับบนสุด
    • ตัวแปร: เงินเดือนวิศวกร, อัตราการเติบโตของเงินเดือน, ปริมาณโทเค็นเริ่มต้น, อัตราการเพิ่มของโทเค็น, ราคา frontier, อัตราการเปลี่ยนแปลงราคาของ frontier, ราคา DeepSeek, ระยะเวลา
  • ผลลัพธ์

    • เกิด จุดตัดที่เดือนที่ 11 โดยต้นทุน inference ของ frontier สูงเกินต้นทุนของชุดวิศวกร+DeepSeek ($1,116.61/เดือน)

ความเห็นและข้อจำกัด

  • กราฟมีสมมติฐานแบบลดทอนความซับซ้อนอยู่
    • ตัวแปรอย่างราคา inference ในอนาคต แนวโน้มการใช้โทเค็น เป็นต้น
    • reflexivity: ผู้เล่นในตลาดเปลี่ยนพฤติกรรมตามสิ่งที่สังเกตเห็น
  • ปัจจัยต่อไปนี้ยังไม่ถูกนำมารวม และหากรวมแล้วจะยิ่งเป็นผลดีต่อโมเดลโลคัลมากขึ้น
    • ความเร็วในการพัฒนาประสิทธิภาพของโมเดลโลคัล ที่สูงมาก
    • ฮาร์ดแวร์ inference เพิ่มเติมที่จะถูก投入ในช่วงหลายเดือนและหลายปีข้างหน้า
  • ประเด็นหลักคือ เมื่อต้นทุน AI สูงขึ้นเกินระดับหนึ่ง มันจะกลายเป็น การเผาเงินสดที่น่ากังวลสำหรับองค์กร และกินสัดส่วนใหญ่ของรายจ่ายทั้งหมด
  • ด้วยเหตุนี้จึงเกิด เพดานต่อขนาดและความเร็วของการขึ้นราคาจาก frontier lab

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความคิดเห็นจาก Hacker News
  • เวลาพูดถึงราคา LLM หลายคนกำลังพลาดประเด็นสำคัญไป ราคาโทเค็นแบบสมัครสมาชิกถูกกว่าราคา API ถึง 10~40 เท่า ดังนั้นการสมัคร Claude เดือนละ $90 เมื่อลองคิดเป็นราคาโทเค็นแบบ API แล้วจะเทียบได้กับประมาณ $1000~$4000
    ประการที่สอง ฝีมือของ “ผู้ปฏิบัติการ” ที่ใช้งานโมเดลสร้างความต่างกับผลลัพธ์อย่างมหาศาล นักพัฒนารุ่นพี่ที่มีทักษะสูง ใช้พรอมป์ตเก่ง และมีความเป็นเจ้าของงานสูง จะให้ผลลัพธ์ดีกว่าสมาชิกทีมที่ขาดแรงจูงใจและพื้นฐานความสามารถอย่างมาก
    สุดท้าย ระหว่างโมเดลล้ำสมัยระดับ 5T อย่าง Opus กับโมเดล distilled ขนาดเล็กของ DeepSeek ที่ดูเด่นแค่บน benchmark นั้น มีความต่างกันมากในด้านความสามารถ ความแน่นอนของผลลัพธ์ และการจัดการข้อผิดพลาด

    • เพิ่งรู้วันนี้ว่าแพลน Anthropic Enterprise ที่บริษัทใหญ่ใช้เพราะฟีเจอร์ด้าน governance และ audit log นั้น คิดค่าบริการโดยบวกเพิ่มเดือนละ $20 ต่อที่นั่งจากอัตราค่าโทเค็น API
      เพราะแบบนี้บริษัทใหญ่จึงต้องจ่ายมากกว่าแพลนสมัครสมาชิกที่มีส่วนลดอยู่มาก
    • อยากรู้ว่ามีหลักฐานอะไรที่บอกว่า Opus เป็น โมเดล 5T
      และดูเหมือนจะเข้าใจผิดเรื่องที่ว่าโมเดลโลคัลนั้น “ถูก distilled มาจาก DeepSeek” โมเดลโลคัลก็ไม่ได้เด่นแค่ใน benchmark อย่างเดียว และ Qwen 3.6 ก็เป็นโมเดลที่ค่อนข้างดี แน่นอนว่าไม่ใช่ Opus แต่เร็วกว่าเยอะ และความเร็วเองก็เป็นคุณภาพอย่างหนึ่ง
    • โมเดลที่ไม่ใช่ระดับล้ำสมัยที่สุดก็ยังพัฒนาต่อเนื่องอยู่ ถ้ามีใครทำงาน 90% ให้เสร็จด้วย DeepSeek ในราคา $100 แล้วใช้ Anthropic หรือ OpenAI อีก $100 เพื่อเก็บงานส่วนที่เหลือให้จบ ก็มีโอกาสสูงที่เขาจะเลือกทางนั้นมากกว่าจ่าย $1000 ให้ Anthropic หรือ OpenAI
    • การที่ราคาโทเค็นแบบสมัครสมาชิกถูกกว่า API 10~40 เท่านั้นเป็น ปรากฏการณ์ชั่วคราว ภายในไม่กี่เดือนข้างหน้า ควรคาดว่าจะมีการขึ้นราคาครั้งใหญ่ หรือจำกัดการใช้งานอย่างเข้มงวด หรือทั้งสองอย่าง
      บริษัทเหล่านี้กำลังขาดทุนมหาศาล และมีหนี้กับภาระผูกพันระดับหลายแสนล้านดอลลาร์ อีกไม่นานก็ต้องเปิดก๊อกการหารายได้
    • ทั้งที่รู้ว่าการสมัคร Claude เดือนละ $90 เทียบได้กับการใช้ API มูลค่า $1000~$4000 แต่ยังคิดอีกหรือว่าการมองว่าโครงสร้างนี้ ไม่ยั่งยืน เป็นเรื่องไร้เหตุผล?
  • นี่เหมือนมองเห็นแต่ต้นไม้จนมองไม่เห็นทั้งป่า การทำงานกับ ChatGPT ให้ความรู้สึกคล้ายอย่างน่าขนลุกกับการทำงานร่วมกับ นักพัฒนาออฟชอร์จากอินเดีย ในยุค enterprise สมัยก่อน ถ้าบอกชัดเจนก็ทำงานได้มีประสิทธิภาพ แต่ถ้าปล่อยให้จัดการเองจะมีโมเมนต์ชวนอุทานว่า WTF บ่อยมาก
    LLM มีแนวโน้มสูงที่จะเข้ามาแทนนักพัฒนาเอาต์ซอร์ส เพราะพนักงานภายในที่เข้าใจบริบทสามารถใช้ LLM ทำงานที่เมื่อก่อนนักพัฒนาออฟชอร์ทำได้

    • แล้วในโมเมนต์ WTF เหล่านั้น มีสักกี่ครั้งที่เป็นเพียงเพราะ “เขาไม่ได้อยู่ในห้องตอนที่ตัดสินใจเรื่องนั้น”? ซอฟต์แวร์องค์กรส่วนใหญ่เต็มไปด้วยโมเมนต์ชวน WTF ที่เกิดจากข้อประนีประนอมสารพัดในข้อกำหนดอยู่แล้ว
    • นอกประเทศของคุณก็มีนักพัฒนาที่มีความสามารถ ใช้ภาษาได้ดีพอ และยอมรับค่าตอบแทนที่ต่ำกว่าอยู่เหมือนกัน และก็มีเหตุผลมากพอที่จำนวนนักพัฒนาแบบนั้นจะเพิ่มขึ้นเรื่อย ๆ
    • ถ้าดูจำนวน ทีมเอาต์ซอร์ส ที่ไปขอรับงานบน LinkedIn ก็ยิ่งเห็นได้ชัดว่าใช่เลย
    • พวก “นักพัฒนาออฟชอร์จากอินเดีย” ก็ไม่ใช่คนที่จะถูกมองข้ามได้ง่าย ๆ พวกเขาเองก็เข้าถึงโมเดล GPT แบบเดียวกันได้ และต้นทุนอาจอยู่ที่แค่ 1 ใน 10 ของเงินเดือนมัธยฐานในสหรัฐฯ
      บริษัทจะพยายามลดต้นทุนส่วนเพิ่มอยู่เสมอ โดยจะจ้าง software architect 1 คนในสหรัฐฯ ให้เขียนสเปก แล้วจ้างนักพัฒนาชาวอินเดีย 10 คนให้คอยดูแลเอเจนต์ 100 ตัว
  • ต่างจากนักพัฒนาระยะไกล ปัญหาของ การเอาต์ซอร์ซ คือ ถ้าจะให้มันเดินได้ดีจริง ๆ ต้องมีผู้จัดการและผู้นำทางเทคนิคที่เก่งมาก
    จากประสบการณ์ ถ้าจะให้ได้ผลลัพธ์ที่มีประสิทธิภาพ ต้องเขียนเอกสารออกแบบและสเปกงานที่ละเอียดมาก ปกติต้องละเอียดพอ ๆ กับพรอมป์ต์ที่ดี
    ถ้าเขียนสเปกละเอียดขนาดนั้นไปแล้ว แล้วจะต้องมีนักพัฒนาเอาต์ซอร์ซกับโมเดลล้ำสมัยไปทำไม?

    • สิ่งที่น่าสนใจคือ ปัญหาของการเอาต์ซอร์ซก็เหมือนกับปัญหาของ AI และทั้งหมดนี้ชวนให้นึกถึงช่วงต้นยุค 2000 บริษัทต่าง ๆ ตื่นเต้นกับการประหยัดเงินได้มากแค่ไหน โดยไม่ตระหนักถึงความเสียหายที่เกิดกับตัวผลิตภัณฑ์
      บริษัทที่มีผู้นำผลิตภัณฑ์/โครงการที่แข็งแกร่งและกำกับอย่างละเอียดมาก อาจสร้างนักพัฒนารุ่นใหม่ขึ้นมาได้ แต่บางบริษัทจะเชื่อคำโฆษณาการขาย แล้วล้มเหลวเมื่อซอฟต์แวร์กลายเป็นสิ่งที่บำรุงรักษาต่อไม่ได้
      อีก 10 ปีข้างหน้า ผมคิดว่าจำนวนนักพัฒนาก็น่าจะยังใกล้เคียงกับตอนนี้ แต่จะสร้างผลิตภัณฑ์ได้มากขึ้น AI จะถูกใช้กับการทำงานอัตโนมัติในขอบเขตที่แยกชัดและมีความหมาย แต่การพัฒนาซอฟต์แวร์ส่วนใหญ่จะเกิดขึ้นใน ระดับนามธรรมที่สูงขึ้น ซึ่งเป็นการแสดงแนวคิดเดิมด้วยขยะข้อความที่น้อยลง
      แก่นของโค้ดจะยิ่งมุ่งไปที่การเข้ารหัสและเผยให้เห็นความซับซ้อนของกรณีขอบเขตแปลก ๆ อย่างเป็นรูปธรรม
      ตอนที่ผมเริ่มพัฒนาซอฟต์แวร์ครั้งแรก ผมเคยทำงานกับ MUD ที่เละเทะมากและถูกส่งต่อผ่านมือมาหลายคน จินตนาการยากจริง ๆ ว่าใครจะเต็มใจขุดคุ้ยก้อนโคลนและสปาเกตตีโค้ดที่ AI สร้างขึ้นโดยไม่มีการกำกับและแก้ไขอย่างเข้มงวด
      แก่นของการพัฒนาซอฟต์แวร์คือการแก้ปัญหาเสมอ หรือให้แม่นยำกว่านั้นคือ การระบุปัญหา เมื่อเวลาผ่านไป เราค่อย ๆ ตัดสิ่งจุกจิกออกเพื่อไปโฟกัสที่จุดนั้นมากขึ้น แนวโน้มนี้จะดำเนินต่อไป และจะพัฒนาไปสู่ภาษาที่กระชับและเป็นนามธรรมมากขึ้นสำหรับการระบุปัญหา ขณะที่ตรรกะการไหลที่ยุ่งยาก ส่วนของไดรเวอร์ และคณิตศาสตร์ จะถูกแยกไปอยู่ในไลบรารีและเครื่องมือมากขึ้น
    • โมเดลธุรกิจทั้งหมดของนักพัฒนาเอาต์ซอร์ซหรือบริษัทเอาต์ซอร์ซคือการคิดเงินคนอื่นเกินจริง พวกเขาบอกว่า “มีวิศวกร 4 คนลงในโปรเจกต์นี้” แต่ทั้ง 4 คนนั้นก็กำลังทำอีก 5 โปรเจกต์อยู่ด้วย
      ต่อให้วิศวกรให้ความร่วมมือ ผู้จัดการหรือเจ้าของธุรกิจก็มักไม่อยากให้ทำงานร่วมกันอย่างใกล้ชิด และบังคับให้ทำงานแบบรักษาระยะห่าง เช่น คุยกันสัปดาห์ละครั้ง
      ผมเคยเจอกับตัว ครั้งหนึ่งเคยใช้งบ £300k กับทีมพัฒนาเอาต์ซอร์ซ โชคดีที่ไม่ใช่เงินผมเอง และสุดท้ายก็ไม่ได้รับมอบอะไรเลย เวลาส่วนใหญ่หมดไปกับการพยายามทำให้ทิศทางงานตรงกัน
      ผมกับพาร์ตเนอร์พอจะรู้ว่าเราอยากได้อะไร และพยายามซิงก์กันให้บ่อยขึ้นเพื่อปรับความพยายามให้ตรงกัน แต่ผู้จัดการฝั่งนั้นคอยขัดขวางตลอด นี่แหละคือ โมเดลธุรกิจแบบที่ปรึกษา
      พนักงานประจำที่ทำงานระยะไกลมีแรงจูงใจตรงกันข้าม พวกเขาเป็นพนักงานเต็มเวลาตามตัวอักษร ไม่มีชั้นผู้บริหารที่คอยขัดขวางการสื่อสาร และถ้าไม่ขี้เกียจหรือเป็นมิจฉาชีพ พวกเขาก็น่าจะอยากแก้ปัญหาที่น่าสนใจมากกว่านั่งเฉย ๆ อย่างน่าเบื่อ
    • โดยทั่วไปเอาต์ซอร์ซก็ให้คืนมาตามที่จ่ายไปอย่างแม่นยำ ในบางแง่มุมมันโปร่งใสมากกว่าวิธีอื่นด้วยซ้ำ เพียงแต่ว่าความโปร่งใสนั้น หรือพูดอีกอย่างคือราคาของคุณภาพ บางครั้งไม่ได้ถูกส่งต่อจากผู้บริหารหรือฝ่ายจัดซื้อที่ตัดสินใจ ไปยังทีมที่ต้องทำงานแบบกระจายจริง ๆ
      ผมคิดว่านั่นก็เป็นจุดที่สมมติฐานของต้นฉบับคลาดเคลื่อน ความต่างระหว่าง DeepSeek กับโมเดลล้ำสมัยมักไม่ใช่สิ่งที่จะชดเชยได้ด้วยเอาต์ซอร์ซคุณภาพต่ำ สุดท้ายคุณก็ต้องจ่ายให้วิศวกรเอาต์ซอร์ซที่มีทักษะสูงมาก และพวกเขาก็อาจไม่ได้ถูกมากตั้งแต่แรก การเอาต์ซอร์ซเกิดขึ้นไม่ใช่แค่เพราะต้นทุน แต่เพราะ ความสามารถและขีดความจุ ด้วย
    • ผมก็คิดไปทางนี้เหมือนกันเป๊ะ
      คุณต้องระบุทุกอย่างให้ถึงระดับรายละเอียดที่เหมาะสม และพอถึงจุดนั้น LLM ก็น่าจะทำได้ค่อนข้างดีแล้ว นอกจากนี้ทีมเอาต์ซอร์ซหลายทีมยังสร้างของในวิธีที่ต่างจากทีมภายในอย่างสิ้นเชิง และความต่างด้านระดับงานส่งมอบกับความเร็วก็ชัดเจนแบบเด็ดขาด
      ทุกอย่างเปลี่ยนเร็วขนาดนี้ แล้วทำไมผมต้องเอาเวลาและเงินของตัวเองไปใช้ฝึกพนักงานของคนอื่นให้ตามเทรนด์ล่าสุดด้วย ก็เป็นคำถามเหมือนกัน
    • ปัญหาของผมก็คือแค่ ความเป็นเจ้าของที่ไม่พอ ถ้าไม่ใช่บริษัทเอาต์ซอร์ซขนาดเล็กและโฟกัสชัด สำหรับบริษัทแล้วแค่ส่งงานออกไปก็มักง่ายกว่า ไม่ต้องพูดถึงเรื่องคุณภาพหรือการบำรุงรักษาแน่นอน ทั้งนี้ตัวอย่างที่ผมเจอก็มีไม่มากในระดับส่วนตัว
  • ผมมีเพื่อนเป็นผู้บริหารบริษัทซอฟต์แวร์ในสหรัฐฯ กำลังเตรียมปลดโปรแกรมเมอร์หลายทีมในสาขายุโรปตะวันออก แล้วแทนที่ด้วยโปรแกรมเมอร์อเมริกันจำนวนน้อยกับ AI เขาบอกว่าทางนั้นมีประสิทธิภาพกว่ามากและทำฟีเจอร์ใหม่ได้เร็วกว่าเยอะ

    • แบบนี้ฟังดูเป็นไปได้มากกว่า สำหรับผม คอขวดกำลังย้ายจากเรื่อง “การเข้าใจโค้ด” ไปเป็นเรื่อง การเข้าใจผู้ใช้ มากขึ้น การตรวจสอบอย่างหลังไม่จำเป็นต้องให้โปรแกรมเมอร์ทำก็ได้
    • เป็นภาพกลับด้านที่น่าสนใจ
      ถ้าเอาไปเทียบกับภาคการผลิต กลยุทธ์หุ่นยนต์มาก่อนก็ไม่ควรตั้งเป้าแค่ดึงการผลิตกลับประเทศ แต่ควรตั้งให้สูงกว่านั้น คือกลายเป็นปลายทางใหม่ของการผลิตแบบเอาต์ซอร์ซ
    • ต้องใช้เวลาอีกนานแค่ไหนกว่าเขาจะกลับสู่โลกความจริงแล้วไล่เอเจนต์ออกเป็นล็อตใหญ่ :-)
    • บทความนี้พูดเรื่องเอาต์ซอร์ซได้ถูกต้อง แต่ผมไม่คิดว่าสาเหตุจะมาจากผู้รับจ้างออฟชอร์ราคาถูก ผู้เชี่ยวชาญที่เก่งจริงจะทำงานได้อย่างอิสระมากขึ้น และด้วย AI พวกเขาก็จะรองรับลูกค้าได้มากขึ้น
      ดังนั้นธุรกิจขนาดกลางและเล็กอาจไม่จำเป็นต้องมีวิศวกร ฝ่ายการเงิน และฝ่ายการตลาดภายในมากเท่าทุกวันนี้
  • อนาคตของ AI ล้ำสมัยฝั่งอเมริกาไม่ใช่การเรียก API แต่เป็นการเอางานไปให้ OAI/Anthropic เหมือนจ้างที่ปรึกษาหรือผู้รับจ้างภายนอก แล้วรับผลลัพธ์คล้ายผลิตภัณฑ์กลับมาโดยไม่ได้เห็นงานระหว่างทางเป็นจำนวนมาก
    เรื่องนี้เป็นสิ่งที่เลี่ยงไม่ได้จากการผสมกันระหว่าง ภัยคุกคามจากการกลั่นโมเดล กับความพยายามพัฒนาสภาพแวดล้อมการรันแบบปิดเฉพาะที่จำเป็นต่อการดันสมรรถนะล้ำสมัยให้สุด
    OAI/Anthropic จะพยายามแย่งงานของทุกคน 100% และ “ครอบครองแรงงาน” เอง ในเรื่องนี้ฝั่งจีนคือฝ่ายพระเอก

    • ไม่ใช่เลย การโยนโปรเจกต์ข้ามกำแพงไปให้อีกฝ่ายทำแทบจะจบลงด้วยหายนะเสมอ ข้อกำหนดไม่มีวันชัดเจนเพียงพอ
    • หวังว่าวิธีนั้นจะไปได้ดีนะ มันทำให้นึกถึงแรงบันดาลใจของ ภาษาโปรแกรมเชิงประกาศ อย่าง Prolog คือประกาศปัญหาให้เครื่องแก้ แทนที่จะสั่งเครื่องแบบเชิงคำสั่งว่าต้องทำอะไร
      แต่สิ่งที่พวกเขายังไม่ตระหนักคือ การนิยามปัญหานั้นยากกว่าคำตอบเสียอีก
  • ผมพยายามอย่างมากที่จะใช้โมเดลแบบรันในเครื่องให้ได้ ไม่ว่าจะเป็นสภาพแวดล้อมการรัน เครื่องมือ ทักษะ พรอมป์ต์ และอื่น ๆ ก็ลองมาหมดแล้ว
    แต่พอเอา Claude Code กับโมเดลของ Anthropic หรือ Codex กับ GPT 5.5 ไปเทียบกับสภาพแวดล้อมที่รัน Qwen, GLM, Gemma แล้ว โมเดลล้ำสมัยที่สุด เหนือกว่าท่วมท้น ตอนนี้ผมไม่เข้าใจแล้วว่าโมเดลที่ไม่ล้ำสมัยยังมีความหมายอะไร เวลาที่เสียไปมีมากกว่าเวลาที่ประหยัดได้

    • ในงานเขียนโค้ดแบบเอเจนต์ ผมเห็นด้วย 100% เลย สำหรับการเขียนโค้ดขนาดใหญ่ โมเดลรันในเครื่องแย่กว่า ช้ากว่า และแพงกว่า
      ถ้าเป็นงานเขียนโค้ดขอบเขตแคบ เช่น เขียนฟังก์ชันเฉพาะตัวหนึ่ง ก็ยังทำได้แม้จะช้า แต่ถ้าใช้เป็น LLM แชตทั่วไปบนฮาร์ดแวร์ผู้บริโภคระดับสูง ก็ยังพอแข่งขันได้ถ้าไม่นับเรื่องต้นทุน
      https://www.williamangel.net/blog/2026/05/17/offline-llm-ene...
    • โมเดลรันในเครื่องยัง ตามหลังอยู่ 3~6 เดือน เมื่อเทียบกับโมเดลล้ำสมัยล่าสุด แต่มีข้อดีใหญ่มากคือไม่ต้องส่งทรัพย์สินทางปัญญาทั้งหมดไปให้บุคคลที่สามที่น่าสงสัย
      ถ้าต้นทุนการอนุมานลดลงต่อไป เหมือนที่เป็นมาตลอดหลายปีที่ผ่านมา ภายในปลายปีนี้เราน่าจะรันโมเดลล้ำสมัยของวันนี้บนโน้ตบุ๊กได้
    • ผมก็เหมือนกัน เวลาได้ยินคนจู้จี้เรื่องจ่ายหรือเบิกคืนค่าแพ็กเกจ Codex หรือ Claude เดือนละ $200 แล้วรู้สึกอึดอัด
      สำหรับวิศวกรซอฟต์แวร์ มันแทบจะมากพอจนใช้ไม่หมด และถ้าคิดถึงประสิทธิภาพที่เพิ่มขึ้นก็ถือว่าถูกมาก
      ยิ่งไปกว่านั้น Claude/Codex ก็ทำได้ดีอยู่แล้วและดีขึ้นทุกเดือน แล้วใครจะอยากไปนั่งปรับแต่งสภาพแวดล้อมการรันหรือกำหนด agent orchestration กันล่ะ
    • ผมก็มาถึงข้อสรุปเดียวกัน ถ้าคิดต้นทุนต่อหนึ่งคำถาม การใช้ Opus ตลอดเวลาคือทางเลือกที่ถูกที่สุดเสมอ
    • ประเด็นสำคัญคืออย่าผูกมัดตัวเองไว้กับบริษัทที่ผลประโยชน์ไม่ตรงกับของคุณ
  • สถานการณ์ที่เป็นไปได้มากกว่าคือ ส่วนล่างจะหายไป และส่วนบนจะยิ่งมีผลิตภาพมากขึ้นผ่านโมเดลล้ำสมัย
    ยิ่งนักพัฒนาอ่อน ก็ยิ่งต้องการ AI ที่มีความสามารถสูงกว่า สมมติฐานของบทความนี้ใช้ไม่ได้ เพราะมันสับสนระหว่างนักพัฒนาที่อ่อนกับ AI ที่อ่อน ว่าดีกว่านักพัฒนาที่เก่งกับ AI ที่เกือบทำงานเองได้
    ผลิตภัณฑ์ที่นักพัฒนาอ่อนซึ่งใช้ AI ล้ำสมัยสร้างขึ้น ตอนนี้ก็ยังด้อยกว่านักพัฒนาที่มีความสามารถซึ่งใช้ AI ที่อ่อนกว่าเมื่อ 2 ปีก่อน
    พูดให้ชัดกว่านั้น นักพัฒนาที่เก่งสามารถใช้ AI ทำผลิตภัณฑ์คุณภาพสูงได้ตั้งแต่ 2 ปีก่อนแล้ว แม้นักพัฒนาที่อ่อนจะใช้ AI รุ่นล่าสุดก็ยังคงลำบาก แต่สำหรับนักพัฒนาที่เก่ง พวกเขาสามารถมอบหมายงานให้ AI ที่เก่งขึ้นได้มากกว่าเดิมและดันผลิตภาพขึ้นไปอีก

    • นาน ๆ ทีในชีวิตที่ตอนนี้ผมรู้สึกโชคดีมากที่ได้อยู่ในที่ทำงานที่ทำงานร่วมกับวิศวกรซีเนียร์ที่มีความสามารถเป็นส่วนใหญ่
      องค์กรฝันร้ายที่มีผู้รับจ้างไร้การกำกับหรือพนักงานจูเนียร์ที่จ้างเกินความจำเป็น จะยิ่งอันตรายถึงขั้นหนักมากในยุคแบบนี้
  • ผมยังเห็นการเล่าเรื่องที่ยก DeepSeek เป็นตัวอย่างของโอเพนซอร์ส LLM อยู่เรื่อย ๆ แต่พวกเขากำลังอุดหนุนโทเคนจำนวนมหาศาลในราคาทุน ถ้าไม่ขี้เกียจและคิดอย่างวิพากษ์วิจารณ์ ก็เข้าใจได้ไม่ยากว่าทำไมถึงทำแบบนั้น
    โดยเฉพาะในสถานการณ์ที่ฮาร์ดแวร์สำหรับการอนุมานถูกจำกัดอย่างหนักเพราะความเสี่ยงทางภูมิรัฐศาสตร์ การใช้ AI รันในเครื่อง ที่ให้ระดับใกล้เคียงกับโมเดลล้ำสมัยยังแพงและไร้ประสิทธิภาพเกินไป
    ผมยังสงสัยมากด้วยว่าข้ออ้างที่ว่า LLM รันในเครื่องจะคุกคามบริษัทโมเดลล้ำสมัยเหล่านี้ได้ในระยะยาวนั้นจริงแค่ไหน
    เหตุผลที่โทเคนจะแพงขึ้นก็เพราะพวกเขากำลังเริ่มครองตลาด และจะใช้อำนาจนั้นจำกัดการกระจายฮาร์ดแวร์ทั้งในและข้ามพรมแดน
    เป็นไปได้มากว่าในบางเวิร์กโฟลว์ LLM รันในเครื่องจะถูกใช้มากขึ้น แต่จะไม่ใช่งานที่ต้องการระดับโมเดลล้ำสมัย และก็คงยากที่จะสู้ราคาที่โมเดลล้ำสมัยเวอร์ชันเล็กและเบากว่าจะเสนอมาเพื่อเก็บตลาดหางยาว

    • มีแหล่งอ้างอิงสำหรับข้ออ้างแรกไหม?
      จากที่ผมเข้าใจ DeepSeek ออกแบบ v4 มาเพื่อ การอนุมานต้นทุนต่ำ โดยเฉพาะ และดูเหมือนว่าต่อให้ลดราคาลง 75% ก็ยังไม่ขาดทุน
    • ผู้ให้บริการรายอื่นที่เสนอโบนัส DeepSeek บน OpenRouter ก็ยังตั้งราคาต่ำมากได้เหมือนกัน ดังนั้นคำพูดที่ว่ามีการอุดหนุนโทเคนในราคาทุนนั้นผิดทั้งหมด เพราะบริษัทเหล่านั้นไม่มีเงินพอจะอุดหนุนด้วยซ้ำ
    • ผมว่าไม่ใช่นะ เท่าที่ได้ยินมา DeepSeek ไม่ได้ขาดทุนจากการอนุมาน
  • ผมมองว่า ประสบการณ์ด้านคุณภาพ และค่านิยมส่วนตัวสำคัญกว่าต้นทุนวิศวกร ตลอดหลายปีที่ผ่านมา ผมเห็นการลัดขั้นตอนมากเกินไปในงานเอาต์ซอร์ส และ AI ก็ชอบลัดขั้นตอนมากเช่นกัน การเอาสองอย่างนี้มารวมกันไม่ได้มีคุณค่าเท่ากับจำนวนเงินที่ประหยัดได้
    ถ้าคุณให้ความสำคัญกับงานคุณภาพสูงและความภาคภูมิใจในงานของตัวเอง แรงงานเอาต์ซอร์สไม่ใช่คำตอบ เพราะโดยมากแล้วต้นทุนที่ต่ำมาจากการที่พวกเขาไม่ได้ใส่ใจรายละเอียดในงานของตัวเอง
    ในทางกลับกัน ถ้าคุณแค่อยากให้มันเสร็จ ๆ ไปและไม่สนว่ามันทำได้ถูกต้องหรือไม่ ก็คงไม่มีวิธีไหนดีกว่าการจ่ายให้น้อยที่สุดเท่าที่จะทำได้

  • มีจุดหนึ่งที่บทความนี้ไม่ได้พูดถึง วิศวกรที่ดีใช้เวลากับการเขียนโค้ดในโปรเจ็กต์ที่มีอยู่เดิมไม่มากนักเมื่อเทียบกับงานอย่างอื่น วิศวกรที่ดี เข้าใจระบบแบบ end-to-end นักพัฒนาออฟชอร์แย่กว่า Llama3