การผสานกำลังระหว่างแรงงานเอาต์ซอร์ส + LocalAI กำลังจะคุ้มค่ากว่า frontier lab ในไม่ช้า

(signalbloom.ai)

14 คะแนน โดย GN⁺ 2026-05-28 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

ขณะที่ ราคา API ของ frontier lab ในสหรัฐฯ ปรับขึ้นอย่างต่อเนื่อง การผสมผสานระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลโอเพนซอร์สอย่าง DeepSeek กำลังกลายเป็น ทางเลือกที่คุ้มค่ากว่า
โมเดล frontier รุ่นล่าสุดอย่าง GPT-5.5, Gemini 3.5 Flash และ Opus-4.7 ได้มีการ ขึ้นราคา 2~3 เท่า หรือเพิ่มปริมาณการใช้โทเค็น
เมื่อเทียบตามเกณฑ์ blended token พบว่า Anthropic·OpenAI อยู่ที่ราว $2.80/M ขณะที่ DeepSeek อยู่ที่ $0.094/M ซึ่งต่างกันประมาณ 30 เท่า
แม้โมเดล frontier จะทรงพลังกว่า แต่สำหรับ งานเขียนโค้ด โมเดล OSS ก็มีคุณภาพดีเพียงพอแล้ว และเมื่อจับคู่กับวิศวกรที่มีความสามารถก็สามารถชดเชยช่องว่างนั้นได้
เหตุผลที่การขึ้นราคาไม่อาจดำเนินต่อไปได้ไม่สิ้นสุด คือ การจับคู่ระหว่างเอาต์ซอร์ส+LocalAI จะทำหน้าที่เป็นเพดานราคา

แนวโน้มต้นทุน inference ที่เพิ่มขึ้นของ frontier lab

ตรงกันข้ามกับความเชื่อทั่วไปที่ว่าต้นทุน inference กำลังลดลง ราคาของ frontier lab ในสหรัฐฯ กำลังอยู่ใน แนวโน้มขาขึ้นอย่างชัดเจน
การเปิดตัว GPT-5.5 ($5/$30) เกิดขึ้นเพียง 2 เดือนหลังการเปิดตัว GPT-5.4 และทำให้ ราคา API โดยรวมเพิ่มขึ้น 2 เท่า
- เทียบกับ GPT-5 ($1.25/$10) เมื่อ 8 เดือนก่อน ก็ แพงขึ้นมากกว่า 3 เท่า
Gemini 3.5 Flash ($1.50/$9.00) มีราคา เพิ่มขึ้น 3 เท่า จากรุ่นก่อนหน้า Gemini-3-flash-preview ($0.50/$3.00)
- และ Gemini-3-flash-preview เองก็มีราคาสูงกว่า 2.5 Flash ($0.30/$2.50) อยู่แล้ว
Anthropic Opus-4.7 ใช้ tokenizer ใหม่ ทำให้ การใช้โทเค็นเพิ่มขึ้น 32~47% ส่งผลให้ต้นทุนจริงสูงขึ้นเมื่อเทียบกับ Opus-4.6 รุ่นก่อนหน้า

เปรียบเทียบโมเดลปิดแบบ frontier กับโมเดลโอเพนซอร์ส

เปรียบเทียบโดยอิง อัตราการใช้ blended token: สมมติให้ต่อโทเค็น input(+cache) 1M มี output 50k โทเค็น (ต่ำกว่าประมาณ 5%)
- agent loop ขนาดใหญ่มีจำนวนเทิร์นมากและมีสัดส่วนการอ่านสูง จึงเป็นการประเมินแบบอนุรักษ์นิยม
เปรียบเทียบราคา blended เฉลี่ยหลังสะท้อนการทำ cache ของแต่ละผู้ให้บริการ (ที่มา: openrouter.ai)
เปรียบเทียบราคาตามผู้ให้บริการ
- Anthropic: input $1.57 / output $25.00 / อัตรา cache hit 79.6% → blended $2.82
- OpenAI: input $1.30 / output $30.22 / อัตรา cache hit 84.8% → blended $2.80
- DeepSeek: input $0.055 / output $0.870 / อัตรา cache hit 88.1% → blended $0.094
ปัจจุบันโมเดลปิดแบบ frontier ยังทรงพลังกว่าโมเดลล่าสุดของ DeepSeek แต่ก็ยังน่าสงสัยว่าช่องว่างนั้นมากพอจะอธิบาย ส่วนต่างราคาที่สูงถึง 30 เท่า หรือไม่
OSS LLM ไม่จำเป็นต้องไปถึงระดับ frontier ขอเพียงมี ประสิทธิภาพเพียงพอสำหรับงานเขียนโค้ด ก็เพียงพอ ซึ่งตอนนี้ก็มาถึงระดับนั้นแล้ว

แนวโน้มการใช้โทเค็นที่เพิ่มขึ้น

เทรนด์ tokenmaxxing กำลังเร่งตัวขึ้นในช่วงหลายเดือนและหลายปีที่ผ่านมา (อ้างอิงบล็อก Pragmatic Engineer)
ในหมู่วิศวกรฝีมือดีมีความเห็นร่วมกันว่า การตั้ง tokenmaxxing เป็นเป้าหมายเป็นเรื่องไม่ฉลาด แม้จะเป็นอีกประเด็นหนึ่งต่างหาก
การเพิ่มขึ้นอย่างมากของปริมาณการใช้โทเค็นยังสะท้อนผ่าน ภาวะขาดแคลน GPU อย่างต่อเนื่อง
การใช้โทเค็นที่เพิ่มขึ้นและการขึ้นราคาต่อโทเค็นกำลังเกิดขึ้นพร้อมกัน และเชื่อมโยงกับกลยุทธ์การจับมูลค่าของ frontier lab ในสหรัฐฯ

(มนุษย์ + LLM ระดับเกือบ frontier) vs frontier LLM

มี บทวิเคราะห์แยกต่างหากที่เปรียบเทียบวิศวกรมนุษย์กับ AI agent ใน 12 มิติ (signalbloom.ai)
ข้อสรุปคือ AI agent ได้ แซงหน้ามนุษย์ในงานเขียนโค้ดไปแล้ว และมีแนวโน้มจะแซงในงานดีบักที่มีขอบเขตจำกัดในไม่ช้า
อย่างไรก็ตาม ความสามารถหลักอื่น ๆ ที่จำเป็นต่อการทำวิศวกรรมที่ดี AI ยังตามหลังอยู่มาก
- ความจำระยะยาว (long-term memory)
- เมตาความจำ (Meta memory): ความสามารถในการแยกแยะอย่างชัดเจนว่าตนเองรู้อะไรและไม่รู้อะไร
- การประเมินความเพียงพอของหลักฐาน (Evidential Sufficiency Assessment): การตัดสินว่ามีหลักฐานเพียงพอสำหรับการลงมือทำหรือไม่
สถาปัตยกรรมเชิงสถิติในปัจจุบันจำเป็นต้องได้รับการเสริมหรือถูกแทนที่ด้วยแนวทางทะลุข้อจำกัดแบบอื่น
ความสามารถในการจัดการงานกับความเป็นอิสระของ AI ไม่ใช่เรื่องเดียวกัน

สถานการณ์จุดตัดด้านต้นทุน

การเปรียบเทียบหลัก
- วิเคราะห์ช่วงเวลาที่การจับคู่ระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลที่มีความสามารถเพียงพอ จะมี ความคุ้มค่าต่อราคาสูงกว่า โมเดล frontier ระดับบนสุด
- ตัวแปร: เงินเดือนวิศวกร, อัตราการเติบโตของเงินเดือน, ปริมาณโทเค็นเริ่มต้น, อัตราการเพิ่มของโทเค็น, ราคา frontier, อัตราการเปลี่ยนแปลงราคาของ frontier, ราคา DeepSeek, ระยะเวลา
ผลลัพธ์
- เกิด จุดตัดที่เดือนที่ 11 โดยต้นทุน inference ของ frontier สูงเกินต้นทุนของชุดวิศวกร+DeepSeek ($1,116.61/เดือน)

ความเห็นและข้อจำกัด

กราฟมีสมมติฐานแบบลดทอนความซับซ้อนอยู่
- ตัวแปรอย่างราคา inference ในอนาคต แนวโน้มการใช้โทเค็น เป็นต้น
- reflexivity: ผู้เล่นในตลาดเปลี่ยนพฤติกรรมตามสิ่งที่สังเกตเห็น
ปัจจัยต่อไปนี้ยังไม่ถูกนำมารวม และหากรวมแล้วจะยิ่งเป็นผลดีต่อโมเดลโลคัลมากขึ้น
- ความเร็วในการพัฒนาประสิทธิภาพของโมเดลโลคัล ที่สูงมาก
- ฮาร์ดแวร์ inference เพิ่มเติมที่จะถูก投入ในช่วงหลายเดือนและหลายปีข้างหน้า
ประเด็นหลักคือ เมื่อต้นทุน AI สูงขึ้นเกินระดับหนึ่ง มันจะกลายเป็น การเผาเงินสดที่น่ากังวลสำหรับองค์กร และกินสัดส่วนใหญ่ของรายจ่ายทั้งหมด
ด้วยเหตุนี้จึงเกิด เพดานต่อขนาดและความเร็วของการขึ้นราคาจาก frontier lab

2 ความคิดเห็น

hmmhmmhm 29 일 전

งานเขียนโค้ดน่าจะพอไหวถ้าใช้ Qwen 3.6 35B A3B และงานรีเสิร์ชใช้ Gemma 26B A4B แต่ก็อยากให้มีอุปกรณ์ on-device ราคาถูกออกมาเพิ่มอีกหน่อยครับ เพราะต้องระดับ Apple M4 Pro ขึ้นไป หรือ RTX 5070 Ti 16GB ขึ้นไป ถึงจะพอรันได้แบบเฉียด ๆ....

GN⁺ 2026-05-28

ความคิดเห็นจาก Hacker News

เวลาพูดถึงราคา LLM หลายคนกำลังพลาดประเด็นสำคัญไป ราคาโทเค็นแบบสมัครสมาชิกถูกกว่าราคา API ถึง 10~40 เท่า ดังนั้นการสมัคร Claude เดือนละ $90 เมื่อลองคิดเป็นราคาโทเค็นแบบ API แล้วจะเทียบได้กับประมาณ $1000~$4000
ประการที่สอง ฝีมือของ “ผู้ปฏิบัติการ” ที่ใช้งานโมเดลสร้างความต่างกับผลลัพธ์อย่างมหาศาล นักพัฒนารุ่นพี่ที่มีทักษะสูง ใช้พรอมป์ตเก่ง และมีความเป็นเจ้าของงานสูง จะให้ผลลัพธ์ดีกว่าสมาชิกทีมที่ขาดแรงจูงใจและพื้นฐานความสามารถอย่างมาก
สุดท้าย ระหว่างโมเดลล้ำสมัยระดับ 5T อย่าง Opus กับโมเดล distilled ขนาดเล็กของ DeepSeek ที่ดูเด่นแค่บน benchmark นั้น มีความต่างกันมากในด้านความสามารถ ความแน่นอนของผลลัพธ์ และการจัดการข้อผิดพลาด
- เพิ่งรู้วันนี้ว่าแพลน Anthropic Enterprise ที่บริษัทใหญ่ใช้เพราะฟีเจอร์ด้าน governance และ audit log นั้น คิดค่าบริการโดยบวกเพิ่มเดือนละ $20 ต่อที่นั่งจากอัตราค่าโทเค็น API
  เพราะแบบนี้บริษัทใหญ่จึงต้องจ่ายมากกว่าแพลนสมัครสมาชิกที่มีส่วนลดอยู่มาก
- อยากรู้ว่ามีหลักฐานอะไรที่บอกว่า Opus เป็น โมเดล 5T
  และดูเหมือนจะเข้าใจผิดเรื่องที่ว่าโมเดลโลคัลนั้น “ถูก distilled มาจาก DeepSeek” โมเดลโลคัลก็ไม่ได้เด่นแค่ใน benchmark อย่างเดียว และ Qwen 3.6 ก็เป็นโมเดลที่ค่อนข้างดี แน่นอนว่าไม่ใช่ Opus แต่เร็วกว่าเยอะ และความเร็วเองก็เป็นคุณภาพอย่างหนึ่ง
- โมเดลที่ไม่ใช่ระดับล้ำสมัยที่สุดก็ยังพัฒนาต่อเนื่องอยู่ ถ้ามีใครทำงาน 90% ให้เสร็จด้วย DeepSeek ในราคา $100 แล้วใช้ Anthropic หรือ OpenAI อีก $100 เพื่อเก็บงานส่วนที่เหลือให้จบ ก็มีโอกาสสูงที่เขาจะเลือกทางนั้นมากกว่าจ่าย $1000 ให้ Anthropic หรือ OpenAI
- การที่ราคาโทเค็นแบบสมัครสมาชิกถูกกว่า API 10~40 เท่านั้นเป็น ปรากฏการณ์ชั่วคราว ภายในไม่กี่เดือนข้างหน้า ควรคาดว่าจะมีการขึ้นราคาครั้งใหญ่ หรือจำกัดการใช้งานอย่างเข้มงวด หรือทั้งสองอย่าง
  บริษัทเหล่านี้กำลังขาดทุนมหาศาล และมีหนี้กับภาระผูกพันระดับหลายแสนล้านดอลลาร์ อีกไม่นานก็ต้องเปิดก๊อกการหารายได้
- ทั้งที่รู้ว่าการสมัคร Claude เดือนละ $90 เทียบได้กับการใช้ API มูลค่า $1000~$4000 แต่ยังคิดอีกหรือว่าการมองว่าโครงสร้างนี้ ไม่ยั่งยืน เป็นเรื่องไร้เหตุผล?
นี่เหมือนมองเห็นแต่ต้นไม้จนมองไม่เห็นทั้งป่า การทำงานกับ ChatGPT ให้ความรู้สึกคล้ายอย่างน่าขนลุกกับการทำงานร่วมกับ นักพัฒนาออฟชอร์จากอินเดีย ในยุค enterprise สมัยก่อน ถ้าบอกชัดเจนก็ทำงานได้มีประสิทธิภาพ แต่ถ้าปล่อยให้จัดการเองจะมีโมเมนต์ชวนอุทานว่า WTF บ่อยมาก
LLM มีแนวโน้มสูงที่จะเข้ามาแทนนักพัฒนาเอาต์ซอร์ส เพราะพนักงานภายในที่เข้าใจบริบทสามารถใช้ LLM ทำงานที่เมื่อก่อนนักพัฒนาออฟชอร์ทำได้
- แล้วในโมเมนต์ WTF เหล่านั้น มีสักกี่ครั้งที่เป็นเพียงเพราะ “เขาไม่ได้อยู่ในห้องตอนที่ตัดสินใจเรื่องนั้น”? ซอฟต์แวร์องค์กรส่วนใหญ่เต็มไปด้วยโมเมนต์ชวน WTF ที่เกิดจากข้อประนีประนอมสารพัดในข้อกำหนดอยู่แล้ว
- นอกประเทศของคุณก็มีนักพัฒนาที่มีความสามารถ ใช้ภาษาได้ดีพอ และยอมรับค่าตอบแทนที่ต่ำกว่าอยู่เหมือนกัน และก็มีเหตุผลมากพอที่จำนวนนักพัฒนาแบบนั้นจะเพิ่มขึ้นเรื่อย ๆ
- ถ้าดูจำนวน ทีมเอาต์ซอร์ส ที่ไปขอรับงานบน LinkedIn ก็ยิ่งเห็นได้ชัดว่าใช่เลย
- พวก “นักพัฒนาออฟชอร์จากอินเดีย” ก็ไม่ใช่คนที่จะถูกมองข้ามได้ง่าย ๆ พวกเขาเองก็เข้าถึงโมเดล GPT แบบเดียวกันได้ และต้นทุนอาจอยู่ที่แค่ 1 ใน 10 ของเงินเดือนมัธยฐานในสหรัฐฯ
  บริษัทจะพยายามลดต้นทุนส่วนเพิ่มอยู่เสมอ โดยจะจ้าง software architect 1 คนในสหรัฐฯ ให้เขียนสเปก แล้วจ้างนักพัฒนาชาวอินเดีย 10 คนให้คอยดูแลเอเจนต์ 100 ตัว
ต่างจากนักพัฒนาระยะไกล ปัญหาของ การเอาต์ซอร์ซ คือ ถ้าจะให้มันเดินได้ดีจริง ๆ ต้องมีผู้จัดการและผู้นำทางเทคนิคที่เก่งมาก
จากประสบการณ์ ถ้าจะให้ได้ผลลัพธ์ที่มีประสิทธิภาพ ต้องเขียนเอกสารออกแบบและสเปกงานที่ละเอียดมาก ปกติต้องละเอียดพอ ๆ กับพรอมป์ต์ที่ดี
ถ้าเขียนสเปกละเอียดขนาดนั้นไปแล้ว แล้วจะต้องมีนักพัฒนาเอาต์ซอร์ซกับโมเดลล้ำสมัยไปทำไม?
- สิ่งที่น่าสนใจคือ ปัญหาของการเอาต์ซอร์ซก็เหมือนกับปัญหาของ AI และทั้งหมดนี้ชวนให้นึกถึงช่วงต้นยุค 2000 บริษัทต่าง ๆ ตื่นเต้นกับการประหยัดเงินได้มากแค่ไหน โดยไม่ตระหนักถึงความเสียหายที่เกิดกับตัวผลิตภัณฑ์
  บริษัทที่มีผู้นำผลิตภัณฑ์/โครงการที่แข็งแกร่งและกำกับอย่างละเอียดมาก อาจสร้างนักพัฒนารุ่นใหม่ขึ้นมาได้ แต่บางบริษัทจะเชื่อคำโฆษณาการขาย แล้วล้มเหลวเมื่อซอฟต์แวร์กลายเป็นสิ่งที่บำรุงรักษาต่อไม่ได้
  อีก 10 ปีข้างหน้า ผมคิดว่าจำนวนนักพัฒนาก็น่าจะยังใกล้เคียงกับตอนนี้ แต่จะสร้างผลิตภัณฑ์ได้มากขึ้น AI จะถูกใช้กับการทำงานอัตโนมัติในขอบเขตที่แยกชัดและมีความหมาย แต่การพัฒนาซอฟต์แวร์ส่วนใหญ่จะเกิดขึ้นใน ระดับนามธรรมที่สูงขึ้น ซึ่งเป็นการแสดงแนวคิดเดิมด้วยขยะข้อความที่น้อยลง
  แก่นของโค้ดจะยิ่งมุ่งไปที่การเข้ารหัสและเผยให้เห็นความซับซ้อนของกรณีขอบเขตแปลก ๆ อย่างเป็นรูปธรรม
  ตอนที่ผมเริ่มพัฒนาซอฟต์แวร์ครั้งแรก ผมเคยทำงานกับ MUD ที่เละเทะมากและถูกส่งต่อผ่านมือมาหลายคน จินตนาการยากจริง ๆ ว่าใครจะเต็มใจขุดคุ้ยก้อนโคลนและสปาเกตตีโค้ดที่ AI สร้างขึ้นโดยไม่มีการกำกับและแก้ไขอย่างเข้มงวด
  แก่นของการพัฒนาซอฟต์แวร์คือการแก้ปัญหาเสมอ หรือให้แม่นยำกว่านั้นคือ การระบุปัญหา เมื่อเวลาผ่านไป เราค่อย ๆ ตัดสิ่งจุกจิกออกเพื่อไปโฟกัสที่จุดนั้นมากขึ้น แนวโน้มนี้จะดำเนินต่อไป และจะพัฒนาไปสู่ภาษาที่กระชับและเป็นนามธรรมมากขึ้นสำหรับการระบุปัญหา ขณะที่ตรรกะการไหลที่ยุ่งยาก ส่วนของไดรเวอร์ และคณิตศาสตร์ จะถูกแยกไปอยู่ในไลบรารีและเครื่องมือมากขึ้น
- โมเดลธุรกิจทั้งหมดของนักพัฒนาเอาต์ซอร์ซหรือบริษัทเอาต์ซอร์ซคือการคิดเงินคนอื่นเกินจริง พวกเขาบอกว่า “มีวิศวกร 4 คนลงในโปรเจกต์นี้” แต่ทั้ง 4 คนนั้นก็กำลังทำอีก 5 โปรเจกต์อยู่ด้วย
  ต่อให้วิศวกรให้ความร่วมมือ ผู้จัดการหรือเจ้าของธุรกิจก็มักไม่อยากให้ทำงานร่วมกันอย่างใกล้ชิด และบังคับให้ทำงานแบบรักษาระยะห่าง เช่น คุยกันสัปดาห์ละครั้ง
  ผมเคยเจอกับตัว ครั้งหนึ่งเคยใช้งบ £300k กับทีมพัฒนาเอาต์ซอร์ซ โชคดีที่ไม่ใช่เงินผมเอง และสุดท้ายก็ไม่ได้รับมอบอะไรเลย เวลาส่วนใหญ่หมดไปกับการพยายามทำให้ทิศทางงานตรงกัน
  ผมกับพาร์ตเนอร์พอจะรู้ว่าเราอยากได้อะไร และพยายามซิงก์กันให้บ่อยขึ้นเพื่อปรับความพยายามให้ตรงกัน แต่ผู้จัดการฝั่งนั้นคอยขัดขวางตลอด นี่แหละคือ โมเดลธุรกิจแบบที่ปรึกษา
  พนักงานประจำที่ทำงานระยะไกลมีแรงจูงใจตรงกันข้าม พวกเขาเป็นพนักงานเต็มเวลาตามตัวอักษร ไม่มีชั้นผู้บริหารที่คอยขัดขวางการสื่อสาร และถ้าไม่ขี้เกียจหรือเป็นมิจฉาชีพ พวกเขาก็น่าจะอยากแก้ปัญหาที่น่าสนใจมากกว่านั่งเฉย ๆ อย่างน่าเบื่อ
- โดยทั่วไปเอาต์ซอร์ซก็ให้คืนมาตามที่จ่ายไปอย่างแม่นยำ ในบางแง่มุมมันโปร่งใสมากกว่าวิธีอื่นด้วยซ้ำ เพียงแต่ว่าความโปร่งใสนั้น หรือพูดอีกอย่างคือราคาของคุณภาพ บางครั้งไม่ได้ถูกส่งต่อจากผู้บริหารหรือฝ่ายจัดซื้อที่ตัดสินใจ ไปยังทีมที่ต้องทำงานแบบกระจายจริง ๆ
  ผมคิดว่านั่นก็เป็นจุดที่สมมติฐานของต้นฉบับคลาดเคลื่อน ความต่างระหว่าง DeepSeek กับโมเดลล้ำสมัยมักไม่ใช่สิ่งที่จะชดเชยได้ด้วยเอาต์ซอร์ซคุณภาพต่ำ สุดท้ายคุณก็ต้องจ่ายให้วิศวกรเอาต์ซอร์ซที่มีทักษะสูงมาก และพวกเขาก็อาจไม่ได้ถูกมากตั้งแต่แรก การเอาต์ซอร์ซเกิดขึ้นไม่ใช่แค่เพราะต้นทุน แต่เพราะ ความสามารถและขีดความจุ ด้วย
- ผมก็คิดไปทางนี้เหมือนกันเป๊ะ
  คุณต้องระบุทุกอย่างให้ถึงระดับรายละเอียดที่เหมาะสม และพอถึงจุดนั้น LLM ก็น่าจะทำได้ค่อนข้างดีแล้ว นอกจากนี้ทีมเอาต์ซอร์ซหลายทีมยังสร้างของในวิธีที่ต่างจากทีมภายในอย่างสิ้นเชิง และความต่างด้านระดับงานส่งมอบกับความเร็วก็ชัดเจนแบบเด็ดขาด
  ทุกอย่างเปลี่ยนเร็วขนาดนี้ แล้วทำไมผมต้องเอาเวลาและเงินของตัวเองไปใช้ฝึกพนักงานของคนอื่นให้ตามเทรนด์ล่าสุดด้วย ก็เป็นคำถามเหมือนกัน
- ปัญหาของผมก็คือแค่ ความเป็นเจ้าของที่ไม่พอ ถ้าไม่ใช่บริษัทเอาต์ซอร์ซขนาดเล็กและโฟกัสชัด สำหรับบริษัทแล้วแค่ส่งงานออกไปก็มักง่ายกว่า ไม่ต้องพูดถึงเรื่องคุณภาพหรือการบำรุงรักษาแน่นอน ทั้งนี้ตัวอย่างที่ผมเจอก็มีไม่มากในระดับส่วนตัว
ผมมีเพื่อนเป็นผู้บริหารบริษัทซอฟต์แวร์ในสหรัฐฯ กำลังเตรียมปลดโปรแกรมเมอร์หลายทีมในสาขายุโรปตะวันออก แล้วแทนที่ด้วยโปรแกรมเมอร์อเมริกันจำนวนน้อยกับ AI เขาบอกว่าทางนั้นมีประสิทธิภาพกว่ามากและทำฟีเจอร์ใหม่ได้เร็วกว่าเยอะ
- แบบนี้ฟังดูเป็นไปได้มากกว่า สำหรับผม คอขวดกำลังย้ายจากเรื่อง “การเข้าใจโค้ด” ไปเป็นเรื่อง การเข้าใจผู้ใช้ มากขึ้น การตรวจสอบอย่างหลังไม่จำเป็นต้องให้โปรแกรมเมอร์ทำก็ได้
- เป็นภาพกลับด้านที่น่าสนใจ
  ถ้าเอาไปเทียบกับภาคการผลิต กลยุทธ์หุ่นยนต์มาก่อนก็ไม่ควรตั้งเป้าแค่ดึงการผลิตกลับประเทศ แต่ควรตั้งให้สูงกว่านั้น คือกลายเป็นปลายทางใหม่ของการผลิตแบบเอาต์ซอร์ซ
- ต้องใช้เวลาอีกนานแค่ไหนกว่าเขาจะกลับสู่โลกความจริงแล้วไล่เอเจนต์ออกเป็นล็อตใหญ่ :-)
- บทความนี้พูดเรื่องเอาต์ซอร์ซได้ถูกต้อง แต่ผมไม่คิดว่าสาเหตุจะมาจากผู้รับจ้างออฟชอร์ราคาถูก ผู้เชี่ยวชาญที่เก่งจริงจะทำงานได้อย่างอิสระมากขึ้น และด้วย AI พวกเขาก็จะรองรับลูกค้าได้มากขึ้น
  ดังนั้นธุรกิจขนาดกลางและเล็กอาจไม่จำเป็นต้องมีวิศวกร ฝ่ายการเงิน และฝ่ายการตลาดภายในมากเท่าทุกวันนี้
อนาคตของ AI ล้ำสมัยฝั่งอเมริกาไม่ใช่การเรียก API แต่เป็นการเอางานไปให้ OAI/Anthropic เหมือนจ้างที่ปรึกษาหรือผู้รับจ้างภายนอก แล้วรับผลลัพธ์คล้ายผลิตภัณฑ์กลับมาโดยไม่ได้เห็นงานระหว่างทางเป็นจำนวนมาก
เรื่องนี้เป็นสิ่งที่เลี่ยงไม่ได้จากการผสมกันระหว่าง ภัยคุกคามจากการกลั่นโมเดล กับความพยายามพัฒนาสภาพแวดล้อมการรันแบบปิดเฉพาะที่จำเป็นต่อการดันสมรรถนะล้ำสมัยให้สุด
OAI/Anthropic จะพยายามแย่งงานของทุกคน 100% และ “ครอบครองแรงงาน” เอง ในเรื่องนี้ฝั่งจีนคือฝ่ายพระเอก
- ไม่ใช่เลย การโยนโปรเจกต์ข้ามกำแพงไปให้อีกฝ่ายทำแทบจะจบลงด้วยหายนะเสมอ ข้อกำหนดไม่มีวันชัดเจนเพียงพอ
- หวังว่าวิธีนั้นจะไปได้ดีนะ มันทำให้นึกถึงแรงบันดาลใจของ ภาษาโปรแกรมเชิงประกาศ อย่าง Prolog คือประกาศปัญหาให้เครื่องแก้ แทนที่จะสั่งเครื่องแบบเชิงคำสั่งว่าต้องทำอะไร
  แต่สิ่งที่พวกเขายังไม่ตระหนักคือ การนิยามปัญหานั้นยากกว่าคำตอบเสียอีก
ผมพยายามอย่างมากที่จะใช้โมเดลแบบรันในเครื่องให้ได้ ไม่ว่าจะเป็นสภาพแวดล้อมการรัน เครื่องมือ ทักษะ พรอมป์ต์ และอื่น ๆ ก็ลองมาหมดแล้ว
แต่พอเอา Claude Code กับโมเดลของ Anthropic หรือ Codex กับ GPT 5.5 ไปเทียบกับสภาพแวดล้อมที่รัน Qwen, GLM, Gemma แล้ว โมเดลล้ำสมัยที่สุด เหนือกว่าท่วมท้น ตอนนี้ผมไม่เข้าใจแล้วว่าโมเดลที่ไม่ล้ำสมัยยังมีความหมายอะไร เวลาที่เสียไปมีมากกว่าเวลาที่ประหยัดได้
- ในงานเขียนโค้ดแบบเอเจนต์ ผมเห็นด้วย 100% เลย สำหรับการเขียนโค้ดขนาดใหญ่ โมเดลรันในเครื่องแย่กว่า ช้ากว่า และแพงกว่า
  ถ้าเป็นงานเขียนโค้ดขอบเขตแคบ เช่น เขียนฟังก์ชันเฉพาะตัวหนึ่ง ก็ยังทำได้แม้จะช้า แต่ถ้าใช้เป็น LLM แชตทั่วไปบนฮาร์ดแวร์ผู้บริโภคระดับสูง ก็ยังพอแข่งขันได้ถ้าไม่นับเรื่องต้นทุน
  https://www.williamangel.net/blog/2026/05/17/offline-llm-ene...
- โมเดลรันในเครื่องยัง ตามหลังอยู่ 3~6 เดือน เมื่อเทียบกับโมเดลล้ำสมัยล่าสุด แต่มีข้อดีใหญ่มากคือไม่ต้องส่งทรัพย์สินทางปัญญาทั้งหมดไปให้บุคคลที่สามที่น่าสงสัย
  ถ้าต้นทุนการอนุมานลดลงต่อไป เหมือนที่เป็นมาตลอดหลายปีที่ผ่านมา ภายในปลายปีนี้เราน่าจะรันโมเดลล้ำสมัยของวันนี้บนโน้ตบุ๊กได้
- ผมก็เหมือนกัน เวลาได้ยินคนจู้จี้เรื่องจ่ายหรือเบิกคืนค่าแพ็กเกจ Codex หรือ Claude เดือนละ $200 แล้วรู้สึกอึดอัด
  สำหรับวิศวกรซอฟต์แวร์ มันแทบจะมากพอจนใช้ไม่หมด และถ้าคิดถึงประสิทธิภาพที่เพิ่มขึ้นก็ถือว่าถูกมาก
  ยิ่งไปกว่านั้น Claude/Codex ก็ทำได้ดีอยู่แล้วและดีขึ้นทุกเดือน แล้วใครจะอยากไปนั่งปรับแต่งสภาพแวดล้อมการรันหรือกำหนด agent orchestration กันล่ะ
- ผมก็มาถึงข้อสรุปเดียวกัน ถ้าคิดต้นทุนต่อหนึ่งคำถาม การใช้ Opus ตลอดเวลาคือทางเลือกที่ถูกที่สุดเสมอ
- ประเด็นสำคัญคืออย่าผูกมัดตัวเองไว้กับบริษัทที่ผลประโยชน์ไม่ตรงกับของคุณ
สถานการณ์ที่เป็นไปได้มากกว่าคือ ส่วนล่างจะหายไป และส่วนบนจะยิ่งมีผลิตภาพมากขึ้นผ่านโมเดลล้ำสมัย
ยิ่งนักพัฒนาอ่อน ก็ยิ่งต้องการ AI ที่มีความสามารถสูงกว่า สมมติฐานของบทความนี้ใช้ไม่ได้ เพราะมันสับสนระหว่างนักพัฒนาที่อ่อนกับ AI ที่อ่อน ว่าดีกว่านักพัฒนาที่เก่งกับ AI ที่เกือบทำงานเองได้
ผลิตภัณฑ์ที่นักพัฒนาอ่อนซึ่งใช้ AI ล้ำสมัยสร้างขึ้น ตอนนี้ก็ยังด้อยกว่านักพัฒนาที่มีความสามารถซึ่งใช้ AI ที่อ่อนกว่าเมื่อ 2 ปีก่อน
พูดให้ชัดกว่านั้น นักพัฒนาที่เก่งสามารถใช้ AI ทำผลิตภัณฑ์คุณภาพสูงได้ตั้งแต่ 2 ปีก่อนแล้ว แม้นักพัฒนาที่อ่อนจะใช้ AI รุ่นล่าสุดก็ยังคงลำบาก แต่สำหรับนักพัฒนาที่เก่ง พวกเขาสามารถมอบหมายงานให้ AI ที่เก่งขึ้นได้มากกว่าเดิมและดันผลิตภาพขึ้นไปอีก
- นาน ๆ ทีในชีวิตที่ตอนนี้ผมรู้สึกโชคดีมากที่ได้อยู่ในที่ทำงานที่ทำงานร่วมกับวิศวกรซีเนียร์ที่มีความสามารถเป็นส่วนใหญ่
  องค์กรฝันร้ายที่มีผู้รับจ้างไร้การกำกับหรือพนักงานจูเนียร์ที่จ้างเกินความจำเป็น จะยิ่งอันตรายถึงขั้นหนักมากในยุคแบบนี้
ผมยังเห็นการเล่าเรื่องที่ยก DeepSeek เป็นตัวอย่างของโอเพนซอร์ส LLM อยู่เรื่อย ๆ แต่พวกเขากำลังอุดหนุนโทเคนจำนวนมหาศาลในราคาทุน ถ้าไม่ขี้เกียจและคิดอย่างวิพากษ์วิจารณ์ ก็เข้าใจได้ไม่ยากว่าทำไมถึงทำแบบนั้น
โดยเฉพาะในสถานการณ์ที่ฮาร์ดแวร์สำหรับการอนุมานถูกจำกัดอย่างหนักเพราะความเสี่ยงทางภูมิรัฐศาสตร์ การใช้ AI รันในเครื่อง ที่ให้ระดับใกล้เคียงกับโมเดลล้ำสมัยยังแพงและไร้ประสิทธิภาพเกินไป
ผมยังสงสัยมากด้วยว่าข้ออ้างที่ว่า LLM รันในเครื่องจะคุกคามบริษัทโมเดลล้ำสมัยเหล่านี้ได้ในระยะยาวนั้นจริงแค่ไหน
เหตุผลที่โทเคนจะแพงขึ้นก็เพราะพวกเขากำลังเริ่มครองตลาด และจะใช้อำนาจนั้นจำกัดการกระจายฮาร์ดแวร์ทั้งในและข้ามพรมแดน
เป็นไปได้มากว่าในบางเวิร์กโฟลว์ LLM รันในเครื่องจะถูกใช้มากขึ้น แต่จะไม่ใช่งานที่ต้องการระดับโมเดลล้ำสมัย และก็คงยากที่จะสู้ราคาที่โมเดลล้ำสมัยเวอร์ชันเล็กและเบากว่าจะเสนอมาเพื่อเก็บตลาดหางยาว
- มีแหล่งอ้างอิงสำหรับข้ออ้างแรกไหม?
  จากที่ผมเข้าใจ DeepSeek ออกแบบ v4 มาเพื่อ การอนุมานต้นทุนต่ำ โดยเฉพาะ และดูเหมือนว่าต่อให้ลดราคาลง 75% ก็ยังไม่ขาดทุน
- ผู้ให้บริการรายอื่นที่เสนอโบนัส DeepSeek บน OpenRouter ก็ยังตั้งราคาต่ำมากได้เหมือนกัน ดังนั้นคำพูดที่ว่ามีการอุดหนุนโทเคนในราคาทุนนั้นผิดทั้งหมด เพราะบริษัทเหล่านั้นไม่มีเงินพอจะอุดหนุนด้วยซ้ำ
- ผมว่าไม่ใช่นะ เท่าที่ได้ยินมา DeepSeek ไม่ได้ขาดทุนจากการอนุมาน
ผมมองว่า ประสบการณ์ด้านคุณภาพ และค่านิยมส่วนตัวสำคัญกว่าต้นทุนวิศวกร ตลอดหลายปีที่ผ่านมา ผมเห็นการลัดขั้นตอนมากเกินไปในงานเอาต์ซอร์ส และ AI ก็ชอบลัดขั้นตอนมากเช่นกัน การเอาสองอย่างนี้มารวมกันไม่ได้มีคุณค่าเท่ากับจำนวนเงินที่ประหยัดได้
ถ้าคุณให้ความสำคัญกับงานคุณภาพสูงและความภาคภูมิใจในงานของตัวเอง แรงงานเอาต์ซอร์สไม่ใช่คำตอบ เพราะโดยมากแล้วต้นทุนที่ต่ำมาจากการที่พวกเขาไม่ได้ใส่ใจรายละเอียดในงานของตัวเอง
ในทางกลับกัน ถ้าคุณแค่อยากให้มันเสร็จ ๆ ไปและไม่สนว่ามันทำได้ถูกต้องหรือไม่ ก็คงไม่มีวิธีไหนดีกว่าการจ่ายให้น้อยที่สุดเท่าที่จะทำได้
มีจุดหนึ่งที่บทความนี้ไม่ได้พูดถึง วิศวกรที่ดีใช้เวลากับการเขียนโค้ดในโปรเจ็กต์ที่มีอยู่เดิมไม่มากนักเมื่อเทียบกับงานอย่างอื่น วิศวกรที่ดี เข้าใจระบบแบบ end-to-end นักพัฒนาออฟชอร์แย่กว่า Llama3