การผสานกำลังระหว่างแรงงานเอาต์ซอร์ส + LocalAI กำลังจะคุ้มค่ากว่า frontier lab ในไม่ช้า
(signalbloom.ai)- ขณะที่ ราคา API ของ frontier lab ในสหรัฐฯ ปรับขึ้นอย่างต่อเนื่อง การผสมผสานระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลโอเพนซอร์สอย่าง DeepSeek กำลังกลายเป็น ทางเลือกที่คุ้มค่ากว่า
- โมเดล frontier รุ่นล่าสุดอย่าง GPT-5.5, Gemini 3.5 Flash และ Opus-4.7 ได้มีการ ขึ้นราคา 2~3 เท่า หรือเพิ่มปริมาณการใช้โทเค็น
- เมื่อเทียบตามเกณฑ์ blended token พบว่า Anthropic·OpenAI อยู่ที่ราว $2.80/M ขณะที่ DeepSeek อยู่ที่ $0.094/M ซึ่งต่างกันประมาณ 30 เท่า
- แม้โมเดล frontier จะทรงพลังกว่า แต่สำหรับ งานเขียนโค้ด โมเดล OSS ก็มีคุณภาพดีเพียงพอแล้ว และเมื่อจับคู่กับวิศวกรที่มีความสามารถก็สามารถชดเชยช่องว่างนั้นได้
- เหตุผลที่การขึ้นราคาไม่อาจดำเนินต่อไปได้ไม่สิ้นสุด คือ การจับคู่ระหว่างเอาต์ซอร์ส+LocalAI จะทำหน้าที่เป็นเพดานราคา
แนวโน้มต้นทุน inference ที่เพิ่มขึ้นของ frontier lab
- ตรงกันข้ามกับความเชื่อทั่วไปที่ว่าต้นทุน inference กำลังลดลง ราคาของ frontier lab ในสหรัฐฯ กำลังอยู่ใน แนวโน้มขาขึ้นอย่างชัดเจน
- การเปิดตัว GPT-5.5 ($5/$30) เกิดขึ้นเพียง 2 เดือนหลังการเปิดตัว GPT-5.4 และทำให้ ราคา API โดยรวมเพิ่มขึ้น 2 เท่า
- เทียบกับ GPT-5 ($1.25/$10) เมื่อ 8 เดือนก่อน ก็ แพงขึ้นมากกว่า 3 เท่า
- Gemini 3.5 Flash ($1.50/$9.00) มีราคา เพิ่มขึ้น 3 เท่า จากรุ่นก่อนหน้า Gemini-3-flash-preview ($0.50/$3.00)
- และ Gemini-3-flash-preview เองก็มีราคาสูงกว่า 2.5 Flash ($0.30/$2.50) อยู่แล้ว
- Anthropic Opus-4.7 ใช้ tokenizer ใหม่ ทำให้ การใช้โทเค็นเพิ่มขึ้น 32~47% ส่งผลให้ต้นทุนจริงสูงขึ้นเมื่อเทียบกับ Opus-4.6 รุ่นก่อนหน้า
เปรียบเทียบโมเดลปิดแบบ frontier กับโมเดลโอเพนซอร์ส
- เปรียบเทียบโดยอิง อัตราการใช้ blended token: สมมติให้ต่อโทเค็น input(+cache) 1M มี output 50k โทเค็น (ต่ำกว่าประมาณ 5%)
- agent loop ขนาดใหญ่มีจำนวนเทิร์นมากและมีสัดส่วนการอ่านสูง จึงเป็นการประเมินแบบอนุรักษ์นิยม
- เปรียบเทียบราคา blended เฉลี่ยหลังสะท้อนการทำ cache ของแต่ละผู้ให้บริการ (ที่มา: openrouter.ai)
-
เปรียบเทียบราคาตามผู้ให้บริการ
- Anthropic: input $1.57 / output $25.00 / อัตรา cache hit 79.6% → blended $2.82
- OpenAI: input $1.30 / output $30.22 / อัตรา cache hit 84.8% → blended $2.80
- DeepSeek: input $0.055 / output $0.870 / อัตรา cache hit 88.1% → blended $0.094
- ปัจจุบันโมเดลปิดแบบ frontier ยังทรงพลังกว่าโมเดลล่าสุดของ DeepSeek แต่ก็ยังน่าสงสัยว่าช่องว่างนั้นมากพอจะอธิบาย ส่วนต่างราคาที่สูงถึง 30 เท่า หรือไม่
- OSS LLM ไม่จำเป็นต้องไปถึงระดับ frontier ขอเพียงมี ประสิทธิภาพเพียงพอสำหรับงานเขียนโค้ด ก็เพียงพอ ซึ่งตอนนี้ก็มาถึงระดับนั้นแล้ว
แนวโน้มการใช้โทเค็นที่เพิ่มขึ้น
- เทรนด์ tokenmaxxing กำลังเร่งตัวขึ้นในช่วงหลายเดือนและหลายปีที่ผ่านมา (อ้างอิงบล็อก Pragmatic Engineer)
- ในหมู่วิศวกรฝีมือดีมีความเห็นร่วมกันว่า การตั้ง tokenmaxxing เป็นเป้าหมายเป็นเรื่องไม่ฉลาด แม้จะเป็นอีกประเด็นหนึ่งต่างหาก
- การเพิ่มขึ้นอย่างมากของปริมาณการใช้โทเค็นยังสะท้อนผ่าน ภาวะขาดแคลน GPU อย่างต่อเนื่อง
- การใช้โทเค็นที่เพิ่มขึ้นและการขึ้นราคาต่อโทเค็นกำลังเกิดขึ้นพร้อมกัน และเชื่อมโยงกับกลยุทธ์การจับมูลค่าของ frontier lab ในสหรัฐฯ
(มนุษย์ + LLM ระดับเกือบ frontier) vs frontier LLM
- มี บทวิเคราะห์แยกต่างหากที่เปรียบเทียบวิศวกรมนุษย์กับ AI agent ใน 12 มิติ (signalbloom.ai)
- ข้อสรุปคือ AI agent ได้ แซงหน้ามนุษย์ในงานเขียนโค้ดไปแล้ว และมีแนวโน้มจะแซงในงานดีบักที่มีขอบเขตจำกัดในไม่ช้า
- อย่างไรก็ตาม ความสามารถหลักอื่น ๆ ที่จำเป็นต่อการทำวิศวกรรมที่ดี AI ยังตามหลังอยู่มาก
- ความจำระยะยาว (long-term memory)
- เมตาความจำ (Meta memory): ความสามารถในการแยกแยะอย่างชัดเจนว่าตนเองรู้อะไรและไม่รู้อะไร
- การประเมินความเพียงพอของหลักฐาน (Evidential Sufficiency Assessment): การตัดสินว่ามีหลักฐานเพียงพอสำหรับการลงมือทำหรือไม่
- สถาปัตยกรรมเชิงสถิติในปัจจุบันจำเป็นต้องได้รับการเสริมหรือถูกแทนที่ด้วยแนวทางทะลุข้อจำกัดแบบอื่น
- ความสามารถในการจัดการงานกับความเป็นอิสระของ AI ไม่ใช่เรื่องเดียวกัน
สถานการณ์จุดตัดด้านต้นทุน
-
การเปรียบเทียบหลัก
- วิเคราะห์ช่วงเวลาที่การจับคู่ระหว่างวิศวกรจากประเทศต้นทุนต่ำกับโมเดลที่มีความสามารถเพียงพอ จะมี ความคุ้มค่าต่อราคาสูงกว่า โมเดล frontier ระดับบนสุด
- ตัวแปร: เงินเดือนวิศวกร, อัตราการเติบโตของเงินเดือน, ปริมาณโทเค็นเริ่มต้น, อัตราการเพิ่มของโทเค็น, ราคา frontier, อัตราการเปลี่ยนแปลงราคาของ frontier, ราคา DeepSeek, ระยะเวลา
-
ผลลัพธ์
- เกิด จุดตัดที่เดือนที่ 11 โดยต้นทุน inference ของ frontier สูงเกินต้นทุนของชุดวิศวกร+DeepSeek ($1,116.61/เดือน)
ความเห็นและข้อจำกัด
- กราฟมีสมมติฐานแบบลดทอนความซับซ้อนอยู่
- ตัวแปรอย่างราคา inference ในอนาคต แนวโน้มการใช้โทเค็น เป็นต้น
- reflexivity: ผู้เล่นในตลาดเปลี่ยนพฤติกรรมตามสิ่งที่สังเกตเห็น
- ปัจจัยต่อไปนี้ยังไม่ถูกนำมารวม และหากรวมแล้วจะยิ่งเป็นผลดีต่อโมเดลโลคัลมากขึ้น
- ความเร็วในการพัฒนาประสิทธิภาพของโมเดลโลคัล ที่สูงมาก
- ฮาร์ดแวร์ inference เพิ่มเติมที่จะถูก投入ในช่วงหลายเดือนและหลายปีข้างหน้า
- ประเด็นหลักคือ เมื่อต้นทุน AI สูงขึ้นเกินระดับหนึ่ง มันจะกลายเป็น การเผาเงินสดที่น่ากังวลสำหรับองค์กร และกินสัดส่วนใหญ่ของรายจ่ายทั้งหมด
- ด้วยเหตุนี้จึงเกิด เพดานต่อขนาดและความเร็วของการขึ้นราคาจาก frontier lab
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
เวลาพูดถึงราคา LLM หลายคนกำลังพลาดประเด็นสำคัญไป ราคาโทเค็นแบบสมัครสมาชิกถูกกว่าราคา API ถึง 10~40 เท่า ดังนั้นการสมัคร Claude เดือนละ $90 เมื่อลองคิดเป็นราคาโทเค็นแบบ API แล้วจะเทียบได้กับประมาณ $1000~$4000
ประการที่สอง ฝีมือของ “ผู้ปฏิบัติการ” ที่ใช้งานโมเดลสร้างความต่างกับผลลัพธ์อย่างมหาศาล นักพัฒนารุ่นพี่ที่มีทักษะสูง ใช้พรอมป์ตเก่ง และมีความเป็นเจ้าของงานสูง จะให้ผลลัพธ์ดีกว่าสมาชิกทีมที่ขาดแรงจูงใจและพื้นฐานความสามารถอย่างมาก
สุดท้าย ระหว่างโมเดลล้ำสมัยระดับ 5T อย่าง Opus กับโมเดล distilled ขนาดเล็กของ DeepSeek ที่ดูเด่นแค่บน benchmark นั้น มีความต่างกันมากในด้านความสามารถ ความแน่นอนของผลลัพธ์ และการจัดการข้อผิดพลาด
เพราะแบบนี้บริษัทใหญ่จึงต้องจ่ายมากกว่าแพลนสมัครสมาชิกที่มีส่วนลดอยู่มาก
และดูเหมือนจะเข้าใจผิดเรื่องที่ว่าโมเดลโลคัลนั้น “ถูก distilled มาจาก DeepSeek” โมเดลโลคัลก็ไม่ได้เด่นแค่ใน benchmark อย่างเดียว และ Qwen 3.6 ก็เป็นโมเดลที่ค่อนข้างดี แน่นอนว่าไม่ใช่ Opus แต่เร็วกว่าเยอะ และความเร็วเองก็เป็นคุณภาพอย่างหนึ่ง
บริษัทเหล่านี้กำลังขาดทุนมหาศาล และมีหนี้กับภาระผูกพันระดับหลายแสนล้านดอลลาร์ อีกไม่นานก็ต้องเปิดก๊อกการหารายได้
นี่เหมือนมองเห็นแต่ต้นไม้จนมองไม่เห็นทั้งป่า การทำงานกับ ChatGPT ให้ความรู้สึกคล้ายอย่างน่าขนลุกกับการทำงานร่วมกับ นักพัฒนาออฟชอร์จากอินเดีย ในยุค enterprise สมัยก่อน ถ้าบอกชัดเจนก็ทำงานได้มีประสิทธิภาพ แต่ถ้าปล่อยให้จัดการเองจะมีโมเมนต์ชวนอุทานว่า WTF บ่อยมาก
LLM มีแนวโน้มสูงที่จะเข้ามาแทนนักพัฒนาเอาต์ซอร์ส เพราะพนักงานภายในที่เข้าใจบริบทสามารถใช้ LLM ทำงานที่เมื่อก่อนนักพัฒนาออฟชอร์ทำได้
บริษัทจะพยายามลดต้นทุนส่วนเพิ่มอยู่เสมอ โดยจะจ้าง software architect 1 คนในสหรัฐฯ ให้เขียนสเปก แล้วจ้างนักพัฒนาชาวอินเดีย 10 คนให้คอยดูแลเอเจนต์ 100 ตัว
ต่างจากนักพัฒนาระยะไกล ปัญหาของ การเอาต์ซอร์ซ คือ ถ้าจะให้มันเดินได้ดีจริง ๆ ต้องมีผู้จัดการและผู้นำทางเทคนิคที่เก่งมาก
จากประสบการณ์ ถ้าจะให้ได้ผลลัพธ์ที่มีประสิทธิภาพ ต้องเขียนเอกสารออกแบบและสเปกงานที่ละเอียดมาก ปกติต้องละเอียดพอ ๆ กับพรอมป์ต์ที่ดี
ถ้าเขียนสเปกละเอียดขนาดนั้นไปแล้ว แล้วจะต้องมีนักพัฒนาเอาต์ซอร์ซกับโมเดลล้ำสมัยไปทำไม?
บริษัทที่มีผู้นำผลิตภัณฑ์/โครงการที่แข็งแกร่งและกำกับอย่างละเอียดมาก อาจสร้างนักพัฒนารุ่นใหม่ขึ้นมาได้ แต่บางบริษัทจะเชื่อคำโฆษณาการขาย แล้วล้มเหลวเมื่อซอฟต์แวร์กลายเป็นสิ่งที่บำรุงรักษาต่อไม่ได้
อีก 10 ปีข้างหน้า ผมคิดว่าจำนวนนักพัฒนาก็น่าจะยังใกล้เคียงกับตอนนี้ แต่จะสร้างผลิตภัณฑ์ได้มากขึ้น AI จะถูกใช้กับการทำงานอัตโนมัติในขอบเขตที่แยกชัดและมีความหมาย แต่การพัฒนาซอฟต์แวร์ส่วนใหญ่จะเกิดขึ้นใน ระดับนามธรรมที่สูงขึ้น ซึ่งเป็นการแสดงแนวคิดเดิมด้วยขยะข้อความที่น้อยลง
แก่นของโค้ดจะยิ่งมุ่งไปที่การเข้ารหัสและเผยให้เห็นความซับซ้อนของกรณีขอบเขตแปลก ๆ อย่างเป็นรูปธรรม
ตอนที่ผมเริ่มพัฒนาซอฟต์แวร์ครั้งแรก ผมเคยทำงานกับ MUD ที่เละเทะมากและถูกส่งต่อผ่านมือมาหลายคน จินตนาการยากจริง ๆ ว่าใครจะเต็มใจขุดคุ้ยก้อนโคลนและสปาเกตตีโค้ดที่ AI สร้างขึ้นโดยไม่มีการกำกับและแก้ไขอย่างเข้มงวด
แก่นของการพัฒนาซอฟต์แวร์คือการแก้ปัญหาเสมอ หรือให้แม่นยำกว่านั้นคือ การระบุปัญหา เมื่อเวลาผ่านไป เราค่อย ๆ ตัดสิ่งจุกจิกออกเพื่อไปโฟกัสที่จุดนั้นมากขึ้น แนวโน้มนี้จะดำเนินต่อไป และจะพัฒนาไปสู่ภาษาที่กระชับและเป็นนามธรรมมากขึ้นสำหรับการระบุปัญหา ขณะที่ตรรกะการไหลที่ยุ่งยาก ส่วนของไดรเวอร์ และคณิตศาสตร์ จะถูกแยกไปอยู่ในไลบรารีและเครื่องมือมากขึ้น
ต่อให้วิศวกรให้ความร่วมมือ ผู้จัดการหรือเจ้าของธุรกิจก็มักไม่อยากให้ทำงานร่วมกันอย่างใกล้ชิด และบังคับให้ทำงานแบบรักษาระยะห่าง เช่น คุยกันสัปดาห์ละครั้ง
ผมเคยเจอกับตัว ครั้งหนึ่งเคยใช้งบ £300k กับทีมพัฒนาเอาต์ซอร์ซ โชคดีที่ไม่ใช่เงินผมเอง และสุดท้ายก็ไม่ได้รับมอบอะไรเลย เวลาส่วนใหญ่หมดไปกับการพยายามทำให้ทิศทางงานตรงกัน
ผมกับพาร์ตเนอร์พอจะรู้ว่าเราอยากได้อะไร และพยายามซิงก์กันให้บ่อยขึ้นเพื่อปรับความพยายามให้ตรงกัน แต่ผู้จัดการฝั่งนั้นคอยขัดขวางตลอด นี่แหละคือ โมเดลธุรกิจแบบที่ปรึกษา
พนักงานประจำที่ทำงานระยะไกลมีแรงจูงใจตรงกันข้าม พวกเขาเป็นพนักงานเต็มเวลาตามตัวอักษร ไม่มีชั้นผู้บริหารที่คอยขัดขวางการสื่อสาร และถ้าไม่ขี้เกียจหรือเป็นมิจฉาชีพ พวกเขาก็น่าจะอยากแก้ปัญหาที่น่าสนใจมากกว่านั่งเฉย ๆ อย่างน่าเบื่อ
ผมคิดว่านั่นก็เป็นจุดที่สมมติฐานของต้นฉบับคลาดเคลื่อน ความต่างระหว่าง DeepSeek กับโมเดลล้ำสมัยมักไม่ใช่สิ่งที่จะชดเชยได้ด้วยเอาต์ซอร์ซคุณภาพต่ำ สุดท้ายคุณก็ต้องจ่ายให้วิศวกรเอาต์ซอร์ซที่มีทักษะสูงมาก และพวกเขาก็อาจไม่ได้ถูกมากตั้งแต่แรก การเอาต์ซอร์ซเกิดขึ้นไม่ใช่แค่เพราะต้นทุน แต่เพราะ ความสามารถและขีดความจุ ด้วย
คุณต้องระบุทุกอย่างให้ถึงระดับรายละเอียดที่เหมาะสม และพอถึงจุดนั้น LLM ก็น่าจะทำได้ค่อนข้างดีแล้ว นอกจากนี้ทีมเอาต์ซอร์ซหลายทีมยังสร้างของในวิธีที่ต่างจากทีมภายในอย่างสิ้นเชิง และความต่างด้านระดับงานส่งมอบกับความเร็วก็ชัดเจนแบบเด็ดขาด
ทุกอย่างเปลี่ยนเร็วขนาดนี้ แล้วทำไมผมต้องเอาเวลาและเงินของตัวเองไปใช้ฝึกพนักงานของคนอื่นให้ตามเทรนด์ล่าสุดด้วย ก็เป็นคำถามเหมือนกัน
ผมมีเพื่อนเป็นผู้บริหารบริษัทซอฟต์แวร์ในสหรัฐฯ กำลังเตรียมปลดโปรแกรมเมอร์หลายทีมในสาขายุโรปตะวันออก แล้วแทนที่ด้วยโปรแกรมเมอร์อเมริกันจำนวนน้อยกับ AI เขาบอกว่าทางนั้นมีประสิทธิภาพกว่ามากและทำฟีเจอร์ใหม่ได้เร็วกว่าเยอะ
ถ้าเอาไปเทียบกับภาคการผลิต กลยุทธ์หุ่นยนต์มาก่อนก็ไม่ควรตั้งเป้าแค่ดึงการผลิตกลับประเทศ แต่ควรตั้งให้สูงกว่านั้น คือกลายเป็นปลายทางใหม่ของการผลิตแบบเอาต์ซอร์ซ
ดังนั้นธุรกิจขนาดกลางและเล็กอาจไม่จำเป็นต้องมีวิศวกร ฝ่ายการเงิน และฝ่ายการตลาดภายในมากเท่าทุกวันนี้
อนาคตของ AI ล้ำสมัยฝั่งอเมริกาไม่ใช่การเรียก API แต่เป็นการเอางานไปให้ OAI/Anthropic เหมือนจ้างที่ปรึกษาหรือผู้รับจ้างภายนอก แล้วรับผลลัพธ์คล้ายผลิตภัณฑ์กลับมาโดยไม่ได้เห็นงานระหว่างทางเป็นจำนวนมาก
เรื่องนี้เป็นสิ่งที่เลี่ยงไม่ได้จากการผสมกันระหว่าง ภัยคุกคามจากการกลั่นโมเดล กับความพยายามพัฒนาสภาพแวดล้อมการรันแบบปิดเฉพาะที่จำเป็นต่อการดันสมรรถนะล้ำสมัยให้สุด
OAI/Anthropic จะพยายามแย่งงานของทุกคน 100% และ “ครอบครองแรงงาน” เอง ในเรื่องนี้ฝั่งจีนคือฝ่ายพระเอก
แต่สิ่งที่พวกเขายังไม่ตระหนักคือ การนิยามปัญหานั้นยากกว่าคำตอบเสียอีก
ผมพยายามอย่างมากที่จะใช้โมเดลแบบรันในเครื่องให้ได้ ไม่ว่าจะเป็นสภาพแวดล้อมการรัน เครื่องมือ ทักษะ พรอมป์ต์ และอื่น ๆ ก็ลองมาหมดแล้ว
แต่พอเอา Claude Code กับโมเดลของ Anthropic หรือ Codex กับ GPT 5.5 ไปเทียบกับสภาพแวดล้อมที่รัน Qwen, GLM, Gemma แล้ว โมเดลล้ำสมัยที่สุด เหนือกว่าท่วมท้น ตอนนี้ผมไม่เข้าใจแล้วว่าโมเดลที่ไม่ล้ำสมัยยังมีความหมายอะไร เวลาที่เสียไปมีมากกว่าเวลาที่ประหยัดได้
ถ้าเป็นงานเขียนโค้ดขอบเขตแคบ เช่น เขียนฟังก์ชันเฉพาะตัวหนึ่ง ก็ยังทำได้แม้จะช้า แต่ถ้าใช้เป็น LLM แชตทั่วไปบนฮาร์ดแวร์ผู้บริโภคระดับสูง ก็ยังพอแข่งขันได้ถ้าไม่นับเรื่องต้นทุน
https://www.williamangel.net/blog/2026/05/17/offline-llm-ene...
ถ้าต้นทุนการอนุมานลดลงต่อไป เหมือนที่เป็นมาตลอดหลายปีที่ผ่านมา ภายในปลายปีนี้เราน่าจะรันโมเดลล้ำสมัยของวันนี้บนโน้ตบุ๊กได้
สำหรับวิศวกรซอฟต์แวร์ มันแทบจะมากพอจนใช้ไม่หมด และถ้าคิดถึงประสิทธิภาพที่เพิ่มขึ้นก็ถือว่าถูกมาก
ยิ่งไปกว่านั้น Claude/Codex ก็ทำได้ดีอยู่แล้วและดีขึ้นทุกเดือน แล้วใครจะอยากไปนั่งปรับแต่งสภาพแวดล้อมการรันหรือกำหนด agent orchestration กันล่ะ
สถานการณ์ที่เป็นไปได้มากกว่าคือ ส่วนล่างจะหายไป และส่วนบนจะยิ่งมีผลิตภาพมากขึ้นผ่านโมเดลล้ำสมัย
ยิ่งนักพัฒนาอ่อน ก็ยิ่งต้องการ AI ที่มีความสามารถสูงกว่า สมมติฐานของบทความนี้ใช้ไม่ได้ เพราะมันสับสนระหว่างนักพัฒนาที่อ่อนกับ AI ที่อ่อน ว่าดีกว่านักพัฒนาที่เก่งกับ AI ที่เกือบทำงานเองได้
ผลิตภัณฑ์ที่นักพัฒนาอ่อนซึ่งใช้ AI ล้ำสมัยสร้างขึ้น ตอนนี้ก็ยังด้อยกว่านักพัฒนาที่มีความสามารถซึ่งใช้ AI ที่อ่อนกว่าเมื่อ 2 ปีก่อน
พูดให้ชัดกว่านั้น นักพัฒนาที่เก่งสามารถใช้ AI ทำผลิตภัณฑ์คุณภาพสูงได้ตั้งแต่ 2 ปีก่อนแล้ว แม้นักพัฒนาที่อ่อนจะใช้ AI รุ่นล่าสุดก็ยังคงลำบาก แต่สำหรับนักพัฒนาที่เก่ง พวกเขาสามารถมอบหมายงานให้ AI ที่เก่งขึ้นได้มากกว่าเดิมและดันผลิตภาพขึ้นไปอีก
องค์กรฝันร้ายที่มีผู้รับจ้างไร้การกำกับหรือพนักงานจูเนียร์ที่จ้างเกินความจำเป็น จะยิ่งอันตรายถึงขั้นหนักมากในยุคแบบนี้
ผมยังเห็นการเล่าเรื่องที่ยก DeepSeek เป็นตัวอย่างของโอเพนซอร์ส LLM อยู่เรื่อย ๆ แต่พวกเขากำลังอุดหนุนโทเคนจำนวนมหาศาลในราคาทุน ถ้าไม่ขี้เกียจและคิดอย่างวิพากษ์วิจารณ์ ก็เข้าใจได้ไม่ยากว่าทำไมถึงทำแบบนั้น
โดยเฉพาะในสถานการณ์ที่ฮาร์ดแวร์สำหรับการอนุมานถูกจำกัดอย่างหนักเพราะความเสี่ยงทางภูมิรัฐศาสตร์ การใช้ AI รันในเครื่อง ที่ให้ระดับใกล้เคียงกับโมเดลล้ำสมัยยังแพงและไร้ประสิทธิภาพเกินไป
ผมยังสงสัยมากด้วยว่าข้ออ้างที่ว่า LLM รันในเครื่องจะคุกคามบริษัทโมเดลล้ำสมัยเหล่านี้ได้ในระยะยาวนั้นจริงแค่ไหน
เหตุผลที่โทเคนจะแพงขึ้นก็เพราะพวกเขากำลังเริ่มครองตลาด และจะใช้อำนาจนั้นจำกัดการกระจายฮาร์ดแวร์ทั้งในและข้ามพรมแดน
เป็นไปได้มากว่าในบางเวิร์กโฟลว์ LLM รันในเครื่องจะถูกใช้มากขึ้น แต่จะไม่ใช่งานที่ต้องการระดับโมเดลล้ำสมัย และก็คงยากที่จะสู้ราคาที่โมเดลล้ำสมัยเวอร์ชันเล็กและเบากว่าจะเสนอมาเพื่อเก็บตลาดหางยาว
จากที่ผมเข้าใจ DeepSeek ออกแบบ v4 มาเพื่อ การอนุมานต้นทุนต่ำ โดยเฉพาะ และดูเหมือนว่าต่อให้ลดราคาลง 75% ก็ยังไม่ขาดทุน
ผมมองว่า ประสบการณ์ด้านคุณภาพ และค่านิยมส่วนตัวสำคัญกว่าต้นทุนวิศวกร ตลอดหลายปีที่ผ่านมา ผมเห็นการลัดขั้นตอนมากเกินไปในงานเอาต์ซอร์ส และ AI ก็ชอบลัดขั้นตอนมากเช่นกัน การเอาสองอย่างนี้มารวมกันไม่ได้มีคุณค่าเท่ากับจำนวนเงินที่ประหยัดได้
ถ้าคุณให้ความสำคัญกับงานคุณภาพสูงและความภาคภูมิใจในงานของตัวเอง แรงงานเอาต์ซอร์สไม่ใช่คำตอบ เพราะโดยมากแล้วต้นทุนที่ต่ำมาจากการที่พวกเขาไม่ได้ใส่ใจรายละเอียดในงานของตัวเอง
ในทางกลับกัน ถ้าคุณแค่อยากให้มันเสร็จ ๆ ไปและไม่สนว่ามันทำได้ถูกต้องหรือไม่ ก็คงไม่มีวิธีไหนดีกว่าการจ่ายให้น้อยที่สุดเท่าที่จะทำได้
มีจุดหนึ่งที่บทความนี้ไม่ได้พูดถึง วิศวกรที่ดีใช้เวลากับการเขียนโค้ดในโปรเจ็กต์ที่มีอยู่เดิมไม่มากนักเมื่อเทียบกับงานอย่างอื่น วิศวกรที่ดี เข้าใจระบบแบบ end-to-end นักพัฒนาออฟชอร์แย่กว่า Llama3