COO ของ Uber เผยว่าการหาเหตุผลมารองรับเงินที่ใช้กับ tokenmaxxing ทำได้ยากขึ้นเรื่อย ๆ
(businessinsider.com)- COO ของ Uber มองว่าการอธิบายให้สมเหตุสมผลว่าเงินที่ใช้กับ AI ให้ผลลัพธ์คุ้มกับต้นทุนที่ใส่ไปหรือไม่นั้นยากขึ้นเรื่อย ๆ
- ประเด็นถกเถียงภายในรุนแรงขึ้นหลัง CTO ของ Uber เปิดเผยว่าได้ใช้预算 Claude Code สำหรับปี 2026 หมดไปแล้ว
- ความเชื่อมโยงที่ว่า ปริมาณการใช้โทเคน ที่มากขึ้นจะนำไปสู่การเพิ่มขึ้นของฟีเจอร์ผู้บริโภคที่มีประโยชน์อย่างเป็นสัดส่วน ยังไม่ได้รับการยืนยัน
- CEO ของ Uber ระบุว่า Uber กำลังชะลอการจ้างงานเพื่อชดเชยการลงทุนด้าน AI
- ต่างจากกระแส tokenmaxxing ของ Big Tech ทาง Duolingo ได้ยกเลิกการตัดสินใจที่จะนำการใช้ AI ไปใส่ในเกณฑ์ประเมินผลงาน หลังเกิดกระแสตอบรับจากพนักงาน
ปัญหาการหาเหตุผลรองรับต้นทุน AI ภายใน Uber
- Andrew Macdonald ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Uber มองว่าการหาเหตุผลรองรับต้นทุน AI ภายในบริษัทกำลังยากขึ้นเรื่อย ๆ
- ใน บทสัมภาษณ์ Rapid Response ที่เผยแพร่เมื่อวันเสาร์ เขาระบุว่า AI ยังไม่ได้สร้างผลลัพธ์มากพอเมื่อเทียบกับเงินที่บริษัทใช้ไป
- การถกเถียงภายในรุนแรงขึ้นหลัง Praveen Neppalli Naga CTO ของ Uber เปิดเผยในการให้สัมภาษณ์กับ The Information เมื่อเดือนเมษายนว่า Uber ใช้งบ Claude Code สำหรับปี 2026 หมดไปแล้ว
- คำพูดดังกล่าวนำไปสู่สถานการณ์ที่ Macdonald อธิบายว่าเป็น “ช่วงเวลาที่เหมือนหัวจะระเบิด” และภายในบริษัทได้มีการพูดคุยถึงการแลกเปลี่ยนระหว่าง การใช้โทเคน AI กับ ขนาดกำลังคน
ยังไม่มีความเชื่อมโยงระหว่างการใช้โทเคนกับผลงานของผลิตภัณฑ์
- หลังจากพูดคุยกับผู้นำวิศวกรรมระดับสูงของ Uber แล้ว Macdonald เห็นว่าการใช้ โทเคน มากขึ้นไม่ได้แปลว่าจะทำให้มีฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้นอย่างเป็นสัดส่วน
- เขากล่าวว่า “ความเชื่อมโยงนั้นยังไม่มี” โดยมองว่าแม้อาจมีการปล่อยฟีเจอร์มากขึ้น แต่ก็ยากที่จะเชื่อมตัวชี้วัดบางอย่างเข้ากับข้อสรุปว่า “ตอนนี้เรากำลังสร้างฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้น 25% จริง ๆ” ได้โดยตรง
- ยิ่งเชื่อมค่าใช้จ่ายด้าน AI เข้ากับผลลัพธ์ได้ยากเท่าไร ก็ยิ่งยากที่จะหาเหตุผลมารองรับต้นทุนแลกเปลี่ยนดังกล่าว
- Dara Khosrowshahi CEO เปิดเผยในการประกาศผลประกอบการเมื่อต้นเดือนนี้ว่า Uber กำลัง ชะลอการจ้างงาน เพื่อชดเชยการลงทุนด้าน AI
ผู้ใช้รู้สึกเหมือนฟรี แต่บริษัทเป็นผู้แบกรับต้นทุน
- Macdonald มองว่าหากอยู่ในมุมของผู้ใช้ที่ไม่ต้องจ่ายเงินและกำลังนึกถึง “กรณีใช้งานที่น่าสนใจ” AI อาจดูเหมือนเป็นของฟรี
- แต่ท้ายที่สุดแล้ว บริษัทจะเป็นผู้จ่ายต้นทุน
- การขยายการใช้ AI จึงไม่ได้เป็นเพียงการทดลองด้านประสิทธิภาพการทำงาน แต่ถูกมองเป็นโครงสร้างต้นทุนที่กระทบทั้งงบประมาณและการบริหารกำลังคน
กระแสที่ต่างจาก tokenmaxxing ของ Big Tech
- Big Tech กำลังผลักดันแนวทาง tokenmaxxing หรือการใช้ AI ให้มากที่สุดอย่างจริงจัง และบางบริษัทก็นำปริมาณการใช้ AI ของพนักงานไปสะท้อนในการประเมินผล
- Meta, Google, JPMorgan ถูกยกเป็นตัวอย่างของบริษัทที่เชื่อมการใช้ AI เข้ากับการประเมินผลงาน เป้าหมาย การขึ้นเงินเดือน และการเลื่อนตำแหน่ง
- ในทางกลับกัน บางบริษัทเริ่มถอยออกจากแนวทางที่ผลักดันการใช้ AI เพียงเพื่อให้ใช้ AI
- Duolingo ยกเลิกการตัดสินใจที่จะรวมการใช้ AI เข้าไปในเกณฑ์ประเมินผลงาน หลังพนักงานตั้งคำถามว่า “เราต้องใช้ AI เพียงเพื่อจะได้บอกว่าใช้ AI หรือเปล่า”
- Luis von Ahn CEO ของ Duolingo กล่าวในการสัมภาษณ์พอดแคสต์เมื่อเดือนเมษายนว่า แทนที่จะเป็นการรับผิดชอบต่อผลลัพธ์จริง ในบางกรณีมันให้ความรู้สึกเหมือนกำลังฝืนผลักสิ่งที่ไม่เหมาะให้เดินหน้าต่อ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ช่วงปี 2007~2009 ตอนที่ Google ขยายดาต้าเซ็นเตอร์อย่างมาก โดยเฉพาะนอกเวลางานจะมี ความจุที่ว่างอยู่ จำนวนมาก
วิศวกรคนไหนก็ได้สามารถรันงานได้เท่าที่ต้องการด้วยลำดับความสำคัญ 0 และถ้างานที่สำคัญกว่าต้องการทรัพยากร งานเหล่านี้ก็จะถูกฆ่าก่อนเป็นอย่างแรก
มีการทดลอง MapReduce ที่รันข้ามคืนกันเยอะมาก และอยู่ช่วงหนึ่งก็เอาบริการภายในมารันที่ลำดับความสำคัญ 0 จนแทบเหมือนใช้งาน “ฟรี”
เมื่อการใช้งานเพิ่มขึ้น บริการแบบนั้นก็ไม่เสถียรมากขึ้นเรื่อยๆ และสุดท้ายก็ต้องอธิบายความคุ้มค่าของการใช้ทรัพยากรหรือลดขนาดลง แต่ก็มองว่านั่นเป็นทิศทางที่ดี
การใช้โทเค็น AI ก็น่าจะเหมาะกับโมเดลคล้ายกัน บริษัทเทคขนาดใหญ่สามารถมีดาต้าเซ็นเตอร์ LLM ของตัวเองไว้รองรับความต้องการภายใน และเปิด ความจุว่างนอกเวลางาน ให้พนักงานใช้ทดลองได้
สำหรับงานประจำวัน ควรส่งเสริม ประสิทธิภาพของโทเค็น มากกว่าจำนวนโทเค็นเอง การใช้โทเค็นมากกับระบบอัตโนมัติที่ช่วยลดแรงงานคนได้หลายชั่วโมงต่อสัปดาห์ถือว่าใช้ได้ดี แต่การใช้โทเค็นมากเพื่อดีบักบั๊กฟรอนต์เอนด์ง่ายๆ ที่แก้มือก็ได้อยู่แล้ว แถมยังกินเวลา 4 ชั่วโมง แบบนั้นคือความสิ้นเปลือง
https://developers.openai.com/api/docs/guides/batch
สำหรับแนวทางอย่างการพัฒนาตามสเปก ที่มนุษย์ไม่ได้อยู่ในลูปตลอดแต่คอยตรวจสอบจากเหนือวงจร วิธีนี้ดูเป็นธรรมชาติกว่ามาก แต่เท่าที่เคยสัมผัสฟรอนต์เอนด์ของ Google อย่างน้อยก็ยังไม่ค่อยเห็นที่ไหนรองรับดี
สิ่งที่เกิดขึ้นตอนนี้เป็นเรื่องที่ชัดเจนมากสำหรับหลายคน มันเหมือนบอกผู้เสพติดหน้าใหม่ที่ถูกออกแบบมาให้ติดโดยตั้งใจว่า “ใช้ให้อย่างระมัดระวังขึ้นหน่อย” เลยมีโอกาสสูงที่จะไม่ได้ผล
ไม่ชอบใช้ AI และก็ไม่ได้รู้สึกว่ามันช่วยอะไรนัก
แต่บริษัทบังคับให้ใช้และติดตามตัวชี้วัด เลยโยนงานจุกจิกไร้สาระเข้าไปทุกวันเพื่อให้ดูเหมือนว่าได้ใช้งาน
ถึงจะสร้างปัญหามากกว่าที่แก้ได้ อย่างน้อยในเชิงตัวชี้วัดก็กลายเป็นคนที่ใช้ AI
ถ้าบริษัทไหนประกาศว่าจะใช้ ปริมาณการใช้โทเค็น เป็นสัญญาณวัดผลงานพนักงาน ผมมองว่านั่นเกือบจะเป็นธงแดงที่ควรหลีกเลี่ยงบริษัทนั้น
ถ้ามีผู้นำด้านวิศวกรรมที่ดี ก็ไม่ควรปฏิบัติกับเรื่องนี้เหมือนเป็นไอเดียที่พอรับได้
แต่ถ้าใช้โทเค็น AI แบบไม่เกิดประสิทธิผลไป 500 ดอลลาร์ กลับได้รับการยกย่องว่าเป็น ผู้ใช้งาน AI ระดับแนวหน้า บริษัทมักพูดประชดกันแบบนี้
บางบริษัทถึงขั้นบอกนักพัฒนาว่า “ตอนนี้เราไม่อยากให้คุณเขียนโค้ดเองแม้แต่บรรทัดเดียว”
จากมุมมองผู้บริหารคงคิดประมาณว่า ถ้าพนักงาน 20% แรกใช้ LLM สร้างโค้ดได้ 80% แล้วบริษัทก็ยังเดินต่อได้ ก็ลดนักพัฒนา 80% ล่างเพื่อประหยัดค่าใช้จ่ายได้
การใช้ ปริมาณการใช้โทเค็น ไปผูกกับการประเมินผลงานพนักงานก็เป็นแค่หนึ่งในนั้น
ใต้เตาปฏิกรณ์ฟิวชันยักษ์บนท้องฟ้า แทบไม่มีอะไรใหม่จริงๆ
ผมเคยอ่านเรื่องคล้าย tokenmaxxing ในอุตสาหกรรมโทรเลขจากหนังสือ “The Information” ของ James Gleick
โทรเลขคิดค่าบริการตามจำนวนตัวอักษร จึงมีตลาด สมุดรหัส ขนาดใหญ่เพื่อลดจำนวนอักขระที่ต้องส่ง การบีบอัดคือเงิน และบริษัทโทรเลขไม่ชอบสิ่งนี้แต่ก็ต้องยอมรับ
อุตสาหกรรมรหัสโทรเลขเริ่มมาตั้งแต่ยุคแรกของการใช้โทรเลขเชิงพาณิชย์ และดำเนินต่อเนื่องไปจนถึงทศวรรษ 1920
แต่ก็มีต้นทุนเช่นกัน รหัสลดความซ้ำซ้อนลงอย่างมาก และความผิดพลาดเพียงเล็กน้อยก็อาจนำไปสู่ความเข้าใจผิดครั้งใหญ่
ตามที่ Gleick อธิบาย นี่ตรงข้ามกับวิธีที่การตีกลองในแอฟริกาเพิ่ม ความซ้ำซ้อน เพื่อเสริมความสัมพันธ์ระหว่างจังหวะกับภาษาที่กลองกำลังเลียนแบบ
ก็คือคนที่เผาโทเค็นหรือค่าใช้จ่ายได้มากที่สุดเป็นฝ่ายชนะ ไม่ใช่โปรแกรมเมอร์ที่ส่งมอบฟีเจอร์ได้
สิ่งที่อธิบายมาจึงใกล้เคียงกับ การลดโทเค็นให้ต่ำที่สุด มากกว่าจะเป็นการเพิ่มให้สูงสุด
ฉันสงสัยเรื่องนี้เกี่ยวกับซอฟต์แวร์สแต็กมาตั้งแต่ก่อนยุค LLM และตอนนี้ยิ่งดูเกี่ยวข้องมากขึ้น
บริษัทอย่าง Uber จะ "เสร็จสมบูรณ์" เมื่อไร? พวกเขาทำซอฟต์แวร์มา 16 ปีแล้ว
มันคือบริษัทที่จับคู่คนขับกับผู้โดยสาร และการสร้างซอฟต์แวร์เพิ่มก็ไม่ได้ทำให้ฉันมีแนวโน้มจะเรียก Uber แทนรถบัสหรือรถไฟมากขึ้นอย่างมีนัยสำคัญ
อีก 20 ปีซอฟต์แวร์จะจบไหม? หรืออีก 80 ปี?
ยังไม่นับสภาพแวดล้อมด้านกฎระเบียบที่เปลี่ยนไปและผลิตภัณฑ์ใหม่ ๆ แค่ดูว่า Uber Eats ออกมาตอนไหนก็พอ
ในช่วง 16 ปีนั้นมี Covid-19 เกิดขึ้น มีการขับขี่อัตโนมัติที่ใช้งานได้จริง และมีความร่วมมือกับ Waymo
แอปสำหรับผู้บริโภคที่เชื่อมต่อกันผ่านเครือข่ายไม่มีทาง "เสร็จสมบูรณ์" ได้เลย ถ้าไม่มีญาณหยั่งรู้ที่สมบูรณ์แบบ
เทคโนโลยีสแต็กภายในเหมือนสิ่งมีชีวิต และแม้แต่การรักษาบริการที่ภายนอกดูเหมือนไม่เปลี่ยนก็ยังมีงานมหาศาล การสเกลก็เป็นเรื่องใหญ่ และ การสเกลกับการบำรุงรักษา ก็ยิ่งขยายกันและกันไปเรื่อย ๆ
แต่ละประเทศมีกฎหมายของตัวเองว่า Uber ทำอะไรได้และทำอะไรไม่ได้ และต้องทำให้เป็นรูปแบบในโค้ด
ตัวอย่างเช่น ในบางแห่ง คุณเรียกแท็กซี่ผ่านแอป Uber แต่ค่าโดยสารอาจไม่ได้ล็อกไว้ล่วงหน้าและคิดตามไมล์แทน
แล้วยังมีกฎหมายระดับเมืองเข้ามาอีก ถ้านั่ง Uber จากเมือง A ที่มีกฎหมายแบบหนึ่งไปเมือง B ที่มีกฎหมายอีกแบบ ต้องทำอย่างไร? ทนายอาจรู้คำตอบ แต่แอปต้องปฏิบัติตามด้วย
แถมกฎหมายก็เปลี่ยนตลอด
การเพิ่มประสิทธิภาพก็ไม่มีวันจบ ทั้งความเร็ว ต้นทุน เส้นทาง ล้วนมีอะไรให้ปรับปรุงเสมอ
ในฐานะผู้บริโภค สิ่งที่เราเห็นเป็นเพียงเศษเสี้ยวเล็กมากของความซับซ้อนที่บริการแบบนี้ต้องสร้างและดูแล
แทบจะมีบั๊กที่ต้องแก้อยู่ตลอด มีบั๊กเยอะมากจริง ๆ
นี่ก็เป็นปัญหาของบริษัทที่ได้รับเงินลงทุนมหาศาล มูลค่าของ Uber ไม่ได้ตั้งอยู่แค่กับสิ่งที่ทำอยู่ตอนนี้ แต่ตั้งอยู่บนความคาดหวังว่ามันจะทำให้แนวคิดอย่างการมีรถส่วนตัวหรือการใช้ขนส่งสาธารณะกลายเป็นของล้าสมัย
ฟังดูพูดเกินจริง แต่จริง ๆ ก็ไม่ได้เกินจริงอย่างที่คิด
tokenmaxxing ฟังไม่เข้าท่าเลย มันคล้ายกับการเขียน งาน SQL/Spark ที่ไร้ประสิทธิภาพ เพื่อจะได้ใช้ compute, memory, และ I/O ให้มากที่สุด
เหมือนจงใจยัด Cartesian product หรือชุดข้อมูลที่ skew สุดขั้วเข้าไปเยอะ ๆ
พอเมตริกกลายเป็นเป้าหมาย เรื่องแบบนี้ก็เกิดขึ้นเสมอ บริษัทควรสร้างสภาพแวดล้อมที่ใช้ AI อย่างมีประสิทธิภาพที่สุด และควรถามก่อนว่า "งานนี้จำเป็นต้องใช้ agent จริงหรือ?"
ถ้าจำเป็น ก็ต้องกำหนดว่าใช้ agent แบบไหน ใช้โมเดลอะไร ต้องการระดับการให้เหตุผลแค่ไหน
ควรส่งเสริมการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อให้ใช้ข้อมูลได้ด้วยบริบทที่น้อยลงด้วย knowledge graph ค่อนข้างดีสำหรับเรื่องนี้
เหมือนกับจุดไฟเผาปั๊มน้ำมันเพื่อจะชนะการแข่งขัน
มันเป็นแค่วิธีจูงใจหรือบังคับให้พนักงานทุกคนทดลองใช้เทคโนโลยีใหม่
พอทุกคนถูกมองว่าใช้ AI กันหมดแล้ว ของอย่าง tokenmaxxing ก็น่าจะจบไปเอง
ฉันก็เห็น use case มากมายที่น่าสงสัยว่าจะสร้างมูลค่าได้จริงไหม แต่ก็เคยเห็นทีมที่ใช้เวิร์กโฟลว์แบบ agent แก้ปัญหาเก่า ๆ ได้ ทั้งที่ถ้าต้องไปชี้แจงต่อคณะกรรมการตรวจต้นทุนก็คงยากจะอธิบายให้ผ่าน
งานอย่างการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อใช้บริบทให้น้อยลงนั้น เท่าที่เข้าใจ บริษัท tokenmaxxing รายใหญ่ส่วนมากก็มีทีมแยกทำอยู่เบื้องหลัง
ฉันเข้าใจว่าบริษัทต่าง ๆ กำลังเผาเงินกับการพัฒนาซอฟต์แวร์แบบมี AI ช่วย แต่ ผลตอบแทนจากการลงทุน โดยรวมเป็นอย่างไร? มันสร้างมูลค่าคุ้มกับประสิทธิภาพที่อ้างไว้จริงหรือ?
สำหรับฉัน นี่เป็นประเด็นเดียวที่น่าสนใจจริง ๆ ในกระแส AI แต่ไม่รู้ทำไมไม่มีใครพูดถึง
คุณอาจใช้ Claude สร้างฟีเจอร์ห่วย ๆ หรือไม่มีประโยชน์ได้ 5 อย่างในวันเดียว หรือสร้างฟีเจอร์ที่มีประโยชน์ 1 อย่างในสองวัน แบบไหนส่งผลต่อ ROI ดีกว่ากัน?
แค่ดูจากตัวอย่างเหมือนจะตอบง่าย แต่ในความเป็นจริงมันละเอียดอ่อนกว่านั้นมาก และวัดยากกว่ามาก
เลยดูเหมือนหลายบริษัทจะยอมแพ้เรื่องการวัด แล้วเลือกทางง่ายคือวิ่งตามกระแสโฆษณาเกินจริง
ถ้ารวมการทำโค้ดรีวิวและใช้งานอย่างถูกวิธีด้วย ฉันค่อนข้างมั่นใจว่าระดับการพัฒนาอย่างยั่งยืนสูงสุดที่ AI ให้ได้ สำหรับวิศวกรอาวุโสที่มีทักษะเหมาะสม อยู่ราว ๆ 20%
งบโทเคนของวิศวกรคนไหนก็ไม่ควรเกินกว่านั้น
ฉันไม่เชื่อเลยว่าวิศวกรที่ทำ tokenmaxxing จะมีประสิทธิผลจริง และก็ไม่เคยเห็นหลักฐานอะไรแบบนั้นเลย ถ้าอะไรก็น่าจะตรงกันข้ามมากกว่า
ถ้ามีโฟลว์ที่ถูกต้องและมีความรู้เกี่ยวกับโค้ดเบส ฉันสัมผัสได้ด้วยตัวเองว่าระดับนั้นทำได้จริงด้วยระดับความพยายามที่ยั่งยืน
ดูเหมือน AI เพื่อเพิ่มผลิตภาพทางวิศวกรรมจะถูกเข้าใจผิดอย่างแพร่หลายว่าเป็น ปุ่มวิเศษ ที่ให้ผลลัพธ์เดิมได้เร็วขึ้นและถูกลง
ถ้าคิดแบบนั้น ก็ไม่แปลกที่จะอยากบังคับให้พนักงานทำ tokenmaxxing เพราะได้ผลลัพธ์มากขึ้น เร็วขึ้น ถูกลง แล้วจะไม่ทำทำไม?
แต่ถ้ามองให้ละเอียดขึ้น มันเป็นแบบนี้ AI ช่วยให้ไปถึง roadmap ได้เร็วขึ้นระดับหนึ่ง แต่ก็ก่อหนี้ทางเทคนิคคล้ายกับการจ้างนักพัฒนาชั่วคราวมาสร้างฟีเจอร์
ไม่ได้หมายความว่าจะมีคนในทีมที่เข้าใจโค้ดใหม่เสมอไป
ในทำนองเดียวกัน การยกระดับทักษะของสมาชิกทีมรุ่นจูเนียร์ก็เกิดน้อยลงด้วย คุณจึงดึง ส่วนต่างระหว่างทักษะกับค่าจ้าง ได้ยากขึ้นกว่าเดิม
ตัวผลิตภัณฑ์เองก็อาจซับซ้อนขึ้นได้ ฟีเจอร์ระดับ P2 เป็น P2 ด้วยเหตุผลของมัน แต่ AI อาจทำให้ใส่ฟีเจอร์ที่ให้ผลตอบแทนส่วนเพิ่มต่ำเข้ามา จนผลิตภัณฑ์ซับซ้อนขึ้น
ฉันช็อกที่เคยมีคนเชื่อว่า tokenmaxxing เป็นความคิดที่ดี
พวก AI maximalist มักเปรียบเทียบเทคโนโลยีนี้กับไฟฟ้า ลองนึกภาพว่าช่วงแรกของยุคไฟฟ้า CEO ให้รางวัลพนักงานจาก การเพิ่มการใช้ไฟฟ้า แทนที่จะหาวิธีใช้ไฟฟ้าให้สร้างผลลัพธ์ทางธุรกิจ
ในยุคนั้นการส่งคนที่มีอาการคล้ายปัญหาสุขภาพจิตเข้าไปอยู่ในสถานดูแลเป็นเรื่องปกติ และเรื่องนี้ก็คงลงเอยแบบนั้น