COO ของ Uber เผยว่าการหาเหตุผลมารองรับเงินที่ใช้กับ tokenmaxxing ทำได้ยากขึ้นเรื่อย ๆ

(businessinsider.com)

4 คะแนน โดย GN⁺ 2026-05-27 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

COO ของ Uber มองว่าการอธิบายให้สมเหตุสมผลว่าเงินที่ใช้กับ AI ให้ผลลัพธ์คุ้มกับต้นทุนที่ใส่ไปหรือไม่นั้นยากขึ้นเรื่อย ๆ
ประเด็นถกเถียงภายในรุนแรงขึ้นหลัง CTO ของ Uber เปิดเผยว่าได้ใช้预算 Claude Code สำหรับปี 2026 หมดไปแล้ว
ความเชื่อมโยงที่ว่า ปริมาณการใช้โทเคน ที่มากขึ้นจะนำไปสู่การเพิ่มขึ้นของฟีเจอร์ผู้บริโภคที่มีประโยชน์อย่างเป็นสัดส่วน ยังไม่ได้รับการยืนยัน
CEO ของ Uber ระบุว่า Uber กำลังชะลอการจ้างงานเพื่อชดเชยการลงทุนด้าน AI
ต่างจากกระแส tokenmaxxing ของ Big Tech ทาง Duolingo ได้ยกเลิกการตัดสินใจที่จะนำการใช้ AI ไปใส่ในเกณฑ์ประเมินผลงาน หลังเกิดกระแสตอบรับจากพนักงาน

ปัญหาการหาเหตุผลรองรับต้นทุน AI ภายใน Uber

Andrew Macdonald ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Uber มองว่าการหาเหตุผลรองรับต้นทุน AI ภายในบริษัทกำลังยากขึ้นเรื่อย ๆ
ใน บทสัมภาษณ์ Rapid Response ที่เผยแพร่เมื่อวันเสาร์ เขาระบุว่า AI ยังไม่ได้สร้างผลลัพธ์มากพอเมื่อเทียบกับเงินที่บริษัทใช้ไป
การถกเถียงภายในรุนแรงขึ้นหลัง Praveen Neppalli Naga CTO ของ Uber เปิดเผยในการให้สัมภาษณ์กับ The Information เมื่อเดือนเมษายนว่า Uber ใช้งบ Claude Code สำหรับปี 2026 หมดไปแล้ว
คำพูดดังกล่าวนำไปสู่สถานการณ์ที่ Macdonald อธิบายว่าเป็น “ช่วงเวลาที่เหมือนหัวจะระเบิด” และภายในบริษัทได้มีการพูดคุยถึงการแลกเปลี่ยนระหว่าง การใช้โทเคน AI กับ ขนาดกำลังคน

ยังไม่มีความเชื่อมโยงระหว่างการใช้โทเคนกับผลงานของผลิตภัณฑ์

หลังจากพูดคุยกับผู้นำวิศวกรรมระดับสูงของ Uber แล้ว Macdonald เห็นว่าการใช้ โทเคน มากขึ้นไม่ได้แปลว่าจะทำให้มีฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้นอย่างเป็นสัดส่วน
เขากล่าวว่า “ความเชื่อมโยงนั้นยังไม่มี” โดยมองว่าแม้อาจมีการปล่อยฟีเจอร์มากขึ้น แต่ก็ยากที่จะเชื่อมตัวชี้วัดบางอย่างเข้ากับข้อสรุปว่า “ตอนนี้เรากำลังสร้างฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้น 25% จริง ๆ” ได้โดยตรง
ยิ่งเชื่อมค่าใช้จ่ายด้าน AI เข้ากับผลลัพธ์ได้ยากเท่าไร ก็ยิ่งยากที่จะหาเหตุผลมารองรับต้นทุนแลกเปลี่ยนดังกล่าว
Dara Khosrowshahi CEO เปิดเผยในการประกาศผลประกอบการเมื่อต้นเดือนนี้ว่า Uber กำลัง ชะลอการจ้างงาน เพื่อชดเชยการลงทุนด้าน AI

ผู้ใช้รู้สึกเหมือนฟรี แต่บริษัทเป็นผู้แบกรับต้นทุน

Macdonald มองว่าหากอยู่ในมุมของผู้ใช้ที่ไม่ต้องจ่ายเงินและกำลังนึกถึง “กรณีใช้งานที่น่าสนใจ” AI อาจดูเหมือนเป็นของฟรี
แต่ท้ายที่สุดแล้ว บริษัทจะเป็นผู้จ่ายต้นทุน
การขยายการใช้ AI จึงไม่ได้เป็นเพียงการทดลองด้านประสิทธิภาพการทำงาน แต่ถูกมองเป็นโครงสร้างต้นทุนที่กระทบทั้งงบประมาณและการบริหารกำลังคน

กระแสที่ต่างจาก tokenmaxxing ของ Big Tech

Big Tech กำลังผลักดันแนวทาง tokenmaxxing หรือการใช้ AI ให้มากที่สุดอย่างจริงจัง และบางบริษัทก็นำปริมาณการใช้ AI ของพนักงานไปสะท้อนในการประเมินผล
Meta, Google, JPMorgan ถูกยกเป็นตัวอย่างของบริษัทที่เชื่อมการใช้ AI เข้ากับการประเมินผลงาน เป้าหมาย การขึ้นเงินเดือน และการเลื่อนตำแหน่ง
ในทางกลับกัน บางบริษัทเริ่มถอยออกจากแนวทางที่ผลักดันการใช้ AI เพียงเพื่อให้ใช้ AI
Duolingo ยกเลิกการตัดสินใจที่จะรวมการใช้ AI เข้าไปในเกณฑ์ประเมินผลงาน หลังพนักงานตั้งคำถามว่า “เราต้องใช้ AI เพียงเพื่อจะได้บอกว่าใช้ AI หรือเปล่า”
Luis von Ahn CEO ของ Duolingo กล่าวในการสัมภาษณ์พอดแคสต์เมื่อเดือนเมษายนว่า แทนที่จะเป็นการรับผิดชอบต่อผลลัพธ์จริง ในบางกรณีมันให้ความรู้สึกเหมือนกำลังฝืนผลักสิ่งที่ไม่เหมาะให้เดินหน้าต่อ

3 ความคิดเห็น

roxie 6 일 전

พอมามองตอนนี้แล้ว สุดท้ายก็ดูเหมือนว่าบริษัทต่าง ๆ กำลังเข้าสู่สถานการณ์ที่ต้องรัดเข็มขัดเรื่องโทเคนกันหมดเลยนะ

colus001 29 일 전

Tokenmaxxing นี่ดูประหลาดจริง ๆ ยิ่งรถบรรทุกใช้น้ำมันมากเท่าไหร่ยิ่งดี นี่มันหมายความว่ายังไงกันแน่ รู้สึกเหมือนโดน Jensen Huang หลอกเล่นเข้าให้แล้วนะ

GN⁺ 2026-05-27

ความคิดเห็นจาก Hacker News

ช่วงปี 2007~2009 ตอนที่ Google ขยายดาต้าเซ็นเตอร์อย่างมาก โดยเฉพาะนอกเวลางานจะมี ความจุที่ว่างอยู่ จำนวนมาก
วิศวกรคนไหนก็ได้สามารถรันงานได้เท่าที่ต้องการด้วยลำดับความสำคัญ 0 และถ้างานที่สำคัญกว่าต้องการทรัพยากร งานเหล่านี้ก็จะถูกฆ่าก่อนเป็นอย่างแรก
มีการทดลอง MapReduce ที่รันข้ามคืนกันเยอะมาก และอยู่ช่วงหนึ่งก็เอาบริการภายในมารันที่ลำดับความสำคัญ 0 จนแทบเหมือนใช้งาน “ฟรี”
เมื่อการใช้งานเพิ่มขึ้น บริการแบบนั้นก็ไม่เสถียรมากขึ้นเรื่อยๆ และสุดท้ายก็ต้องอธิบายความคุ้มค่าของการใช้ทรัพยากรหรือลดขนาดลง แต่ก็มองว่านั่นเป็นทิศทางที่ดี
การใช้โทเค็น AI ก็น่าจะเหมาะกับโมเดลคล้ายกัน บริษัทเทคขนาดใหญ่สามารถมีดาต้าเซ็นเตอร์ LLM ของตัวเองไว้รองรับความต้องการภายใน และเปิด ความจุว่างนอกเวลางาน ให้พนักงานใช้ทดลองได้
สำหรับงานประจำวัน ควรส่งเสริม ประสิทธิภาพของโทเค็น มากกว่าจำนวนโทเค็นเอง การใช้โทเค็นมากกับระบบอัตโนมัติที่ช่วยลดแรงงานคนได้หลายชั่วโมงต่อสัปดาห์ถือว่าใช้ได้ดี แต่การใช้โทเค็นมากเพื่อดีบักบั๊กฟรอนต์เอนด์ง่ายๆ ที่แก้มือก็ได้อยู่แล้ว แถมยังกินเวลา 4 ชั่วโมง แบบนั้นคือความสิ้นเปลือง
- มันไม่คล้ายกับ batch processing ของ OpenAI เหรอ? คำขอจะถูกประมวลผลภายใน 24 ชั่วโมงและค่าใช้จ่ายถูกลงครึ่งหนึ่ง
  https://developers.openai.com/api/docs/guides/batch
- ไม่น่าคิดว่าผู้ใช้ LLM จะมีเหตุผลกันขนาดนั้น ดูเหมือนมีผู้ใช้จำนวนมากพอสมควรที่ยืนกรานว่าต้องโยนทุกงานเล็กน้อยให้ Opus
- ฟรอนต์เอนด์ AI ส่วนใหญ่ถูกออกแบบมาสำหรับ งานแบบโต้ตอบ เลยทำให้กำหนดงานลำดับความสำคัญ 0 ที่จะประมวลผลเมื่อไรก็ได้ในอนาคตได้ยาก
  สำหรับแนวทางอย่างการพัฒนาตามสเปก ที่มนุษย์ไม่ได้อยู่ในลูปตลอดแต่คอยตรวจสอบจากเหนือวงจร วิธีนี้ดูเป็นธรรมชาติกว่ามาก แต่เท่าที่เคยสัมผัสฟรอนต์เอนด์ของ Google อย่างน้อยก็ยังไม่ค่อยเห็นที่ไหนรองรับดี
- การห้ามไม่ให้คนใช้โทเค็นเยอะกับบั๊กฟรอนต์เอนด์ง่ายๆ แล้วหมดไป 4 ชั่วโมงนั้น คงไม่ง่ายนัก
  สิ่งที่เกิดขึ้นตอนนี้เป็นเรื่องที่ชัดเจนมากสำหรับหลายคน มันเหมือนบอกผู้เสพติดหน้าใหม่ที่ถูกออกแบบมาให้ติดโดยตั้งใจว่า “ใช้ให้อย่างระมัดระวังขึ้นหน่อย” เลยมีโอกาสสูงที่จะไม่ได้ผล
- ท้ายที่สุดแล้ว การที่ทุกคนยอมรับ โมเดลจีนที่ถูกกว่ากัน 10 เท่า ก็ดูเป็นไปได้มากกว่าไม่ใช่เหรอ
ไม่ชอบใช้ AI และก็ไม่ได้รู้สึกว่ามันช่วยอะไรนัก
แต่บริษัทบังคับให้ใช้และติดตามตัวชี้วัด เลยโยนงานจุกจิกไร้สาระเข้าไปทุกวันเพื่อให้ดูเหมือนว่าได้ใช้งาน
ถึงจะสร้างปัญหามากกว่าที่แก้ได้ อย่างน้อยในเชิงตัวชี้วัดก็กลายเป็นคนที่ใช้ AI
ถ้าบริษัทไหนประกาศว่าจะใช้ ปริมาณการใช้โทเค็น เป็นสัญญาณวัดผลงานพนักงาน ผมมองว่านั่นเกือบจะเป็นธงแดงที่ควรหลีกเลี่ยงบริษัทนั้น
ถ้ามีผู้นำด้านวิศวกรรมที่ดี ก็ไม่ควรปฏิบัติกับเรื่องนี้เหมือนเป็นไอเดียที่พอรับได้
- ถ้าเบิกค่าอาหารตอนเดินทางเกิน 100 ดอลลาร์ ก็ต้องไปคุยแบบอึดอัดกับผู้จัดการหรือทีมการเงิน
  แต่ถ้าใช้โทเค็น AI แบบไม่เกิดประสิทธิผลไป 500 ดอลลาร์ กลับได้รับการยกย่องว่าเป็น ผู้ใช้งาน AI ระดับแนวหน้า บริษัทมักพูดประชดกันแบบนี้
- อาจจะน่าแปลกใจ แต่ผมรู้จักนักพัฒนาหลายคนในบริษัทเทคขนาดใหญ่ที่ใครๆ ก็รู้จัก แม้จะไม่ใช่ FAANG และทุกที่ล้วนมี ตารางจัดอันดับโทเค็น ไม่ทางใดก็ทางหนึ่ง
  บางบริษัทถึงขั้นบอกนักพัฒนาว่า “ตอนนี้เราไม่อยากให้คุณเขียนโค้ดเองแม้แต่บรรทัดเดียว”
  จากมุมมองผู้บริหารคงคิดประมาณว่า ถ้าพนักงาน 20% แรกใช้ LLM สร้างโค้ดได้ 80% แล้วบริษัทก็ยังเดินต่อได้ ก็ลดนักพัฒนา 80% ล่างเพื่อประหยัดค่าใช้จ่ายได้
- แม้แต่บริษัทที่เมื่อก่อนมีภาวะผู้นำที่สมเหตุสมผล พอ LLM AI โผล่มาก็เริ่มรีบร้อนและตัดสินใจแบบน่าสงสัย
  การใช้ ปริมาณการใช้โทเค็น ไปผูกกับการประเมินผลงานพนักงานก็เป็นแค่หนึ่งในนั้น
- โทเค็นคือ จำนวนบรรทัดโค้ดต่อวิศวกร แบบใหม่ มันเอาไปทำกราฟได้ง่ายและ “บริหารจัดการ” ก็ง่าย
- Meta ทำแบบนี้ ลองเดาดูได้เลยว่าเกณฑ์หนึ่งของการปลดพนักงานล่าสุดน่าจะเป็นอะไร
ใต้เตาปฏิกรณ์ฟิวชันยักษ์บนท้องฟ้า แทบไม่มีอะไรใหม่จริงๆ
ผมเคยอ่านเรื่องคล้าย tokenmaxxing ในอุตสาหกรรมโทรเลขจากหนังสือ “The Information” ของ James Gleick
โทรเลขคิดค่าบริการตามจำนวนตัวอักษร จึงมีตลาด สมุดรหัส ขนาดใหญ่เพื่อลดจำนวนอักขระที่ต้องส่ง การบีบอัดคือเงิน และบริษัทโทรเลขไม่ชอบสิ่งนี้แต่ก็ต้องยอมรับ
อุตสาหกรรมรหัสโทรเลขเริ่มมาตั้งแต่ยุคแรกของการใช้โทรเลขเชิงพาณิชย์ และดำเนินต่อเนื่องไปจนถึงทศวรรษ 1920
แต่ก็มีต้นทุนเช่นกัน รหัสลดความซ้ำซ้อนลงอย่างมาก และความผิดพลาดเพียงเล็กน้อยก็อาจนำไปสู่ความเข้าใจผิดครั้งใหญ่
ตามที่ Gleick อธิบาย นี่ตรงข้ามกับวิธีที่การตีกลองในแอฟริกาเพิ่ม ความซ้ำซ้อน เพื่อเสริมความสัมพันธ์ระหว่างจังหวะกับภาษาที่กลองกำลังเลียนแบบ
- นั่นไม่ใช่ตรงกันข้ามกับ tokenmaxxing แบบเป๊ะๆ เหรอ? ถ้าจะเทียบกับโทรเลข ก็น่าจะเป็นสถานการณ์ที่พนักงานโทรเลขถูกประเมินจากเวลาที่ครอบครองสายต่อวัน ไม่ใช่จากจำนวนลูกค้าที่ให้บริการ
  ก็คือคนที่เผาโทเค็นหรือค่าใช้จ่ายได้มากที่สุดเป็นฝ่ายชนะ ไม่ใช่โปรแกรมเมอร์ที่ส่งมอบฟีเจอร์ได้
  สิ่งที่อธิบายมาจึงใกล้เคียงกับ การลดโทเค็นให้ต่ำที่สุด มากกว่าจะเป็นการเพิ่มให้สูงสุด
- น่าสนใจ แต่ tokenmaxxing ไม่ใช่การเพิ่ม ประสิทธิภาพ ของการใช้โทเค็นให้สูงสุด มันคือการเพิ่มปริมาณการใช้เองให้สูงสุด
- ที่อธิบายมาจริงๆ แล้วแทบจะเป็นด้านตรงข้ามของ tokenmaxxing
ฉันสงสัยเรื่องนี้เกี่ยวกับซอฟต์แวร์สแต็กมาตั้งแต่ก่อนยุค LLM และตอนนี้ยิ่งดูเกี่ยวข้องมากขึ้น
บริษัทอย่าง Uber จะ "เสร็จสมบูรณ์" เมื่อไร? พวกเขาทำซอฟต์แวร์มา 16 ปีแล้ว
มันคือบริษัทที่จับคู่คนขับกับผู้โดยสาร และการสร้างซอฟต์แวร์เพิ่มก็ไม่ได้ทำให้ฉันมีแนวโน้มจะเรียก Uber แทนรถบัสหรือรถไฟมากขึ้นอย่างมีนัยสำคัญ
อีก 20 ปีซอฟต์แวร์จะจบไหม? หรืออีก 80 ปี?
- โค้ดเบสส่วนใหญ่คือ การเชื่อมต่อแบบปรับแต่งตามตลาดท้องถิ่น บางส่วนทำให้เป็นระบบได้ แต่ความซับซ้อนส่วนใหญ่มาจากตรงนั้น
- ถ้าเบราว์เซอร์, Android, iOS หยุดนิ่งเกิน 16 ปี มันอาจจะง่ายขึ้นบ้าง
  ยังไม่นับสภาพแวดล้อมด้านกฎระเบียบที่เปลี่ยนไปและผลิตภัณฑ์ใหม่ ๆ แค่ดูว่า Uber Eats ออกมาตอนไหนก็พอ
  ในช่วง 16 ปีนั้นมี Covid-19 เกิดขึ้น มีการขับขี่อัตโนมัติที่ใช้งานได้จริง และมีความร่วมมือกับ Waymo
  แอปสำหรับผู้บริโภคที่เชื่อมต่อกันผ่านเครือข่ายไม่มีทาง "เสร็จสมบูรณ์" ได้เลย ถ้าไม่มีญาณหยั่งรู้ที่สมบูรณ์แบบ
  เทคโนโลยีสแต็กภายในเหมือนสิ่งมีชีวิต และแม้แต่การรักษาบริการที่ภายนอกดูเหมือนไม่เปลี่ยนก็ยังมีงานมหาศาล การสเกลก็เป็นเรื่องใหญ่ และ การสเกลกับการบำรุงรักษา ก็ยิ่งขยายกันและกันไปเรื่อย ๆ
- ดูเหมือนคุณจะมองข้ามว่าการดำเนินงานระหว่างประเทศและการเพิ่มประสิทธิภาพนั้นซับซ้อนแค่ไหน
  แต่ละประเทศมีกฎหมายของตัวเองว่า Uber ทำอะไรได้และทำอะไรไม่ได้ และต้องทำให้เป็นรูปแบบในโค้ด
  ตัวอย่างเช่น ในบางแห่ง คุณเรียกแท็กซี่ผ่านแอป Uber แต่ค่าโดยสารอาจไม่ได้ล็อกไว้ล่วงหน้าและคิดตามไมล์แทน
  แล้วยังมีกฎหมายระดับเมืองเข้ามาอีก ถ้านั่ง Uber จากเมือง A ที่มีกฎหมายแบบหนึ่งไปเมือง B ที่มีกฎหมายอีกแบบ ต้องทำอย่างไร? ทนายอาจรู้คำตอบ แต่แอปต้องปฏิบัติตามด้วย
  แถมกฎหมายก็เปลี่ยนตลอด
  การเพิ่มประสิทธิภาพก็ไม่มีวันจบ ทั้งความเร็ว ต้นทุน เส้นทาง ล้วนมีอะไรให้ปรับปรุงเสมอ
  ในฐานะผู้บริโภค สิ่งที่เราเห็นเป็นเพียงเศษเสี้ยวเล็กมากของความซับซ้อนที่บริการแบบนี้ต้องสร้างและดูแล
- มีเทคโนโลยีและเทคนิคใหม่ ๆ ที่ต้องนำมาทำอยู่เสมอ ต้องการอัลกอริทึมที่ดีกว่า การดีพลอยที่ใหญ่กว่า และความน่าเชื่อถือที่สูงกว่า
  แทบจะมีบั๊กที่ต้องแก้อยู่ตลอด มีบั๊กเยอะมากจริง ๆ
- Uber ไม่ได้เคยพยายามทำ รถขับเคลื่อนอัตโนมัติ ของตัวเองด้วยหรือ?
  นี่ก็เป็นปัญหาของบริษัทที่ได้รับเงินลงทุนมหาศาล มูลค่าของ Uber ไม่ได้ตั้งอยู่แค่กับสิ่งที่ทำอยู่ตอนนี้ แต่ตั้งอยู่บนความคาดหวังว่ามันจะทำให้แนวคิดอย่างการมีรถส่วนตัวหรือการใช้ขนส่งสาธารณะกลายเป็นของล้าสมัย
  ฟังดูพูดเกินจริง แต่จริง ๆ ก็ไม่ได้เกินจริงอย่างที่คิด
tokenmaxxing ฟังไม่เข้าท่าเลย มันคล้ายกับการเขียน งาน SQL/Spark ที่ไร้ประสิทธิภาพ เพื่อจะได้ใช้ compute, memory, และ I/O ให้มากที่สุด
เหมือนจงใจยัด Cartesian product หรือชุดข้อมูลที่ skew สุดขั้วเข้าไปเยอะ ๆ
พอเมตริกกลายเป็นเป้าหมาย เรื่องแบบนี้ก็เกิดขึ้นเสมอ บริษัทควรสร้างสภาพแวดล้อมที่ใช้ AI อย่างมีประสิทธิภาพที่สุด และควรถามก่อนว่า "งานนี้จำเป็นต้องใช้ agent จริงหรือ?"
ถ้าจำเป็น ก็ต้องกำหนดว่าใช้ agent แบบไหน ใช้โมเดลอะไร ต้องการระดับการให้เหตุผลแค่ไหน
ควรส่งเสริมการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อให้ใช้ข้อมูลได้ด้วยบริบทที่น้อยลงด้วย knowledge graph ค่อนข้างดีสำหรับเรื่องนี้
- เป็นตรรกะระดับเด็กเล็กเลย ประมาณว่า "ถ้าใช้ X แล้วอาจได้ผลลัพธ์ที่ดี งั้นถ้าอยากให้ผลลัพธ์ดีสูงสุดก็ต้องใช้ X ให้มากที่สุดเท่าที่จะทำได้"
  เหมือนกับจุดไฟเผาปั๊มน้ำมันเพื่อจะชนะการแข่งขัน
- เหตุผลที่ tokenmaxxing มีอยู่ ก็เพราะผู้บริหารคิดว่าพนักงานต่อต้านการเปลี่ยนแปลง
  มันเป็นแค่วิธีจูงใจหรือบังคับให้พนักงานทุกคนทดลองใช้เทคโนโลยีใหม่
  พอทุกคนถูกมองว่าใช้ AI กันหมดแล้ว ของอย่าง tokenmaxxing ก็น่าจะจบไปเอง
- ตรรกะที่ใช้ปกป้อง tokenmaxxing มักเป็นว่า มันเปิดพื้นที่ให้พนักงานได้สำรวจโลกกว้างและใหม่ของ เวิร์กโฟลว์ที่ขับเคลื่อนด้วย AI อย่างอิสระ
  ฉันก็เห็น use case มากมายที่น่าสงสัยว่าจะสร้างมูลค่าได้จริงไหม แต่ก็เคยเห็นทีมที่ใช้เวิร์กโฟลว์แบบ agent แก้ปัญหาเก่า ๆ ได้ ทั้งที่ถ้าต้องไปชี้แจงต่อคณะกรรมการตรวจต้นทุนก็คงยากจะอธิบายให้ผ่าน
  งานอย่างการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อใช้บริบทให้น้อยลงนั้น เท่าที่เข้าใจ บริษัท tokenmaxxing รายใหญ่ส่วนมากก็มีทีมแยกทำอยู่เบื้องหลัง
ฉันเข้าใจว่าบริษัทต่าง ๆ กำลังเผาเงินกับการพัฒนาซอฟต์แวร์แบบมี AI ช่วย แต่ ผลตอบแทนจากการลงทุน โดยรวมเป็นอย่างไร? มันสร้างมูลค่าคุ้มกับประสิทธิภาพที่อ้างไว้จริงหรือ?
สำหรับฉัน นี่เป็นประเด็นเดียวที่น่าสนใจจริง ๆ ในกระแส AI แต่ไม่รู้ทำไมไม่มีใครพูดถึง
- ฉันคิดว่าเพราะมีคนไม่มากที่รู้วิธีวัดมันอย่างถูกต้อง
  คุณอาจใช้ Claude สร้างฟีเจอร์ห่วย ๆ หรือไม่มีประโยชน์ได้ 5 อย่างในวันเดียว หรือสร้างฟีเจอร์ที่มีประโยชน์ 1 อย่างในสองวัน แบบไหนส่งผลต่อ ROI ดีกว่ากัน?
  แค่ดูจากตัวอย่างเหมือนจะตอบง่าย แต่ในความเป็นจริงมันละเอียดอ่อนกว่านั้นมาก และวัดยากกว่ามาก
  เลยดูเหมือนหลายบริษัทจะยอมแพ้เรื่องการวัด แล้วเลือกทางง่ายคือวิ่งตามกระแสโฆษณาเกินจริง
ถ้ารวมการทำโค้ดรีวิวและใช้งานอย่างถูกวิธีด้วย ฉันค่อนข้างมั่นใจว่าระดับการพัฒนาอย่างยั่งยืนสูงสุดที่ AI ให้ได้ สำหรับวิศวกรอาวุโสที่มีทักษะเหมาะสม อยู่ราว ๆ 20%
งบโทเคนของวิศวกรคนไหนก็ไม่ควรเกินกว่านั้น
ฉันไม่เชื่อเลยว่าวิศวกรที่ทำ tokenmaxxing จะมีประสิทธิผลจริง และก็ไม่เคยเห็นหลักฐานอะไรแบบนั้นเลย ถ้าอะไรก็น่าจะตรงกันข้ามมากกว่า
ถ้ามีโฟลว์ที่ถูกต้องและมีความรู้เกี่ยวกับโค้ดเบส ฉันสัมผัสได้ด้วยตัวเองว่าระดับนั้นทำได้จริงด้วยระดับความพยายามที่ยั่งยืน
ดูเหมือน AI เพื่อเพิ่มผลิตภาพทางวิศวกรรมจะถูกเข้าใจผิดอย่างแพร่หลายว่าเป็น ปุ่มวิเศษ ที่ให้ผลลัพธ์เดิมได้เร็วขึ้นและถูกลง
ถ้าคิดแบบนั้น ก็ไม่แปลกที่จะอยากบังคับให้พนักงานทำ tokenmaxxing เพราะได้ผลลัพธ์มากขึ้น เร็วขึ้น ถูกลง แล้วจะไม่ทำทำไม?
แต่ถ้ามองให้ละเอียดขึ้น มันเป็นแบบนี้ AI ช่วยให้ไปถึง roadmap ได้เร็วขึ้นระดับหนึ่ง แต่ก็ก่อหนี้ทางเทคนิคคล้ายกับการจ้างนักพัฒนาชั่วคราวมาสร้างฟีเจอร์
ไม่ได้หมายความว่าจะมีคนในทีมที่เข้าใจโค้ดใหม่เสมอไป
ในทำนองเดียวกัน การยกระดับทักษะของสมาชิกทีมรุ่นจูเนียร์ก็เกิดน้อยลงด้วย คุณจึงดึง ส่วนต่างระหว่างทักษะกับค่าจ้าง ได้ยากขึ้นกว่าเดิม
ตัวผลิตภัณฑ์เองก็อาจซับซ้อนขึ้นได้ ฟีเจอร์ระดับ P2 เป็น P2 ด้วยเหตุผลของมัน แต่ AI อาจทำให้ใส่ฟีเจอร์ที่ให้ผลตอบแทนส่วนเพิ่มต่ำเข้ามา จนผลิตภัณฑ์ซับซ้อนขึ้น
ฉันช็อกที่เคยมีคนเชื่อว่า tokenmaxxing เป็นความคิดที่ดี
พวก AI maximalist มักเปรียบเทียบเทคโนโลยีนี้กับไฟฟ้า ลองนึกภาพว่าช่วงแรกของยุคไฟฟ้า CEO ให้รางวัลพนักงานจาก การเพิ่มการใช้ไฟฟ้า แทนที่จะหาวิธีใช้ไฟฟ้าให้สร้างผลลัพธ์ทางธุรกิจ
ในยุคนั้นการส่งคนที่มีอาการคล้ายปัญหาสุขภาพจิตเข้าไปอยู่ในสถานดูแลเป็นเรื่องปกติ และเรื่องนี้ก็คงลงเอยแบบนั้น
- ปัญหาคือในระดับปัจเจก มันเป็นกลยุทธ์ที่ดี การจัดการที่แย่จะอ่านสิ่งนี้เป็น สัญญาณของผลิตภาพ