1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • COO ของ Uber มองว่าการอธิบายให้สมเหตุสมผลว่าเงินที่ใช้กับ AI ให้ผลลัพธ์คุ้มกับต้นทุนที่ใส่ไปหรือไม่นั้นยากขึ้นเรื่อย ๆ
  • ประเด็นถกเถียงภายในรุนแรงขึ้นหลัง CTO ของ Uber เปิดเผยว่าได้ใช้预算 Claude Code สำหรับปี 2026 หมดไปแล้ว
  • ความเชื่อมโยงที่ว่า ปริมาณการใช้โทเคน ที่มากขึ้นจะนำไปสู่การเพิ่มขึ้นของฟีเจอร์ผู้บริโภคที่มีประโยชน์อย่างเป็นสัดส่วน ยังไม่ได้รับการยืนยัน
  • CEO ของ Uber ระบุว่า Uber กำลังชะลอการจ้างงานเพื่อชดเชยการลงทุนด้าน AI
  • ต่างจากกระแส tokenmaxxing ของ Big Tech ทาง Duolingo ได้ยกเลิกการตัดสินใจที่จะนำการใช้ AI ไปใส่ในเกณฑ์ประเมินผลงาน หลังเกิดกระแสตอบรับจากพนักงาน

ปัญหาการหาเหตุผลรองรับต้นทุน AI ภายใน Uber

  • Andrew Macdonald ประธานเจ้าหน้าที่ฝ่ายปฏิบัติการของ Uber มองว่าการหาเหตุผลรองรับต้นทุน AI ภายในบริษัทกำลังยากขึ้นเรื่อย ๆ
  • ใน บทสัมภาษณ์ Rapid Response ที่เผยแพร่เมื่อวันเสาร์ เขาระบุว่า AI ยังไม่ได้สร้างผลลัพธ์มากพอเมื่อเทียบกับเงินที่บริษัทใช้ไป
  • การถกเถียงภายในรุนแรงขึ้นหลัง Praveen Neppalli Naga CTO ของ Uber เปิดเผยในการให้สัมภาษณ์กับ The Information เมื่อเดือนเมษายนว่า Uber ใช้งบ Claude Code สำหรับปี 2026 หมดไปแล้ว
  • คำพูดดังกล่าวนำไปสู่สถานการณ์ที่ Macdonald อธิบายว่าเป็น “ช่วงเวลาที่เหมือนหัวจะระเบิด” และภายในบริษัทได้มีการพูดคุยถึงการแลกเปลี่ยนระหว่าง การใช้โทเคน AI กับ ขนาดกำลังคน

ยังไม่มีความเชื่อมโยงระหว่างการใช้โทเคนกับผลงานของผลิตภัณฑ์

  • หลังจากพูดคุยกับผู้นำวิศวกรรมระดับสูงของ Uber แล้ว Macdonald เห็นว่าการใช้ โทเคน มากขึ้นไม่ได้แปลว่าจะทำให้มีฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้นอย่างเป็นสัดส่วน
  • เขากล่าวว่า “ความเชื่อมโยงนั้นยังไม่มี” โดยมองว่าแม้อาจมีการปล่อยฟีเจอร์มากขึ้น แต่ก็ยากที่จะเชื่อมตัวชี้วัดบางอย่างเข้ากับข้อสรุปว่า “ตอนนี้เรากำลังสร้างฟีเจอร์ผู้บริโภคที่มีประโยชน์เพิ่มขึ้น 25% จริง ๆ” ได้โดยตรง
  • ยิ่งเชื่อมค่าใช้จ่ายด้าน AI เข้ากับผลลัพธ์ได้ยากเท่าไร ก็ยิ่งยากที่จะหาเหตุผลมารองรับต้นทุนแลกเปลี่ยนดังกล่าว
  • Dara Khosrowshahi CEO เปิดเผยในการประกาศผลประกอบการเมื่อต้นเดือนนี้ว่า Uber กำลัง ชะลอการจ้างงาน เพื่อชดเชยการลงทุนด้าน AI

ผู้ใช้รู้สึกเหมือนฟรี แต่บริษัทเป็นผู้แบกรับต้นทุน

  • Macdonald มองว่าหากอยู่ในมุมของผู้ใช้ที่ไม่ต้องจ่ายเงินและกำลังนึกถึง “กรณีใช้งานที่น่าสนใจ” AI อาจดูเหมือนเป็นของฟรี
  • แต่ท้ายที่สุดแล้ว บริษัทจะเป็นผู้จ่ายต้นทุน
  • การขยายการใช้ AI จึงไม่ได้เป็นเพียงการทดลองด้านประสิทธิภาพการทำงาน แต่ถูกมองเป็นโครงสร้างต้นทุนที่กระทบทั้งงบประมาณและการบริหารกำลังคน

กระแสที่ต่างจาก tokenmaxxing ของ Big Tech

  • Big Tech กำลังผลักดันแนวทาง tokenmaxxing หรือการใช้ AI ให้มากที่สุดอย่างจริงจัง และบางบริษัทก็นำปริมาณการใช้ AI ของพนักงานไปสะท้อนในการประเมินผล
  • Meta, Google, JPMorgan ถูกยกเป็นตัวอย่างของบริษัทที่เชื่อมการใช้ AI เข้ากับการประเมินผลงาน เป้าหมาย การขึ้นเงินเดือน และการเลื่อนตำแหน่ง
  • ในทางกลับกัน บางบริษัทเริ่มถอยออกจากแนวทางที่ผลักดันการใช้ AI เพียงเพื่อให้ใช้ AI
  • Duolingo ยกเลิกการตัดสินใจที่จะรวมการใช้ AI เข้าไปในเกณฑ์ประเมินผลงาน หลังพนักงานตั้งคำถามว่า “เราต้องใช้ AI เพียงเพื่อจะได้บอกว่าใช้ AI หรือเปล่า”
  • Luis von Ahn CEO ของ Duolingo กล่าวในการสัมภาษณ์พอดแคสต์เมื่อเดือนเมษายนว่า แทนที่จะเป็นการรับผิดชอบต่อผลลัพธ์จริง ในบางกรณีมันให้ความรู้สึกเหมือนกำลังฝืนผลักสิ่งที่ไม่เหมาะให้เดินหน้าต่อ

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความคิดเห็นจาก Hacker News
  • ช่วงปี 2007~2009 ตอนที่ Google ขยายดาต้าเซ็นเตอร์อย่างมาก โดยเฉพาะนอกเวลางานจะมี ความจุที่ว่างอยู่ จำนวนมาก
    วิศวกรคนไหนก็ได้สามารถรันงานได้เท่าที่ต้องการด้วยลำดับความสำคัญ 0 และถ้างานที่สำคัญกว่าต้องการทรัพยากร งานเหล่านี้ก็จะถูกฆ่าก่อนเป็นอย่างแรก
    มีการทดลอง MapReduce ที่รันข้ามคืนกันเยอะมาก และอยู่ช่วงหนึ่งก็เอาบริการภายในมารันที่ลำดับความสำคัญ 0 จนแทบเหมือนใช้งาน “ฟรี”
    เมื่อการใช้งานเพิ่มขึ้น บริการแบบนั้นก็ไม่เสถียรมากขึ้นเรื่อยๆ และสุดท้ายก็ต้องอธิบายความคุ้มค่าของการใช้ทรัพยากรหรือลดขนาดลง แต่ก็มองว่านั่นเป็นทิศทางที่ดี
    การใช้โทเค็น AI ก็น่าจะเหมาะกับโมเดลคล้ายกัน บริษัทเทคขนาดใหญ่สามารถมีดาต้าเซ็นเตอร์ LLM ของตัวเองไว้รองรับความต้องการภายใน และเปิด ความจุว่างนอกเวลางาน ให้พนักงานใช้ทดลองได้
    สำหรับงานประจำวัน ควรส่งเสริม ประสิทธิภาพของโทเค็น มากกว่าจำนวนโทเค็นเอง การใช้โทเค็นมากกับระบบอัตโนมัติที่ช่วยลดแรงงานคนได้หลายชั่วโมงต่อสัปดาห์ถือว่าใช้ได้ดี แต่การใช้โทเค็นมากเพื่อดีบักบั๊กฟรอนต์เอนด์ง่ายๆ ที่แก้มือก็ได้อยู่แล้ว แถมยังกินเวลา 4 ชั่วโมง แบบนั้นคือความสิ้นเปลือง

    • มันไม่คล้ายกับ batch processing ของ OpenAI เหรอ? คำขอจะถูกประมวลผลภายใน 24 ชั่วโมงและค่าใช้จ่ายถูกลงครึ่งหนึ่ง
      https://developers.openai.com/api/docs/guides/batch
    • ไม่น่าคิดว่าผู้ใช้ LLM จะมีเหตุผลกันขนาดนั้น ดูเหมือนมีผู้ใช้จำนวนมากพอสมควรที่ยืนกรานว่าต้องโยนทุกงานเล็กน้อยให้ Opus
    • ฟรอนต์เอนด์ AI ส่วนใหญ่ถูกออกแบบมาสำหรับ งานแบบโต้ตอบ เลยทำให้กำหนดงานลำดับความสำคัญ 0 ที่จะประมวลผลเมื่อไรก็ได้ในอนาคตได้ยาก
      สำหรับแนวทางอย่างการพัฒนาตามสเปก ที่มนุษย์ไม่ได้อยู่ในลูปตลอดแต่คอยตรวจสอบจากเหนือวงจร วิธีนี้ดูเป็นธรรมชาติกว่ามาก แต่เท่าที่เคยสัมผัสฟรอนต์เอนด์ของ Google อย่างน้อยก็ยังไม่ค่อยเห็นที่ไหนรองรับดี
    • การห้ามไม่ให้คนใช้โทเค็นเยอะกับบั๊กฟรอนต์เอนด์ง่ายๆ แล้วหมดไป 4 ชั่วโมงนั้น คงไม่ง่ายนัก
      สิ่งที่เกิดขึ้นตอนนี้เป็นเรื่องที่ชัดเจนมากสำหรับหลายคน มันเหมือนบอกผู้เสพติดหน้าใหม่ที่ถูกออกแบบมาให้ติดโดยตั้งใจว่า “ใช้ให้อย่างระมัดระวังขึ้นหน่อย” เลยมีโอกาสสูงที่จะไม่ได้ผล
    • ท้ายที่สุดแล้ว การที่ทุกคนยอมรับ โมเดลจีนที่ถูกกว่ากัน 10 เท่า ก็ดูเป็นไปได้มากกว่าไม่ใช่เหรอ
  • ไม่ชอบใช้ AI และก็ไม่ได้รู้สึกว่ามันช่วยอะไรนัก
    แต่บริษัทบังคับให้ใช้และติดตามตัวชี้วัด เลยโยนงานจุกจิกไร้สาระเข้าไปทุกวันเพื่อให้ดูเหมือนว่าได้ใช้งาน
    ถึงจะสร้างปัญหามากกว่าที่แก้ได้ อย่างน้อยในเชิงตัวชี้วัดก็กลายเป็นคนที่ใช้ AI

  • ถ้าบริษัทไหนประกาศว่าจะใช้ ปริมาณการใช้โทเค็น เป็นสัญญาณวัดผลงานพนักงาน ผมมองว่านั่นเกือบจะเป็นธงแดงที่ควรหลีกเลี่ยงบริษัทนั้น
    ถ้ามีผู้นำด้านวิศวกรรมที่ดี ก็ไม่ควรปฏิบัติกับเรื่องนี้เหมือนเป็นไอเดียที่พอรับได้

    • ถ้าเบิกค่าอาหารตอนเดินทางเกิน 100 ดอลลาร์ ก็ต้องไปคุยแบบอึดอัดกับผู้จัดการหรือทีมการเงิน
      แต่ถ้าใช้โทเค็น AI แบบไม่เกิดประสิทธิผลไป 500 ดอลลาร์ กลับได้รับการยกย่องว่าเป็น ผู้ใช้งาน AI ระดับแนวหน้า บริษัทมักพูดประชดกันแบบนี้
    • อาจจะน่าแปลกใจ แต่ผมรู้จักนักพัฒนาหลายคนในบริษัทเทคขนาดใหญ่ที่ใครๆ ก็รู้จัก แม้จะไม่ใช่ FAANG และทุกที่ล้วนมี ตารางจัดอันดับโทเค็น ไม่ทางใดก็ทางหนึ่ง
      บางบริษัทถึงขั้นบอกนักพัฒนาว่า “ตอนนี้เราไม่อยากให้คุณเขียนโค้ดเองแม้แต่บรรทัดเดียว”
      จากมุมมองผู้บริหารคงคิดประมาณว่า ถ้าพนักงาน 20% แรกใช้ LLM สร้างโค้ดได้ 80% แล้วบริษัทก็ยังเดินต่อได้ ก็ลดนักพัฒนา 80% ล่างเพื่อประหยัดค่าใช้จ่ายได้
    • แม้แต่บริษัทที่เมื่อก่อนมีภาวะผู้นำที่สมเหตุสมผล พอ LLM AI โผล่มาก็เริ่มรีบร้อนและตัดสินใจแบบน่าสงสัย
      การใช้ ปริมาณการใช้โทเค็น ไปผูกกับการประเมินผลงานพนักงานก็เป็นแค่หนึ่งในนั้น
    • โทเค็นคือ จำนวนบรรทัดโค้ดต่อวิศวกร แบบใหม่ มันเอาไปทำกราฟได้ง่ายและ “บริหารจัดการ” ก็ง่าย
    • Meta ทำแบบนี้ ลองเดาดูได้เลยว่าเกณฑ์หนึ่งของการปลดพนักงานล่าสุดน่าจะเป็นอะไร
  • ใต้เตาปฏิกรณ์ฟิวชันยักษ์บนท้องฟ้า แทบไม่มีอะไรใหม่จริงๆ
    ผมเคยอ่านเรื่องคล้าย tokenmaxxing ในอุตสาหกรรมโทรเลขจากหนังสือ “The Information” ของ James Gleick
    โทรเลขคิดค่าบริการตามจำนวนตัวอักษร จึงมีตลาด สมุดรหัส ขนาดใหญ่เพื่อลดจำนวนอักขระที่ต้องส่ง การบีบอัดคือเงิน และบริษัทโทรเลขไม่ชอบสิ่งนี้แต่ก็ต้องยอมรับ
    อุตสาหกรรมรหัสโทรเลขเริ่มมาตั้งแต่ยุคแรกของการใช้โทรเลขเชิงพาณิชย์ และดำเนินต่อเนื่องไปจนถึงทศวรรษ 1920
    แต่ก็มีต้นทุนเช่นกัน รหัสลดความซ้ำซ้อนลงอย่างมาก และความผิดพลาดเพียงเล็กน้อยก็อาจนำไปสู่ความเข้าใจผิดครั้งใหญ่
    ตามที่ Gleick อธิบาย นี่ตรงข้ามกับวิธีที่การตีกลองในแอฟริกาเพิ่ม ความซ้ำซ้อน เพื่อเสริมความสัมพันธ์ระหว่างจังหวะกับภาษาที่กลองกำลังเลียนแบบ

    • นั่นไม่ใช่ตรงกันข้ามกับ tokenmaxxing แบบเป๊ะๆ เหรอ? ถ้าจะเทียบกับโทรเลข ก็น่าจะเป็นสถานการณ์ที่พนักงานโทรเลขถูกประเมินจากเวลาที่ครอบครองสายต่อวัน ไม่ใช่จากจำนวนลูกค้าที่ให้บริการ
      ก็คือคนที่เผาโทเค็นหรือค่าใช้จ่ายได้มากที่สุดเป็นฝ่ายชนะ ไม่ใช่โปรแกรมเมอร์ที่ส่งมอบฟีเจอร์ได้
      สิ่งที่อธิบายมาจึงใกล้เคียงกับ การลดโทเค็นให้ต่ำที่สุด มากกว่าจะเป็นการเพิ่มให้สูงสุด
    • น่าสนใจ แต่ tokenmaxxing ไม่ใช่การเพิ่ม ประสิทธิภาพ ของการใช้โทเค็นให้สูงสุด มันคือการเพิ่มปริมาณการใช้เองให้สูงสุด
    • ที่อธิบายมาจริงๆ แล้วแทบจะเป็นด้านตรงข้ามของ tokenmaxxing
  • ฉันสงสัยเรื่องนี้เกี่ยวกับซอฟต์แวร์สแต็กมาตั้งแต่ก่อนยุค LLM และตอนนี้ยิ่งดูเกี่ยวข้องมากขึ้น
    บริษัทอย่าง Uber จะ "เสร็จสมบูรณ์" เมื่อไร? พวกเขาทำซอฟต์แวร์มา 16 ปีแล้ว
    มันคือบริษัทที่จับคู่คนขับกับผู้โดยสาร และการสร้างซอฟต์แวร์เพิ่มก็ไม่ได้ทำให้ฉันมีแนวโน้มจะเรียก Uber แทนรถบัสหรือรถไฟมากขึ้นอย่างมีนัยสำคัญ
    อีก 20 ปีซอฟต์แวร์จะจบไหม? หรืออีก 80 ปี?

    • โค้ดเบสส่วนใหญ่คือ การเชื่อมต่อแบบปรับแต่งตามตลาดท้องถิ่น บางส่วนทำให้เป็นระบบได้ แต่ความซับซ้อนส่วนใหญ่มาจากตรงนั้น
    • ถ้าเบราว์เซอร์, Android, iOS หยุดนิ่งเกิน 16 ปี มันอาจจะง่ายขึ้นบ้าง
      ยังไม่นับสภาพแวดล้อมด้านกฎระเบียบที่เปลี่ยนไปและผลิตภัณฑ์ใหม่ ๆ แค่ดูว่า Uber Eats ออกมาตอนไหนก็พอ
      ในช่วง 16 ปีนั้นมี Covid-19 เกิดขึ้น มีการขับขี่อัตโนมัติที่ใช้งานได้จริง และมีความร่วมมือกับ Waymo
      แอปสำหรับผู้บริโภคที่เชื่อมต่อกันผ่านเครือข่ายไม่มีทาง "เสร็จสมบูรณ์" ได้เลย ถ้าไม่มีญาณหยั่งรู้ที่สมบูรณ์แบบ
      เทคโนโลยีสแต็กภายในเหมือนสิ่งมีชีวิต และแม้แต่การรักษาบริการที่ภายนอกดูเหมือนไม่เปลี่ยนก็ยังมีงานมหาศาล การสเกลก็เป็นเรื่องใหญ่ และ การสเกลกับการบำรุงรักษา ก็ยิ่งขยายกันและกันไปเรื่อย ๆ
    • ดูเหมือนคุณจะมองข้ามว่าการดำเนินงานระหว่างประเทศและการเพิ่มประสิทธิภาพนั้นซับซ้อนแค่ไหน
      แต่ละประเทศมีกฎหมายของตัวเองว่า Uber ทำอะไรได้และทำอะไรไม่ได้ และต้องทำให้เป็นรูปแบบในโค้ด
      ตัวอย่างเช่น ในบางแห่ง คุณเรียกแท็กซี่ผ่านแอป Uber แต่ค่าโดยสารอาจไม่ได้ล็อกไว้ล่วงหน้าและคิดตามไมล์แทน
      แล้วยังมีกฎหมายระดับเมืองเข้ามาอีก ถ้านั่ง Uber จากเมือง A ที่มีกฎหมายแบบหนึ่งไปเมือง B ที่มีกฎหมายอีกแบบ ต้องทำอย่างไร? ทนายอาจรู้คำตอบ แต่แอปต้องปฏิบัติตามด้วย
      แถมกฎหมายก็เปลี่ยนตลอด
      การเพิ่มประสิทธิภาพก็ไม่มีวันจบ ทั้งความเร็ว ต้นทุน เส้นทาง ล้วนมีอะไรให้ปรับปรุงเสมอ
      ในฐานะผู้บริโภค สิ่งที่เราเห็นเป็นเพียงเศษเสี้ยวเล็กมากของความซับซ้อนที่บริการแบบนี้ต้องสร้างและดูแล
    • มีเทคโนโลยีและเทคนิคใหม่ ๆ ที่ต้องนำมาทำอยู่เสมอ ต้องการอัลกอริทึมที่ดีกว่า การดีพลอยที่ใหญ่กว่า และความน่าเชื่อถือที่สูงกว่า
      แทบจะมีบั๊กที่ต้องแก้อยู่ตลอด มีบั๊กเยอะมากจริง ๆ
    • Uber ไม่ได้เคยพยายามทำ รถขับเคลื่อนอัตโนมัติ ของตัวเองด้วยหรือ?
      นี่ก็เป็นปัญหาของบริษัทที่ได้รับเงินลงทุนมหาศาล มูลค่าของ Uber ไม่ได้ตั้งอยู่แค่กับสิ่งที่ทำอยู่ตอนนี้ แต่ตั้งอยู่บนความคาดหวังว่ามันจะทำให้แนวคิดอย่างการมีรถส่วนตัวหรือการใช้ขนส่งสาธารณะกลายเป็นของล้าสมัย
      ฟังดูพูดเกินจริง แต่จริง ๆ ก็ไม่ได้เกินจริงอย่างที่คิด
  • tokenmaxxing ฟังไม่เข้าท่าเลย มันคล้ายกับการเขียน งาน SQL/Spark ที่ไร้ประสิทธิภาพ เพื่อจะได้ใช้ compute, memory, และ I/O ให้มากที่สุด
    เหมือนจงใจยัด Cartesian product หรือชุดข้อมูลที่ skew สุดขั้วเข้าไปเยอะ ๆ
    พอเมตริกกลายเป็นเป้าหมาย เรื่องแบบนี้ก็เกิดขึ้นเสมอ บริษัทควรสร้างสภาพแวดล้อมที่ใช้ AI อย่างมีประสิทธิภาพที่สุด และควรถามก่อนว่า "งานนี้จำเป็นต้องใช้ agent จริงหรือ?"
    ถ้าจำเป็น ก็ต้องกำหนดว่าใช้ agent แบบไหน ใช้โมเดลอะไร ต้องการระดับการให้เหตุผลแค่ไหน
    ควรส่งเสริมการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อให้ใช้ข้อมูลได้ด้วยบริบทที่น้อยลงด้วย knowledge graph ค่อนข้างดีสำหรับเรื่องนี้

    • เป็นตรรกะระดับเด็กเล็กเลย ประมาณว่า "ถ้าใช้ X แล้วอาจได้ผลลัพธ์ที่ดี งั้นถ้าอยากให้ผลลัพธ์ดีสูงสุดก็ต้องใช้ X ให้มากที่สุดเท่าที่จะทำได้"
      เหมือนกับจุดไฟเผาปั๊มน้ำมันเพื่อจะชนะการแข่งขัน
    • เหตุผลที่ tokenmaxxing มีอยู่ ก็เพราะผู้บริหารคิดว่าพนักงานต่อต้านการเปลี่ยนแปลง
      มันเป็นแค่วิธีจูงใจหรือบังคับให้พนักงานทุกคนทดลองใช้เทคโนโลยีใหม่
      พอทุกคนถูกมองว่าใช้ AI กันหมดแล้ว ของอย่าง tokenmaxxing ก็น่าจะจบไปเอง
    • ตรรกะที่ใช้ปกป้อง tokenmaxxing มักเป็นว่า มันเปิดพื้นที่ให้พนักงานได้สำรวจโลกกว้างและใหม่ของ เวิร์กโฟลว์ที่ขับเคลื่อนด้วย AI อย่างอิสระ
      ฉันก็เห็น use case มากมายที่น่าสงสัยว่าจะสร้างมูลค่าได้จริงไหม แต่ก็เคยเห็นทีมที่ใช้เวิร์กโฟลว์แบบ agent แก้ปัญหาเก่า ๆ ได้ ทั้งที่ถ้าต้องไปชี้แจงต่อคณะกรรมการตรวจต้นทุนก็คงยากจะอธิบายให้ผ่าน
      งานอย่างการประหยัดโทเคน การเพิ่ม cache hit rate และการจัดโครงสร้างข้อมูลเพื่อใช้บริบทให้น้อยลงนั้น เท่าที่เข้าใจ บริษัท tokenmaxxing รายใหญ่ส่วนมากก็มีทีมแยกทำอยู่เบื้องหลัง
  • ฉันเข้าใจว่าบริษัทต่าง ๆ กำลังเผาเงินกับการพัฒนาซอฟต์แวร์แบบมี AI ช่วย แต่ ผลตอบแทนจากการลงทุน โดยรวมเป็นอย่างไร? มันสร้างมูลค่าคุ้มกับประสิทธิภาพที่อ้างไว้จริงหรือ?
    สำหรับฉัน นี่เป็นประเด็นเดียวที่น่าสนใจจริง ๆ ในกระแส AI แต่ไม่รู้ทำไมไม่มีใครพูดถึง

    • ฉันคิดว่าเพราะมีคนไม่มากที่รู้วิธีวัดมันอย่างถูกต้อง
      คุณอาจใช้ Claude สร้างฟีเจอร์ห่วย ๆ หรือไม่มีประโยชน์ได้ 5 อย่างในวันเดียว หรือสร้างฟีเจอร์ที่มีประโยชน์ 1 อย่างในสองวัน แบบไหนส่งผลต่อ ROI ดีกว่ากัน?
      แค่ดูจากตัวอย่างเหมือนจะตอบง่าย แต่ในความเป็นจริงมันละเอียดอ่อนกว่านั้นมาก และวัดยากกว่ามาก
      เลยดูเหมือนหลายบริษัทจะยอมแพ้เรื่องการวัด แล้วเลือกทางง่ายคือวิ่งตามกระแสโฆษณาเกินจริง
  • ถ้ารวมการทำโค้ดรีวิวและใช้งานอย่างถูกวิธีด้วย ฉันค่อนข้างมั่นใจว่าระดับการพัฒนาอย่างยั่งยืนสูงสุดที่ AI ให้ได้ สำหรับวิศวกรอาวุโสที่มีทักษะเหมาะสม อยู่ราว ๆ 20%
    งบโทเคนของวิศวกรคนไหนก็ไม่ควรเกินกว่านั้น
    ฉันไม่เชื่อเลยว่าวิศวกรที่ทำ tokenmaxxing จะมีประสิทธิผลจริง และก็ไม่เคยเห็นหลักฐานอะไรแบบนั้นเลย ถ้าอะไรก็น่าจะตรงกันข้ามมากกว่า
    ถ้ามีโฟลว์ที่ถูกต้องและมีความรู้เกี่ยวกับโค้ดเบส ฉันสัมผัสได้ด้วยตัวเองว่าระดับนั้นทำได้จริงด้วยระดับความพยายามที่ยั่งยืน

  • ดูเหมือน AI เพื่อเพิ่มผลิตภาพทางวิศวกรรมจะถูกเข้าใจผิดอย่างแพร่หลายว่าเป็น ปุ่มวิเศษ ที่ให้ผลลัพธ์เดิมได้เร็วขึ้นและถูกลง
    ถ้าคิดแบบนั้น ก็ไม่แปลกที่จะอยากบังคับให้พนักงานทำ tokenmaxxing เพราะได้ผลลัพธ์มากขึ้น เร็วขึ้น ถูกลง แล้วจะไม่ทำทำไม?
    แต่ถ้ามองให้ละเอียดขึ้น มันเป็นแบบนี้ AI ช่วยให้ไปถึง roadmap ได้เร็วขึ้นระดับหนึ่ง แต่ก็ก่อหนี้ทางเทคนิคคล้ายกับการจ้างนักพัฒนาชั่วคราวมาสร้างฟีเจอร์
    ไม่ได้หมายความว่าจะมีคนในทีมที่เข้าใจโค้ดใหม่เสมอไป
    ในทำนองเดียวกัน การยกระดับทักษะของสมาชิกทีมรุ่นจูเนียร์ก็เกิดน้อยลงด้วย คุณจึงดึง ส่วนต่างระหว่างทักษะกับค่าจ้าง ได้ยากขึ้นกว่าเดิม
    ตัวผลิตภัณฑ์เองก็อาจซับซ้อนขึ้นได้ ฟีเจอร์ระดับ P2 เป็น P2 ด้วยเหตุผลของมัน แต่ AI อาจทำให้ใส่ฟีเจอร์ที่ให้ผลตอบแทนส่วนเพิ่มต่ำเข้ามา จนผลิตภัณฑ์ซับซ้อนขึ้น

  • ฉันช็อกที่เคยมีคนเชื่อว่า tokenmaxxing เป็นความคิดที่ดี
    พวก AI maximalist มักเปรียบเทียบเทคโนโลยีนี้กับไฟฟ้า ลองนึกภาพว่าช่วงแรกของยุคไฟฟ้า CEO ให้รางวัลพนักงานจาก การเพิ่มการใช้ไฟฟ้า แทนที่จะหาวิธีใช้ไฟฟ้าให้สร้างผลลัพธ์ทางธุรกิจ
    ในยุคนั้นการส่งคนที่มีอาการคล้ายปัญหาสุขภาพจิตเข้าไปอยู่ในสถานดูแลเป็นเรื่องปกติ และเรื่องนี้ก็คงลงเอยแบบนั้น

    • ปัญหาคือในระดับปัจเจก มันเป็นกลยุทธ์ที่ดี การจัดการที่แย่จะอ่านสิ่งนี้เป็น สัญญาณของผลิตภาพ