2 คะแนน โดย ragingwind 18 시간 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

‘ภาษีของการประสานงาน’ ในยุค AI เอเจนต์ และคอขวดของความสนใจมนุษย์

บทความของ Addy Osmani พูดถึงปัญหาที่ว่าการรัน AI เอเจนต์หลายตัวพร้อมกัน อาจไม่ได้แปลว่าจะนำไปสู่การเพิ่มผลิตภาพจริงได้ทันที แม้เอเจนต์จะทำงานแบบขนานได้ แต่การตัดสินของมนุษย์ที่ต้องใช้เพื่อทำความเข้าใจ ตรวจทาน และรวมผลลัพธ์เข้าด้วยกันนั้นไม่สามารถทำให้เป็นแบบขนานได้ ประเด็นสำคัญอยู่ตรงนี้ ผู้เขียนเรียกต้นทุนนี้ว่า ‘ภาษีของการประสานงาน’ ซึ่งหมายถึงต้นทุนแฝงของการคอยประสานหลายเวิร์กโฟลว์เข้าด้วยกัน หากมองในแง่ของการมอบหมายงาน ก็อาจตีความได้ว่าประเด็นสำคัญไม่ใช่การมอบหมายให้มากขึ้น แต่คือการมอบหมายเท่าที่เรายังตรวจทานได้อย่างเหมาะสม

  • ข้อโต้แย้งหลัก

    • อธิบายว่า การเริ่มใช้งาน AI เอเจนต์นั้นง่าย แต่การตรวจสอบผลลัพธ์ของมันและทำให้สอดคล้องกับการเปลี่ยนแปลงอื่น ๆ ไม่ใช่เรื่องง่าย
    • ต่อให้รันหลายเอเจนต์ ก็ไม่ได้หมายความว่าจะมี “ตัวเราเพิ่มขึ้น” และท้ายที่สุดการตัดสินกับการรวมงานก็ยังต้องผ่านความสนใจของคนเพียงคนเดียว
    • ชี้ให้เห็นว่าความรู้สึกว่ายุ่งมาก กับการมีผลิตภาพจริง อาจเป็นคนละเรื่องกัน
    • มองว่าแม้จะรันเอเจนต์ 20 ตัว ก็ไม่ได้หมายความว่านั่นจะเท่ากับงานที่สามารถนำไป deploy ได้ในระดับ 20 เอเจนต์เสมอไป
  • ภาษีของการประสานงาน

    • ผู้เขียนมองว่าต้นทุนของการประสานเอเจนต์หลายตัวเป็นปัญหาเชิงโครงสร้าง ไม่ใช่แค่เรื่องสมาธิไม่พอหรือการฝึกฝนไม่ดี แต่เป็นปัญหาของการออกแบบระบบ
    • ผลลัพธ์ที่เอเจนต์สร้างขึ้นในท้ายที่สุดก็ยังต้องให้คนตรวจทาน ในกระบวนการนี้ ปัญหาเรื่องความถูกต้อง ความสอดคล้องกับสถาปัตยกรรม และ merge conflict จะไหลมารวมที่คนคนเดียว
    • เพราะฉะนั้น มนุษย์จึงกลายเป็นองค์ประกอบแบบอนุกรมที่ช้าในระบบ AI เอเจนต์ โดยองค์ประกอบแบบอนุกรมหมายถึงส่วนที่ไม่สามารถจัดการหลายงานพร้อมกันได้ และต้องทำตามลำดับ
  • อุปมาเชิงเทคนิค

    • ผู้เขียนเปรียบสถานการณ์นี้กับ GIL ของ Python โดย GIL เป็นกลไกที่ทำให้แม้จะมีหลายเธรด แต่ก็มีได้เพียงหนึ่งเธรดเท่านั้นที่รันโค้ด Python ได้ในเวลาเดียวกัน
    • ความหมายคือ แม้เอเจนต์จะรันพร้อมกันได้ แต่เมื่อถึงช่วงที่ต้องใช้ความเข้าใจและการตัดสินจริง ๆ ทุกอย่างก็ต้องรอ “ล็อก” เดียวกัน นั่นคือความสนใจของมนุษย์
    • นอกจากนี้ยังยกหลักการทางวิศวกรรมสมรรถนะที่ว่า ความเร็วที่ได้จากการประมวลผลแบบขนานจะถูกจำกัดโดยส่วนที่ไม่สามารถทำให้ขนานได้ ต่อให้เพิ่มจำนวนเอเจนต์ แต่ถ้าเวลาในการตัดสินไม่ลดลง throughput โดยรวมก็เพิ่มขึ้นได้ยาก
  • ข้อดี

    • เอเจนต์อาจมีประโยชน์กับงานอิสระที่สามารถประมวลผลอยู่เบื้องหลังได้
    • งานอย่างการเขียนเทสต์หรือการสร้างภาพหน้าจอ ซึ่งเครื่องสามารถพิสูจน์ได้ในระดับหนึ่ง อาจช่วยลดภาระของคนได้
    • เสนอว่าหากรวบการตรวจทานผลลัพธ์มาทำเป็นรอบ ๆ ก็อาจช่วยลดต้นทุนจากการสลับบริบทไปมาระหว่างงานได้
  • ข้อจำกัดและความเสี่ยง

    • ระบุว่าต่อให้เพิ่มจำนวนเอเจนต์ ความกว้างแบนด์ด้านการรับรู้ของมนุษย์ หรือก็คือความสามารถในการทำความเข้าใจและตัดสิน ก็ไม่ได้เพิ่มขึ้นตาม
    • หากคอยเช็กเอเจนต์บ่อย ๆ ก็ต้องเรียกบริบทของงานแต่ละชิ้นกลับมาใหม่ทุกครั้ง จนอาจเพิ่มความเหนื่อยล้าได้
    • เตือนว่า หากการตรวจทานตื้นเกินไป ก็อาจเกิดสถานการณ์ที่ยอมรับโค้ดที่เอเจนต์สร้างขึ้นทั้งที่ยังไม่ได้เข้าใจมันดีพอ
    • หากบริหารต้นทุนนี้ไม่ดี ก็อาจทำให้ทั้งหนี้ทางเทคนิคและหนี้ทางการรับรู้สะสมไปพร้อมกัน หนี้ทางเทคนิคคือภาระในโค้ดที่แก้ยากในภายหลัง ส่วนหนี้ทางการรับรู้หมายถึงการที่นักพัฒนาปล่อยให้การเปลี่ยนแปลงสะสมทั้งที่ยังไม่เข้าใจระบบดีพอ
  • จุดที่แตกต่าง

    • จุดโฟกัสของบทความนี้ไม่ได้อยู่ที่สมรรถนะของ AI เอเจนต์เอง แต่คือความสนใจของมนุษย์
    • ระบุว่าควรมองผลิตภาพไม่ใช่จากจำนวนครั้งที่รันเอเจนต์ แต่จากปริมาณงานที่ถูกตรวจทาน รวมเข้าระบบ และพร้อม deploy ได้จริง
    • จุดเด่นคือการมองมนุษย์ไม่ใช่ผู้กำกับดูแลที่อยู่นอกระบบ แต่เป็นทรัพยากรที่มีข้อจำกัดซึ่งอยู่ภายในระบบแบบขนานนั้นเอง
  • แนวทางปฏิบัติ

    • เสนอว่าขนาดการใช้งานเอเจนต์ไม่ควรกำหนดจากจำนวนที่หน้าจอของเครื่องมือรองรับ แต่ควรกำหนดจากความเร็วที่เรายังรีวิวได้อย่างเหมาะสม
    • ควรแยกประเภทงาน งานที่แยกขาดจากกันได้ควรมอบให้เอเจนต์เบื้องหลังจัดการ ส่วนงานที่การตัดสินคือหัวใจสำคัญ เช่น บั๊กแปลก ๆ หรือการออกแบบสถาปัตยกรรม ควรหลีกเลี่ยงการทำแบบขนาน
    • อธิบายว่าความสนใจของคนควรถูกใช้ไปกับการตัดสิน ส่วนสิ่งที่เครื่องตรวจสอบได้ เอเจนต์ควรแสดงให้เห็นผ่านเทสต์หรือหลักฐานก่อน
    • การมอบหมายงานจึงมีความหมายอย่างจำกัดมากในจุดนี้ สิ่งสำคัญกว่าความสามารถในการมอบหมายให้มาก คือความสามารถในการแยกว่าอะไรควรมอบหมาย และอะไรที่ต้องตัดสินด้วยตัวเอง

บทความนี้ชี้ให้เห็นว่าคอขวดของการใช้ AI เอเจนต์อาจไม่ได้อยู่ที่ความสามารถในการรัน แต่อยู่ที่ความสามารถในการตรวจทานและตัดสิน การเปิดเอเจนต์หลายตัวกลายเป็นเรื่องง่ายขึ้นแล้ว แต่กระบวนการรับผลลัพธ์เหล่านั้นไปใช้อย่างมีความรับผิดชอบก็ยังเป็นหน้าที่ของมนุษย์อยู่ดี ดังนั้น ผลิตภาพจึงไม่ได้มาจากการเพิ่มจำนวนเอเจนต์ แต่มาจากการมองความสนใจของตัวเองเป็นทรัพยากรสำคัญของระบบ และจัดวางงานให้สอดคล้องกับข้อจำกัดนั้น การมอบหมายงานก็อยู่ภายใต้หลักการเดียวกัน ไม่ใช่การมอบหมายให้มากขึ้น แต่คือการมอบหมายภายในขอบเขตที่ยังตัดสินได้อย่างเหมาะสม

2 ความคิดเห็น

 
jjpark78 16 시간 전

ช่วงนี้ผมก็รู้สึกเหมือนกันว่า เวลาโยนงานไว้พร้อมกัน 10-20 งานแล้วกลับมานั่งตรวจทีละงาน มันสลับคอนเท็กซ์ไม่ทัน จนต้องนึกย้อนว่าอันนี้คืออะไรนะ?? อยู่บ่อย ๆ..

 
j2sus91 13 시간 전

ถ้าทำงานแบบลำดับต่อเนื่อง การตรวจสอบและการรีวิวโดยมนุษย์ก็จะกลายเป็นคอขวดอย่างหลีกเลี่ยงไม่ได้

ท้ายที่สุด เวิร์กโฟลว์การทำงานก็ควรถูกย้ายไปสู่การประมวลผลแบบขนานของเอเจนต์
แต่ความสามารถในการรับรู้ของมนุษย์ก็มีขีดจำกัด

สุดท้ายแล้ว ดูเหมือนว่าเรากำลังเข้าสู่ยุคที่หัวใจสำคัญของคุณภาพและการป้องกันความผิดพลาดคือการสร้างลูปการตรวจสอบ
และไม่ใช่แค่มนุษย์ตรวจสอบมนุษย์เท่านั้น แต่ต้องทำให้ขั้นตอนการตรวจสอบแข็งแรงขึ้นด้วยการให้อเอเจนต์คานอำนาจและตรวจสอบกันเอง