ภาษีของการประสานงาน
(x.com/addyosmani)‘ภาษีของการประสานงาน’ ในยุค AI เอเจนต์ และคอขวดของความสนใจมนุษย์
บทความของ Addy Osmani พูดถึงปัญหาที่ว่าการรัน AI เอเจนต์หลายตัวพร้อมกัน อาจไม่ได้แปลว่าจะนำไปสู่การเพิ่มผลิตภาพจริงได้ทันที แม้เอเจนต์จะทำงานแบบขนานได้ แต่การตัดสินของมนุษย์ที่ต้องใช้เพื่อทำความเข้าใจ ตรวจทาน และรวมผลลัพธ์เข้าด้วยกันนั้นไม่สามารถทำให้เป็นแบบขนานได้ ประเด็นสำคัญอยู่ตรงนี้ ผู้เขียนเรียกต้นทุนนี้ว่า ‘ภาษีของการประสานงาน’ ซึ่งหมายถึงต้นทุนแฝงของการคอยประสานหลายเวิร์กโฟลว์เข้าด้วยกัน หากมองในแง่ของการมอบหมายงาน ก็อาจตีความได้ว่าประเด็นสำคัญไม่ใช่การมอบหมายให้มากขึ้น แต่คือการมอบหมายเท่าที่เรายังตรวจทานได้อย่างเหมาะสม
-
ข้อโต้แย้งหลัก
- อธิบายว่า การเริ่มใช้งาน AI เอเจนต์นั้นง่าย แต่การตรวจสอบผลลัพธ์ของมันและทำให้สอดคล้องกับการเปลี่ยนแปลงอื่น ๆ ไม่ใช่เรื่องง่าย
- ต่อให้รันหลายเอเจนต์ ก็ไม่ได้หมายความว่าจะมี “ตัวเราเพิ่มขึ้น” และท้ายที่สุดการตัดสินกับการรวมงานก็ยังต้องผ่านความสนใจของคนเพียงคนเดียว
- ชี้ให้เห็นว่าความรู้สึกว่ายุ่งมาก กับการมีผลิตภาพจริง อาจเป็นคนละเรื่องกัน
- มองว่าแม้จะรันเอเจนต์ 20 ตัว ก็ไม่ได้หมายความว่านั่นจะเท่ากับงานที่สามารถนำไป deploy ได้ในระดับ 20 เอเจนต์เสมอไป
-
ภาษีของการประสานงาน
- ผู้เขียนมองว่าต้นทุนของการประสานเอเจนต์หลายตัวเป็นปัญหาเชิงโครงสร้าง ไม่ใช่แค่เรื่องสมาธิไม่พอหรือการฝึกฝนไม่ดี แต่เป็นปัญหาของการออกแบบระบบ
- ผลลัพธ์ที่เอเจนต์สร้างขึ้นในท้ายที่สุดก็ยังต้องให้คนตรวจทาน ในกระบวนการนี้ ปัญหาเรื่องความถูกต้อง ความสอดคล้องกับสถาปัตยกรรม และ merge conflict จะไหลมารวมที่คนคนเดียว
- เพราะฉะนั้น มนุษย์จึงกลายเป็นองค์ประกอบแบบอนุกรมที่ช้าในระบบ AI เอเจนต์ โดยองค์ประกอบแบบอนุกรมหมายถึงส่วนที่ไม่สามารถจัดการหลายงานพร้อมกันได้ และต้องทำตามลำดับ
-
อุปมาเชิงเทคนิค
- ผู้เขียนเปรียบสถานการณ์นี้กับ GIL ของ Python โดย GIL เป็นกลไกที่ทำให้แม้จะมีหลายเธรด แต่ก็มีได้เพียงหนึ่งเธรดเท่านั้นที่รันโค้ด Python ได้ในเวลาเดียวกัน
- ความหมายคือ แม้เอเจนต์จะรันพร้อมกันได้ แต่เมื่อถึงช่วงที่ต้องใช้ความเข้าใจและการตัดสินจริง ๆ ทุกอย่างก็ต้องรอ “ล็อก” เดียวกัน นั่นคือความสนใจของมนุษย์
- นอกจากนี้ยังยกหลักการทางวิศวกรรมสมรรถนะที่ว่า ความเร็วที่ได้จากการประมวลผลแบบขนานจะถูกจำกัดโดยส่วนที่ไม่สามารถทำให้ขนานได้ ต่อให้เพิ่มจำนวนเอเจนต์ แต่ถ้าเวลาในการตัดสินไม่ลดลง throughput โดยรวมก็เพิ่มขึ้นได้ยาก
-
ข้อดี
- เอเจนต์อาจมีประโยชน์กับงานอิสระที่สามารถประมวลผลอยู่เบื้องหลังได้
- งานอย่างการเขียนเทสต์หรือการสร้างภาพหน้าจอ ซึ่งเครื่องสามารถพิสูจน์ได้ในระดับหนึ่ง อาจช่วยลดภาระของคนได้
- เสนอว่าหากรวบการตรวจทานผลลัพธ์มาทำเป็นรอบ ๆ ก็อาจช่วยลดต้นทุนจากการสลับบริบทไปมาระหว่างงานได้
-
ข้อจำกัดและความเสี่ยง
- ระบุว่าต่อให้เพิ่มจำนวนเอเจนต์ ความกว้างแบนด์ด้านการรับรู้ของมนุษย์ หรือก็คือความสามารถในการทำความเข้าใจและตัดสิน ก็ไม่ได้เพิ่มขึ้นตาม
- หากคอยเช็กเอเจนต์บ่อย ๆ ก็ต้องเรียกบริบทของงานแต่ละชิ้นกลับมาใหม่ทุกครั้ง จนอาจเพิ่มความเหนื่อยล้าได้
- เตือนว่า หากการตรวจทานตื้นเกินไป ก็อาจเกิดสถานการณ์ที่ยอมรับโค้ดที่เอเจนต์สร้างขึ้นทั้งที่ยังไม่ได้เข้าใจมันดีพอ
- หากบริหารต้นทุนนี้ไม่ดี ก็อาจทำให้ทั้งหนี้ทางเทคนิคและหนี้ทางการรับรู้สะสมไปพร้อมกัน หนี้ทางเทคนิคคือภาระในโค้ดที่แก้ยากในภายหลัง ส่วนหนี้ทางการรับรู้หมายถึงการที่นักพัฒนาปล่อยให้การเปลี่ยนแปลงสะสมทั้งที่ยังไม่เข้าใจระบบดีพอ
-
จุดที่แตกต่าง
- จุดโฟกัสของบทความนี้ไม่ได้อยู่ที่สมรรถนะของ AI เอเจนต์เอง แต่คือความสนใจของมนุษย์
- ระบุว่าควรมองผลิตภาพไม่ใช่จากจำนวนครั้งที่รันเอเจนต์ แต่จากปริมาณงานที่ถูกตรวจทาน รวมเข้าระบบ และพร้อม deploy ได้จริง
- จุดเด่นคือการมองมนุษย์ไม่ใช่ผู้กำกับดูแลที่อยู่นอกระบบ แต่เป็นทรัพยากรที่มีข้อจำกัดซึ่งอยู่ภายในระบบแบบขนานนั้นเอง
-
แนวทางปฏิบัติ
- เสนอว่าขนาดการใช้งานเอเจนต์ไม่ควรกำหนดจากจำนวนที่หน้าจอของเครื่องมือรองรับ แต่ควรกำหนดจากความเร็วที่เรายังรีวิวได้อย่างเหมาะสม
- ควรแยกประเภทงาน งานที่แยกขาดจากกันได้ควรมอบให้เอเจนต์เบื้องหลังจัดการ ส่วนงานที่การตัดสินคือหัวใจสำคัญ เช่น บั๊กแปลก ๆ หรือการออกแบบสถาปัตยกรรม ควรหลีกเลี่ยงการทำแบบขนาน
- อธิบายว่าความสนใจของคนควรถูกใช้ไปกับการตัดสิน ส่วนสิ่งที่เครื่องตรวจสอบได้ เอเจนต์ควรแสดงให้เห็นผ่านเทสต์หรือหลักฐานก่อน
- การมอบหมายงานจึงมีความหมายอย่างจำกัดมากในจุดนี้ สิ่งสำคัญกว่าความสามารถในการมอบหมายให้มาก คือความสามารถในการแยกว่าอะไรควรมอบหมาย และอะไรที่ต้องตัดสินด้วยตัวเอง
บทความนี้ชี้ให้เห็นว่าคอขวดของการใช้ AI เอเจนต์อาจไม่ได้อยู่ที่ความสามารถในการรัน แต่อยู่ที่ความสามารถในการตรวจทานและตัดสิน การเปิดเอเจนต์หลายตัวกลายเป็นเรื่องง่ายขึ้นแล้ว แต่กระบวนการรับผลลัพธ์เหล่านั้นไปใช้อย่างมีความรับผิดชอบก็ยังเป็นหน้าที่ของมนุษย์อยู่ดี ดังนั้น ผลิตภาพจึงไม่ได้มาจากการเพิ่มจำนวนเอเจนต์ แต่มาจากการมองความสนใจของตัวเองเป็นทรัพยากรสำคัญของระบบ และจัดวางงานให้สอดคล้องกับข้อจำกัดนั้น การมอบหมายงานก็อยู่ภายใต้หลักการเดียวกัน ไม่ใช่การมอบหมายให้มากขึ้น แต่คือการมอบหมายภายในขอบเขตที่ยังตัดสินได้อย่างเหมาะสม
2 ความคิดเห็น
ช่วงนี้ผมก็รู้สึกเหมือนกันว่า เวลาโยนงานไว้พร้อมกัน 10-20 งานแล้วกลับมานั่งตรวจทีละงาน มันสลับคอนเท็กซ์ไม่ทัน จนต้องนึกย้อนว่าอันนี้คืออะไรนะ?? อยู่บ่อย ๆ..
ถ้าทำงานแบบลำดับต่อเนื่อง การตรวจสอบและการรีวิวโดยมนุษย์ก็จะกลายเป็นคอขวดอย่างหลีกเลี่ยงไม่ได้
ท้ายที่สุด เวิร์กโฟลว์การทำงานก็ควรถูกย้ายไปสู่การประมวลผลแบบขนานของเอเจนต์
แต่ความสามารถในการรับรู้ของมนุษย์ก็มีขีดจำกัด
สุดท้ายแล้ว ดูเหมือนว่าเรากำลังเข้าสู่ยุคที่หัวใจสำคัญของคุณภาพและการป้องกันความผิดพลาดคือการสร้างลูปการตรวจสอบ
และไม่ใช่แค่มนุษย์ตรวจสอบมนุษย์เท่านั้น แต่ต้องทำให้ขั้นตอนการตรวจสอบแข็งแรงขึ้นด้วยการให้อเอเจนต์คานอำนาจและตรวจสอบกันเอง