AI Agent ทำงานได้อย่างอิสระจริงแค่ไหน
- Anthropic วิเคราะห์ปฏิสัมพันธ์กับ Claude Code หลายล้านครั้งเพื่อวัดว่า AI Agent รับงานไปทำจริงมากแค่ไหน
- แกนสำคัญของงานวิจัยนี้ไม่ใช่ประสิทธิภาพของโมเดล แต่คือ มนุษย์มอบอิสระในการตัดสินใจให้มากน้อยเพียงใด
- งานส่วนใหญ่ใช้เวลาสั้น แต่ ระยะเวลาทำงานแบบอัตโนมัติที่ยาวที่สุดเพิ่มจาก 25 นาที → มากกว่า 45 นาทีภายใน 3 เดือน
- จุดที่น่าสนใจคือ การเปลี่ยนแปลงนี้เกิดจาก การสั่งสมความไว้วางใจของผู้ใช้ มากกว่าการอัปเกรดโมเดล
- ผู้ใช้ที่มีประสบการณ์จะปรับกลยุทธ์การกำกับดูแลเป็น รูปแบบการเฝ้าดูติดตาม ที่เพิ่มสัดส่วนการอนุมัติอัตโนมัติ แต่ยัง แทรกแซงระหว่างทางเมื่อจำเป็น
- นอกจากนี้ AI เองก็แสดง กลไกควบคุมตนเอง โดยจะถามหรือหยุดเมื่อไม่แน่ใจ
- ปัจจุบันการใช้งานเอเจนต์ครึ่งหนึ่งกระจุกตัวอยู่ใน ด้านการพัฒนาซอฟต์แวร์
- สุดท้ายแล้ว ความเป็นอิสระของ AI Agent ไม่ได้ถูกกำหนดด้วยประสิทธิภาพของโมเดล แต่ด้วย ความไว้วางใจ วัฒนธรรมองค์กร และโครงสร้างเครื่องมือ
1 ความคิดเห็น
เดี๋ยวก่อน!<ctrl+ enter>