- วิศวกรรมซอฟต์แวร์ คิดเป็นราว 50% ของการเรียกใช้เครื่องมือ AI เอเจนต์ทั้งหมด ขณะที่ 16 vertical เช่น เฮลท์แคร์ กฎหมาย และการเงิน ต่างมีสัดส่วนไม่ถึง 5% ต่อสาขา
- ความสามารถที่แท้จริงของโมเดล AI อยู่ในระดับที่ทำงานซึ่งมนุษย์ใช้เวลา 5 ชั่วโมงได้ แต่ในการใช้งานจริง เซสชันที่เปอร์เซ็นไทล์ 99.9 ใช้เวลาเพียงราว 42 นาที แสดงให้เห็นช่องว่างขนาดใหญ่ระหว่างความสามารถกับความไว้วางใจ
- เมื่อผู้ใช้มีประสบการณ์มากขึ้น อัตราการอนุมัติอัตโนมัติ จะเพิ่มจาก 20% ไปเป็นมากกว่า 40% และในเวลาเดียวกัน ผู้ใช้ที่ชำนาญจะเปลี่ยนกลยุทธ์การกำกับดูแลจากการอนุมัติล่วงหน้าไปเป็นการเฝ้าติดตามเชิงรุก
- แก่นสำคัญของ Vertical AI คือ การเชื่อมต่อข้อมูลกรรมสิทธิ์, context engineering เฉพาะโดเมน, และการจัดการการเปลี่ยนแปลงของลูกค้า ซึ่งเป็นเกณฑ์ที่ใช้แยกระหว่าง wrapper ธรรมดากับบริษัทที่สร้างความได้เปรียบป้องกันได้
- เช่นเดียวกับที่ SaaS ได้สร้าง ยูนิคอร์นมากกว่า 170 ราย ตลอดหลายทศวรรษที่ผ่านมา ก็มีความเป็นไปได้ที่จะเกิด Vertical AI ยูนิคอร์น ที่สอดคล้องกับ SaaS ยูนิคอร์นแต่ละราย และเวอร์ชัน AI นั้นอาจแทนที่ได้ไม่ใช่แค่ซอฟต์แวร์ แต่รวมถึงผู้ปฏิบัติงานด้วย
วิศวกรรมซอฟต์แวร์ครองครึ่งหนึ่งของกิจกรรม AI เอเจนต์
- จากงานวิจัยการใช้งานจริงของ AI เอเจนต์ที่เผยแพร่โดย Anthropic พบว่าวิศวกรรมซอฟต์แวร์คิดเป็น 49.7% ของการเรียกใช้เครื่องมือแบบ agentic ทั้งหมด
- เฮลท์แคร์มีเพียง 1% กฎหมาย 0.9% และการศึกษา 1.8% และใน 16 vertical ไม่มีสาขาใดเกิน 9%
- สิ่งนี้ไม่ได้หมายความว่าตลาดอิ่มตัวแล้ว แต่หมายความว่า ตลาดยังไม่ก่อตัวเต็มที่
- Han Wang เรียกสิ่งนี้ว่าเป็น โอกาสแบบ greenfield ที่ผู้ก่อตั้งส่วนใหญ่มองข้าม
- Garry Tan ผู้เขียนบทความนี้กล่าวว่า “ถ้าจะเริ่มสตาร์ตอัพตอนนี้ ผมจะจับตา พื้นที่สีแดงในกราฟนี้”
Deployment Overhang
- ตามการประเมินของ METR โมเดล Claude สามารถทำงานที่มนุษย์ต้องใช้เวลา 5 ชั่วโมง ได้ แต่เซสชันใช้งานจริงเฉลี่ยมีเพียง 42 นาที
- ช่องว่างระหว่างสิ่งที่ AI ทำได้กับสิ่งที่ผู้ใช้ยอมให้ AI ทำ กำลังก่อให้เกิดโอกาสขนาดใหญ่
- ระหว่างเดือนตุลาคม 2025 ถึงมกราคม 2026 ระยะเวลาของ turn ที่เปอร์เซ็นไทล์ 99.9 เพิ่มขึ้นเกือบสองเท่า จากต่ำกว่า 25 นาทีเป็นมากกว่า 45 นาที
- นี่ไม่ใช่แค่ผลจากประสิทธิภาพของโมเดลที่ดีขึ้น แต่ยังเป็นผลจากการที่ผู้ใช้ สะสมความไว้วางใจ ในแต่ละเซสชัน
- จากข้อมูลภายใน อัตราความสำเร็จของ Claude Code เพิ่มขึ้นเป็นสองเท่า และการแทรกแซงของมนุษย์ต่อเซสชันลดจาก 5.4 ครั้งเหลือ 3.3 ครั้ง
- โมเดลมีความสามารถเพียงพอแล้ว แต่การนำไปใช้งานจริงยังตามไม่ทัน และนี่คือโอกาสของผลิตภัณฑ์ใหม่
วิวัฒนาการของความไว้วางใจ
- ผู้ใช้ใหม่อนุมัติอัตโนมัติเพียง 20% ของเซสชัน Claude Code แต่หลังมีประสบการณ์ 750 เซสชัน มากกว่า 40% จะ เปลี่ยนเป็นอนุมัติอัตโนมัติเต็มรูปแบบ
- อย่างสวนทางกับสัญชาตญาณ ผู้ใช้ที่ชำนาญไม่ได้แทรกแซงน้อยลง แต่ แทรกแซงมากขึ้น — ผู้ใช้ใหม่มีอัตราการแทรกแซง 5% ส่วนผู้ใช้ชำนาญอยู่ที่ 9%
- นี่ไม่ใช่ความขัดแย้ง แต่คือการเปลี่ยนแปลงของกลยุทธ์การกำกับดูแล (oversight): ผู้เริ่มต้นจะอนุมัติล่วงหน้าทีละขั้น ส่วนผู้ใช้ชำนาญจะ มอบหมายก่อนแล้วค่อยเข้าแทรกเมื่อเกิดปัญหา (อนุมัติล่วงหน้า → เฝ้าติดตามเชิงรุก)
- ข้อค้นพบด้านความปลอดภัย: ในงานที่ซับซ้อน Claude Code จะตั้งคำถามเพื่อยืนยัน บ่อยกว่าความถี่ที่มนุษย์แทรกแซงมากกว่าสองเท่า
- เป็นรูปแบบพฤติกรรมที่เอเจนต์ไม่ได้เดินหน้าต่อแบบสุ่มสี่สุ่มห้า แต่ หยุดเองเมื่อไม่แน่ใจ
- บทเรียนหลักของ Anthropic: ระดับอิสระที่เอเจนต์ใช้งานจริงนั้นเป็นสิ่งที่ ถูกประกอบร่วมกันโดยโมเดล ผู้ใช้ และผลิตภัณฑ์
Vertical AI playbook ของ Aaron Levie
- สูตรสร้าง Vertical AI ที่ Aaron Levie เสนอ:
- การเข้าใจ ข้อมูล เวิร์กโฟลว์ และกำแพงด้านกฎระเบียบ ที่เป็นเอกลักษณ์ของแต่ละอุตสาหกรรม คือหัวใจของบริษัทที่มีความสามารถในการป้องกันการแข่งขันสูง
- ต้องมีความสามารถด้าน การผสานข้อมูลเฉพาะ การทำเวิร์กโฟลว์อัตโนมัติ และการจัดการการเปลี่ยนแปลง ไม่ใช่แค่ wrapper ธรรมดา
- สร้างซอฟต์แวร์แบบ agentic ที่เชื่อมต่อกับ ข้อมูลกรรมสิทธิ์
- ออกแบบให้ซอฟต์แวร์ทำงานได้สอดคล้องกับคนจริงและปัญหาจริง
- เพิ่มความฉลาดของผลลัพธ์ให้สูงสุดด้วย context engineering เฉพาะโดเมน
- สิ่งที่ผู้ก่อตั้งส่วนใหญ่มักพลาดคือการผลักดัน การจัดการการเปลี่ยนแปลง (change management) ให้กับลูกค้า
- เหตุผลที่ Vertical AI ป้องกันการแข่งขันได้: ใครก็สร้าง wrapper ได้ แต่มีไม่กี่รายที่สามารถจัดการกับ เวิร์กโฟลว์เฉพาะ ข้อจำกัดด้านกฎระเบียบ และแรงเสียดทานในองค์กร เช่น การเรียกเก็บเงินในเฮลท์แคร์ การทำ legal discovery หรือการอนุญาตก่อสร้าง
- SaaS เติบโต 10 เท่าทุก 10 ปีตลอดหลายทศวรรษที่ผ่านมา และในช่วง 20 ปีหลัง เงินลงทุน VC มากกว่า 40% ไหลเข้าสู่ SaaS พร้อมสร้าง SaaS ยูนิคอร์นมากกว่า 170 ราย
- วิทยานิพนธ์หลักคือ Vertical AI ยูนิคอร์นจะมีคู่ขนานกับ SaaS ยูนิคอร์นแต่ละราย และเวอร์ชัน AI อาจใหญ่กว่า 10 เท่า เพราะมันแทนที่ได้ไม่ใช่แค่ซอฟต์แวร์ แต่รวมถึง ผู้ปฏิบัติงาน ด้วย
อินไซต์เรื่องการประกอบร่วมกัน (Co-Construction) และนัยเชิงนโยบาย
- ข้อค้นพบหลักของ Anthropic:
- ความเป็นอิสระไม่ใช่คุณสมบัติโดยเนื้อแท้ของโมเดล แต่เป็นสิ่งที่ ถูกประกอบร่วมกันโดยโมเดล ผู้ใช้ และผลิตภัณฑ์
- การประเมินก่อนนำไปใช้งานเพียงอย่างเดียวจับสิ่งนี้ไม่ได้ จึงจำเป็นต้องมี การวัดในสภาพแวดล้อมจริง
- ตัวเลขด้านความปลอดภัย: 73% ของการเรียกใช้เครื่องมือมีมนุษย์แทรกแซง และมีเพียง 0.8% เท่านั้นที่ถูกจัดเป็นการกระทำที่ย้อนกลับไม่ได้
- การนำไปใช้ที่มีความเสี่ยงสูงที่สุด (เช่น การรั่วไหลของ API key หรือการเทรดคริปโตแบบอัตโนมัติ) ส่วนใหญ่ยังเป็นเพียง การประเมินด้านความปลอดภัย ไม่ใช่โปรดักชันจริง
- นโยบายแบบ “ต้องอนุมัติทุกการกระทำ” ไม่ได้เพิ่มความปลอดภัย แต่กลับ ลดทอนผลิตภาพเท่านั้น และเป้าหมายนโยบายที่ดีกว่าคือทำให้มนุษย์สามารถเฝ้าติดตามและแทรกแซงได้
ที่ซ่อนของยูนิคอร์น
- วิศวกรรมซอฟต์แวร์ถูกช่วงชิงพื้นที่ไปก่อนแล้ว ขณะที่เฮลท์แคร์ กฎหมาย การเงิน การศึกษา บริการลูกค้า โลจิสติกส์ และอีก 16 vertical ที่มีส่วนแบ่งตลาดเพียงเลขหลักเดียว กำลังรอใครสักคนมาฝังความเชี่ยวชาญเฉพาะโดเมนลงในเอเจนต์
- ก่อนหน้านี้มี SaaS ยูนิคอร์นเกิดขึ้น 300 ราย และถัดจากนี้จะมี Vertical AI ยูนิคอร์น 300 ราย
- ผู้ก่อตั้งที่เลือก vertical ที่เหมาะสม ฝังความเชี่ยวชาญโดเมนไว้ในเอเจนต์ และแก้โจทย์เรื่องการจัดการการเปลี่ยนแปลงได้ จะเป็นผู้ครอง ซอฟต์แวร์องค์กรในทศวรรษหน้า
- ตอนนี้โมเดลสามารถทำงานได้แล้วนาน 5 ชั่วโมง แต่ผู้ใช้ยังอนุญาตเพียง 42 นาที
- สิ่งนี้แสดงว่าเรายังอยู่ใน ระยะเริ่มต้นของการใช้ AI
- และยังมีอีกมากมายหลายสาขาที่ ยังไม่เคยมีการใส่ปัญญาแม้แต่ 1 นาทีเดียว
ยังไม่มีความคิดเห็น