ซอฟต์แวร์หลังยุค AI: การเปิดฉากของยุค Harness
(tomtunguz.com)- จุดจบของยุคซอฟต์แวร์คือ จุดเริ่มต้นของยุคฮาร์เนส (harness) และ SaaS ที่ขับเคลื่อนด้วยเวิร์กโฟลว์แบบตายตัวและฐานข้อมูลแบบจัดการกำลังถูกแทนที่ด้วย AI ที่มีสติปัญญา
- AI มีพลังมาก แต่ยังไม่ถูกฝึกให้เชื่องเหมือนม้าป่า และเพื่อใช้พลังนั้นให้เกิดประโยชน์ จำเป็นต้องมี การควบคุมอย่างเป็นระบบ (domestication)
- ฮาร์เนสของ AI agent ถูกนิยามด้วย องค์ประกอบหลัก 7 ส่วน ที่ล้อมรอบ LLM ซึ่งเป็นศูนย์กลาง โดยแต่ละส่วนเป็นตัวกำหนดความน่าเชื่อถือและประสิทธิภาพระดับโปรดักชัน
- ในยุคที่ทุกบริษัทเข้าถึงโมเดลเดียวกันได้ ผู้ชนะจะไม่ใช่คนที่มีตัวโมเดล แต่เป็น ฝ่ายที่ออกแบบและใช้งานฮาร์เนสได้ดีกว่า (best rider)
- ตลาดย่อยที่แยกจากกันนับพันแห่ง ซึ่งแล็บใหญ่ไม่ได้ให้ความสำคัญเป็นลำดับแรก ยังคงเป็นโอกาสสำหรับสตาร์ตอัป
ความหมายของยุคฮาร์เนส
- AI กำลัง แทนที่ SaaS ที่อิงกับเวิร์กโฟลว์แบบตายตัวและฐานข้อมูลแบบจัดการด้วย สติปัญญา (intelligence) และกำลังกำหนดกระบวนทัศน์ซอฟต์แวร์ขึ้นใหม่
- มีการเปรียบ AI เป็นมัสแตง ซึ่งทรงพลังแต่ยังดิบและไม่สามารถนำไปใช้ได้ตรง ๆ ดังนั้น การฝึกให้เชื่องจึงคือฮาร์เนส
- แก่นของการฝึกให้เชื่องคือสถาปัตยกรรมที่วาง LLM ไว้ตรงกลาง และจัดวางองค์ประกอบ 7 ส่วนรอบ ๆ แบบรัศมี
7 องค์ประกอบของฮาร์เนสสำหรับ AI agent
-
1. Context & Memory (บริบทและหน่วยความจำ)
- โมเดลทั่วไปจำเป็นต้องมี ระบบค้นคืนข้อมูลที่ปรับแต่งตามการใช้งาน (bespoke retrieval) โดยระบบค้นหาบริบทสำหรับรังสีแพทย์ย่อมไม่เหมือนกับระบบสำหรับผู้ช่วยงานกฎหมาย
- ไม่ว่าจะเป็นหน่วยความจำระยะสั้น ("agent กำลังทำอะไรอยู่เมื่อ 45 วินาทีก่อน"), การค้นหารูปภาพขนาดใหญ่ (รังสีวิทยา·การสร้างภาพ), หรือการค้นหาคีย์เวิร์ดในเอกสารนับพันล้านฉบับ ระบบก็ต้องแตกต่างกันไปตามแต่ละกรณีใช้งาน
- ถัดจากระบบค้นคืนข้อมูลจะมี ฐานข้อมูลบริบท (context database) ซึ่งทำหน้าที่เป็น "สมุดสูตร" ที่บันทึกว่าธุรกิจดำเนินงานจริงอย่างไร
- ขั้นตอนปฏิบัติงานมาตรฐาน (SOP) ที่ผู้คนพกติดอยู่ในหัวเมื่อมาทำงาน ก็คือสูตรเหล่านั้น
- การเก็บรวบรวมในช่วงแรกและการพัฒนาไปตามการเปลี่ยนแปลงของคนและกระบวนการ คือแก่นสำคัญของ context DB
-
2. Tools & Action (เครื่องมือและการลงมือทำ)
- เครื่องมือคือวิธีที่ agent ใช้เพื่อส่งผลต่อโลกภายนอก และหากสูตรใน context DB คือ "ต้องทำอะไร" เครื่องมือก็คือ วัตถุดิบและอุปกรณ์ที่ใช้ลงมือทำสิ่งนั้นจริง
- ฮาร์เนสสมัยใหม่เปิดเผยเครื่องมือผ่าน registry พร้อมตรวจสอบอาร์กิวเมนต์ที่โมเดลส่งมา, dispatch การเรียกใช้, ให้การทำงานที่อ่อนไหวผ่าน approval gate และ parse ผลลัพธ์กลับเข้าสู่ลูปของ agent
- MCP กำลังก้าวขึ้นมาเป็น connective tissue สำหรับการเชื่อมต่อเครื่องมือ
- คุณภาพของฮาร์เนสถูกกำหนดโดยจำนวนเครื่องมือที่สามารถเปิดให้ใช้งานได้อย่างปลอดภัย และความสามารถในการจัดการความล้มเหลวได้อย่างเรียบร้อย
-
3. Orchestration & Loop (ออร์เคสเตรชันและลูป)
- ลูปของ agent มีโครงสร้างเป็น คิด (think) → ลงมือทำ (act) → สังเกต (observe) → ทำซ้ำ (repeat)
- การวางแผน การแตกงาน การใช้ sub-agent การ retry และเงื่อนไขการหยุด เป็นสิ่งที่กำหนดวิธีการทำงาน
- ระบบควรดีขึ้นเมื่อใช้งานไปเรื่อย ๆ และ รูปแบบ closed loop ที่เรียนรู้จากการรันแต่ละครั้งคือจุดสร้างความแตกต่างระหว่างผู้ให้บริการ
-
4. State & Persistence (สถานะและการคงอยู่ของข้อมูล)
- ในองค์กรขนาดใหญ่ที่มีผู้ใช้จำนวนมากใช้ระบบพร้อมกัน ความสามารถในการ ยืดหยุ่นและกู้คืนได้ (resilient) เป็นสิ่งจำเป็น
- หากฮาร์เนสล่มในขั้นตอนที่ 7 จากงาน 10 ขั้นตอน ก็ควร กลับมาทำต่อจากขั้นตอนที่ 8 แทนที่จะเริ่มใหม่ทั้งหมด
- file system, checkpoint, session thread และ artifact store คือกลไกที่ช่วยป้องกันการสูญหายของงาน
-
5. Sandbox & Compute (แซนด์บ็อกซ์และคอมพิวต์)
- agent แต่ละตัวต้องมี พื้นที่ทำงานแยกอิสระ (sandbox)
- Unix workspace แบบแยกส่วน, การควบคุม network egress, และ credentials ที่เก็บไว้นอกตัวโมเดล คือสิ่งที่รับประกันความปลอดภัย ความลับ และความเร็วในระดับสเกลใหญ่
-
6. Observability & Governance (การสังเกตการณ์และการกำกับดูแล)
- "สิ่งที่มองไม่เห็น ย่อมเชื่อถือไม่ได้" — การติดตามทุกขั้นตอน การบันทึกทุกการเรียกใช้เครื่องมือ การรัน evals ในฐานะ regression test และ human-in-the-loop สำหรับการตัดสินใจความเสี่ยงสูง คือสิ่งที่เปลี่ยนเดโมให้กลายเป็นระบบโปรดักชัน
- Guardrails ใช้บังคับใช้นโยบาย และ Evals ช่วยจับ regression ได้ก่อนลูกค้า
-
7. Cost & Workflow Optimization (ต้นทุนและการเพิ่มประสิทธิภาพเวิร์กโฟลว์)
- องค์ประกอบที่เจ็ดคือ วิจารณญาณเชิงสถาปัตยกรรม (architectural judgment)
- ต้องแยกให้ออกว่าส่วนใดควรทำแบบ deterministic หรือ non-deterministic, เลือกโมเดลที่เหมาะกับแต่ละขั้นตอน (ล้ำสมัย·ขนาดกลาง·ขนาดเล็ก·fine-tuning) และตัดสินใจว่าควรวางความรู้ไว้ใน skill หรือใน memory
สมรภูมิการแข่งขันแบบใหม่
- ผลลัพธ์คือพลวัตการแข่งขันรูปแบบใหม่ของซอฟต์แวร์ ซึ่งไม่ได้ใช้เหมือนกันในทุกหมวดหมู่
- ตลาดที่แล็บใหญ่ (สถาบันวิจัย AI รายใหญ่) ให้ความสำคัญก่อน จะได้ประโยชน์จาก ความเร็วในการลงมือทำและการควบคุมโมเดลโดยตรง
- แต่ขณะเดียวกัน ตลาดแยกย่อยอีกนับพันแห่ง ก็ยังเปิดกว้างสำหรับสตาร์ตอัป
- ในยุคที่ทุกบริษัทสามารถใช้โมเดลเดียวกันได้ "ผู้ที่ขี่ได้เก่งที่สุด (best riders)" จะเป็นฝ่ายชนะ — กล่าวคือ ความสามารถในการออกแบบและปฏิบัติการฮาร์เนสคือขีดความสามารถทางการแข่งขันที่สำคัญ
ยังไม่มีความคิดเห็น