• จุดจบของยุคซอฟต์แวร์คือ จุดเริ่มต้นของยุคฮาร์เนส (harness) และ SaaS ที่ขับเคลื่อนด้วยเวิร์กโฟลว์แบบตายตัวและฐานข้อมูลแบบจัดการกำลังถูกแทนที่ด้วย AI ที่มีสติปัญญา
  • AI มีพลังมาก แต่ยังไม่ถูกฝึกให้เชื่องเหมือนม้าป่า และเพื่อใช้พลังนั้นให้เกิดประโยชน์ จำเป็นต้องมี การควบคุมอย่างเป็นระบบ (domestication)
  • ฮาร์เนสของ AI agent ถูกนิยามด้วย องค์ประกอบหลัก 7 ส่วน ที่ล้อมรอบ LLM ซึ่งเป็นศูนย์กลาง โดยแต่ละส่วนเป็นตัวกำหนดความน่าเชื่อถือและประสิทธิภาพระดับโปรดักชัน
  • ในยุคที่ทุกบริษัทเข้าถึงโมเดลเดียวกันได้ ผู้ชนะจะไม่ใช่คนที่มีตัวโมเดล แต่เป็น ฝ่ายที่ออกแบบและใช้งานฮาร์เนสได้ดีกว่า (best rider)
  • ตลาดย่อยที่แยกจากกันนับพันแห่ง ซึ่งแล็บใหญ่ไม่ได้ให้ความสำคัญเป็นลำดับแรก ยังคงเป็นโอกาสสำหรับสตาร์ตอัป

ความหมายของยุคฮาร์เนส

  • AI กำลัง แทนที่ SaaS ที่อิงกับเวิร์กโฟลว์แบบตายตัวและฐานข้อมูลแบบจัดการด้วย สติปัญญา (intelligence) และกำลังกำหนดกระบวนทัศน์ซอฟต์แวร์ขึ้นใหม่
  • มีการเปรียบ AI เป็นมัสแตง ซึ่งทรงพลังแต่ยังดิบและไม่สามารถนำไปใช้ได้ตรง ๆ ดังนั้น การฝึกให้เชื่องจึงคือฮาร์เนส
  • แก่นของการฝึกให้เชื่องคือสถาปัตยกรรมที่วาง LLM ไว้ตรงกลาง และจัดวางองค์ประกอบ 7 ส่วนรอบ ๆ แบบรัศมี

7 องค์ประกอบของฮาร์เนสสำหรับ AI agent

  • 1. Context & Memory (บริบทและหน่วยความจำ)

    • โมเดลทั่วไปจำเป็นต้องมี ระบบค้นคืนข้อมูลที่ปรับแต่งตามการใช้งาน (bespoke retrieval) โดยระบบค้นหาบริบทสำหรับรังสีแพทย์ย่อมไม่เหมือนกับระบบสำหรับผู้ช่วยงานกฎหมาย
    • ไม่ว่าจะเป็นหน่วยความจำระยะสั้น ("agent กำลังทำอะไรอยู่เมื่อ 45 วินาทีก่อน"), การค้นหารูปภาพขนาดใหญ่ (รังสีวิทยา·การสร้างภาพ), หรือการค้นหาคีย์เวิร์ดในเอกสารนับพันล้านฉบับ ระบบก็ต้องแตกต่างกันไปตามแต่ละกรณีใช้งาน
    • ถัดจากระบบค้นคืนข้อมูลจะมี ฐานข้อมูลบริบท (context database) ซึ่งทำหน้าที่เป็น "สมุดสูตร" ที่บันทึกว่าธุรกิจดำเนินงานจริงอย่างไร
      • ขั้นตอนปฏิบัติงานมาตรฐาน (SOP) ที่ผู้คนพกติดอยู่ในหัวเมื่อมาทำงาน ก็คือสูตรเหล่านั้น
      • การเก็บรวบรวมในช่วงแรกและการพัฒนาไปตามการเปลี่ยนแปลงของคนและกระบวนการ คือแก่นสำคัญของ context DB
  • 2. Tools & Action (เครื่องมือและการลงมือทำ)

    • เครื่องมือคือวิธีที่ agent ใช้เพื่อส่งผลต่อโลกภายนอก และหากสูตรใน context DB คือ "ต้องทำอะไร" เครื่องมือก็คือ วัตถุดิบและอุปกรณ์ที่ใช้ลงมือทำสิ่งนั้นจริง
    • ฮาร์เนสสมัยใหม่เปิดเผยเครื่องมือผ่าน registry พร้อมตรวจสอบอาร์กิวเมนต์ที่โมเดลส่งมา, dispatch การเรียกใช้, ให้การทำงานที่อ่อนไหวผ่าน approval gate และ parse ผลลัพธ์กลับเข้าสู่ลูปของ agent
    • MCP กำลังก้าวขึ้นมาเป็น connective tissue สำหรับการเชื่อมต่อเครื่องมือ
    • คุณภาพของฮาร์เนสถูกกำหนดโดยจำนวนเครื่องมือที่สามารถเปิดให้ใช้งานได้อย่างปลอดภัย และความสามารถในการจัดการความล้มเหลวได้อย่างเรียบร้อย
  • 3. Orchestration & Loop (ออร์เคสเตรชันและลูป)

    • ลูปของ agent มีโครงสร้างเป็น คิด (think) → ลงมือทำ (act) → สังเกต (observe) → ทำซ้ำ (repeat)
    • การวางแผน การแตกงาน การใช้ sub-agent การ retry และเงื่อนไขการหยุด เป็นสิ่งที่กำหนดวิธีการทำงาน
    • ระบบควรดีขึ้นเมื่อใช้งานไปเรื่อย ๆ และ รูปแบบ closed loop ที่เรียนรู้จากการรันแต่ละครั้งคือจุดสร้างความแตกต่างระหว่างผู้ให้บริการ
  • 4. State & Persistence (สถานะและการคงอยู่ของข้อมูล)

    • ในองค์กรขนาดใหญ่ที่มีผู้ใช้จำนวนมากใช้ระบบพร้อมกัน ความสามารถในการ ยืดหยุ่นและกู้คืนได้ (resilient) เป็นสิ่งจำเป็น
    • หากฮาร์เนสล่มในขั้นตอนที่ 7 จากงาน 10 ขั้นตอน ก็ควร กลับมาทำต่อจากขั้นตอนที่ 8 แทนที่จะเริ่มใหม่ทั้งหมด
    • file system, checkpoint, session thread และ artifact store คือกลไกที่ช่วยป้องกันการสูญหายของงาน
  • 5. Sandbox & Compute (แซนด์บ็อกซ์และคอมพิวต์)

    • agent แต่ละตัวต้องมี พื้นที่ทำงานแยกอิสระ (sandbox)
    • Unix workspace แบบแยกส่วน, การควบคุม network egress, และ credentials ที่เก็บไว้นอกตัวโมเดล คือสิ่งที่รับประกันความปลอดภัย ความลับ และความเร็วในระดับสเกลใหญ่
  • 6. Observability & Governance (การสังเกตการณ์และการกำกับดูแล)

    • "สิ่งที่มองไม่เห็น ย่อมเชื่อถือไม่ได้" — การติดตามทุกขั้นตอน การบันทึกทุกการเรียกใช้เครื่องมือ การรัน evals ในฐานะ regression test และ human-in-the-loop สำหรับการตัดสินใจความเสี่ยงสูง คือสิ่งที่เปลี่ยนเดโมให้กลายเป็นระบบโปรดักชัน
    • Guardrails ใช้บังคับใช้นโยบาย และ Evals ช่วยจับ regression ได้ก่อนลูกค้า
  • 7. Cost & Workflow Optimization (ต้นทุนและการเพิ่มประสิทธิภาพเวิร์กโฟลว์)

    • องค์ประกอบที่เจ็ดคือ วิจารณญาณเชิงสถาปัตยกรรม (architectural judgment)
    • ต้องแยกให้ออกว่าส่วนใดควรทำแบบ deterministic หรือ non-deterministic, เลือกโมเดลที่เหมาะกับแต่ละขั้นตอน (ล้ำสมัย·ขนาดกลาง·ขนาดเล็ก·fine-tuning) และตัดสินใจว่าควรวางความรู้ไว้ใน skill หรือใน memory

สมรภูมิการแข่งขันแบบใหม่

  • ผลลัพธ์คือพลวัตการแข่งขันรูปแบบใหม่ของซอฟต์แวร์ ซึ่งไม่ได้ใช้เหมือนกันในทุกหมวดหมู่
  • ตลาดที่แล็บใหญ่ (สถาบันวิจัย AI รายใหญ่) ให้ความสำคัญก่อน จะได้ประโยชน์จาก ความเร็วในการลงมือทำและการควบคุมโมเดลโดยตรง
  • แต่ขณะเดียวกัน ตลาดแยกย่อยอีกนับพันแห่ง ก็ยังเปิดกว้างสำหรับสตาร์ตอัป
  • ในยุคที่ทุกบริษัทสามารถใช้โมเดลเดียวกันได้ "ผู้ที่ขี่ได้เก่งที่สุด (best riders)" จะเป็นฝ่ายชนะ — กล่าวคือ ความสามารถในการออกแบบและปฏิบัติการฮาร์เนสคือขีดความสามารถทางการแข่งขันที่สำคัญ

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น