• แสดงภาพและอธิบายเทรนด์ล่าสุดในหมวด เทคนิค/เครื่องมือ/แพลตฟอร์ม/ภาษาและเฟรมเวิร์กสำหรับการพัฒนา ด้วย 4 ระดับ ได้แก่ Adopt (แนะนำให้นำไปใช้), Trial (ทดลองใช้), Assess (ประเมิน), Hold (ระวัง)
  • 4 ธีมหลัก: การนำ orchestration มาใช้กับโครงสร้างพื้นฐาน AI, การเติบโตของเอเจนต์ที่อิง MCP, เวิร์กโฟลว์การเขียนโค้ดด้วย AI, การเกิดขึ้นของ anti-pattern ด้าน AI

นำ orchestration มาใช้กับ AI infrastructure

  • เวิร์กโหลด AI กำลังทำให้องค์กรต้องใช้ การ orchestration ของ GPU fleet ขนาดใหญ่ สำหรับการฝึกและการอนุมาน
    • เมื่อโมเดลขนาดใหญ่ที่เกินข้อจำกัดของความจุ HBM (80GB) ของ GPU เดี่ยวมีมากขึ้น การฝึกแบบกระจายและการอนุมานแบบหลาย GPU จึงกลายเป็นสิ่งจำเป็น
    • ทีมแพลตฟอร์มต้องสร้างไปป์ไลน์หลายขั้นที่ซับซ้อน และปรับ throughput กับ latency อย่างต่อเนื่อง
    • ใช้ Nvidia DCGM Exporter ทำ fleet telemetry ระยะไกล และใช้ topology-aware scheduling เพื่อวางงานในตำแหน่งที่มี interconnect bandwidth สูงที่สุด
  • Kubernetes เป็นรากฐานหลักในการจัดการเวิร์กโหลด AI ในระดับใหญ่ แต่แพลตฟอร์มทางเลือกอย่าง microVM(Firecracker) และ Uncloud ก็ได้รับความสนใจเช่นกัน
    • กลยุทธ์การจัดวางที่คำนึงถึงการสื่อสารความเร็วสูงระหว่างลิงก์ GPU เช่น การจัดการคิวและโควตาผ่าน Kueue, topology-aware scheduling, และ gang scheduling กำลังพัฒนาอย่างต่อเนื่อง
    • จัดวางงานแบบหลาย GPU ภายใน “island” ของดาต้าเซ็นเตอร์แบบต่อเนื่อง (rack หรือ pod) ที่มีลิงก์ความเร็วสูงระหว่าง GPU เช่น NVLink/NVSwitch และ RDMA
  • การปรับปรุงล่าสุดของ Kubernetes ในด้าน API ที่รับรู้หลาย GPU และ NUMA ช่วยเสริมความสามารถเหล่านี้ ทั้งการเพิ่มแบนด์วิดท์ระหว่างอุปกรณ์ ลด tail latency และเพิ่มอัตราการใช้งานอย่างมีประสิทธิภาพ
    • จากความต้องการเวิร์กโฟลว์การเขียนโค้ดด้วย AI ที่เพิ่มขึ้น และเอเจนต์ที่ดีขึ้นด้วย MCP ทำให้คาดว่าจะเกิดนวัตกรรมอย่างรวดเร็วใน AI infrastructure
    • GPU-aware orchestration กำลังกลายเป็นข้อกำหนดพื้นฐาน และ topology กำลังกลายเป็นปัจจัยด้าน scheduling ระดับชั้นหนึ่ง

การเติบโตของเอเจนต์ที่อิง MCP

  • การเติบโตขึ้นพร้อมกันของ MCP และเอเจนต์ รวมถึงการขยายตัวของระบบนิเวศโปรโตคอลและเครื่องมือที่สร้างรอบสิ่งเหล่านี้ เป็นหัวข้อหลักของ Radar ครั้งนี้
    • MCP กำลังวางตัวเป็น โปรโตคอลรวมศูนย์ขั้นสุดท้ายสำหรับการขับเคลื่อนเอเจนต์และการทำงานแบบมีประสิทธิภาพ/กึ่งอัตโนมัติ
  • ผู้ขายรายใหญ่แทบทั้งหมดกำลังเพิ่มการรองรับ MCP และ เวิร์กโฟลว์ที่มีเอเจนต์เป็นศูนย์กลาง กำลังเติบโตอย่างรวดเร็ว
  • มีการสังเกตเห็นนวัตกรรมอย่างต่อเนื่องในเวิร์กโฟลว์ของเอเจนต์ และ context engineering กำลังก้าวขึ้นมาเป็นหัวใจของการปรับพฤติกรรมโมเดลและประสิทธิภาพการใช้ทรัพยากรให้เหมาะสมที่สุด
    • โปรโตคอลใหม่อย่าง A2A(Agent-to-Agent) และ AG-UI ช่วยลดความซับซ้อนในการสร้างแอปความร่วมมือแบบหลายเอเจนต์
    • เทคโนโลยีอย่าง AGENTS.md, Anchoring coding agents, และ Context7 MCP server กำลังถูกนำไปใช้ในเวิร์กโฟลว์การพัฒนาจริง
  • ด้วยลักษณะของระบบนิเวศ AI ทำให้ใน Radar แต่ละครั้งมีนวัตกรรมใหม่เกิดขึ้นอย่างรวดเร็ว
    — ครั้งก่อนคือ RAG ส่วนครั้งนี้คือ เวิร์กโฟลว์ของเอเจนต์ และกลุ่มดาว (constellation) ของเครื่องมือ เทคนิค และแพลตฟอร์มที่เติบโตขึ้นเพื่อรองรับมัน
    • และยังมี anti-pattern ด้าน AI ที่น่าจับตาบางส่วนเริ่มปรากฏขึ้น

เวิร์กโฟลว์การเขียนโค้ดด้วย AI

  • AI กำลังเปลี่ยนวิธีการสร้างและบำรุงรักษาซอฟต์แวร์ และเป็นหัวข้อที่ครองการพูดคุยในช่วงหลัง
    • ตั้งแต่ การใช้ AI เพื่อทำความเข้าใจ codebase แบบ legacy ไปจนถึง GenAI สำหรับ forward engineering มันกำลังถูกฝังเชิงกลยุทธ์ตลอดห่วงโซ่มูลค่าของซอฟต์แวร์
    • กำลังเรียนรู้วิธีป้อนความรู้ให้ coding agent ได้มีประสิทธิภาพยิ่งขึ้น
  • ทีมต่าง ๆ กำลังทดลองแนวปฏิบัติใหม่ เช่น การกำหนดคำแนะนำแบบปรับแต่งผ่านไฟล์ AGENTS.md และการผสานกับ MCP server อย่าง Context7 เพื่อดึงเอกสาร dependency ล่าสุด
    • มีการตระหนักมากขึ้นว่า AI ควรช่วยเพิ่มศักยภาพไม่ใช่แค่ผู้มีส่วนร่วมรายบุคคล แต่รวมถึง ทั้งทีม
    • คำแนะนำร่วมที่ผ่านการคัดสรร และ คำสั่งแบบกำหนดเอง จึงเริ่มเกิดขึ้นเพื่อรับประกันการกระจายความรู้อย่างเท่าเทียม
  • ภูมิทัศน์ของเครื่องมือกำลังพัฒนาอย่างคึกคัก:
    • นักออกแบบใช้ UX Pilot และ AI Design Reviewer ขณะที่นักพัฒนาใช้ v0 และ Bolt เพื่อสร้างต้นแบบอย่างรวดเร็วผ่าน self-service UI prototyping
    • การถกเถียงเกี่ยวกับ spec-driven development ยังคงดำเนินต่อไป ทั้งเรื่องขอบเขต ระดับความละเอียด และความเป็นไปได้ที่จะทำหน้าที่เป็นแหล่งความจริงหนึ่งเดียวสำหรับการส่งมอบแบบค่อยเป็นค่อยไป
    • แม้จะมีความตื่นเต้น แต่ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ยังเป็นข้อกังวลร่วมอยู่เสมอ เป็นการย้ำว่า AI อาจเร่งงานวิศวกรรมได้ แต่การตัดสินใจของมนุษย์ยังคงขาดไม่ได้

การเกิดขึ้นของ anti-pattern ด้าน AI แบบใหม่

  • การเร่งนำ AI ไปใช้ทั่วทั้งอุตสาหกรรมทำให้ anti-pattern ที่กำลังเกิดขึ้นใหม่ เริ่มปรากฏควบคู่ไปกับแนวปฏิบัติที่มีประสิทธิภาพ
    • แม้จะยอมรับประโยชน์ที่ชัดเจนของแนวคิดอย่าง self-service UI prototyping แบบใช้ครั้งคราวด้วย GenAI แต่ก็รับรู้ถึงศักยภาพที่จะพาองค์กรไปสู่ anti-pattern ของ Shadow IT ที่เร่งโดย AI
    • เมื่อ MCP(Model Context Protocol) ได้รับความสนใจ หลายทีมกลับตกอยู่ใน anti-pattern ของ การแปลง API-to-MCP แบบไร้เดียงสา
  • ประสิทธิผลของโซลูชัน Text-to-SQL ไม่เป็นไปตามความคาดหวังช่วงแรก และ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ก็ยังเป็นข้อกังวลที่เกี่ยวข้องต่อเนื่อง
    • แม้แต่ในแนวปฏิบัติใหม่อย่าง spec-driven development ก็ยังมีความเสี่ยงที่จะย้อนกลับไปสู่ anti-pattern ของวิศวกรรมซอฟต์แวร์แบบดั้งเดิม
      — โดยเฉพาะอคติต่อการทำสเปกล่วงหน้ามากเกินไปและการปล่อยแบบบิ๊กแบง
  • GenAI กำลังพัฒนาในความเร็วและขนาดที่ไม่เคยมีมาก่อน จึงคาดว่า anti-pattern ใหม่จะเกิดขึ้นอย่างรวดเร็ว
    • ทีมงานจำเป็นต้องระวังรูปแบบที่ช่วงแรกดูมีประสิทธิภาพ แต่เมื่อเวลาผ่านไปกลับทำให้ประสิทธิภาพลดลง ทำให้ feedback ช้าลง บั่นทอนความสามารถในการปรับตัว หรือทำให้ความรับผิดชอบไม่ชัดเจน

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

  • แนวปฏิบัติที่ทำให้มั่นใจว่ากระบวนการพัฒนาซอฟต์แวร์และเทคโนโลยีจะยังคงเป็นไปตามมาตรฐานด้านกฎระเบียบและความปลอดภัยอย่างต่อเนื่องผ่านระบบอัตโนมัติ
  • ผสานเครื่องมือ policy-as-code อย่าง Open Policy Agent และสร้าง SBOM ภายใน CD pipeline เพื่อให้ตรวจพบและแก้ไขปัญหาด้าน compliance ตั้งแต่ระยะต้นตามแนวทาง SLSA
  • เมื่อแปลงกฎและแนวปฏิบัติที่ดีเป็นโค้ด ก็สามารถบังคับใช้มาตรฐานได้อย่างสม่ำเสมอทั่วทั้งทีมโดยไม่เกิดคอขวด
  • เมื่อความเสี่ยงจากความชะล่าใจต่อโค้ดที่ AI สร้างขึ้นเพิ่มขึ้น การฝัง compliance ไว้ในกระบวนการพัฒนาจึงสำคัญกว่าที่เคย

2. Curated shared instructions for software teams

  • สำหรับทีมที่ใช้ AI อย่างจริงจังในการส่งมอบซอฟต์แวร์ กำลังขยับจากการ prompting แบบรายบุคคลไปสู่คำแนะนำร่วมที่ผ่านการคัดสรร
  • วิธีนำไปใช้ที่ตรงไปตรงมาที่สุดคือการ commit ไฟล์คำแนะนำอย่าง AGENTS.md ลงใน project repository โดยตรง
  • เครื่องมือเขียนโค้ดด้วย AI ส่วนใหญ่ เช่น Cursor, Windsurf, Claude Code รองรับการแชร์คำแนะนำผ่าน custom slash command หรือ workflow
  • ทันทีที่ prompt ได้รับการปรับปรุง ทั้งทีมก็จะได้รับประโยชน์ พร้อมรับประกันการเข้าถึงคำแนะนำ AI ที่ดีที่สุดอย่างสม่ำเสมอ

3. Pre-commit hooks

  • Git hooks มีมานานแล้ว แต่ก็ยังถูกใช้งานไม่เต็มที่
  • การเติบโตของการเขียนโค้ดแบบมี AI ช่วยและ agent coding ทำให้ความเสี่ยงในการ commit ความลับหรือโค้ดที่มีปัญหาโดยไม่ตั้งใจเพิ่มขึ้น
  • แม้จะมีกลไกตรวจสอบโค้ดมากมาย เช่น continuous integration แต่ pre-commit hook คือมาตรการป้องกันที่เรียบง่ายและมีประสิทธิภาพซึ่งควรมีทีมจำนวนมากขึ้นนำไปใช้
  • แนวทางที่ดีที่สุดคือทำให้มันเรียบง่ายและมีเป้าหมายชัดเจน โดยมุ่งเน้นความเสี่ยงที่ตรวจจับได้มีประสิทธิภาพที่สุดในขั้นตอนนี้ของเวิร์กโฟลว์ เช่น การสแกนหาความลับ

4. การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซี

  • การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซีช่วยเร่งการทำความเข้าใจระบบขนาดใหญ่ที่ซับซ้อนได้อย่างมาก
  • เครื่องมืออย่าง Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ช่วยสนับสนุนการทำให้กฎทางธุรกิจปรากฏชัด การสรุปตรรกะ และการระบุการพึ่งพา
  • เมื่อใช้ร่วมกับเฟรมเวิร์กแบบเปิดและการพรอมป์ต LLM โดยตรง จะช่วยลดเวลาที่ใช้ในการทำความเข้าใจโค้ดเบสแบบเลกาซีได้อย่างมาก
  • ความพยายามในการตั้งค่าแนวทางขั้นสูงอย่าง GraphRAG จะแตกต่างกันไป โดยเฉพาะตามขนาดและความซับซ้อนของโค้ดเบสที่วิเคราะห์ แต่ผลกระทบต่อประสิทธิภาพการทำงานนั้นสม่ำเสมอและมีนัยสำคัญ

Trial

5. AGENTS.md

  • รูปแบบทั่วไปสำหรับให้คำแนะนำแก่ AI coding agent ที่ทำงานในโปรเจ็กต์
  • โดยพื้นฐานแล้วคือไฟล์ README สำหรับเอเจนต์ และไม่มีฟิลด์หรือฟอร์แมตบังคับนอกเหนือจาก Markdown
  • อาศัยความสามารถของ coding agent ที่ใช้ LLM ในการตีความคำแนะนำที่มนุษย์เขียนและอ่านได้
  • การใช้งานโดยทั่วไปมักรวมถึงเคล็ดลับการใช้เครื่องมือในสภาพแวดล้อมการเขียนโค้ด คำแนะนำในการทดสอบ และแนวปฏิบัติที่ต้องการสำหรับการจัดการ commit

6. AI สำหรับ code migration

  • การย้ายโค้ดมีได้หลายรูปแบบ ตั้งแต่การเขียนใหม่ทั้งภาษาไปจนถึงการอัปเกรด dependency หรือเฟรมเวิร์ก และมักต้องใช้แรงงานแบบแมนนวลนานหลายเดือน
  • ทีมที่อัปเกรด เวอร์ชัน .NET framework กำลังทดลองใช้ AI เพื่อย่นระยะกระบวนการ
  • ในอดีตมีการใช้เครื่องมือ refactoring แบบกำหนดกฎเชิงกำหนดแน่นอนอย่าง OpenRewrite ขณะที่การใช้ AI เพียงอย่างเดียวอาจมีค่าใช้จ่ายสูงและทำให้บทสนทนาออกนอกทางได้ง่าย
  • แทนที่จะมอบหมายการอัปเกรดทั้งหมด กระบวนการถูกแยกเป็นขั้นตอนย่อยที่เล็กลงและตรวจสอบได้ เช่น การวิเคราะห์ข้อผิดพลาดในการคอมไพล์ การสร้าง migration diff และการตรวจสอบการทดสอบแบบวนซ้ำ
  • กรณีศึกษาในอุตสาหกรรมอย่าง int32-to-int64 migration ขนาดใหญ่ของ Google ก็สะท้อนแนวโน้มคล้ายกัน

7. Delta Lake liquid clustering

  • เทคโนโลยีสำหรับตาราง Delta Lake ที่ทำหน้าที่เป็นทางเลือกแทน partitioning และ Z-ordering
  • ในอดีต การเพิ่มประสิทธิภาพการอ่านของตาราง Delta จำเป็นต้องกำหนด partition และคีย์ Z-order ตั้งแต่ตอนสร้างตาราง โดยอิงตามรูปแบบคิวรีที่คาดการณ์ไว้
  • liquid clustering ใช้อัลกอริทึมแบบ tree-based ในการจัดกลุ่มข้อมูลตามคีย์ที่ระบุ
  • สามารถเปลี่ยนแปลงแบบค่อยเป็นค่อยไปได้โดยไม่ต้องเขียนข้อมูลทั้งหมดใหม่ จึงให้ความยืดหยุ่นมากขึ้นในการรองรับรูปแบบคิวรีที่หลากหลาย
  • Databricks Runtime for Delta Lake รองรับ liquid clustering อัตโนมัติผ่านการวิเคราะห์เวิร์กโหลดคิวรีในอดีต การระบุคอลัมน์ที่เหมาะสมที่สุด และการจัดกลุ่มข้อมูลตามนั้น

8. การทำ UI prototype แบบ self-serve ด้วย GenAI

  • เครื่องมืออย่าง Claude Code, Figma Make, Miro AI, v0 ช่วยให้ผู้จัดการผลิตภัณฑ์สร้างต้นแบบแบบโต้ตอบได้และนำไปทดสอบกับผู้ใช้ได้โดยตรงจาก text prompt
  • แทนที่จะสร้าง wireframe ด้วยมือ ทีมสามารถสร้างอาร์ติแฟกต์ HTML, CSS, JS ที่ใช้งานได้ภายในไม่กี่นาที
  • ต้นแบบแบบ "ใช้แล้วทิ้ง" เหล่านี้แลกความประณีตกับการเรียนรู้ที่รวดเร็ว จึงเหมาะอย่างยิ่งสำหรับการตรวจสอบเบื้องต้นระหว่าง design sprint
  • ความสมจริงที่สูงขึ้นอาจนำไปสู่การโฟกัสผิดจุดในรายละเอียด หรือความคาดหวังที่ไม่สมจริงต่อความพยายามระดับโปรดักชัน จึงจำเป็นต้องมีการกำหนดกรอบและบริหารความคาดหวังอย่างชัดเจน

9. Structured output จาก LLMs

  • แนวปฏิบัติในการจำกัดให้ LLM สร้างคำตอบในรูปแบบที่กำหนดไว้ล่วงหน้า เช่น JSON หรือคลาสของภาษาโปรแกรมเฉพาะ
  • เป็นสิ่งจำเป็นต่อการสร้างแอปพลิเคชันระดับโปรดักชันที่เชื่อถือได้ เพราะช่วยแปลงข้อความที่โดยทั่วไปคาดเดาได้ยากของ LLM ให้เป็นสัญญาข้อมูลที่เครื่องอ่านได้และกำหนดแน่นอนได้
  • มีแนวทางหลากหลาย ตั้งแต่การจัดฟอร์แมตด้วยพรอมป์ตแบบง่ายและ model-native structured outputs ไปจนถึงวิธี constrained decoding ที่แข็งแรงกว่าโดยใช้เครื่องมืออย่าง Outlines และ Instructor
  • ถูกใช้อย่างประสบความสำเร็จในการดึงข้อมูลที่ซับซ้อนและไม่มีโครงสร้างจากเอกสารหลายประเภท แล้วแปลงเป็น JSON ที่มีโครงสร้างสำหรับ business logic ขั้นปลาย

10. TCR (Test && Commit || Revert)

  • เวิร์กโฟลว์การเขียนโปรแกรมที่ต่อยอดจากการพัฒนาแบบ test-driven โดยใช้กฎง่าย ๆ เพื่อส่งเสริมการทำงานเป็นขั้นเล็ก ๆ อย่างต่อเนื่อง
  • หลังการเปลี่ยนแปลงแต่ละครั้ง หากการทดสอบผ่าน การเปลี่ยนแปลงจะถูก commit และหากล้มเหลว การเปลี่ยนแปลงจะถูกย้อนกลับ
  • นำไปใช้งานได้ไม่ยาก เพราะเพียงแค่กำหนดสคริปต์ที่ทำให้วงจรนี้เป็นอัตโนมัติภายในโค้ดเบส
  • TCR ซึ่งถูกแนะนำครั้งแรกใน article อย่างเป็นทางการของ Kent Beck ช่วยเสริมแนวปฏิบัติการเขียนโค้ดเชิงบวกอย่าง YAGNI และ KISS

Assess

11. AI-powered UI testing

  • ใน Radar ก่อนหน้านี้ การทดสอบ UI ที่ขับเคลื่อนด้วย AI มุ่งเน้นไปที่ exploratory testing เป็นหลัก และมีการกล่าวว่า non-determinism ของ LLM อาจก่อให้เกิดความไม่เสถียร
  • ด้วยการเติบโตของ MCP, เฟรมเวิร์กทดสอบ UI หลักอย่าง Playwright และ Selenium ได้นำ MCP server ของตนเองมาใช้ (playwright-mcp, mcp-selenium)
  • ด้วยการทำ browser automation ที่เชื่อถือได้ผ่านเทคโนโลยีเนทีฟ ทำให้ coding assistant สามารถสร้างการทดสอบ UI ที่เชื่อถือได้ใน Playwright หรือ Selenium
  • มีความตื่นเต้นกับความคืบหน้าอย่าง Playwright Agents ในรีลีส Playwright ล่าสุด และคาดว่าจะได้เห็นแนวทางที่ใช้งานได้จริงมากขึ้นพร้อมประสบการณ์จากภาคสนาม

12. การยึด coding agents เข้ากับ reference application

  • ก่อนหน้านี้เราเคยใส่ blip ให้กับแพตเทิร์น tailored service templates ซึ่งช่วยให้องค์กรที่นำไมโครเซอร์วิสมาใช้สามารถบูตสแตรปบริการใหม่และผสานเข้ากับโครงสร้างพื้นฐานเดิมได้อย่างราบรื่น
  • เมื่อเวลาผ่านไป เมื่อมี dependency, framework และแพตเทิร์นสถาปัตยกรรมใหม่ ๆ เกิดขึ้น ก็มีแนวโน้มที่ code drift ระหว่างเทมเพลตเหล่านี้กับบริการเดิมจะเพิ่มมากขึ้น
  • ในยุคของ coding agent เรากำลังทดลอง anchoring coding agents to a reference application เพื่อรักษาแนวปฏิบัติที่ดีและความสอดคล้องของสถาปัตยกรรม
  • เซิร์ฟเวอร์ Model Context Protocol (MCP) สามารถเปิดเผยทั้งโค้ดเทมเพลตอ้างอิงและ commit diff เพื่อให้เอเจนต์ตรวจจับ drift และเสนอแนวทางแก้ไขได้

13. Context engineering

  • การออกแบบและเพิ่มประสิทธิภาพข้อมูลที่ป้อนให้ LLM อย่างเป็นระบบระหว่างการอนุมาน เพื่อให้สร้างผลลัพธ์ที่ต้องการได้อย่างสม่ำเสมอ
  • ครอบคลุมการจัดโครงสร้าง การคัดเลือก และการจัดลำดับขององค์ประกอบบริบท เช่น prompt, ข้อมูลที่ดึงมา, memory, คำสั่ง และสัญญาณจากสภาพแวดล้อม
  • ต่างจาก prompt engineering ที่เน้นเฉพาะถ้อยคำใน prompt, context engineering พิจารณาองค์ประกอบของบริบททั้งหมด
  • ปัจจุบันวิศวกรใช้เทคนิคย่อยที่หลากหลาย ซึ่งจัดกลุ่มได้เป็น 3 ด้าน: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

  • เทคนิคเกิดใหม่ในการทำให้ระบบเลกาซีทันสมัยขึ้น โดยใช้คำอธิบายของ codebase เลกาซีที่สร้างโดย AI
  • มีการเพิ่มขั้นตอนที่ชัดเจนซึ่งมุ่งเน้นว่าโค้ดเลกาซีทำอะไรอยู่ (สเปก) พร้อมกับจงใจซ่อนวิธีการ implement ในปัจจุบัน
  • มีความเกี่ยวข้องกับ spec-driven development แต่ประยุกต์ใช้กับการทำระบบเลกาซีให้ทันสมัยโดยเฉพาะ
  • ตามลูป reverse-engineering → design/solutioning → forward-engineering ทั้งมนุษย์และ AI agent สามารถให้เหตุผลในระดับที่สูงขึ้นได้ก่อนจะ commit ลงไปที่ implementation

15. GraphQL as data access pattern for LLMs

  • แนวทางเกิดใหม่สำหรับการสร้างชั้นการเข้าถึงข้อมูลที่เป็นแบบเดียวกันและเป็นมิตรต่อโมเดล เพื่อยกระดับ context engineering
  • สามารถเปิดเผยข้อมูลที่มีโครงสร้างและ query ได้ โดยไม่ต้องให้สิทธิ์โมเดลเข้าถึงฐานข้อมูลโดยตรง
  • ต่างจาก REST API ที่ต้องมี endpoint หรือ filter ใหม่สำหรับแต่ละ use case, GraphQL ช่วยให้โมเดลดึงเฉพาะข้อมูลที่ต้องการได้
  • GraphQL schema ที่นิยามไว้อย่างชัดเจนให้ metadata ที่ LLM สามารถใช้อนุมานเกี่ยวกับเอนทิตีและความสัมพันธ์ที่มีอยู่ได้

16. Knowledge flows over knowledge stocks

  • เรามักถูกถามบ่อย ๆ ว่า “จะปรับปรุงวิธีที่ทีมต่าง ๆ แบ่งปันข้อมูลกันอย่างไร”
  • แนวคิด knowledge flows and knowledge stocks ซึ่งยืมมาจากการคิดเชิงระบบ เป็นมุมมองที่มีคุณค่า
  • แนวคิดนี้ส่งเสริมให้มองความรู้ขององค์กรเป็นระบบ โดย stock คือความรู้ที่สะสมไว้ ส่วน flow คือวิธีที่ความรู้เคลื่อนผ่านและพัฒนาไปทั่วทั้งองค์กร
  • การเพิ่ม flow ของความรู้จากภายนอกเข้าสู่องค์กรมักช่วยกระตุ้นนวัตกรรม และการตั้ง communities of practice เป็นวิธีที่พิสูจน์แล้วว่าช่วยปรับปรุง flow ได้

17. LLM as a judge

  • การใช้ LLM เป็นผู้ตัดสินเพื่อประเมินผลลัพธ์ของระบบอื่น ๆ (โดยทั่วไปคือ generator ที่อิง LLM) ได้รับความสนใจจากศักยภาพในการทำ evaluation ของ generative AI แบบอัตโนมัติและขยายขนาดได้
  • เพื่อสะท้อนความซับซ้อนและความเสี่ยงที่เพิ่งถูกรับรู้ blip นี้จึงถูกย้ายจาก Trial ไปเป็น Assess
  • การประเมินมีความเปราะบางต่อ position bias, verbosity bias และความทนทานต่ำ ขณะที่ปัญหาที่ร้ายแรงกว่าคือ scaling contamination
  • เพื่อรับมือกับข้อบกพร่องเหล่านี้ จึงมีการสำรวจเทคนิคที่ดีขึ้น เช่น LLMs as a jury (ใช้หลายโมเดลเพื่อหาฉันทามติ) หรือการใช้เหตุผลแบบ chain-of-thought ระหว่างการประเมิน

18. On-device information retrieval

  • เทคนิคที่ทำให้การค้นหา, การรับรู้บริบท และ retrieval-augmented generation (RAG) ทำงานได้ทั้งหมดบนอุปกรณ์ของผู้ใช้เอง (มือถือ เดสก์ท็อป หรืออุปกรณ์ edge)
  • ให้ความสำคัญกับความเป็นส่วนตัวและประสิทธิภาพเชิงคำนวณ โดยผสานฐานข้อมูลโลคัลแบบน้ำหนักเบาเข้ากับโมเดลที่ปรับให้เหมาะกับการอนุมานบนอุปกรณ์
  • การใช้งานที่มีอนาคตสดใสคือการรวม sqlite-vec (ส่วนขยายของ SQLite ที่รองรับการค้นหาเวกเตอร์ในฐานข้อมูลแบบฝังตัว) กับ EmbeddingGemma (โมเดล embedding ขนาด 300 ล้านพารามิเตอร์ที่อิงสถาปัตยกรรม Gemma 3)
  • แนะนำให้ประเมินสำหรับแอปพลิเคชันแบบ local-first รวมถึง use case อื่น ๆ ที่ให้ความสำคัญกับอธิปไตยของข้อมูล, latency ต่ำ และความเป็นส่วนตัว

19. SAIF

  • SAIF (Secure AI Framework) คือเฟรมเวิร์กที่ Google พัฒนาขึ้นเพื่อให้คำแนะนำเชิงปฏิบัติสำหรับการจัดการความเสี่ยงด้านความปลอดภัยของ AI
  • จัดการภัยคุกคามที่พบบ่อยอย่างเป็นระบบ เช่น data poisoning และ prompt injection ผ่านแผนที่ความเสี่ยงที่ชัดเจน การวิเคราะห์องค์ประกอบ และกลยุทธ์การบรรเทาที่ใช้งานได้จริง
  • การเน้นไปที่ความเสี่ยงที่เปลี่ยนแปลงอยู่ตลอดของการสร้างระบบ agentic มีความเหมาะสมกับช่วงเวลาและมีคุณค่าเป็นพิเศษ
  • มอบเพลย์บุ๊กที่กระชับและนำไปใช้ได้จริงสำหรับการเสริมความแข็งแกร่งให้แนวปฏิบัติด้านความปลอดภัยของการใช้ LLM และแอปพลิเคชันที่ขับเคลื่อนด้วย AI

20. Service mesh without sidecar

  • เนื่องจากต้นทุนและความซับซ้อนในการปฏิบัติการของ service mesh แบบ sidecar ยังคงมีอยู่ เราจึงรู้สึกตื่นเต้นกับตัวเลือก service mesh แบบไม่มี sidecar อย่าง Istio ambient mode
  • Ambient mode นำเสนอสถาปัตยกรรมแบบแบ่งชั้นที่แยกขอบเขตความรับผิดชอบออกเป็น 2 องค์ประกอบหลัก: L4 proxy ต่อโหนด (ztunnel) และ L7 proxy ต่อ namespace (Waypoint proxy)
  • ztunnel ช่วยให้มั่นใจว่าทราฟฟิก L3 และ L4 ถูกส่งต่ออย่างมีประสิทธิภาพและปลอดภัย จัดการทั้งการดึงใบรับรองสำหรับทุก identity ของโหนด และการเปลี่ยนเส้นทางทราฟฟิกไปยัง workload ที่รองรับ ambient
  • Waypoints proxy เป็นองค์ประกอบเสริมของ ambient mode ที่เปิดใช้ความสามารถของ Istio ที่สมบูรณ์ยิ่งขึ้น เช่น การจัดการทราฟฟิก ความปลอดภัย และการมองเห็นระบบ

21. Small language models

  • สังเกตเห็นพัฒนาการอย่างต่อเนื่องของ small language models (SLMs) ตลอดหลายเล่มของ Technology Radar
  • ความสนใจที่เพิ่มขึ้นต่อการสร้างโซลูชันเอเจนต์ ทำให้มีหลักฐานเพิ่มขึ้นว่า SLM สามารถขับเคลื่อน agentic AI ได้อย่างมีประสิทธิภาพ
  • เวิร์กโฟลว์เอเจนต์ส่วนใหญ่ในปัจจุบันมุ่งเน้นงานเฉพาะทางและทำซ้ำที่ไม่ต้องการการให้เหตุผลขั้นสูง จึงเหมาะกับ SLM
  • การพัฒนาอย่างต่อเนื่องของ SLM เช่น Phi-3, SmolLM2, DeepSeek ทำให้มีความสามารถเพียงพอสำหรับงานลักษณะนี้

22. Spec-driven development

  • แนวทางเกิดใหม่สำหรับเวิร์กโฟลว์การเขียนโค้ดที่มี AI ช่วยเหลือ โดยคำจำกัดความของคำนี้ยังคงอยู่ระหว่างการพัฒนา
  • โดยทั่วไปหมายถึงเวิร์กโฟลว์ที่เริ่มจากสเปกฟีเจอร์แบบมีโครงสร้าง จากนั้นค่อยแตกย่อยผ่านหลายขั้นตอนเป็นส่วนย่อย โซลูชัน และงานต่างๆ
  • Kiro ของ Amazon จะพาผู้ใช้ผ่านเวิร์กโฟลว์ 3 ขั้น ได้แก่ requirements, design และการสร้างงาน
  • spec-kit ของ GitHub ใช้กระบวนการ 3 ขั้นที่คล้ายกัน แต่เพิ่ม orchestration ที่สมบูรณ์ขึ้น, prompt ที่ปรับแต่งได้ และ "constitution" ที่กำหนดหลักการคงที่ซึ่งต้องปฏิบัติตามเสมอ

23. Team of coding agents

  • เทคนิคที่นักพัฒนาประสานงาน AI coding agent หลายตัว โดยแต่ละตัวมีบทบาทเฉพาะของตนเอง เช่น architect, back-end specialist และ tester
  • เครื่องมืออย่าง Claude Code, Roo Code, Kilo Code รองรับ subagent และหลายโหมดการทำงาน
  • อาศัยหลักการที่พิสูจน์แล้วว่าการกำหนดบทบาทและ persona เฉพาะให้ LLM ช่วยปรับปรุงคุณภาพผลลัพธ์ โดยได้ผลลัพธ์ที่ดีกว่าจากการประสานงานเอเจนต์หลายบทบาท แทนการพึ่งเอเจนต์อเนกประสงค์เพียงตัวเดียว
  • เป็นสัญญาณของการเปลี่ยนผ่านไปสู่ไปป์ไลน์การพัฒนาที่มี AI ช่วยเหลือแบบหลายขั้นและมีการ orchestration

24. Topology-aware scheduling

  • GPU และ LPU ไม่ได้เป็นอุปกรณ์เดี่ยวอีกต่อไป แต่เป็นเครือข่ายตัวเร่งความเร็วที่เชื่อมโยงกันแน่นแฟ้น ซึ่งประสิทธิภาพขึ้นอยู่กับการจัดวางและโทโพโลยี
  • ในระบบระดับแร็กอย่าง NVL72 ของ NVIDIA นั้น GPU 72 ตัวแชร์ VRAM มากกว่า 13TB และทำงานเสมือนเป็นตัวเร่งความเร็วตัวเดียว แต่เมื่อเวิร์กโหลดต้องข้าม switch island งานแบบ collective จะกลายเป็นคอขวด
  • สถาปัตยกรรมที่กำหนดตารางด้วยซอฟต์แวร์ ณ เวลา compile ของ Groq ตั้งอยู่บนสมมติฐานเรื่องการเคลื่อนย้ายข้อมูลแบบกำหนดแน่นอน และการจัดตารางแบบสุ่มจะทำลายสมมติฐานและความสามารถในการคาดการณ์นี้
  • ตัวจัดตารางแบบง่ายที่ไม่สนใจโทโพโลยีมักกระจายเวิร์กโหลดแบบมัลติ-GPU แบบตามอำเภอใจ ส่งผลให้เวลาในแต่ละสเต็ปและประสิทธิภาพลดลง

25. Toxic flow analysis for AI

  • มุกคุ้นหูที่ว่า S ใน MCP ย่อมาจาก "security" กำลังซ่อนปัญหาที่เกิดขึ้นจริงอย่างมาก
  • เมื่อเอเจนต์สื่อสารกันผ่านการเรียกใช้เครื่องมือหรือ API พวกมันอาจเจอกับสิ่งที่เรียกว่า lethal trifecta ได้อย่างรวดเร็ว: การเข้าถึงข้อมูลส่วนบุคคล, การเปิดรับเนื้อหาที่ไม่น่าเชื่อถือ และความสามารถในการสื่อสารออกสู่ภายนอก
  • เอเจนต์ที่มีทั้งสามอย่างนี้มีความเปราะบางมาก และเพราะ LLM มีแนวโน้มทำตามคำสั่งในอินพุต เนื้อหาจากแหล่งที่ไม่น่าเชื่อถือซึ่งมีคำสั่งให้รั่วไหลข้อมูลจึงอาจนำไปสู่การรั่วไหลของข้อมูลได้ง่าย
  • toxic flow analysis จะตรวจสอบกราฟการไหลของระบบเอเจนต์เพื่อระบุเส้นทางข้อมูลที่อาจไม่ปลอดภัยสำหรับการตรวจสอบเพิ่มเติม

Hold

26. AI-accelerated shadow IT

  • AI ลดอุปสรรคให้คนที่ไม่เขียนโค้ดสามารถสร้างและเชื่อมต่อซอฟต์แวร์ได้ด้วยตนเอง แทนที่จะต้องรอฝ่าย IT
  • แม้จะตื่นเต้นกับศักยภาพที่สิ่งนี้ปลดล็อก แต่ก็เฝ้าระวังสัญญาณแรกของ AI-accelerated shadow IT
  • แพลตฟอร์ม no-code สำหรับทำ workflow automation ตอนนี้รองรับการเชื่อมต่อ AI API แล้ว เช่น OpenAI หรือ Anthropic ทำให้เกิดแรงจูงใจในการใช้ AI เป็นเหมือน duct tape เพื่อเชื่อมการบูรณาการที่ก่อนหน้านี้เป็นไปไม่ได้
  • ขณะเดียวกัน AI coding assistant ก็มีความเป็นเอเจนต์มากขึ้น ทำให้คนที่ไม่เขียนโค้ดแต่ผ่านการฝึกพื้นฐานสามารถสร้างแอปพลิเคชันยูทิลิตีภายในได้

27. Capacity-driven development

  • หัวใจสำคัญของความสำเร็จในแนวปฏิบัติการพัฒนาซอฟต์แวร์สมัยใหม่คือการคงโฟกัสไว้ที่การไหลของงาน
  • ทีมแบบ Stream-aligned มุ่งเน้นไปที่สตรีมคุณค่าหนึ่งเดียว เช่น user journey หรือผลิตภัณฑ์ เพื่อส่งมอบคุณค่าแบบ end-to-end ได้อย่างมีประสิทธิภาพ
  • อย่างไรก็ตาม พบแนวโน้มที่น่ากังวลไปสู่ capacity-driven development ซึ่งทีมที่จัดแนวแบบนี้เมื่อมีความสามารถเหลือ จะไปรับงานฟีเจอร์ของผลิตภัณฑ์หรือสตรีมอื่น
  • ในระยะสั้นอาจดูมีประสิทธิภาพ แต่เป็นการเพิ่มประสิทธิภาพเฉพาะจุดที่เหมาะกับการรับมือความต้องการพุ่งสูง และหากกลายเป็นเรื่องปกติจะเพิ่มภาระทางความคิดและหนี้ทางเทคนิค

28. Complacency with AI-generated code

  • เมื่อ AI coding assistant และเอเจนต์ได้รับความสนใจมากขึ้น ก็มีข้อมูลและงานวิจัยเพิ่มขึ้นที่ตอกย้ำความกังวลเรื่อง complacency with AI-generated code
  • แม้จะมีหลักฐานมากพอว่าเครื่องมือเหล่านี้ช่วยเร่งการพัฒนาได้ แต่งานวิจัยแสดงให้เห็นว่าคุณภาพโค้ดอาจลดลงเมื่อเวลาผ่านไป
  • งานวิจัย 2024 research ของ GitClear พบว่าโค้ดซ้ำและ code churn เพิ่มขึ้นมากกว่าที่คาดไว้ ขณะที่กิจกรรม refactoring ในประวัติคอมมิตกลับลดลง
  • งาน research ของ Microsoft กับกลุ่ม knowledge worker แสดงให้เห็นว่าความมั่นใจที่ขับเคลื่อนด้วย AI มักเกิดขึ้นพร้อมกับการลดลงของการคิดเชิงวิพากษ์

29. Naive API-to-MCP conversion

  • องค์กรต่างๆ ต้องการแปลง API ภายในของตนเป็น Model Context Protocol (MCP) อย่างราบรื่นและตรงไปตรงมา เพื่อให้ AI agent โต้ตอบกับระบบที่มีอยู่ได้
  • มีเครื่องมือจำนวนเพิ่มขึ้นที่พยายามรองรับการแปลงนี้ เช่น MCP link และ FastAPI-MCP
  • มีจุดยืนคัดค้าน naive API-to-MCP conversion ลักษณะนี้ เพราะ API มักถูกออกแบบมาสำหรับนักพัฒนามนุษย์ และประกอบด้วยงานย่อยระดับอะตอมที่ละเอียดเกินไป ซึ่งเมื่อ AI นำไปเชื่อมต่อกันอาจทำให้ใช้โทเค็นมากเกินจำเป็น บริบทปนเปื้อน และประสิทธิภาพของเอเจนต์ลดลง
  • API เหล่านี้ โดยเฉพาะ API ภายใน มักเปิดเผยข้อมูลอ่อนไหวหรืออนุญาตให้ทำงานที่สร้างความเสียหายได้

30. Standalone data engineering teams

  • การจัดทีมวิศวกรรมข้อมูลแยกต่างหากที่พัฒนาและเป็นเจ้าของ data pipeline และผลิตภัณฑ์ โดยแยกจากโดเมนธุรกิจสตรีมที่ให้บริการ เป็น anti-pattern ที่นำไปสู่ความไม่มีประสิทธิภาพและผลลัพธ์ทางธุรกิจที่อ่อนแอ
  • โครงสร้างนี้ทำซ้ำความผิดพลาดในอดีตจากการแยกความสามารถด้าน DevOps การทดสอบ หรือการ deploy ออกจากกัน ก่อให้เกิด knowledge silo, คอขวด และการสูญเปล่าของความพยายาม
  • หากไม่มีการทำงานร่วมกันอย่างใกล้ชิด วิศวกรข้อมูลมักขาดบริบทธุรกิจและโดเมนที่จำเป็นต่อการออกแบบ data product ที่มีความหมาย ทำให้ทั้งการยอมรับใช้งานและคุณค่าถูกจำกัด
  • ทางเลือกที่ดีกว่าคือให้ทีม data platform มุ่งเน้นการดูแลโครงสร้างพื้นฐานที่ใช้ร่วมกัน และให้ทีมธุรกิจข้ามสายงานสร้างและเป็นเจ้าของ data products ของตนเองตามหลักการ data mesh

31. Text to SQL

  • Text to SQL ใช้ LLM แปลภาษาธรรมชาติเป็น SQL ที่รันได้ แต่ความน่าเชื่อถือมักยังไม่ถึงระดับที่คาดหวัง
  • จึงย้าย blip นี้ไปไว้ใน Hold เพื่อไม่แนะนำให้ใช้ใน workflow ที่ไม่มีการกำกับดูแล เช่น การซ่อนเอาต์พุตไว้ หรือการแปลงคิวรีที่ผู้ใช้สร้างขึ้นแบบอัตโนมัติอย่างไดนามิก
  • ในกรณีเหล่านี้ LLM มักเกิด hallucination เนื่องจากมีความเข้าใจ schema หรือโดเมนอย่างจำกัด ทำให้เสี่ยงต่อการดึงข้อมูลผิดพลาดหรือแก้ไขข้อมูลโดยไม่ตั้งใจ
  • สำหรับ agentic business intelligence ควรหลีกเลี่ยงการเข้าถึงฐานข้อมูลโดยตรง และใช้ semantic layer สำหรับ data abstraction ที่มีการจัดการแทน เช่น Cube หรือ dbt's semantic layer

[Platforms]

Adopt

32. Arm in the cloud

  • Arm compute instances บนคลาวด์ได้รับความนิยมมากขึ้นเรื่อย ๆ ในช่วงไม่กี่ปีที่ผ่านมา เพราะมีประสิทธิภาพด้านต้นทุนและพลังงานเมื่อเทียบกับอินสแตนซ์แบบ x86 ดั้งเดิม
  • ผู้ให้บริการคลาวด์รายใหญ่รวมถึง AWS, Azure และ GCP ต่างก็มีตัวเลือก Arm ที่แข็งแกร่งแล้วในตอนนี้
  • หลายทีมย้าย workload อย่าง microservices, ฐานข้อมูลโอเพนซอร์ส และแม้แต่ high-performance computing ไปยัง Arm ได้สำเร็จ โดยแทบไม่ต้องแก้โค้ดมากนักและปรับเพียง build script เล็กน้อย
  • เครื่องมือสมัยใหม่อย่าง multi-arch Docker images ช่วยให้การ build และ deploy บนทั้งสภาพแวดล้อม Arm และ x86 ง่ายขึ้น

Trial

33. Apache Paimon

  • Apache Paimon เป็นฟอร์แมต data lake แบบโอเพนซอร์สที่ออกแบบมาเพื่อรองรับ lakehouse architecture
  • ผสานการทำงานได้อย่างราบรื่นกับเอนจินประมวลผลอย่าง Flink และ Spark จึงรองรับทั้งงานสตรีมมิงและงานแบตช์
  • จุดเด่นสำคัญของสถาปัตยกรรม Paimon คือการผสานระหว่างฟอร์แมต data lake มาตรฐานกับโครงสร้าง LSM (log-structured merge tree)
  • การผสานนี้ช่วยแก้โจทย์ดั้งเดิมของ data lake เรื่องการอัปเดตประสิทธิภาพสูงและการอ่านที่มี latency ต่ำ

34. DataDog LLM Observability

  • Datadog LLM Observability ให้ความสามารถด้านการติดตาม มอนิเตอร์ และวินิจฉัยแบบ end-to-end สำหรับ workflow ของ large language model และแอปพลิเคชัน agent
  • ระบบจะจับคู่แต่ละ prompt, การเรียกใช้เครื่องมือ และขั้นตอนกลางเป็น span และ trace พร้อมติดตาม latency, ปริมาณ token, ข้อผิดพลาด และ metric ด้านคุณภาพ และผสานเข้ากับชุดผลิตภัณฑ์ APM และ observability ที่กว้างขวางของ Datadog
  • องค์กรที่ใช้ Datadog อยู่แล้วและคุ้นเคยกับโครงสร้างค่าใช้จ่ายของมัน อาจพบว่าความสามารถด้าน LLM observability เป็นวิธีที่ตรงไปตรงมาในการมองเห็น AI workload ตราบใดที่สามารถ instrument workload เหล่านั้นได้
  • การตั้งค่าและใช้งาน LLM instrumentation ต้องอาศัยความระมัดระวังและความเข้าใจที่ชัดเจนต่อ workload และการนำไปใช้งาน และแนะนำให้วิศวกรข้อมูลกับบุคลากรฝ่ายปฏิบัติการทำงานร่วมกันอย่างใกล้ชิดระหว่างการ deploy

35. Delta Sharing

  • Delta Sharing เป็นมาตรฐานเปิดและโปรโตคอลสำหรับการแชร์ข้อมูลข้ามแพลตฟอร์มอย่างปลอดภัย ที่พัฒนาโดย Databricks และ Linux Foundation
  • มีความเป็นอิสระจากคลาวด์ และเปิดให้องค์กรแชร์ข้อมูลแบบ live ข้ามผู้ให้บริการคลาวด์และตำแหน่ง on-premises ได้โดยไม่ต้องคัดลอกหรือทำสำเนาข้อมูล
  • ใช้ REST API แบบเรียบง่ายเพื่อออก URL ที่มีการ presign แบบระยะสั้น ทำให้ผู้รับสามารถดึงชุดข้อมูลขนาดใหญ่ด้วยเครื่องมืออย่าง pandas, Spark หรือ Power BI
  • รองรับการแชร์ตารางข้อมูล, view, โมเดล AI และโน้ตบุ๊ก พร้อมมอบความสามารถด้าน governance และ audit แบบรวมศูนย์ที่แข็งแกร่ง

36. Dovetail

  • Dovetail platform เข้ามาแก้ปัญหาท้าทายที่ดำเนินมาอย่างต่อเนื่องในการจัดการข้อมูลวิจัยเชิงคุณภาพที่กระจัดกระจาย
  • ให้คลังข้อมูลส่วนกลางสำหรับบทสัมภาษณ์ผู้ใช้ บันทึกถอดความ และ insight ช่วยเปลี่ยนข้อมูลดิบให้เป็นทรัพย์สินที่มีโครงสร้างและวิเคราะห์ได้
  • มีประโยชน์อย่างยิ่งใน workflow ด้าน product discovery โดยเฉพาะการสร้าง evidence trail ที่เชื่อมคำพูดของลูกค้าและธีมที่สังเคราะห์แล้วเข้ากับสมมติฐานของผลิตภัณฑ์และ ROI ที่คาดไว้โดยตรง
  • ด้วยวิธีนี้ Dovetail จึงช่วยเสริมบทบาทของข้อมูลเชิงคุณภาพในการตัดสินใจด้านผลิตภัณฑ์

37. Langdock

  • Langdock เป็นแพลตฟอร์มสำหรับให้องค์กรพัฒนาและรันเอเจนต์ generative AI และ workflow สำหรับการดำเนินงานภายใน
  • ให้สภาพแวดล้อมแบบรวมศูนย์ที่มีทั้งผู้ช่วยแชตภายใน, API layer สำหรับเชื่อมต่อกับ LLM หลายตัว และเครื่องมือสร้าง agent workflow ที่เชื่อมกับระบบอย่าง Slack, Confluence และ Google Drive
  • แพลตฟอร์มนี้มีตัวเลือกทั้ง on-premises และการโฮสต์ใน EU พร้อมมาตรฐานด้าน compliance ระดับองค์กร จึงเน้นเรื่อง data sovereignty
  • องค์กรที่นำ Langdock ไปใช้งานยังคงต้องใส่ใจกับ data governance อย่างมาก และใช้เทคนิคอย่าง toxic flow analysis เพื่อป้องกัน lethal trifecta

38. LangSmith

  • LangSmith เป็นแพลตฟอร์มแบบโฮสต์จากทีม LangChain ที่ให้ความสามารถด้าน observability, tracing และ evaluation สำหรับแอปพลิเคชัน LLM
  • มันบันทึก trace อย่างละเอียดของ chain, tool และ prompt ทำให้ทีมสามารถดีบักและวัดพฤติกรรมของโมเดล ติดตาม performance regression และจัดการชุดข้อมูลสำหรับการประเมินได้
  • LangSmith เป็นแพลตฟอร์ม SaaS แบบ proprietary ที่รองรับ workflow ที่ไม่ใช่ LangChain ได้อย่างจำกัด จึงน่าสนใจที่สุดสำหรับทีมที่ลงทุนกับ ecosystem นี้อยู่แล้ว
  • การรองรับแบบบูรณาการสำหรับการประเมิน prompt และการทดลองต่าง ๆ นั้นดูสมบูรณ์ยิ่งกว่าเมื่อเทียบกับทางเลือกโอเพนซอร์สอย่าง Langfuse

39. Model Context Protocol (MCP)

  • Model Context Protocol (MCP) คือมาตรฐานเปิดที่กำหนดวิธีที่แอปพลิเคชันและเอเจนต์ LLM จะผสานรวมกับแหล่งข้อมูลและเครื่องมือภายนอก
  • MCP แตกต่างจากโปรโตคอล Agent2Agent (A2A) ที่ใช้จัดการการสื่อสารระหว่างเอเจนต์ โดย MCP มุ่งเน้นที่บริบทและการเข้าถึงเครื่องมือ
  • หลังจาก blip ครั้งก่อน การนำ MCP ไปใช้เพิ่มขึ้นอย่างมาก โดยบริษัทใหญ่ ๆ เช่น JetBrains (IntelliJ) และ Apple ได้เข้าร่วมระบบนิเวศนี้ พร้อมกับเฟรมเวิร์กเกิดใหม่อย่าง FastMCP
  • มาตรฐาน MCP Registry ที่อยู่ในสถานะพรีวิว ตอนนี้รองรับการค้นหาเครื่องมือทั้งแบบสาธารณะและแบบปิดแล้ว

40. n8n

  • n8n เป็นแพลตฟอร์มอัตโนมัติเวิร์กโฟลว์ภายใต้ไลเซนส์ fair-code คล้ายกับ Zapier หรือ Make (เดิมชื่อ Integromat) แต่สร้างมาสำหรับนักพัฒนาที่ต้องการตัวเลือกแบบ self-hosted, ขยายต่อได้ และควบคุมด้วยโค้ดได้
  • มีแนวทางแบบ low-code และภาพกราฟิกสำหรับการสร้างเวิร์กโฟลว์มากกว่า Apache Airflow ขณะเดียวกันก็รองรับโค้ดคัสตอมด้วย JavaScript หรือ Python
  • กรณีใช้งานหลักคือการรวมหลายบริการเข้าด้วยกันเป็นเวิร์กโฟลว์อัตโนมัติ แต่ก็สามารถเชื่อม LLM เข้ากับแหล่งข้อมูล หน่วยความจำ และเครื่องมือที่กำหนดค่าได้เช่นกัน
  • หลายทีมใช้ n8n เพื่อทำต้นแบบเวิร์กโฟลว์เอเจนต์อย่างรวดเร็วผ่านแอปแชตหรือเว็บฮุกที่เป็นตัวกระตุ้น และมักใช้ความสามารถ import และ export เพื่อสร้างเวิร์กโฟลว์ด้วยการช่วยเหลือจาก AI

41. OpenThread

  • OpenThread คืออิมพลีเมนเทชันโอเพนซอร์สของโปรโตคอลเครือข่าย Thread ที่พัฒนาโดย Google
  • รองรับความสามารถหลักทั้งหมดของข้อกำหนด Thread รวมถึงเลเยอร์เครือข่ายอย่าง IPv6, 6LoWPAN และ LR-WPAN รวมถึงความสามารถด้าน mesh network ที่ทำให้อุปกรณ์ทำงานเป็นทั้งโหนดและ border router ได้
  • OpenThread ทำงานได้บนฮาร์ดแวร์หลากหลายแพลตฟอร์ม โดยใช้ abstraction layer ที่ยืดหยุ่นและ integration hook ที่ช่วยให้ผู้ผลิตรวมวิทยุและความสามารถด้านการเข้ารหัสของตนเองเข้าไปได้
  • โปรโตคอลที่เติบโตเต็มที่นี้ถูกใช้แพร่หลายในผลิตภัณฑ์เชิงพาณิชย์ และจากประสบการณ์พบว่าเชื่อถือได้สำหรับการสร้างโซลูชัน IoT ที่หลากหลาย ตั้งแต่อุปกรณ์พลังงานต่ำที่ใช้แบตเตอรี่ไปจนถึงเครือข่ายเซ็นเซอร์ mesh ขนาดใหญ่

Assess

42. AG-UI Protocol

  • AG-UI คือโปรโตคอลและไลบรารีแบบเปิดที่ออกแบบมาเพื่อทำให้ user interface แบบสมบูรณ์และการสื่อสารระหว่างเอเจนต์เป็นมาตรฐานเดียวกัน
  • มุ่งเน้นไปที่เอเจนต์ที่ติดต่อกับผู้ใช้โดยตรง และทำให้ใช้งานได้ทั่วไปกับทุก frontend และ backend ผ่านการผสานรวมฝั่ง middleware และ client
  • โปรโตคอลนี้กำหนดวิธีที่สอดคล้องกันให้เอเจนต์ฝั่ง backend สื่อสารกับแอปพลิเคชันฝั่ง frontend ทำให้เกิดการทำงานร่วมกันแบบเรียลไทม์ที่มีการเก็บสถานะระหว่าง AI กับผู้ใช้มนุษย์ได้
  • รองรับโปรโตคอลขนส่งหลายแบบ รวมถึง SSE และ WebSockets และมีประเภทอีเวนต์ที่เป็นมาตรฐานเพื่อแสดงสถานะต่าง ๆ ของการทำงานของเอเจนต์

43. Agent-to-Agent (A2A) Protocol

  • Agent2Agent (A2A) คือโปรโตคอลที่กำหนดมาตรฐานสำหรับการสื่อสารและปฏิสัมพันธ์ระหว่างเอเจนต์ในเวิร์กโฟลว์แบบหลายเอเจนต์ที่ซับซ้อน
  • ใช้ Agent Cards เพื่ออธิบายองค์ประกอบหลักของการสื่อสารระหว่างเอเจนต์ รวมถึงข้อกำหนดด้านการค้นพบความสามารถ การถ่ายโอน และโครงร่างความปลอดภัย
  • A2A ช่วยเสริม Model Context Protocol (MCP) โดยมุ่งเน้นที่การสื่อสารระหว่างเอเจนต์โดยไม่เปิดเผยรายละเอียดภายใน เช่น สถานะ หน่วยความจำ หรือ internals ของเอเจนต์
  • โปรโตคอลนี้ส่งเสริมแนวปฏิบัติที่ดี เช่น แนวทางแบบ asynchronous-first สำหรับงานที่ใช้เวลานาน การตอบสนองแบบสตรีมสำหรับอัปเดตแบบค่อยเป็นค่อยไป และการรับส่งข้อมูลอย่างปลอดภัยด้วย HTTPS, authentication และ authorization

44. Amazon S3 Vectors

  • Amazon S3 Vectors ขยาย S3 object storage ด้วยความสามารถด้านเวกเตอร์แบบเนทีฟ พร้อมฟังก์ชัน vector storage และ similarity search ในตัว
  • ผสานรวมกับระบบนิเวศ AWS ได้อย่างราบรื่น รวมถึง Amazon Bedrock และ OpenSearch และมีความสามารถเพิ่มเติมอย่างการกรองเมทาดาทาและการกำกับดูแลผ่าน IAM
  • แม้ยังอยู่ในสถานะพรีวิวและมีข้อจำกัดอยู่ แต่คุณค่าที่นำเสนอนั้นน่าสนใจ — แนวทางด้าน vector storage ที่คุ้มค่าและเข้าถึงได้ง่ายนี้สามารถใช้กับแอปพลิเคชันหลากหลายประเภทที่มีข้อมูลปริมาณมากและไม่ได้กังวลเรื่อง latency ต่ำเป็นหลัก

45. Ardoq

  • Ardoq คือแพลตฟอร์ม enterprise architecture (EA) ที่ช่วยให้องค์กรสร้าง จัดการ และขยายฐานความรู้ด้านสถาปัตยกรรมเพื่อวางแผนอนาคตได้อย่างมีประสิทธิภาพยิ่งขึ้น
  • ต่างจากเอกสารแบบคงที่ดั้งเดิมที่มักเกิด drift และแยกเป็นไซโล แนวทางที่ขับเคลื่อนด้วยข้อมูลของ Ardoq จะดึงข้อมูลจากระบบที่มีอยู่เพื่อสร้าง knowledge graph แบบไดนามิกที่คงความทันสมัยตามการเปลี่ยนแปลงของ landscape
  • ความสามารถที่มีประโยชน์อย่างยิ่งคือ Ardoq Scenarios ซึ่งใช้แนวทาง branching และ merging คล้าย Git เพื่อสร้างแบบจำลองและกำหนดสถานะอนาคตแบบ what-if ได้ในเชิงภาพ
  • องค์กรที่กำลังผลักดันการเปลี่ยนผ่านด้านสถาปัตยกรรมควรประเมินแพลตฟอร์ม EA เฉพาะทางอย่าง Ardoq เพื่อดูศักยภาพในการทำให้กระบวนการนี้ง่ายและเร็วขึ้น

46. CloudNativePG

  • CloudNativePG คือ Kubernetes Operator ที่ช่วยทำให้การโฮสต์และจัดการคลัสเตอร์ PostgreSQL แบบ high availability บน Kubernetes ง่ายขึ้น
  • การรันบริการแบบ stateful อย่าง PostgreSQL บน Kubernetes อาจซับซ้อน เพราะต้องมีความรู้เชิงลึกทั้งเรื่อง Kubernetes และการทำ replication ของ PostgreSQL
  • CloudNativePG ซ่อนความซับซ้อนส่วนใหญ่ไว้ด้วยการปฏิบัติต่อคลัสเตอร์ PostgreSQL ทั้งหมดเป็นรีซอร์ซเชิงประกาศเดียวที่กำหนดค่าได้
  • มีสถาปัตยกรรม primary/standby ที่ราบรื่นด้วย native streaming replication และมาพร้อมความสามารถด้าน high availability ตั้งแต่ต้น เช่น self-healing, automatic failover ที่โปรโมต replica ที่ตามทันที่สุด และการสร้าง replica ที่ล้มเหลวขึ้นมาใหม่โดยอัตโนมัติ

47. Coder

  • Coder คือแพลตฟอร์มที่ช่วย provision สภาพแวดล้อมการเขียนโค้ดแบบมาตรฐานได้อย่างรวดเร็ว ตามแนวปฏิบัติ development environments in the cloud ที่กล่าวถึงก่อนหน้านี้
  • เมื่อเทียบกับเครื่องมือที่คล้ายกันอย่าง Gitpod (ปัจจุบันรีแบรนด์เป็น Ona) และ GitHub Codespaces, Coder ให้การควบคุมการปรับแต่ง workstation ได้มากกว่าผ่าน Terraform
  • โฮสต์ workstation บนโครงสร้างพื้นฐานของคุณเองในคลาวด์หรือดาต้าเซ็นเตอร์ แทนที่จะใช้เซิร์ฟเวอร์ของผู้ขาย
  • แนวทางนี้ให้ความยืดหยุ่นมากขึ้น รวมถึงความสามารถในการรันเอเจนต์เขียนโค้ด AI และเข้าถึงระบบภายในขององค์กร

48. Graft

  • Graft คือเอนจินทรานแซกชันสตอเรจที่ทำให้การซิงก์ข้อมูลที่มีความสอดคล้องกันสูงและมีประสิทธิภาพเป็นไปได้ในสภาพแวดล้อมแบบ edge และแบบกระจาย
  • ใช้ lazy replication เพื่อซิงก์ข้อมูลเฉพาะเมื่อจำเป็น, ใช้ partial replication เพื่อลดการใช้แบนด์วิดท์ และใช้ serializable snapshot isolation เพื่อรับประกันความถูกต้องของข้อมูล
  • แม้ Radar จะเคยกล่าวถึง Electric สำหรับกรณีใช้งานที่คล้ายกัน แต่ Graft มีความโดดเด่นตรงที่เปลี่ยน object storage ให้เป็นระบบทรานแซกชันที่รองรับการอัปเดตระดับเพจอย่างสอดคล้อง โดยไม่บังคับรูปแบบข้อมูล
  • เหมาะสำหรับขับเคลื่อนแอปพลิเคชันมือถือแบบ local-first, จัดการการซิงก์ข้ามแพลตฟอร์มที่ซับซ้อน และทำหน้าที่เป็นแกนหลักของ replica แบบ stateless ในระบบ serverless หรือ embedded

49. groundcover

  • groundcover คือแพลตฟอร์ม observability แบบ cloud-native ที่รวม logs, traces, metrics และเหตุการณ์ของ Kubernetes ไว้ในหน้าต่างเดียว
  • ใช้ eBPF เพื่อเก็บข้อมูล observability แบบละเอียดด้วย zero-code instrumentation โดยไม่ต้องแทรกเอเจนต์หรือ SDK ลงในโค้ดแอปพลิเคชัน
  • eBPF sensor ของ groundcover ทำงานบนโหนดเฉพาะของแต่ละคลัสเตอร์ที่ถูกมอนิเตอร์ และทำงานแยกจากแอปพลิเคชันที่มันเฝ้าสังเกต
  • ความสามารถหลักประกอบด้วย observability ระดับเคอร์เนลเชิงลึก, bring-your-own-cloud (BYOC) architecture เพื่อความเป็นส่วนตัวของข้อมูล และโมเดลราคาที่ไม่ขึ้นกับปริมาณข้อมูลเพื่อให้คาดการณ์ค่าใช้จ่ายได้

50. Karmada

  • Karmada ("Kubernetes Armada") คือแพลตฟอร์มสำหรับ orchestration เวิร์กโหลดข้ามหลาย Kubernetes คลัสเตอร์, คลาวด์ และดาต้าเซ็นเตอร์
  • ปัจจุบันหลายทีมยังคงผสานเครื่องมือ GitOps อย่าง Flux หรือ ArgoCD เข้ากับสคริปต์แบบคัสตอมเพื่อดีพลอยทั่วทั้งคลัสเตอร์ ดังนั้นโซลูชันที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะจึงเป็นที่ต้อนรับ
  • Karmada ใช้ Kubernetes-native API จึงไม่จำเป็นต้องแก้ไขแอปพลิเคชันที่สร้างไว้แล้วสำหรับสภาพแวดล้อม cloud-native
  • มีความสามารถด้าน scheduling ขั้นสูงสำหรับการจัดการแบบ multi-cloud, high availability, disaster recovery และ traffic scheduling

51. OpenFeature

  • เมื่อธุรกิจขยายตัว การจัดการ feature flag มักซับซ้อนขึ้นเรื่อยๆ และทีมต่างๆ ต้องการ abstraction layer ที่ไปไกลกว่า feature toggle แบบพื้นฐานที่สุด
  • OpenFeature มอบเลเยอร์นี้ผ่านข้อกำหนด API ที่เป็นกลางต่อผู้ให้บริการและขับเคลื่อนโดยชุมชน เพื่อสร้างมาตรฐานให้กับวิธีที่ feature flag ถูกนิยามและถูกใช้งาน
  • CLI รองรับการนิยามสคีมาหลากหลายอย่างกว้างขวาง ตั้งแต่การตั้งค่าพื้นฐานด้วย environment variable หรือ in-memory configuration ไปจนถึงแพลตฟอร์มที่成熟แล้วอย่าง ConfigCat หรือ LaunchDarkly
  • อย่างไรก็ตาม ยังมีข้อควรระวังสำคัญอยู่ข้อหนึ่ง: ทีมควรแยกจัดการ categories of flags แต่ละประเภทอย่างมีวินัย เพื่อหลีกเลี่ยงการเพิ่มจำนวน flag เกินควบคุม, ความซับซ้อนของแอปพลิเคชัน และภาระการทดสอบที่มากเกินไป

52. Oxide

  • การสร้างและปฏิบัติการโครงสร้างพื้นฐานแบบ private มีความซับซ้อน และนี่คือหนึ่งในเหตุผลหลักที่ public cloud กลายเป็นตัวเลือกเริ่มต้นสำหรับองค์กรส่วนใหญ่
  • แต่สำหรับผู้ที่จำเป็นต้องใช้ Oxide มอบทางเลือกที่ประกอบและบูรณาการทั้งฮาร์ดแวร์และซอฟต์แวร์ขึ้นมาใหม่ตั้งแต่ต้น
  • ให้บริการแร็กที่ประกอบสำเร็จล่วงหน้าซึ่งมีทั้งคอมพิวต์ เครือข่าย และสตอเรจ พร้อมรัน system software ที่บูรณาการอย่างสมบูรณ์
  • ทีมสามารถจัดการทรัพยากรผ่าน IaaS API ของ Oxide โดยใช้ Terraform และเครื่องมืออัตโนมัติอื่นๆ ซึ่งเป็นสิ่งที่ Oxide เรียกว่าโครงสร้างพื้นฐานแบบยืดหยุ่น on-premises

53. Restate

  • Restate คือแพลตฟอร์มสำหรับ persistent execution ที่ออกแบบมาเพื่อแก้โจทย์ระบบกระจายที่ซับซ้อนเมื่อสร้างแอปพลิเคชันแบบ stateful และ fault-tolerant
  • ผ่าน execution journaling แพลตฟอร์มจะบันทึกทุกขั้นตอนเพื่อรับประกัน fault tolerance, การกู้คืนที่เชื่อถือได้ และการสื่อสารระหว่างบริการแบบ exactly-once
  • ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของแพลตฟอร์มคือการแยก application logic ออกเป็นบริการแบบ persistent สามประเภท: Basic Services สำหรับฟังก์ชันแบบ stateless, Virtual Objects สำหรับจำลองเอนทิตีแบบ concurrent ที่มีสถานะ, และ Workflows สำหรับ orchestration กระบวนการหลายขั้นตอนที่ซับซ้อน
  • กำลังประเมิน Restate อย่างรอบคอบในระบบประกันภัยขนาดใหญ่ และจนถึงตอนนี้พึงพอใจกับประสิทธิภาพอย่างมาก

54. SkyPilot

  • SkyPilot คือแพลตฟอร์มโอเพนซอร์สสำหรับรันและสเกลเวิร์กโหลด AI ทั้ง on-premises หรือบนคลาวด์
  • SkyPilot ซึ่งพัฒนาโดย Sky Computing Lab แห่ง UC Berkeley ทำหน้าที่เป็น intelligent broker ที่ค้นหาและ provision GPU ที่ถูกที่สุดและพร้อมใช้งานโดยอัตโนมัติบนคลาวด์รายใหญ่และ Kubernetes คลัสเตอร์ ซึ่งมักช่วยลดต้นทุนคอมพิวต์ได้
  • สำหรับทีมโครงสร้างพื้นฐาน มันช่วยทำให้การรัน AI บน Kubernetes ง่ายขึ้นด้วยความสะดวกในการใช้งานแบบ Slurm, ความแข็งแกร่งแบบ cloud-native, การเข้าถึง pod โดยตรงผ่าน SSH และความสามารถอย่าง gang scheduling และการรองรับ multi-cluster
  • รองรับการสเกลเวิร์กโหลดฝึกสอนหรืออนุมานได้อย่างราบรื่น

55. StarRocks

  • StarRocks คือฐานข้อมูลเชิงวิเคราะห์ที่นิยามใหม่ของ business intelligence แบบเรียลไทม์ โดยผสานความเร็วของระบบ OLAP แบบดั้งเดิมเข้ากับความยืดหยุ่นของ data lakehouse สมัยใหม่
  • บรรลุ query latency ต่ำกว่า 1 วินาทีในระดับขนาดใหญ่ด้วย SIMD-optimized execution engine, column store และ cost-based optimizer ที่ซับซ้อน
  • สถาปัตยกรรมประสิทธิภาพสูงนี้ทำให้ผู้ใช้สามารถรันวิเคราะห์ที่ซับซ้อนกับรูปแบบข้อมูลแบบเปิดอย่าง Apache Iceberg ได้โดยตรง โดยไม่ต้องคำนวณล่วงหน้าหรือคัดลอกข้อมูล
  • แม้จะมีหลายแพลตฟอร์มในพื้นที่นี้ แต่ StarRocks ถูกมองว่าเป็นตัวเลือกที่แข็งแกร่งสำหรับโซลูชันที่คุ้มค่า ซึ่งต้องรองรับทั้ง concurrency ระดับสูงมากและความสดใหม่ของข้อมูลล่าสุดอย่างสม่ำเสมอ

56. Uncloud

  • Uncloud คือเครื่องมือ orchestration และ clustering สำหรับคอนเทนเนอร์แบบน้ำหนักเบา ที่ช่วยให้นักพัฒนานำแอปพลิเคชัน Docker Compose ขึ้นสู่ production ได้
  • มอบประสบการณ์ที่เรียบง่ายและให้ความรู้สึกเหมือนคลาวด์โดยไม่มี operational overhead แบบ Kubernetes
  • สามารถสเกลข้ามหลายเครื่องและดีพลอยแบบไม่มี downtime ได้ ด้วยการตั้งค่า mesh network ที่ปลอดภัยด้วย WireGuard สำหรับการสื่อสารโดยอัตโนมัติ และใช้ reverse proxy ของ Caddy เพื่อให้มี HTTPS อัตโนมัติและ load balancing
  • ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของ Uncloud คือการออกแบบแบบกระจายศูนย์อย่างสมบูรณ์ ซึ่งตัดความจำเป็นของ central control plane ออกไป และรับประกันว่าการทำงานของคลัสเตอร์จะยังคงใช้งานได้แม้เครื่องบางเครื่องจะออฟไลน์

[Tools]

Adopt

57. ClickHouse

  • ClickHouse คือฐานข้อมูล OLAP แบบ distributed และโอเพนซอร์สสำหรับการวิเคราะห์แบบเรียลไทม์
  • เติบโตเป็นเอนจินที่มีประสิทธิภาพสูงมากและสเกลได้ดีสำหรับรองรับการวิเคราะห์ข้อมูลขนาดใหญ่
  • ด้วย incremental materialized views, query engine ที่มีประสิทธิภาพ และการบีบอัดข้อมูลที่แข็งแกร่ง ทำให้เหมาะอย่างยิ่งกับ interactive queries
  • การรองรับ approximate aggregate functions ในตัวช่วยให้สามารถเลือกระหว่างความแม่นยำกับประสิทธิภาพได้ ซึ่งมีประโยชน์อย่างยิ่งสำหรับการวิเคราะห์ข้อมูลที่มี cardinality สูง

58. NeMo Guardrails

  • NeMo Guardrails คือชุดเครื่องมือโอเพนซอร์สจาก NVIDIA ที่ช่วยเพิ่มกลไกความปลอดภัยและการควบคุมแบบโปรแกรมได้ให้กับแอปพลิเคชันสนทนาที่ขับเคลื่อนด้วย LLM ได้อย่างง่ายดาย
  • ช่วยกำหนดและบังคับใช้กฎพฤติกรรมเพื่อให้มั่นใจว่าเอาต์พุตมีความปลอดภัย ตรงประเด็น และเป็นไปตามข้อกำหนด
  • นักพัฒนาใช้ Colang ซึ่งเป็นภาษาที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะ เพื่อสร้าง conversation flow ที่ยืดหยุ่น จัดการบทสนทนา และบังคับใช้เส้นทางกับขั้นตอนการปฏิบัติงานที่กำหนดไว้ล่วงหน้า
  • NeMo Guardrails มี asynchronous-first API เพื่อประสิทธิภาพ และรองรับ guardrails สำหรับความปลอดภัยของเนื้อหา ความมั่นคงปลอดภัย ตลอดจนการปรับแต่งอินพุตและเอาต์พุต

59. pnpm

  • นับตั้งแต่ Radar ครั้งก่อน เรายังคงได้รับคำติชมเชิงบวกเกี่ยวกับ pnpm จากทีมอย่างต่อเนื่อง
  • pnpm เป็นตัวจัดการแพ็กเกจสำหรับ Node.js ที่ให้ประสิทธิภาพดีขึ้นอย่างมากเมื่อเทียบกับทางเลือกอื่น ทั้งในด้านความเร็วและประสิทธิภาพการใช้พื้นที่ดิสก์
  • รองรับการเพิ่มประสิทธิภาพระดับไฟล์แบบ incremental โดยทำ hard link ให้แพ็กเกจที่ซ้ำกันจากโฟลเดอร์ node_modules ของหลายโปรเจ็กต์ไปยังตำแหน่งเดียวบนดิสก์ ซึ่งช่วยเพิ่มประสิทธิภาพได้อีก
  • pnpm กลายเป็นตัวเลือกเริ่มต้นสำหรับการจัดการแพ็กเกจของ Node.js เพราะให้วงจร feedback ที่เร็วขึ้นมากโดยมีปัญหาความเข้ากันได้เพียงเล็กน้อย

60. Pydantic

  • Pydantic เป็นไลบรารี Python สำหรับกำหนดโมเดลข้อมูลด้วย type hint มาตรฐาน และบังคับใช้ schema ของข้อมูลในขณะรันไทม์
  • เดิมที type annotation ถูกเพิ่มเข้ามาใน Python เพื่อการวิเคราะห์แบบสถิต แต่ความหลากหลายที่เพิ่มขึ้นทำให้ถูกนำไปใช้อย่างกว้างขวางขึ้น รวมถึงการตรวจสอบความถูกต้องในขณะรันไทม์
  • สร้างขึ้นบน Rust core ที่รวดเร็ว จึงให้ความสามารถในการตรวจสอบข้อมูล การแยกวิเคราะห์ และการทำ serialization ได้อย่างมีประสิทธิภาพ
  • กลายเป็นสิ่งจำเป็นในแอปพลิเคชัน LLM และโดยทั่วไปใช้เทคนิค structured output from LLMs เพื่อจัดการกับธรรมชาติที่คาดเดาไม่ได้ของ LLM

Trial

61. AI Design Reviewer

  • AI Design Reviewer เป็นปลั๊กอิน Figma สำหรับทำ design audit หรือ heuristic evaluation และรวบรวม feedback ที่นำไปปฏิบัติได้กับดีไซน์เดิมหรือดีไซน์ใหม่
  • การตรวจประเมินครอบคลุมทั้ง UX critique, ความไม่สอดคล้องของ UI, ช่องว่างด้านการเข้าถึง, คุณภาพของเนื้อหา และสถานการณ์ edge case
  • นอกจากการระบุปัญหาแล้ว ยังให้คำแนะนำที่รับรู้บริบทของโดเมนซึ่งช่วยให้ทีมสร้างภาษาการออกแบบร่วมกันและเหตุผลเบื้องหลังการเลือกดีไซน์
  • ทีมใช้ AI Design Reviewer เพื่อวิเคราะห์ดีไซน์แบบ legacy โดยระบุทั้งประสบการณ์เชิงบวกที่ควรรักษาไว้และประสบการณ์เชิงลบที่ควรแก้ไข เพื่อใช้ประกอบการกำหนดเป้าหมาย UX สำหรับการออกแบบใหม่

62. Barman

  • Barman (Backup and Recovery Manager) เป็นเครื่องมือโอเพนซอร์สสำหรับจัดการการสำรองข้อมูลและการกู้คืนจากภัยพิบัติของเซิร์ฟเวอร์ PostgreSQL
  • ช่วยทำให้การสร้าง physical backup ง่ายขึ้นผ่านวิธีการที่หลากหลาย จัดระเบียบด้วยแค็ตตาล็อกที่ครอบคลุม และรองรับกระบวนการกู้คืนจากภัยพิบัติทั้งหมดด้วยการกู้คืนข้อมูลตามจุดเวลาไปยังเซิร์ฟเวอร์ที่กำลังทำงานอยู่
  • พบว่า Barman ทั้งทรงพลังและใช้งานง่าย และประทับใจอย่างมากกับความเร็วของการกู้คืนตามจุดเวลาระหว่างกิจกรรมการย้ายระบบ
  • ยังทำงานกับการสำรองข้อมูลตามกำหนดเวลาได้ดี และมีความสามารถในการจัดการการตั้งค่าด้านการจัดตารางและการเก็บรักษาที่ซับซ้อนและผสมผสานกัน

63. Claude Code

  • Claude Code ของ Anthropic เป็นเครื่องมือ AI coding แบบ agentic ที่มีอินเทอร์เฟซภาษาธรรมชาติและโมเดลการทำงานแบบเอเจนต์สำหรับวางแผนและลงมือทำเวิร์กโฟลว์หลายขั้นตอนที่ซับซ้อน
  • แม้จะเปิดตัวมาไม่ถึงหนึ่งปี แต่ก็ถูกนำไปใช้กันอย่างแพร่หลายแล้วในหมู่นักพัฒนาทั้งภายในและภายนอก Thoughtworks จึงถูกจัดไว้ใน Trial
  • มีการเปิดตัว coding agent แบบคอนโซลอย่าง Codex CLI ของ OpenAI, Gemini CLI ของ Google และ OpenCode แบบโอเพนซอร์ส ขณะที่ผู้ช่วยแบบอยู่บน IDE อย่าง Cursor, Windsurf และ GitHub Copilot ตอนนี้ก็มี agent mode แล้ว
  • เราเห็นทีมต่าง ๆ ใช้มันไม่เพียงเพื่อเขียนและแก้ไขโค้ด แต่ยังใช้เป็น AI agent อเนกประสงค์สำหรับจัดการสเปก สตอรี การตั้งค่า โครงสร้างพื้นฐาน และเอกสารด้วย

64. Cleanlab

  • ในแนวคิด data-centric AI การปรับปรุงคุณภาพของชุดข้อมูลมักให้ผลด้านประสิทธิภาพมากกว่าการจูนโมเดลเอง
  • Cleanlab เป็นไลบรารี Python แบบโอเพนซอร์สที่ออกแบบมาเพื่อแก้ปัญหานี้ โดยระบุปัญหาข้อมูลทั่วไป เช่น การติดป้ายกำกับผิด outlier และข้อมูลซ้ำ ในชุดข้อมูลข้อความ รูปภาพ ตาราง และเสียง ได้โดยอัตโนมัติ
  • Cleanlab สร้างขึ้นบนหลักการของ confident learning โดยใช้ความน่าจะเป็นของการคาดการณ์จากโมเดลเพื่อประเมิน label noise และวัดคุณภาพข้อมูลเชิงปริมาณ
  • แนวทางที่ไม่ขึ้นกับโมเดลนี้ช่วยให้นักพัฒนาวินิจฉัยและแก้ไขข้อผิดพลาดของชุดข้อมูล จากนั้นฝึกโมเดลใหม่เพื่อเพิ่มความทนทานและความแม่นยำ

65. Context7

  • Context7 เป็นเซิร์ฟเวอร์ MCP ที่แก้ปัญหาความไม่ถูกต้องของโค้ดที่สร้างโดย AI
  • ในขณะที่ LLM พึ่งพาข้อมูลฝึกที่ล้าสมัย Context7 ช่วยให้แน่ใจว่าสามารถสร้างโค้ดที่ถูกต้อง ทันสมัย และตรงกับเวอร์ชันของไลบรารีและเฟรมเวิร์กที่ใช้ในโปรเจ็กต์
  • มันดึงเอกสารล่าสุดและตัวอย่างโค้ดที่ใช้งานได้จริงโดยตรงจาก source repository ของเฟรมเวิร์ก แล้วฉีดเข้าไปใน context window ของ LLM ในจังหวะที่ทำ prompting
  • จากประสบการณ์ Context7 ช่วยลดอาการหลอนของโค้ดและการพึ่งพาข้อมูลฝึกที่ล้าสมัยได้อย่างมาก

66. Data Contract CLI

  • Data Contract CLI เป็นเครื่องมือบรรทัดคำสั่งแบบโอเพนซอร์สที่ออกแบบมาสำหรับการทำงานกับสเปก Data Contract
  • ช่วยให้สามารถสร้างและแก้ไข data contract ได้ และที่สำคัญคือสามารถตรวจสอบข้อมูลเทียบกับสัญญาได้ ซึ่งจำเป็นต่อการรับประกันความถูกต้องครบถ้วนและคุณภาพของ data product
  • CLI รองรับ schema definition ได้อย่างกว้างขวางหลายแบบ เช่น Avro, SQL DDL และ Open Data Contract Standard และยังสามารถเปรียบเทียบเวอร์ชันของสัญญาหลายเวอร์ชันเพื่อตรวจจับ breaking change ได้ทันที
  • พบว่ามีประโยชน์อย่างยิ่งต่อการทำให้ contract governance ระหว่าง data product ต่าง ๆ ใช้งานได้จริงผ่านการผสานรวมกับ CI/CD โดยเฉพาะในบริบทของ data mesh

67. Databricks Assistant

  • Databricks Assistant เป็นเครื่องมือเชิงสนทนาที่ขับเคลื่อนด้วย AI และผสานรวมอยู่ในแพลตฟอร์ม Databricks โดยตรง ทำหน้าที่เป็น pair programmer ตามบริบทสำหรับผู้เชี่ยวชาญด้านข้อมูล
  • ต่างจากผู้ช่วยเขียนโค้ดทั่วไป มันได้เปรียบจากความเข้าใจพื้นฐานเกี่ยวกับสภาพแวดล้อม Databricks และบริบทข้อมูล รวมถึงเมทาดาทาจาก Unity Catalog
  • Assistant ทำได้มากกว่าการสร้าง code snippet โดยสามารถเขียนคำสั่ง SQL และ Python แบบหลายขั้นตอนที่ซับซ้อน วินิจฉัยข้อผิดพลาด และให้คำอธิบายอย่างละเอียดที่อิงกับเวิร์กสเปซนั้น ๆ
  • สำหรับองค์กรที่ลงทุนกับ ecosystem ของ Databricks อยู่แล้ว มันสามารถเร่งประสิทธิภาพการทำงานและลดอุปสรรคในการเริ่มต้นงานข้อมูลที่ซับซ้อนได้

68. Hoppscotch

  • Hoppscotch เป็นเครื่องมือโอเพนซอร์สน้ำหนักเบาสำหรับการพัฒนา ดีบัก ทดสอบ และแชร์ API
  • รองรับหลายโปรโตคอล รวมถึง HTTP, GraphQL และ WebSocket และมีไคลเอนต์ข้ามแพลตฟอร์มสำหรับสภาพแวดล้อมเว็บ เดสก์ท็อป และ CLI
  • แม้พื้นที่ของเครื่องมือ API จะมีทางเลือกอย่าง Postman, Insomnia และ Bruno อยู่หนาแน่น แต่ Hoppscotch โดดเด่นด้วยขนาดที่เบาและการออกแบบที่เป็นมิตรต่อความเป็นส่วนตัว
  • มันตัดระบบ analytics ออก ใช้ local-first storage และรองรับ self-hosting จึงเป็นตัวเลือกที่แข็งแกร่งสำหรับองค์กรที่มองหาวิธีแชร์ API script อย่างเป็นธรรมชาติ พร้อมรักษาความเป็นส่วนตัวของข้อมูลไว้อย่างเข้มแข็ง

69. NVIDIA DCGM Exporter

  • NVIDIA DCGM Exporter เป็นเครื่องมือโอเพนซอร์สที่ช่วยให้ทีมมอนิเตอร์การเทรน GPU แบบกระจายศูนย์ในระดับขนาดใหญ่ได้
  • มันแปลง telemetry แบบ proprietary ของ NVIDIA Data Center GPU Manager (DCGM) ให้อยู่ในรูปแบบเปิดที่เข้ากันได้กับระบบมอนิเตอร์มาตรฐาน
  • เปิดเผยเมตริกแบบเรียลไทม์ที่สำคัญจากทั้ง GPU และโฮสต์เซิร์ฟเวอร์ เช่น การใช้งาน GPU อุณหภูมิ พลังงาน และจำนวนข้อผิดพลาด ECC
  • การมองเห็นระดับนี้เป็นสิ่งจำเป็นสำหรับองค์กรที่ทำการ fine-tune LLM แบบกำหนดเองหรือรันงานเทรนระยะยาวที่ใช้ GPU หนัก

70. RelationalAI

  • เมื่อมีการนำเข้าข้อมูลปริมาณมากและหลากหลายเข้าสู่ Snowflake ความสัมพันธ์เฉพาะตัวและกฎโดยนัยภายในข้อมูลนั้นอาจไม่ชัดเจน
  • RelationalAI ที่สร้างขึ้นเป็น Snowflake Native App ช่วยให้ทีมสามารถสร้างโมเดลที่ซับซ้อนเพื่อจับแนวคิดที่มีความหมาย กำหนดเอนทิตีทางธุรกิจหลัก และฝังตรรกะที่ซับซ้อนไว้กับตาราง Snowflake ได้โดยตรง
  • ด้วย Graph Reasoner อันทรงพลัง ผู้ใช้สามารถสร้าง วิเคราะห์ และแสดงภาพกราฟความรู้เชิงสัมพันธ์บนพื้นฐานของโมเดลเหล่านี้ได้
  • สำหรับองค์กรที่ต้องจัดการชุดข้อมูลขนาดใหญ่ซึ่งเปลี่ยนแปลงอย่างรวดเร็ว การสร้างกราฟความรู้อาจเป็นสิ่งจำเป็นต่อการมอนิเตอร์เชิงรุกล่วงหน้าและการสร้างข้อมูลเชิงลึกที่ลึกขึ้นและนำไปใช้ได้จริง

71. UX Pilot

  • UX Pilot เป็นเครื่องมือ AI ที่รองรับหลายขั้นตอนของกระบวนการออกแบบ UX ตั้งแต่การทำ wireframing ไปจนถึงการออกแบบภาพความละเอียดสูงและการรีวิว
  • รองรับอินพุตทั้งข้อความและภาพ และสามารถสร้างหน้าจอ โฟลว์ และเลย์เอาต์ได้โดยอัตโนมัติ
  • ฟีเจอร์ Autoflow สร้างการเปลี่ยนผ่านของ user flow และ Deep Design ช่วยสร้างผลลัพธ์ที่สมบูรณ์และละเอียดมากขึ้น
  • UX Pilot ยังมีปลั๊กอิน Figma สำหรับส่งออกดีไซน์ที่สร้างขึ้นไปปรับแต่งต่อภายในเครื่องมือออกแบบมาตรฐาน

72. v0

  • v0 ได้พัฒนาต่อจากตอนที่ถูกแนะนำครั้งล่าสุดใน Radar
  • ตอนนี้มี design mode ที่ช่วยให้ผู้จัดการผลิตภัณฑ์สามารถสร้างและปรับแต่ง UI prototype แบบ self-service ได้ง่ายขึ้น
  • รุ่นล่าสุดได้เพิ่มโมเดลของตัวเองที่มี context window ขนาดใหญ่และความสามารถแบบ multimodal ทำให้ v0 สามารถสร้างและปรับปรุง UI ได้จากทั้งอินพุตข้อความและภาพ
  • อีกส่วนเสริมที่น่าสนใจคือ agent mode ซึ่งช่วยให้ระบบสามารถแยกงานที่ซับซ้อนออกเป็นส่วนย่อยและเลือกโมเดลที่เหมาะสมสำหรับแต่ละงานได้

Assess

73. Augment Code

  • Augment Code เป็น AI coding assistant ที่ให้การสนับสนุนโดยรับรู้บริบทเชิงลึกสำหรับโค้ดเบสขนาดใหญ่
  • โดดเด่นด้วย context engineering ขั้นสูงที่ช่วยให้อัปเดตดัชนีโค้ดและค้นหาได้อย่างรวดเร็ว แม้โค้ดจะมีการเปลี่ยนแปลงบ่อยครั้ง
  • Augment รองรับโมเดลอย่าง Claude Sonnet 4 และ 4.5 รวมถึง GPT-5 ผสานการทำงานกับ GitHub, Jira และ Confluence และรองรับ Model Context Protocol (MCP) เพื่อการทำงานร่วมกับเครื่องมือภายนอก
  • ให้คำแนะนำแบบเป็นขั้นตอนสำหรับการเปลี่ยนแปลงโค้ดเบสที่ซับซ้อน ตั้งแต่การรีแฟกเตอร์และอัปเกรด dependency ไปจนถึงการอัปเดตสคีมา

74. Azure AI Document Intelligence

  • Azure AI Document Intelligence (เดิมชื่อ Form Recognizer) ดึงข้อความ ตาราง และคู่คีย์-ค่าออกจากเอกสารที่ไม่มีโครงสร้าง แล้วแปลงเป็นข้อมูลที่มีโครงสร้าง
  • ใช้โมเดล deep learning ที่ฝึกไว้ล่วงหน้าเพื่อตีความเลย์เอาต์และความหมาย และสามารถฝึก custom model สำหรับรูปแบบเฉพาะได้ผ่านอินเทอร์เฟซแบบ no-code
  • หนึ่งในทีมรายงานว่า ADI ช่วยลดการป้อนข้อมูลด้วยมือได้อย่างมาก ปรับปรุงความถูกต้องของข้อมูล และเร่งการทำรายงาน ส่งผลให้ตัดสินใจบนพื้นฐานข้อมูลได้เร็วขึ้น
  • เช่นเดียวกับ Amazon Textract และ Google Document AI เครื่องมือนี้มอบการประมวลผลเอกสารระดับองค์กรด้วยความสามารถในการเข้าใจเลย์เอาต์ที่แข็งแกร่ง

75. Docling

  • Docling เป็นไลบรารี Python และ TypeScript แบบโอเพนซอร์สสำหรับการประมวลผลเอกสารขั้นสูงของข้อมูลที่ไม่มีโครงสร้าง
  • แก้ปัญหา "last mile" ที่มักถูกมองข้ามในการแปลงเอกสารจริง เช่น PDF และ PowerPoint ให้เป็นรูปแบบที่สะอาดและเครื่องอ่านได้
  • ต่างจากตัวแยกข้อมูลแบบดั้งเดิม Docling ใช้แนวทางที่อิง computer vision เพื่อตีความเลย์เอาต์เอกสารและโครงสร้างเชิงความหมาย ทำให้เอาต์พุตมีคุณค่าอย่างยิ่งสำหรับไปป์ไลน์ retrieval-augmented generation (RAG)
  • แปลงเอกสารที่ซับซ้อนเป็นรูปแบบที่มีโครงสร้าง เช่น JSON หรือ Markdown เพื่อรองรับเทคนิคอย่าง structured output from LLMs

76. E2B

  • E2B เป็นเครื่องมือโอเพนซอร์สสำหรับรันโค้ดที่ AI สร้างขึ้นภายใน sandbox ที่ปลอดภัยและแยกขาดในคลาวด์
  • เอเจนต์สามารถใช้ sandbox เหล่านี้ซึ่งสร้างอยู่บน microVM ของ Firecracker เพื่อรันโค้ดอย่างปลอดภัย วิเคราะห์ข้อมูล ทำวิจัย หรือใช้งาน virtual machine ได้
  • สิ่งนี้ช่วยให้สามารถสร้างและดีพลอย AI agent ระดับองค์กรได้ พร้อมทั้งมีการควบคุมสภาพแวดล้อมการรันและความปลอดภัยอย่างเต็มรูปแบบ

77. Helix editor

  • มีการฟื้นกลับมาบ้างของ text editor แบบเรียบง่ายที่มุ่งมาแทนที่ Vim ซึ่งเป็นของโปรดบนบรรทัดคำสั่ง
  • Helix เป็นหนึ่งในคู่แข่งของพื้นที่ที่คับคั่งนี้ ร่วมกับ Neovim และ Kakoune ที่เพิ่งได้รับความสนใจ
  • Helix นิยามตัวเองแบบขำ ๆ ว่าเป็น post-modern text editor และสิ่งที่ดึงดูดความสนใจของเราตั้งแต่แรกคือฟีเจอร์อย่างหลายเคอร์เซอร์ การรองรับ Tree-sitter และการรองรับ Language Server Protocol (LSP) ที่รวมมาในตัว
  • มีการพัฒนาอย่างต่อเนื่องพร้อมระบบปลั๊กอินที่กำลังดำเนินอยู่ และโดยรวมเป็น modal editor น้ำหนักเบาที่ให้ความรู้สึกคุ้นเคยกับผู้ใช้ Vim แต่เพิ่มความสะดวกสมัยใหม่บางอย่างเข้ามา

78. Kueue

  • Kueue เป็นคอนโทรลเลอร์แบบ Kubernetes-native สำหรับคิวงานที่ใช้จัดการโควตาและการใช้ทรัพยากร
  • มี API สำหรับจัดการเวิร์กโหลด Kubernetes ที่มีลำดับความสำคัญและความต้องการทรัพยากรแตกต่างกัน และทำหน้าที่เป็นตัวจัดการระดับงานที่ตัดสินใจว่าจะอนุญาตหรือนำงานออกเมื่อใด
  • Kueue ถูกออกแบบมาเพื่อการจัดการทรัพยากรอย่างมีประสิทธิภาพ การจัดลำดับความสำคัญของงาน และการตั้งเวลาแบบขั้นสูง ช่วยเพิ่มประสิทธิภาพการรันเวิร์กโหลดในสภาพแวดล้อม Kubernetes โดยเฉพาะเวิร์กโหลด ML ที่ใช้เครื่องมืออย่าง Kubeflow
  • มันไม่ได้มาแทนที่ cluster-autoscaler และ kube-scheduler แต่ทำงานร่วมกัน โดยมุ่งเน้นที่การอนุญาตงานตามลำดับ โควตา ลำดับความสำคัญ และการรับรู้โทโพโลยี

79. MCPScan.ai

  • MCPScan.ai เป็นสแกนเนอร์ความปลอดภัยสำหรับเซิร์ฟเวอร์ Model Context Protocol (MCP) ที่ทำงานได้สองโหมดคือ scan และ proxy
  • ในโหมด scan จะวิเคราะห์การตั้งค่าและคำอธิบายของเครื่องมือเพื่อตรวจหาช่องโหว่ที่รู้จัก เช่น prompt injection, tool poisoning และ toxic flows
  • ในโหมด proxy, MCPScan.ai ทำหน้าที่เป็นสะพานเชื่อมระหว่างระบบเอเจนต์กับเซิร์ฟเวอร์ MCP และคอยตรวจสอบทราฟฟิกรันไทม์อย่างต่อเนื่อง
  • โหมดนี้ยังบังคับใช้กฎความปลอดภัยและ guardrail แบบกำหนดเอง รวมถึงการตรวจสอบการเรียกใช้เครื่องมือ การตรวจจับ PII และข้อจำกัดด้านการไหลของข้อมูลด้วย

80. oRPC

  • oRPC (OpenAPI Remote Procedure Call) มอบ API แบบ type-safe ครบวงจรใน TypeScript พร้อมทั้งสอดคล้องกับข้อกำหนด OpenAPI อย่างสมบูรณ์
  • สามารถสร้างข้อกำหนด OpenAPI แบบสมบูรณ์ได้โดยอัตโนมัติ ช่วยให้การผสานรวมและการจัดทำเอกสารง่ายขึ้น
  • ขณะที่ทางเลือกอย่าง tRPC และ ElysiaJS มักต้องนำเฟรมเวิร์กใหม่มาใช้เพื่อให้ได้ type safety แต่ oRPC สามารถผสานรวมกับเฟรมเวิร์ก Node.js เดิมได้อย่างราบรื่น รวมถึง Express, Fastify, Hono, Next.js
  • ความยืดหยุ่นนี้ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับทีมที่ต้องการนำ end-to-end type safety มาใช้กับ API เดิมโดยไม่ต้องรีแฟกเตอร์ครั้งใหญ่

81. Power user for dbt

  • Power user for dbt คือส่วนขยายสำหรับ Visual Studio Code ที่ผสานรวมโดยตรงกับทั้งสภาพแวดล้อม dbt และ dbt Cloud
  • เนื่องจาก dbt ยังคงเป็นหนึ่งในเครื่องมือที่เราชื่นชอบ สิ่งใดก็ตามที่ช่วยปรับปรุงการใช้งานจึงเป็นส่วนเสริมที่ระบบนิเวศนี้ยินดีต้อนรับ
  • ก่อนหน้านี้นักพัฒนาต้องพึ่งพาเครื่องมือหลายตัวนอก IDE เพื่อตรวจสอบโค้ด SQL หรือดู lineage ของโมเดล
  • ส่วนขยายนี้ทำให้ความสามารถเหล่านั้นถูกฝังอยู่ใน VS Code แล้ว พร้อมมี code autocompletion, ผลลัพธ์คิวรีแบบเรียลไทม์, และการแสดง lineage ของโมเดลและคอลัมน์แบบภาพ

82. Serena

  • Serena คือชุดเครื่องมือเขียนโค้ดที่ทรงพลัง ซึ่งมอบความสามารถคล้าย IDE สำหรับการค้นหาและแก้ไขโค้ดเชิงความหมายให้กับ coding agent อย่าง Claude Code
  • ด้วยการทำงานในระดับสัญลักษณ์และความเข้าใจโครงสร้างเชิงความสัมพันธ์ของโค้ด Serena จึงช่วยเพิ่มประสิทธิภาพด้านโทเคนได้อย่างมาก
  • แทนที่จะต้องอ่านทั้งไฟล์หรือพึ่งการแทนที่สตริงแบบหยาบ ๆ coding agent สามารถใช้เครื่องมือ Serena ที่แม่นยำอย่าง find_symbol, find_referencing_symbols, insert_after_symbol เพื่อค้นหาและแก้ไขโค้ดได้
  • แม้ผลกระทบจะเล็กน้อยในโปรเจกต์ขนาดเล็ก แต่เมื่อ codebase ใหญ่ขึ้น ประสิทธิภาพลักษณะนี้จะมีคุณค่ามาก

83. SweetPad

  • ส่วนขยาย SweetPad ช่วยให้นักพัฒนาสามารถใช้ VS Code หรือ Cursor สำหรับวงจรชีวิตการพัฒนาแอปพลิเคชัน Swift บนแพลตฟอร์ม Apple ได้ครบถ้วน
  • โดยรวมเครื่องมือสำคัญอย่าง xcodebuild, xcode-build-server, swift-format เข้าไว้ด้วยกัน จึงไม่จำเป็นต้องสลับไปใช้ Xcode ตลอดเวลา
  • นักพัฒนาสามารถจัดการ simulator, deploy ไปยังอุปกรณ์, รวมถึง build, run และ debug แอป Swift สำหรับ iOS, macOS และ watchOS ได้จากใน IDE โดยตรงโดยไม่ต้องเปิด Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

  • Tape/Z (Tools for Assembly Program Exploration for Z/OS) คือชุดเครื่องมือที่กำลังพัฒนาสำหรับวิเคราะห์โค้ดเมนเฟรม HLASM (High-Level Assembler)
  • พัฒนาโดย Thoughtworker และมีความสามารถอย่างการพาร์ส, การสร้าง control flow graph, การติดตาม dependency, และการแสดง flowchart
  • เราได้กล่าวถึงมานานแล้วว่าพื้นที่เมนเฟรมขาดแคลนเครื่องมือแบบเปิดและขับเคลื่อนโดยชุมชน โดยตัวเลือกส่วนใหญ่เป็นซอฟต์แวร์กรรมสิทธิ์หรือผูกกับ ecosystem ของผู้ขาย
  • Tape/Z ช่วยอุดช่องว่างนี้ด้วยการมอบความสามารถด้านการวิเคราะห์ที่เข้าถึงได้และเขียนสคริปต์ได้

[Languages and Frameworks]

Adopt

85. Fastify

  • เรายังคงมีประสบการณ์เชิงบวกกับ Fastify อย่างต่อเนื่อง — เว็บเฟรมเวิร์กสำหรับ Node.js ที่รวดเร็ว ไม่ยัดเยียดแนวทาง และมี overhead ต่ำ
  • มีความสามารถสำคัญทั้งหมดที่เว็บเฟรมเวิร์กขนาดเล็กควรมี รวมถึงการพาร์ส การตรวจสอบความถูกต้อง การซีเรียลไลซ์ ตลอดจนระบบปลั๊กอินที่แข็งแกร่งและการสนับสนุนจากชุมชนที่ดี
  • ทีมไม่พบข้อเสียสำคัญของ Fastify เมื่อเทียบกับทางเลือกอย่าง Express.js และยังได้ประโยชน์ด้านประสิทธิภาพที่วัดผลได้ ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการพัฒนาเว็บแบบมินิมัลบน Node.js

86. LangGraph

  • LangGraph คือ orchestration framework สำหรับสร้างแอปพลิเคชัน multi-agent แบบมีสถานะโดยใช้ LLM
  • มอบ primitive ระดับล่างอย่าง node และ edge พร้อมความสามารถในตัวที่ให้ผู้พัฒนาควบคุม agent workflow, การจัดการหน่วยความจำ, และการคงอยู่ของสถานะได้อย่างละเอียด
  • ซึ่งหมายความว่านักพัฒนาสามารถเริ่มจากกราฟสำเร็จรูปแบบง่าย ๆ แล้วขยายไปสู่สถาปัตยกรรมเอเจนต์ที่ซับซ้อนและพัฒนาเปลี่ยนแปลงได้
  • ด้วยการรองรับรูปแบบความทนทาน เช่น streaming, การจัดการ context ขั้นสูง, model fallback, และการจัดการข้อผิดพลาดของเครื่องมือ LangGraph จึงช่วยสร้างแอปพลิเคชันเอเจนต์ระดับ production ที่แข็งแกร่งได้

87. vLLM

  • vLLM คือ inference engine สำหรับ LLM ที่มี throughput สูงและใช้หน่วยความจำอย่างมีประสิทธิภาพ ซึ่งสามารถรันได้ทั้งบนคลาวด์หรือ on-premises
  • รองรับสถาปัตยกรรมโมเดลหลายแบบและโมเดลโอเพนซอร์สยอดนิยม
  • ทีมได้ deploy vLLM worker แบบ dockerized บนแพลตฟอร์ม GPU เช่น NVIDIA DGX และ Intel HPC เพื่อโฮสต์โมเดลอย่าง Llama 3.1 (8B และ 70B), Mistral 7B และ Llama-SQL สำหรับการช่วยเขียนโค้ดของนักพัฒนา, การค้นคืนความรู้, และการโต้ตอบกับฐานข้อมูลด้วยภาษาธรรมชาติ
  • vLLM เข้ากันได้กับมาตรฐาน OpenAI SDK ทำให้ให้บริการโมเดลได้อย่างสม่ำเสมอ

Trial

88. Crossplane

  • นับตั้งแต่ปรากฏบน Radar ครั้งล่าสุด การนำ Crossplane ไปใช้ยังคงเพิ่มขึ้นอย่างต่อเนื่อง โดยเฉพาะในการขยาย Kubernetes cluster
  • จากการใช้งานจริง เราพบว่า Crossplane โดดเด่นในกรณีใช้งานเฉพาะ มากกว่าจะเป็นเครื่องมือ infrastructure as code (IaC) แบบอเนกประสงค์
  • ข้อสังเกตก่อนหน้ายังคงใช้ได้: Crossplane ทำงานได้ดีที่สุดในฐานะตัวเสริมของ workload ที่ deploy อยู่ภายใน Kubernetes และไม่ใช่ตัวแทนเต็มรูปแบบของเครื่องมืออย่าง Terraform
  • ทีมที่ "ทุ่มทั้งหมด" ให้ Crossplane เป็นโซลูชัน IaC หลักมักประสบปัญหา แต่ทีมที่ใช้อย่างเหมาะสม — สำหรับกรณีใช้งานแบบกำหนดเป้าหมายเฉพาะ — กลับเห็นผลลัพธ์ที่แข็งแกร่ง

89. DeepEval

  • DeepEval คือเฟรมเวิร์กประเมินผลแบบโอเพนซอร์สบนพื้นฐาน Python สำหรับการวัดประสิทธิภาพของ LLM
  • สามารถใช้ประเมิน retrieval-augmented generation (RAG) และแอปพลิเคชันอื่น ๆ ที่สร้างด้วย LlamaIndex หรือ LangChain รวมถึงใช้สำหรับการตั้ง baseline และ benchmark ของโมเดล
  • DeepEval ประเมินทั้งความถูกต้อง ความเกี่ยวข้อง และความสอดคล้อง เพื่อให้การประเมินที่เชื่อถือได้มากขึ้นในสถานการณ์จริง นอกเหนือจากคะแนนจับคู่คำเพียงอย่างเดียว
  • มีเมตริกอย่างการตรวจจับ hallucination, ความเกี่ยวข้องของคำตอบ, การปรับแต่ง hyperparameter และรองรับ GEval สำหรับสร้างเมตริกแบบกำหนดเองตาม use case

90. FastMCP

  • Model Context Protocol (MCP) กำลังกลายเป็นมาตรฐานอย่างรวดเร็วสำหรับการมอบคอนเท็กซ์และเครื่องมือให้กับแอปพลิเคชัน LLM
  • อย่างไรก็ตาม การนำ MCP server ไปใช้งานโดยทั่วไปมักมี boilerplate จำนวนมากสำหรับการตั้งค่า การจัดการโปรโตคอล และการจัดการข้อผิดพลาด
  • FastMCP เป็นเฟรมเวิร์ก Python ที่ทำให้กระบวนการนี้ง่ายขึ้น โดยซ่อนความซับซ้อนของโปรโตคอลและทำให้นักพัฒนาสามารถกำหนด MCP resource และเครื่องมือผ่าน Python decorator ที่เข้าใจได้ง่าย
  • การทำ abstraction นี้ช่วยให้ทีมโฟกัสกับ business logic ได้มากขึ้น ส่งผลให้การใช้งาน MCP สะอาดตาและดูแลรักษาง่ายกว่าเดิม

91. LiteLLM

  • LiteLLM เป็น SDK ที่ให้การผสานรวมกับผู้ให้บริการ LLM หลายรายได้อย่างราบรื่นผ่านรูปแบบ OpenAI API มาตรฐาน
  • รองรับผู้ให้บริการและโมเดลได้อย่างกว้างขวาง พร้อมมอบอินเทอร์เฟซแบบรวมศูนย์สำหรับ text completion, embedding และการสร้างภาพ
  • ด้วยการซ่อนความแตกต่างของ API เฉพาะแต่ละผู้ให้บริการ LiteLLM จึงช่วยให้การผสานรวมง่ายขึ้นและ route คำขอไปยัง model endpoint ที่ถูกต้องโดยอัตโนมัติ
  • ยังมีความสามารถระดับ production ผ่าน proxy framework เช่น guardrails, caching, logging, rate limiting และ load balancing

92. MLForecast

  • MLForecast เป็นเฟรมเวิร์กและไลบรารี Python สำหรับการพยากรณ์อนุกรมเวลา โดยนำโมเดล machine learning ไปใช้กับชุดข้อมูลขนาดใหญ่
  • ช่วยให้กระบวนการทำ feature engineering แบบอัตโนมัติที่มักซับซ้อนง่ายขึ้น รวมถึง lag, rolling statistics และฟีเจอร์ที่อิงตามวันที่
  • เป็นหนึ่งในไม่กี่ไลบรารีที่มีการรองรับแบบ native สำหรับ distributed computing framework อย่าง Spark และ Dask จึงช่วยรับประกันเรื่อง scalability
  • ยังรองรับการพยากรณ์เชิงความน่าจะเป็นด้วยวิธีอย่าง conformal prediction เพื่อให้การวัดความไม่แน่นอนของการคาดการณ์ในเชิงปริมาณ

93. Nuxt

  • Nuxt เป็น meta-framework แบบมีแนวทางชัดเจนที่สร้างอยู่บน Vue.js สำหรับการสร้างเว็บแอปพลิเคชันแบบฟูลสแตก และมักถูกเรียกว่า “Next.js สำหรับ Vue.js”
  • เช่นเดียวกับฝั่ง React, Nuxt มีความสามารถที่เป็นมิตรต่อ SEO เช่น pre-rendering, server-side rendering (SSR) และการจัดการ metadata
  • Nuxt ได้รับการสนับสนุนจาก Vercel บริษัทเดียวกับที่อยู่เบื้องหลัง Next.js พร้อมทั้งมีชุมชนที่แข็งแกร่งและ ecosystem ของโมดูลทั้งทางการและจากภายนอก
  • โมดูลเหล่านี้ช่วยให้การผสานรวมฟีเจอร์อย่างการประมวลผลภาพ, sitemap และ Tailwind CSS ง่ายขึ้น

94. Phoenix

  • ยังคงมีประสบการณ์เชิงบวกกับ Phoenix อย่างต่อเนื่อง — เว็บ MVC framework ฝั่งเซิร์ฟเวอร์ที่เขียนด้วย Elixir
  • Phoenix พัฒนาต่อยอดจากแนวคิดด้านการพัฒนาแอปอย่างรวดเร็วและประสบการณ์นักพัฒนาของ Ruby on Rails ขณะเดียวกันก็ขยายไปสู่กระบวนทัศน์การเขียนโปรแกรมเชิงฟังก์ชัน
  • ในฉบับนี้มีการเน้นย้ำการเปิดตัว Phoenix LiveView 1.0
  • LiveView เป็นโซลูชันแบบ HTML-over-the-wire ที่คล้ายกับ HTMX หรือ Hotwire ซึ่งช่วยให้นักพัฒนาสร้างประสบการณ์ผู้ใช้ที่สมบูรณ์และเรียลไทม์ได้ด้วย HTML ที่เรนเดอร์จากเซิร์ฟเวอร์ทั้งหมด

95. Presidio

  • Presidio เป็น SDK ด้านการปกป้องข้อมูลสำหรับการระบุ และทำข้อมูลนิรนาม ของข้อมูลอ่อนไหวในข้อความทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง
  • ใช้ named entity recognition, regular expression และตรรกะแบบอิงกฎเพื่อตรวจจับข้อมูลที่ระบุตัวบุคคลได้ (PII) เช่น หมายเลขบัตรเครดิต ชื่อ และสถานที่
  • Presidio รองรับตัวรู้จำเอนทิตีแบบ custom และ pipeline การทำข้อมูลนิรนาม ทำให้องค์กรสามารถปรับให้เข้ากับข้อกำหนดด้านความเป็นส่วนตัวและการปฏิบัติตามกฎระเบียบของตนเองได้
  • ทีมงานใช้ Presidio ในสภาพแวดล้อมระดับองค์กรที่ต้องควบคุมการแชร์ข้อมูลอย่างเข้มงวดเมื่อผสานรวมกับ LLM

96. Pydantic AI

  • Pydantic AI ยังคงพิสูจน์ตัวเองว่าเป็นเฟรมเวิร์กโอเพนซอร์สที่เสถียรและได้รับการสนับสนุนอย่างดีสำหรับการสร้าง GenAI agent ในระดับ production
  • สร้างอยู่บนรากฐาน Pydantic ที่เชื่อถือได้ จึงมอบ type safety ที่แข็งแกร่ง การสังเกตการณ์แบบ first-class ผ่าน OpenTelemetry และเครื่องมือประเมินผลในตัว
  • การออกเวอร์ชัน 1.0 เมื่อวันที่ 4 กันยายน 2025 ถือเป็นหมุดหมายสำคัญด้านความพร้อมใช้งาน
  • นับจากนั้นมา เฟรมเวิร์กนี้ได้รับความไว้วางใจและการยอมรับอย่างกว้างขวางจากความเรียบง่ายและการดูแลรักษาที่ง่าย จนเข้าร่วมแถวเดียวกับเฟรมเวิร์ก agent ยอดนิยมอื่น ๆ เช่น LangChain และ LangGraph

97. Tauri

  • Tauri เป็นเฟรมเวิร์กสำหรับการสร้างเดสก์ท็อปแอปพลิเคชันประสิทธิภาพสูงโดยใช้โค้ดเบสเว็บ UI ชุดเดียว
  • ต่างจาก web wrapper แบบดั้งเดิมอย่าง Electron, Tauri สร้างบนพื้นฐานของ Rust และใช้ native webview ของระบบปฏิบัติการ จึงให้ทั้งไฟล์ไบนารีที่เล็กกว่าและความปลอดภัยที่แข็งแกร่งกว่า
  • เคยประเมิน Tauri ครั้งแรกเมื่อหลายปีก่อน และหลังจากนั้นก็ได้ขยายจากเดสก์ท็อปไปสู่การรองรับ iOS และ Android
  • เวอร์ชันล่าสุดมีจุดเด่นคือการนำโมเดลสิทธิ์และขอบเขตที่ยืดหยุ่นยิ่งขึ้นเข้ามาใช้แทนรายการสิทธิ์แบบเดิม รองรับการส่งข้อมูลดิบ และมีชั้นการสื่อสารระหว่างโปรเซส (IPC) ที่ได้รับการปรับปรุงเพื่อเพิ่มประสิทธิภาพ

Assess

98. Agent Development Kit (ADK)

  • Agent Development Kit (ADK) เป็นเฟรมเวิร์กสำหรับการพัฒนาและนำ AI agent ไปใช้งาน โดยใช้ระเบียบวิธีวิศวกรรมซอฟต์แวร์สมัยใหม่แทนที่จะพึ่งพาเพียงการ prompt
  • นำ abstraction ที่คุ้นเคยเข้ามาใช้ เช่น class, method, workflow pattern และการรองรับ CLI
  • เมื่อเทียบกับเฟรมเวิร์กอย่าง LangGraph หรือ CrewAI จุดแข็งของ ADK คือการผสานรวมอย่างลึกซึ้งกับโครงสร้างพื้นฐาน AI ของ Google ซึ่งให้ความพร้อมระดับองค์กรทั้งด้าน grounding, การเข้าถึงข้อมูล และการมอนิเตอร์
  • ออกแบบมาโดยคำนึงถึง interoperability และรองรับ A2A protocol สำหรับ tool wrapper และการสื่อสารระหว่าง agent

99. Agno

  • Agno เป็นเฟรมเวิร์กสำหรับการสร้าง รัน และจัดการระบบ multi-agent
  • ให้ความยืดหยุ่นในการสร้างทั้ง agent ที่ทำงานอัตโนมัติเต็มรูปแบบหรือ workflow แบบควบคุมเป็นขั้นตอน พร้อมการรองรับ human-in-the-loop, session management, memory และ knowledge ในตัว
  • ชื่นชมการให้ความสำคัญกับประสิทธิภาพผ่านเวลาเริ่มต้นของ agent ที่น่าประทับใจและการใช้หน่วยความจำที่ต่ำ
  • Agno มาพร้อม runtime ของตัวเองชื่อ AgentOS ซึ่งเป็นแอปพลิเคชัน FastAPI ที่มี control plane แบบรวมศูนย์สำหรับการทดสอบ การมอนิเตอร์ และการจัดการระบบ agent อย่างคล่องตัว

100. assistant-ui

  • assistant-ui เป็นไลบรารีโอเพนซอร์ส TypeScript และ React สำหรับอินเทอร์เฟซแชต AI
  • จัดการส่วนที่ซับซ้อนของการทำแชต UI เช่น streaming, state management และฟีเจอร์ UX ทั่วไปสำหรับการแก้ไขข้อความและสลับ branch ขณะที่ยังเปิดให้นักพัฒนาสามารถออกแบบคอมโพเนนต์ของตนเองด้วย Radix primitive
  • รองรับการผสานรวมกับ runtime ยอดนิยม รวมถึง Vercel AI SDK และ LangGraph และยังมี runtime solution ที่ปรับแต่งได้สำหรับกรณีใช้งานที่ซับซ้อน
  • ประสบความสำเร็จในการสร้างอินเทอร์เฟซแชตแบบเรียบง่ายด้วย assistant-ui และพอใจกับผลลัพธ์

101. AutoRound

  • AutoRound ของ Intel เป็นอัลกอริทึม quantization ขั้นสูงสำหรับบีบอัดโมเดล AI ขนาดใหญ่ เช่น LLM และ vision language models (VLM) โดยลดการสูญเสียความแม่นยำให้น้อยที่สุด
  • ใช้การเพิ่มประสิทธิภาพแบบ sign-gradient descent เพื่อลดขนาดโมเดลลงสู่ระดับบิตต่ำมาก (2-4 บิต) และใช้ความกว้างบิตแบบผสมในแต่ละเลเยอร์เพื่อประสิทธิภาพที่เหมาะสมที่สุด
  • กระบวนการ quantization นี้ยังรวดเร็วมากอีกด้วย: สามารถ quantize โมเดลขนาด 7 พันล้านพารามิเตอร์ได้ภายในไม่กี่นาทีบน GPU เดียว
  • AutoRound ผสานรวมกับ inference engine ยอดนิยมอย่าง vLLM และ Transformers ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการ quantize โมเดล

102. Browser Use

  • Browser Use เป็นไลบรารี Python แบบโอเพนซอร์สที่ช่วยให้เอเจนต์ที่ใช้ LLM สามารถควบคุมเว็บเบราว์เซอร์และโต้ตอบกับเว็บแอปพลิเคชันได้
  • สามารถนำทาง กรอกข้อมูล และดึงข้อความได้ รวมถึงจัดการหลายแท็บเพื่อประสานงานงานข้ามแอปพลิเคชัน
  • ไลบรารีนี้มีประโยชน์อย่างยิ่งเมื่อ AI agent จำเป็นต้องเข้าถึง จัดการ หรือดึงข้อมูลจากคอนเทนต์บนเว็บ
  • รองรับ LLM หลากหลายตัว และใช้ Playwright โดยผสานความเข้าใจเชิงภาพเข้ากับการดึงโครงสร้าง HTML เพื่อการโต้ตอบบนเว็บที่สมบูรณ์ยิ่งขึ้น

103. DeepSpeed

  • DeepSpeed เป็นไลบรารี Python ที่เพิ่มประสิทธิภาพ distributed deep learning สำหรับทั้งการฝึกและการอนุมาน
  • สำหรับการฝึก มีการรวมเทคนิคอย่าง Zero Redundancy Optimizer (ZeRO) และ 3D parallelism เพื่อขยายโมเดลอย่างมีประสิทธิภาพบน GPU หลายพันตัว
  • สำหรับการอนุมาน มีการผสาน tensor, pipeline, expert และ ZeRO parallelism เข้ากับ custom kernel และการเพิ่มประสิทธิภาพการสื่อสารเพื่อลด latency ให้ต่ำที่สุด
  • DeepSpeed ขับเคลื่อนโมเดลภาษาขนาดใหญ่ที่สุดบางส่วนของโลก รวมถึง Megatron-Turing NLG (530B) และ BLOOM (176B)

104. Drizzle

  • Drizzle เป็น ORM สำหรับ TypeScript ที่มีน้ำหนักเบา
  • ต่างจาก Prisma ORM ตรงที่มอบทั้ง API แบบคล้าย SQL ที่เรียบง่ายและอินเทอร์เฟซคิวรีสไตล์ ORM แบบดั้งเดิมให้กับนักพัฒนา
  • ยังรองรับการดึงสคีมาจากฐานข้อมูลเดิม ทำให้รองรับได้ทั้งแนวทาง database-first และ code-first
  • Drizzle ถูกออกแบบโดยคำนึงถึงสภาพแวดล้อมแบบ serverless มีขนาด bundle เล็ก และรองรับ prepared statements

105. Java post-quantum cryptography

  • คอมพิวเตอร์ควอนตัมยังคงพัฒนาอย่างรวดเร็วต่อเนื่อง และบริการแบบ SaaS อย่าง AWS Braket ก็เปิดให้เข้าถึงอัลกอริทึมควอนตัมบนหลายสถาปัตยกรรมแล้ว
  • ตั้งแต่เดือนมีนาคม Java 24 ได้เพิ่ม Java post-quantum cryptography โดยรองรับอัลกอริทึมเข้ารหัสหลังยุคควอนตัมอย่าง ML-KEM และ ML-DSA
  • .Net 10 ก็ขยายการรองรับเช่นกัน
  • คำแนะนำนั้นง่ายมาก: หากคุณกำลังสร้างซอฟต์แวร์ด้วยภาษาเหล่านี้ ก็ควรเริ่มนำอัลกอริทึมที่ปลอดภัยต่อยุคควอนตัมมาใช้ตั้งแต่ตอนนี้เพื่อทำให้ระบบพร้อมสำหรับอนาคต

106. kagent

  • Kagent เป็นเฟรมเวิร์กโอเพนซอร์สสำหรับรัน agentic AI ภายในคลัสเตอร์ Kubernetes
  • ช่วยให้เอเจนต์ที่ใช้ LLM สามารถวางแผนและดำเนินงานด้านปฏิบัติการ เช่น การวินิจฉัยปัญหา การแก้ไขคอนฟิก และการโต้ตอบกับเครื่องมือด้านการมองเห็นระบบ ผ่าน Kubernetes native API และการผสานรวม Model Context Protocol (MCP)
  • เป้าหมายคือการนำ "AgentOps" มาสู่โครงสร้างพื้นฐาน cloud-native ด้วยการผสานการจัดการแบบ declarative เข้ากับการให้เหตุผลแบบอัตโนมัติ
  • ในฐานะโปรเจกต์ CNCF Sandbox ควรนำ Kagent ไปใช้อย่างระมัดระวัง โดยเฉพาะเมื่อพิจารณาถึงความเสี่ยงของการมอบความสามารถด้านการจัดการปฏิบัติการให้กับ LLM และเทคนิคอย่าง toxic flow analysis อาจมีคุณค่าอย่างมากในการประเมินและลดความเสี่ยงเหล่านี้

107. LangExtract

  • LangExtract เป็นไลบรารี Python ที่ใช้ LLM เพื่อดึงข้อมูลแบบมีโครงสร้างจากข้อความที่ไม่มีโครงสร้างตามคำสั่งที่ผู้ใช้กำหนดเอง
  • สามารถประมวลผลเนื้อหาเฉพาะโดเมน เช่น clinical notes และรายงาน เพื่อระบุและจัดระเบียบรายละเอียดสำคัญ โดยยังคงติดตามย้อนกลับแต่ละจุดข้อมูลที่ดึงออกมาไปยังแหล่งที่มาได้
  • เอนทิตีที่ดึงออกมาสามารถส่งออกเป็นไฟล์ .jsonl (รูปแบบมาตรฐานสำหรับข้อมูลโมเดลภาษา) และแสดงผลผ่านอินเทอร์เฟซ HTML แบบโต้ตอบเพื่อทบทวนบริบทได้
  • ทีมได้ประเมิน LangExtract สำหรับการดึงเอนทิตีเพื่อนำไปเติม knowledge graph เฉพาะโดเมน และพบว่ามันมีประสิทธิภาพในการแปลงเอกสารที่ซับซ้อนให้เป็นรูปแบบเชิงโครงสร้างที่เครื่องอ่านได้

108. Langflow

  • Langflow เป็นแพลตฟอร์ม low-code แบบโอเพนซอร์สสำหรับสร้างและทำให้เห็นภาพเวิร์กโฟลว์ของ LLM
  • สร้างอยู่บน LangChain และช่วยให้นักพัฒนาสามารถเชื่อมโยง prompt, tools, vector databases และองค์ประกอบด้าน memory ผ่านอินเทอร์เฟซแบบลากและวาง พร้อมทั้งรองรับโค้ด Python แบบกำหนดเองสำหรับตรรกะขั้นสูง
  • มีประโยชน์อย่างยิ่งสำหรับการทำต้นแบบแอปพลิเคชันเอเจนต์โดยไม่ต้องเขียนโค้ดแบ็กเอนด์ครบทั้งหมด
  • อย่างไรก็ตาม Langflow ยังถือว่าใหม่พอสมควรและยังมีจุดที่ไม่เรียบร้อยอยู่บ้างสำหรับการใช้งานจริงในโปรดักชัน และข้อควรระวังทั่วไปเกี่ยวกับแพลตฟอร์ม low-code ก็ใช้ได้กับกรณีนี้เช่นกัน

109. LMCache

  • LMCache เป็นโซลูชันแคช key-value (KV) สำหรับเร่งโครงสร้างพื้นฐานการให้บริการ LLM
  • มันทำหน้าที่เป็นชั้นแคชเฉพาะทางครอบคลุมทั้งพูลของ inference engine สำหรับ LLM โดยเก็บรายการแคช KV ที่คำนวณไว้ล่วงหน้าสำหรับข้อความที่มีแนวโน้มจะถูกประมวลผลซ้ำหลายครั้ง เช่น ประวัติแชตหรือชุดเอกสาร
  • การคงค่าดังกล่าวไว้บนดิสก์ช่วย offload การคำนวณ prefill ออกจาก GPU เพื่อลด time-to-first-token (TTFT) และลดต้นทุนการอนุมานในเวิร์กโหลดที่ท้าทาย เช่น RAG pipelines, แอปพลิเคชันแชตหลายรอบ และระบบเอเจนต์
  • สามารถผสาน LMCache เข้ากับเซิร์ฟเวอร์อนุมานหลักอย่าง vLLM หรือ NVIDIA Dynamo ได้ และคุ้มค่าที่จะประเมินผลกระทบต่อการตั้งค่า

110. Mem0

  • Mem0 เป็น memory layer ที่ออกแบบมาสำหรับ AI agent
  • แนวทางแบบพื้นฐานมักจะเก็บประวัติการแชตทั้งหมดไว้ในฐานข้อมูลและนำกลับมาใช้ในการสนทนาในอนาคต ซึ่งนำไปสู่การใช้โทเคนมากเกินไป
  • Mem0 เข้ามาแทนที่ด้วยสถาปัตยกรรมที่ซับซ้อนกว่านั้น โดยแยกหน่วยความจำออกเป็นการระลึกระยะสั้นและเลเยอร์ระยะยาวอัจฉริยะที่ดึงและเก็บเฉพาะข้อเท็จจริงและความสัมพันธ์ที่สำคัญ
  • สถาปัตยกรรมนี้ผสาน vector store สำหรับความคล้ายคลึงเชิงความหมายเข้ากับ knowledge graph เพื่อทำความเข้าใจข้อมูลเชิงเวลาและเชิงความสัมพันธ์

111. Open Security Control Assessment Language (OSCAL)

  • Open Security Controls Assessment Language (OSCAL) เป็นรูปแบบการแลกเปลี่ยนข้อมูลแบบเปิดและเครื่องอ่านได้ ที่ออกแบบมาเพื่อเพิ่มระบบอัตโนมัติในการปฏิบัติตามข้อกำหนดและการบริหารความเสี่ยง พร้อมช่วยให้ทีมก้าวพ้นจากแนวทางทำงานด้วยมือที่อิงข้อความ
  • นำโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐฯ (NIST) โดย OSCAL มอบ standard representations in XML, JSON and YAML สำหรับการแสดง security controls ที่เกี่ยวข้องกับเฟรมเวิร์กอุตสาหกรรมอย่าง SOC 2 และ PCI รวมถึงเฟรมเวิร์กภาครัฐอย่าง FedRAMP ของสหรัฐฯ, Cybersecurity Control Catalogue ของสิงคโปร์ และ Information Security Manual ของออสเตรเลีย
  • แม้ OSCAL จะยังไม่ได้รับการยอมรับอย่างแพร่หลายนอกภาครัฐ และระบบนิเวศยังอยู่ระหว่างการพัฒนา แต่เราตื่นเต้นกับศักยภาพของมันในการทำให้การประเมินความปลอดภัยง่ายขึ้น ลดการพึ่งพาสเปรดชีตและการทำงานแบบติ๊กช่อง และเปิดทางให้เกิดการปฏิบัติตามข้อกำหนดแบบอัตโนมัติเมื่อผสานเข้ากับแพลตฟอร์ม compliance-as-code และ continuous compliance

112. OpenInference

  • OpenInference เป็นชุดของข้อกำหนดและปลั๊กอินที่ออกแบบมาเพื่อสังเกตการณ์แอปพลิเคชัน AI โดยทำงานเสริม OpenTelemetry
  • มอบ instrumentation ที่เป็นมาตรฐานสำหรับเฟรมเวิร์กและไลบรารีด้านแมชชีนเลิร์นนิง เพื่อช่วยให้นักพัฒนาติดตามการเรียกใช้ LLM พร้อมบริบทแวดล้อม เช่น การค้นคืนจาก vector store หรือการเรียกใช้เครื่องมือภายนอกไปยัง API และ search engine
  • span สามารถส่งออกไปยังตัวเก็บข้อมูลที่รองรับ OTEL ใดก็ได้ ทำให้สอดคล้องกับ telemetry pipeline ที่มีอยู่เดิม
  • ก่อนหน้านี้เราเคยบลิป Langfuse ซึ่งเป็นแพลตฟอร์มด้าน LLM visibility ที่ใช้งานกันอย่างแพร่หลาย และ OpenInference SDK สามารถบันทึก trace ไปยัง Langfuse และแพลตฟอร์ม visibility อื่น ๆ ที่รองรับ OpenTelemetry ได้

113. Valibot

  • Valibot เป็นไลบรารี schema validation สำหรับ TypeScript
  • เช่นเดียวกับไลบรารี validation ยอดนิยมอื่น ๆ ของ TypeScript อย่าง Zod และ Ajv มันรองรับ type inference แต่สิ่งที่ทำให้แตกต่างคือการออกแบบแบบโมดูลาร์
  • สถาปัตยกรรมนี้ช่วยให้ bundler ทำ tree shaking และ code splitting ได้อย่างมีประสิทธิภาพ จึงรวมเฉพาะฟังก์ชัน validation ที่ถูกใช้งานจริงเท่านั้น
  • Valibot สามารถลดขนาด bundle ได้มากถึง 95% เมื่อเทียบกับ Zod ในสถานการณ์ที่เหมาะสม ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับ schema validation ในสภาพแวดล้อมที่ขนาด bundle สำคัญ เช่น client-side validation หรือฟังก์ชัน serverless

114. Vercel AI SDK

  • Vercel AI SDK เป็นชุดเครื่องมือโอเพนซอร์สแบบฟูลสแตกสำหรับสร้างแอปพลิเคชันและเอเจนต์ที่ขับเคลื่อนด้วย AI ใน ecosystem ของ TypeScript
  • ประกอบด้วยองค์ประกอบหลักสองส่วน: AI SDK Core ทำหน้าที่ทำให้การเรียกใช้ LLM เป็นมาตรฐานโดยไม่ยึดติดกับโมเดล พร้อมรองรับการสร้างข้อความ การสร้างอ็อบเจ็กต์แบบมีโครงสร้าง และการเรียกใช้เครื่องมือ
  • AI SDK UI มีลักษณะคล้าย assistant-ui โดยช่วยลดความซับซ้อนของการพัฒนาฝั่งฟรอนต์เอนด์ใน React, Vue, Next.js และ Svelte ด้วยการสตรีม การจัดการสถานะ และการอัปเดต UI แบบเรียลไทม์
  • สำหรับทีมที่ทำงานอยู่ใน ecosystem ของ TypeScript และ Next.js อยู่แล้ว Vercel AI SDK มอบวิธีที่รวดเร็วและลื่นไหลในการสร้างแอปพลิเคชัน AI พร้อมประสบการณ์ฝั่งไคลเอนต์ที่ครบถ้วน

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น