เปิดตัว Thoughtworks Technology Radar, Volume 33

(thoughtworks.com)

15 คะแนน โดย GN⁺ 2025-11-07 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

แสดงภาพและอธิบายเทรนด์ล่าสุดในหมวด เทคนิค/เครื่องมือ/แพลตฟอร์ม/ภาษาและเฟรมเวิร์กสำหรับการพัฒนา ด้วย 4 ระดับ ได้แก่ Adopt (แนะนำให้นำไปใช้), Trial (ทดลองใช้), Assess (ประเมิน), Hold (ระวัง)
4 ธีมหลัก: การนำ orchestration มาใช้กับโครงสร้างพื้นฐาน AI, การเติบโตของเอเจนต์ที่อิง MCP, เวิร์กโฟลว์การเขียนโค้ดด้วย AI, การเกิดขึ้นของ anti-pattern ด้าน AI

นำ orchestration มาใช้กับ AI infrastructure

เวิร์กโหลด AI กำลังทำให้องค์กรต้องใช้ การ orchestration ของ GPU fleet ขนาดใหญ่ สำหรับการฝึกและการอนุมาน
- เมื่อโมเดลขนาดใหญ่ที่เกินข้อจำกัดของความจุ HBM (80GB) ของ GPU เดี่ยวมีมากขึ้น การฝึกแบบกระจายและการอนุมานแบบหลาย GPU จึงกลายเป็นสิ่งจำเป็น
- ทีมแพลตฟอร์มต้องสร้างไปป์ไลน์หลายขั้นที่ซับซ้อน และปรับ throughput กับ latency อย่างต่อเนื่อง
- ใช้ Nvidia DCGM Exporter ทำ fleet telemetry ระยะไกล และใช้ topology-aware scheduling เพื่อวางงานในตำแหน่งที่มี interconnect bandwidth สูงที่สุด
Kubernetes เป็นรากฐานหลักในการจัดการเวิร์กโหลด AI ในระดับใหญ่ แต่แพลตฟอร์มทางเลือกอย่าง microVM(Firecracker) และ Uncloud ก็ได้รับความสนใจเช่นกัน
- กลยุทธ์การจัดวางที่คำนึงถึงการสื่อสารความเร็วสูงระหว่างลิงก์ GPU เช่น การจัดการคิวและโควตาผ่าน Kueue, topology-aware scheduling, และ gang scheduling กำลังพัฒนาอย่างต่อเนื่อง
- จัดวางงานแบบหลาย GPU ภายใน “island” ของดาต้าเซ็นเตอร์แบบต่อเนื่อง (rack หรือ pod) ที่มีลิงก์ความเร็วสูงระหว่าง GPU เช่น NVLink/NVSwitch และ RDMA
การปรับปรุงล่าสุดของ Kubernetes ในด้าน API ที่รับรู้หลาย GPU และ NUMA ช่วยเสริมความสามารถเหล่านี้ ทั้งการเพิ่มแบนด์วิดท์ระหว่างอุปกรณ์ ลด tail latency และเพิ่มอัตราการใช้งานอย่างมีประสิทธิภาพ
- จากความต้องการเวิร์กโฟลว์การเขียนโค้ดด้วย AI ที่เพิ่มขึ้น และเอเจนต์ที่ดีขึ้นด้วย MCP ทำให้คาดว่าจะเกิดนวัตกรรมอย่างรวดเร็วใน AI infrastructure
- GPU-aware orchestration กำลังกลายเป็นข้อกำหนดพื้นฐาน และ topology กำลังกลายเป็นปัจจัยด้าน scheduling ระดับชั้นหนึ่ง

การเติบโตของเอเจนต์ที่อิง MCP

การเติบโตขึ้นพร้อมกันของ MCP และเอเจนต์ รวมถึงการขยายตัวของระบบนิเวศโปรโตคอลและเครื่องมือที่สร้างรอบสิ่งเหล่านี้ เป็นหัวข้อหลักของ Radar ครั้งนี้
- MCP กำลังวางตัวเป็น โปรโตคอลรวมศูนย์ขั้นสุดท้ายสำหรับการขับเคลื่อนเอเจนต์และการทำงานแบบมีประสิทธิภาพ/กึ่งอัตโนมัติ
ผู้ขายรายใหญ่แทบทั้งหมดกำลังเพิ่มการรองรับ MCP และ เวิร์กโฟลว์ที่มีเอเจนต์เป็นศูนย์กลาง กำลังเติบโตอย่างรวดเร็ว
มีการสังเกตเห็นนวัตกรรมอย่างต่อเนื่องในเวิร์กโฟลว์ของเอเจนต์ และ context engineering กำลังก้าวขึ้นมาเป็นหัวใจของการปรับพฤติกรรมโมเดลและประสิทธิภาพการใช้ทรัพยากรให้เหมาะสมที่สุด
- โปรโตคอลใหม่อย่าง A2A(Agent-to-Agent) และ AG-UI ช่วยลดความซับซ้อนในการสร้างแอปความร่วมมือแบบหลายเอเจนต์
- เทคโนโลยีอย่าง AGENTS.md, Anchoring coding agents, และ Context7 MCP server กำลังถูกนำไปใช้ในเวิร์กโฟลว์การพัฒนาจริง
ด้วยลักษณะของระบบนิเวศ AI ทำให้ใน Radar แต่ละครั้งมีนวัตกรรมใหม่เกิดขึ้นอย่างรวดเร็ว
— ครั้งก่อนคือ RAG ส่วนครั้งนี้คือ เวิร์กโฟลว์ของเอเจนต์ และกลุ่มดาว (constellation) ของเครื่องมือ เทคนิค และแพลตฟอร์มที่เติบโตขึ้นเพื่อรองรับมัน
- และยังมี anti-pattern ด้าน AI ที่น่าจับตาบางส่วนเริ่มปรากฏขึ้น

เวิร์กโฟลว์การเขียนโค้ดด้วย AI

AI กำลังเปลี่ยนวิธีการสร้างและบำรุงรักษาซอฟต์แวร์ และเป็นหัวข้อที่ครองการพูดคุยในช่วงหลัง
- ตั้งแต่ การใช้ AI เพื่อทำความเข้าใจ codebase แบบ legacy ไปจนถึง GenAI สำหรับ forward engineering มันกำลังถูกฝังเชิงกลยุทธ์ตลอดห่วงโซ่มูลค่าของซอฟต์แวร์
- กำลังเรียนรู้วิธีป้อนความรู้ให้ coding agent ได้มีประสิทธิภาพยิ่งขึ้น
ทีมต่าง ๆ กำลังทดลองแนวปฏิบัติใหม่ เช่น การกำหนดคำแนะนำแบบปรับแต่งผ่านไฟล์ AGENTS.md และการผสานกับ MCP server อย่าง Context7 เพื่อดึงเอกสาร dependency ล่าสุด
- มีการตระหนักมากขึ้นว่า AI ควรช่วยเพิ่มศักยภาพไม่ใช่แค่ผู้มีส่วนร่วมรายบุคคล แต่รวมถึง ทั้งทีม
- คำแนะนำร่วมที่ผ่านการคัดสรร และ คำสั่งแบบกำหนดเอง จึงเริ่มเกิดขึ้นเพื่อรับประกันการกระจายความรู้อย่างเท่าเทียม
ภูมิทัศน์ของเครื่องมือกำลังพัฒนาอย่างคึกคัก:
- นักออกแบบใช้ UX Pilot และ AI Design Reviewer ขณะที่นักพัฒนาใช้ v0 และ Bolt เพื่อสร้างต้นแบบอย่างรวดเร็วผ่าน self-service UI prototyping
- การถกเถียงเกี่ยวกับ spec-driven development ยังคงดำเนินต่อไป ทั้งเรื่องขอบเขต ระดับความละเอียด และความเป็นไปได้ที่จะทำหน้าที่เป็นแหล่งความจริงหนึ่งเดียวสำหรับการส่งมอบแบบค่อยเป็นค่อยไป
- แม้จะมีความตื่นเต้น แต่ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ยังเป็นข้อกังวลร่วมอยู่เสมอ เป็นการย้ำว่า AI อาจเร่งงานวิศวกรรมได้ แต่การตัดสินใจของมนุษย์ยังคงขาดไม่ได้

การเกิดขึ้นของ anti-pattern ด้าน AI แบบใหม่

การเร่งนำ AI ไปใช้ทั่วทั้งอุตสาหกรรมทำให้ anti-pattern ที่กำลังเกิดขึ้นใหม่ เริ่มปรากฏควบคู่ไปกับแนวปฏิบัติที่มีประสิทธิภาพ
- แม้จะยอมรับประโยชน์ที่ชัดเจนของแนวคิดอย่าง self-service UI prototyping แบบใช้ครั้งคราวด้วย GenAI แต่ก็รับรู้ถึงศักยภาพที่จะพาองค์กรไปสู่ anti-pattern ของ Shadow IT ที่เร่งโดย AI
- เมื่อ MCP(Model Context Protocol) ได้รับความสนใจ หลายทีมกลับตกอยู่ใน anti-pattern ของ การแปลง API-to-MCP แบบไร้เดียงสา
ประสิทธิผลของโซลูชัน Text-to-SQL ไม่เป็นไปตามความคาดหวังช่วงแรก และ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ก็ยังเป็นข้อกังวลที่เกี่ยวข้องต่อเนื่อง
- แม้แต่ในแนวปฏิบัติใหม่อย่าง spec-driven development ก็ยังมีความเสี่ยงที่จะย้อนกลับไปสู่ anti-pattern ของวิศวกรรมซอฟต์แวร์แบบดั้งเดิม
  — โดยเฉพาะอคติต่อการทำสเปกล่วงหน้ามากเกินไปและการปล่อยแบบบิ๊กแบง
GenAI กำลังพัฒนาในความเร็วและขนาดที่ไม่เคยมีมาก่อน จึงคาดว่า anti-pattern ใหม่จะเกิดขึ้นอย่างรวดเร็ว
- ทีมงานจำเป็นต้องระวังรูปแบบที่ช่วงแรกดูมีประสิทธิภาพ แต่เมื่อเวลาผ่านไปกลับทำให้ประสิทธิภาพลดลง ทำให้ feedback ช้าลง บั่นทอนความสามารถในการปรับตัว หรือทำให้ความรับผิดชอบไม่ชัดเจน

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

แนวปฏิบัติที่ทำให้มั่นใจว่ากระบวนการพัฒนาซอฟต์แวร์และเทคโนโลยีจะยังคงเป็นไปตามมาตรฐานด้านกฎระเบียบและความปลอดภัยอย่างต่อเนื่องผ่านระบบอัตโนมัติ
ผสานเครื่องมือ policy-as-code อย่าง Open Policy Agent และสร้าง SBOM ภายใน CD pipeline เพื่อให้ตรวจพบและแก้ไขปัญหาด้าน compliance ตั้งแต่ระยะต้นตามแนวทาง SLSA
เมื่อแปลงกฎและแนวปฏิบัติที่ดีเป็นโค้ด ก็สามารถบังคับใช้มาตรฐานได้อย่างสม่ำเสมอทั่วทั้งทีมโดยไม่เกิดคอขวด
เมื่อความเสี่ยงจากความชะล่าใจต่อโค้ดที่ AI สร้างขึ้นเพิ่มขึ้น การฝัง compliance ไว้ในกระบวนการพัฒนาจึงสำคัญกว่าที่เคย

2. Curated shared instructions for software teams

สำหรับทีมที่ใช้ AI อย่างจริงจังในการส่งมอบซอฟต์แวร์ กำลังขยับจากการ prompting แบบรายบุคคลไปสู่คำแนะนำร่วมที่ผ่านการคัดสรร
วิธีนำไปใช้ที่ตรงไปตรงมาที่สุดคือการ commit ไฟล์คำแนะนำอย่าง AGENTS.md ลงใน project repository โดยตรง
เครื่องมือเขียนโค้ดด้วย AI ส่วนใหญ่ เช่น Cursor, Windsurf, Claude Code รองรับการแชร์คำแนะนำผ่าน custom slash command หรือ workflow
ทันทีที่ prompt ได้รับการปรับปรุง ทั้งทีมก็จะได้รับประโยชน์ พร้อมรับประกันการเข้าถึงคำแนะนำ AI ที่ดีที่สุดอย่างสม่ำเสมอ

3. Pre-commit hooks

Git hooks มีมานานแล้ว แต่ก็ยังถูกใช้งานไม่เต็มที่
การเติบโตของการเขียนโค้ดแบบมี AI ช่วยและ agent coding ทำให้ความเสี่ยงในการ commit ความลับหรือโค้ดที่มีปัญหาโดยไม่ตั้งใจเพิ่มขึ้น
แม้จะมีกลไกตรวจสอบโค้ดมากมาย เช่น continuous integration แต่ pre-commit hook คือมาตรการป้องกันที่เรียบง่ายและมีประสิทธิภาพซึ่งควรมีทีมจำนวนมากขึ้นนำไปใช้
แนวทางที่ดีที่สุดคือทำให้มันเรียบง่ายและมีเป้าหมายชัดเจน โดยมุ่งเน้นความเสี่ยงที่ตรวจจับได้มีประสิทธิภาพที่สุดในขั้นตอนนี้ของเวิร์กโฟลว์ เช่น การสแกนหาความลับ

4. การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซี

การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซีช่วยเร่งการทำความเข้าใจระบบขนาดใหญ่ที่ซับซ้อนได้อย่างมาก
เครื่องมืออย่าง Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ช่วยสนับสนุนการทำให้กฎทางธุรกิจปรากฏชัด การสรุปตรรกะ และการระบุการพึ่งพา
เมื่อใช้ร่วมกับเฟรมเวิร์กแบบเปิดและการพรอมป์ต LLM โดยตรง จะช่วยลดเวลาที่ใช้ในการทำความเข้าใจโค้ดเบสแบบเลกาซีได้อย่างมาก
ความพยายามในการตั้งค่าแนวทางขั้นสูงอย่าง GraphRAG จะแตกต่างกันไป โดยเฉพาะตามขนาดและความซับซ้อนของโค้ดเบสที่วิเคราะห์ แต่ผลกระทบต่อประสิทธิภาพการทำงานนั้นสม่ำเสมอและมีนัยสำคัญ

Trial

5. AGENTS.md

รูปแบบทั่วไปสำหรับให้คำแนะนำแก่ AI coding agent ที่ทำงานในโปรเจ็กต์
โดยพื้นฐานแล้วคือไฟล์ README สำหรับเอเจนต์ และไม่มีฟิลด์หรือฟอร์แมตบังคับนอกเหนือจาก Markdown
อาศัยความสามารถของ coding agent ที่ใช้ LLM ในการตีความคำแนะนำที่มนุษย์เขียนและอ่านได้
การใช้งานโดยทั่วไปมักรวมถึงเคล็ดลับการใช้เครื่องมือในสภาพแวดล้อมการเขียนโค้ด คำแนะนำในการทดสอบ และแนวปฏิบัติที่ต้องการสำหรับการจัดการ commit

6. AI สำหรับ code migration

การย้ายโค้ดมีได้หลายรูปแบบ ตั้งแต่การเขียนใหม่ทั้งภาษาไปจนถึงการอัปเกรด dependency หรือเฟรมเวิร์ก และมักต้องใช้แรงงานแบบแมนนวลนานหลายเดือน
ทีมที่อัปเกรด เวอร์ชัน .NET framework กำลังทดลองใช้ AI เพื่อย่นระยะกระบวนการ
ในอดีตมีการใช้เครื่องมือ refactoring แบบกำหนดกฎเชิงกำหนดแน่นอนอย่าง OpenRewrite ขณะที่การใช้ AI เพียงอย่างเดียวอาจมีค่าใช้จ่ายสูงและทำให้บทสนทนาออกนอกทางได้ง่าย
แทนที่จะมอบหมายการอัปเกรดทั้งหมด กระบวนการถูกแยกเป็นขั้นตอนย่อยที่เล็กลงและตรวจสอบได้ เช่น การวิเคราะห์ข้อผิดพลาดในการคอมไพล์ การสร้าง migration diff และการตรวจสอบการทดสอบแบบวนซ้ำ
กรณีศึกษาในอุตสาหกรรมอย่าง int32-to-int64 migration ขนาดใหญ่ของ Google ก็สะท้อนแนวโน้มคล้ายกัน

7. Delta Lake liquid clustering

เทคโนโลยีสำหรับตาราง Delta Lake ที่ทำหน้าที่เป็นทางเลือกแทน partitioning และ Z-ordering
ในอดีต การเพิ่มประสิทธิภาพการอ่านของตาราง Delta จำเป็นต้องกำหนด partition และคีย์ Z-order ตั้งแต่ตอนสร้างตาราง โดยอิงตามรูปแบบคิวรีที่คาดการณ์ไว้
liquid clustering ใช้อัลกอริทึมแบบ tree-based ในการจัดกลุ่มข้อมูลตามคีย์ที่ระบุ
สามารถเปลี่ยนแปลงแบบค่อยเป็นค่อยไปได้โดยไม่ต้องเขียนข้อมูลทั้งหมดใหม่ จึงให้ความยืดหยุ่นมากขึ้นในการรองรับรูปแบบคิวรีที่หลากหลาย
Databricks Runtime for Delta Lake รองรับ liquid clustering อัตโนมัติผ่านการวิเคราะห์เวิร์กโหลดคิวรีในอดีต การระบุคอลัมน์ที่เหมาะสมที่สุด และการจัดกลุ่มข้อมูลตามนั้น

8. การทำ UI prototype แบบ self-serve ด้วย GenAI

เครื่องมืออย่าง Claude Code, Figma Make, Miro AI, v0 ช่วยให้ผู้จัดการผลิตภัณฑ์สร้างต้นแบบแบบโต้ตอบได้และนำไปทดสอบกับผู้ใช้ได้โดยตรงจาก text prompt
แทนที่จะสร้าง wireframe ด้วยมือ ทีมสามารถสร้างอาร์ติแฟกต์ HTML, CSS, JS ที่ใช้งานได้ภายในไม่กี่นาที
ต้นแบบแบบ "ใช้แล้วทิ้ง" เหล่านี้แลกความประณีตกับการเรียนรู้ที่รวดเร็ว จึงเหมาะอย่างยิ่งสำหรับการตรวจสอบเบื้องต้นระหว่าง design sprint
ความสมจริงที่สูงขึ้นอาจนำไปสู่การโฟกัสผิดจุดในรายละเอียด หรือความคาดหวังที่ไม่สมจริงต่อความพยายามระดับโปรดักชัน จึงจำเป็นต้องมีการกำหนดกรอบและบริหารความคาดหวังอย่างชัดเจน

9. Structured output จาก LLMs

แนวปฏิบัติในการจำกัดให้ LLM สร้างคำตอบในรูปแบบที่กำหนดไว้ล่วงหน้า เช่น JSON หรือคลาสของภาษาโปรแกรมเฉพาะ
เป็นสิ่งจำเป็นต่อการสร้างแอปพลิเคชันระดับโปรดักชันที่เชื่อถือได้ เพราะช่วยแปลงข้อความที่โดยทั่วไปคาดเดาได้ยากของ LLM ให้เป็นสัญญาข้อมูลที่เครื่องอ่านได้และกำหนดแน่นอนได้
มีแนวทางหลากหลาย ตั้งแต่การจัดฟอร์แมตด้วยพรอมป์ตแบบง่ายและ model-native structured outputs ไปจนถึงวิธี constrained decoding ที่แข็งแรงกว่าโดยใช้เครื่องมืออย่าง Outlines และ Instructor
ถูกใช้อย่างประสบความสำเร็จในการดึงข้อมูลที่ซับซ้อนและไม่มีโครงสร้างจากเอกสารหลายประเภท แล้วแปลงเป็น JSON ที่มีโครงสร้างสำหรับ business logic ขั้นปลาย

10. TCR (Test && Commit || Revert)

เวิร์กโฟลว์การเขียนโปรแกรมที่ต่อยอดจากการพัฒนาแบบ test-driven โดยใช้กฎง่าย ๆ เพื่อส่งเสริมการทำงานเป็นขั้นเล็ก ๆ อย่างต่อเนื่อง
หลังการเปลี่ยนแปลงแต่ละครั้ง หากการทดสอบผ่าน การเปลี่ยนแปลงจะถูก commit และหากล้มเหลว การเปลี่ยนแปลงจะถูกย้อนกลับ
นำไปใช้งานได้ไม่ยาก เพราะเพียงแค่กำหนดสคริปต์ที่ทำให้วงจรนี้เป็นอัตโนมัติภายในโค้ดเบส
TCR ซึ่งถูกแนะนำครั้งแรกใน article อย่างเป็นทางการของ Kent Beck ช่วยเสริมแนวปฏิบัติการเขียนโค้ดเชิงบวกอย่าง YAGNI และ KISS

Assess

11. AI-powered UI testing

ใน Radar ก่อนหน้านี้ การทดสอบ UI ที่ขับเคลื่อนด้วย AI มุ่งเน้นไปที่ exploratory testing เป็นหลัก และมีการกล่าวว่า non-determinism ของ LLM อาจก่อให้เกิดความไม่เสถียร
ด้วยการเติบโตของ MCP, เฟรมเวิร์กทดสอบ UI หลักอย่าง Playwright และ Selenium ได้นำ MCP server ของตนเองมาใช้ (playwright-mcp, mcp-selenium)
ด้วยการทำ browser automation ที่เชื่อถือได้ผ่านเทคโนโลยีเนทีฟ ทำให้ coding assistant สามารถสร้างการทดสอบ UI ที่เชื่อถือได้ใน Playwright หรือ Selenium
มีความตื่นเต้นกับความคืบหน้าอย่าง Playwright Agents ในรีลีส Playwright ล่าสุด และคาดว่าจะได้เห็นแนวทางที่ใช้งานได้จริงมากขึ้นพร้อมประสบการณ์จากภาคสนาม

12. การยึด coding agents เข้ากับ reference application

ก่อนหน้านี้เราเคยใส่ blip ให้กับแพตเทิร์น tailored service templates ซึ่งช่วยให้องค์กรที่นำไมโครเซอร์วิสมาใช้สามารถบูตสแตรปบริการใหม่และผสานเข้ากับโครงสร้างพื้นฐานเดิมได้อย่างราบรื่น
เมื่อเวลาผ่านไป เมื่อมี dependency, framework และแพตเทิร์นสถาปัตยกรรมใหม่ ๆ เกิดขึ้น ก็มีแนวโน้มที่ code drift ระหว่างเทมเพลตเหล่านี้กับบริการเดิมจะเพิ่มมากขึ้น
ในยุคของ coding agent เรากำลังทดลอง anchoring coding agents to a reference application เพื่อรักษาแนวปฏิบัติที่ดีและความสอดคล้องของสถาปัตยกรรม
เซิร์ฟเวอร์ Model Context Protocol (MCP) สามารถเปิดเผยทั้งโค้ดเทมเพลตอ้างอิงและ commit diff เพื่อให้เอเจนต์ตรวจจับ drift และเสนอแนวทางแก้ไขได้

13. Context engineering

การออกแบบและเพิ่มประสิทธิภาพข้อมูลที่ป้อนให้ LLM อย่างเป็นระบบระหว่างการอนุมาน เพื่อให้สร้างผลลัพธ์ที่ต้องการได้อย่างสม่ำเสมอ
ครอบคลุมการจัดโครงสร้าง การคัดเลือก และการจัดลำดับขององค์ประกอบบริบท เช่น prompt, ข้อมูลที่ดึงมา, memory, คำสั่ง และสัญญาณจากสภาพแวดล้อม
ต่างจาก prompt engineering ที่เน้นเฉพาะถ้อยคำใน prompt, context engineering พิจารณาองค์ประกอบของบริบททั้งหมด
ปัจจุบันวิศวกรใช้เทคนิคย่อยที่หลากหลาย ซึ่งจัดกลุ่มได้เป็น 3 ด้าน: Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

เทคนิคเกิดใหม่ในการทำให้ระบบเลกาซีทันสมัยขึ้น โดยใช้คำอธิบายของ codebase เลกาซีที่สร้างโดย AI
มีการเพิ่มขั้นตอนที่ชัดเจนซึ่งมุ่งเน้นว่าโค้ดเลกาซีทำอะไรอยู่ (สเปก) พร้อมกับจงใจซ่อนวิธีการ implement ในปัจจุบัน
มีความเกี่ยวข้องกับ spec-driven development แต่ประยุกต์ใช้กับการทำระบบเลกาซีให้ทันสมัยโดยเฉพาะ
ตามลูป reverse-engineering → design/solutioning → forward-engineering ทั้งมนุษย์และ AI agent สามารถให้เหตุผลในระดับที่สูงขึ้นได้ก่อนจะ commit ลงไปที่ implementation

15. GraphQL as data access pattern for LLMs

แนวทางเกิดใหม่สำหรับการสร้างชั้นการเข้าถึงข้อมูลที่เป็นแบบเดียวกันและเป็นมิตรต่อโมเดล เพื่อยกระดับ context engineering
สามารถเปิดเผยข้อมูลที่มีโครงสร้างและ query ได้ โดยไม่ต้องให้สิทธิ์โมเดลเข้าถึงฐานข้อมูลโดยตรง
ต่างจาก REST API ที่ต้องมี endpoint หรือ filter ใหม่สำหรับแต่ละ use case, GraphQL ช่วยให้โมเดลดึงเฉพาะข้อมูลที่ต้องการได้
GraphQL schema ที่นิยามไว้อย่างชัดเจนให้ metadata ที่ LLM สามารถใช้อนุมานเกี่ยวกับเอนทิตีและความสัมพันธ์ที่มีอยู่ได้

16. Knowledge flows over knowledge stocks

เรามักถูกถามบ่อย ๆ ว่า “จะปรับปรุงวิธีที่ทีมต่าง ๆ แบ่งปันข้อมูลกันอย่างไร”
แนวคิด knowledge flows and knowledge stocks ซึ่งยืมมาจากการคิดเชิงระบบ เป็นมุมมองที่มีคุณค่า
แนวคิดนี้ส่งเสริมให้มองความรู้ขององค์กรเป็นระบบ โดย stock คือความรู้ที่สะสมไว้ ส่วน flow คือวิธีที่ความรู้เคลื่อนผ่านและพัฒนาไปทั่วทั้งองค์กร
การเพิ่ม flow ของความรู้จากภายนอกเข้าสู่องค์กรมักช่วยกระตุ้นนวัตกรรม และการตั้ง communities of practice เป็นวิธีที่พิสูจน์แล้วว่าช่วยปรับปรุง flow ได้

17. LLM as a judge

การใช้ LLM เป็นผู้ตัดสินเพื่อประเมินผลลัพธ์ของระบบอื่น ๆ (โดยทั่วไปคือ generator ที่อิง LLM) ได้รับความสนใจจากศักยภาพในการทำ evaluation ของ generative AI แบบอัตโนมัติและขยายขนาดได้
เพื่อสะท้อนความซับซ้อนและความเสี่ยงที่เพิ่งถูกรับรู้ blip นี้จึงถูกย้ายจาก Trial ไปเป็น Assess
การประเมินมีความเปราะบางต่อ position bias, verbosity bias และความทนทานต่ำ ขณะที่ปัญหาที่ร้ายแรงกว่าคือ scaling contamination
เพื่อรับมือกับข้อบกพร่องเหล่านี้ จึงมีการสำรวจเทคนิคที่ดีขึ้น เช่น LLMs as a jury (ใช้หลายโมเดลเพื่อหาฉันทามติ) หรือการใช้เหตุผลแบบ chain-of-thought ระหว่างการประเมิน

18. On-device information retrieval

เทคนิคที่ทำให้การค้นหา, การรับรู้บริบท และ retrieval-augmented generation (RAG) ทำงานได้ทั้งหมดบนอุปกรณ์ของผู้ใช้เอง (มือถือ เดสก์ท็อป หรืออุปกรณ์ edge)
ให้ความสำคัญกับความเป็นส่วนตัวและประสิทธิภาพเชิงคำนวณ โดยผสานฐานข้อมูลโลคัลแบบน้ำหนักเบาเข้ากับโมเดลที่ปรับให้เหมาะกับการอนุมานบนอุปกรณ์
การใช้งานที่มีอนาคตสดใสคือการรวม sqlite-vec (ส่วนขยายของ SQLite ที่รองรับการค้นหาเวกเตอร์ในฐานข้อมูลแบบฝังตัว) กับ EmbeddingGemma (โมเดล embedding ขนาด 300 ล้านพารามิเตอร์ที่อิงสถาปัตยกรรม Gemma 3)
แนะนำให้ประเมินสำหรับแอปพลิเคชันแบบ local-first รวมถึง use case อื่น ๆ ที่ให้ความสำคัญกับอธิปไตยของข้อมูล, latency ต่ำ และความเป็นส่วนตัว

19. SAIF

SAIF (Secure AI Framework) คือเฟรมเวิร์กที่ Google พัฒนาขึ้นเพื่อให้คำแนะนำเชิงปฏิบัติสำหรับการจัดการความเสี่ยงด้านความปลอดภัยของ AI
จัดการภัยคุกคามที่พบบ่อยอย่างเป็นระบบ เช่น data poisoning และ prompt injection ผ่านแผนที่ความเสี่ยงที่ชัดเจน การวิเคราะห์องค์ประกอบ และกลยุทธ์การบรรเทาที่ใช้งานได้จริง
การเน้นไปที่ความเสี่ยงที่เปลี่ยนแปลงอยู่ตลอดของการสร้างระบบ agentic มีความเหมาะสมกับช่วงเวลาและมีคุณค่าเป็นพิเศษ
มอบเพลย์บุ๊กที่กระชับและนำไปใช้ได้จริงสำหรับการเสริมความแข็งแกร่งให้แนวปฏิบัติด้านความปลอดภัยของการใช้ LLM และแอปพลิเคชันที่ขับเคลื่อนด้วย AI

20. Service mesh without sidecar

เนื่องจากต้นทุนและความซับซ้อนในการปฏิบัติการของ service mesh แบบ sidecar ยังคงมีอยู่ เราจึงรู้สึกตื่นเต้นกับตัวเลือก service mesh แบบไม่มี sidecar อย่าง Istio ambient mode
Ambient mode นำเสนอสถาปัตยกรรมแบบแบ่งชั้นที่แยกขอบเขตความรับผิดชอบออกเป็น 2 องค์ประกอบหลัก: L4 proxy ต่อโหนด (ztunnel) และ L7 proxy ต่อ namespace (Waypoint proxy)
ztunnel ช่วยให้มั่นใจว่าทราฟฟิก L3 และ L4 ถูกส่งต่ออย่างมีประสิทธิภาพและปลอดภัย จัดการทั้งการดึงใบรับรองสำหรับทุก identity ของโหนด และการเปลี่ยนเส้นทางทราฟฟิกไปยัง workload ที่รองรับ ambient
Waypoints proxy เป็นองค์ประกอบเสริมของ ambient mode ที่เปิดใช้ความสามารถของ Istio ที่สมบูรณ์ยิ่งขึ้น เช่น การจัดการทราฟฟิก ความปลอดภัย และการมองเห็นระบบ

21. Small language models

สังเกตเห็นพัฒนาการอย่างต่อเนื่องของ small language models (SLMs) ตลอดหลายเล่มของ Technology Radar
ความสนใจที่เพิ่มขึ้นต่อการสร้างโซลูชันเอเจนต์ ทำให้มีหลักฐานเพิ่มขึ้นว่า SLM สามารถขับเคลื่อน agentic AI ได้อย่างมีประสิทธิภาพ
เวิร์กโฟลว์เอเจนต์ส่วนใหญ่ในปัจจุบันมุ่งเน้นงานเฉพาะทางและทำซ้ำที่ไม่ต้องการการให้เหตุผลขั้นสูง จึงเหมาะกับ SLM
การพัฒนาอย่างต่อเนื่องของ SLM เช่น Phi-3, SmolLM2, DeepSeek ทำให้มีความสามารถเพียงพอสำหรับงานลักษณะนี้

22. Spec-driven development

แนวทางเกิดใหม่สำหรับเวิร์กโฟลว์การเขียนโค้ดที่มี AI ช่วยเหลือ โดยคำจำกัดความของคำนี้ยังคงอยู่ระหว่างการพัฒนา
โดยทั่วไปหมายถึงเวิร์กโฟลว์ที่เริ่มจากสเปกฟีเจอร์แบบมีโครงสร้าง จากนั้นค่อยแตกย่อยผ่านหลายขั้นตอนเป็นส่วนย่อย โซลูชัน และงานต่างๆ
Kiro ของ Amazon จะพาผู้ใช้ผ่านเวิร์กโฟลว์ 3 ขั้น ได้แก่ requirements, design และการสร้างงาน
spec-kit ของ GitHub ใช้กระบวนการ 3 ขั้นที่คล้ายกัน แต่เพิ่ม orchestration ที่สมบูรณ์ขึ้น, prompt ที่ปรับแต่งได้ และ "constitution" ที่กำหนดหลักการคงที่ซึ่งต้องปฏิบัติตามเสมอ

23. Team of coding agents

เทคนิคที่นักพัฒนาประสานงาน AI coding agent หลายตัว โดยแต่ละตัวมีบทบาทเฉพาะของตนเอง เช่น architect, back-end specialist และ tester
เครื่องมืออย่าง Claude Code, Roo Code, Kilo Code รองรับ subagent และหลายโหมดการทำงาน
อาศัยหลักการที่พิสูจน์แล้วว่าการกำหนดบทบาทและ persona เฉพาะให้ LLM ช่วยปรับปรุงคุณภาพผลลัพธ์ โดยได้ผลลัพธ์ที่ดีกว่าจากการประสานงานเอเจนต์หลายบทบาท แทนการพึ่งเอเจนต์อเนกประสงค์เพียงตัวเดียว
เป็นสัญญาณของการเปลี่ยนผ่านไปสู่ไปป์ไลน์การพัฒนาที่มี AI ช่วยเหลือแบบหลายขั้นและมีการ orchestration

24. Topology-aware scheduling

GPU และ LPU ไม่ได้เป็นอุปกรณ์เดี่ยวอีกต่อไป แต่เป็นเครือข่ายตัวเร่งความเร็วที่เชื่อมโยงกันแน่นแฟ้น ซึ่งประสิทธิภาพขึ้นอยู่กับการจัดวางและโทโพโลยี
ในระบบระดับแร็กอย่าง NVL72 ของ NVIDIA นั้น GPU 72 ตัวแชร์ VRAM มากกว่า 13TB และทำงานเสมือนเป็นตัวเร่งความเร็วตัวเดียว แต่เมื่อเวิร์กโหลดต้องข้าม switch island งานแบบ collective จะกลายเป็นคอขวด
สถาปัตยกรรมที่กำหนดตารางด้วยซอฟต์แวร์ ณ เวลา compile ของ Groq ตั้งอยู่บนสมมติฐานเรื่องการเคลื่อนย้ายข้อมูลแบบกำหนดแน่นอน และการจัดตารางแบบสุ่มจะทำลายสมมติฐานและความสามารถในการคาดการณ์นี้
ตัวจัดตารางแบบง่ายที่ไม่สนใจโทโพโลยีมักกระจายเวิร์กโหลดแบบมัลติ-GPU แบบตามอำเภอใจ ส่งผลให้เวลาในแต่ละสเต็ปและประสิทธิภาพลดลง

25. Toxic flow analysis for AI

มุกคุ้นหูที่ว่า S ใน MCP ย่อมาจาก "security" กำลังซ่อนปัญหาที่เกิดขึ้นจริงอย่างมาก
เมื่อเอเจนต์สื่อสารกันผ่านการเรียกใช้เครื่องมือหรือ API พวกมันอาจเจอกับสิ่งที่เรียกว่า lethal trifecta ได้อย่างรวดเร็ว: การเข้าถึงข้อมูลส่วนบุคคล, การเปิดรับเนื้อหาที่ไม่น่าเชื่อถือ และความสามารถในการสื่อสารออกสู่ภายนอก
เอเจนต์ที่มีทั้งสามอย่างนี้มีความเปราะบางมาก และเพราะ LLM มีแนวโน้มทำตามคำสั่งในอินพุต เนื้อหาจากแหล่งที่ไม่น่าเชื่อถือซึ่งมีคำสั่งให้รั่วไหลข้อมูลจึงอาจนำไปสู่การรั่วไหลของข้อมูลได้ง่าย
toxic flow analysis จะตรวจสอบกราฟการไหลของระบบเอเจนต์เพื่อระบุเส้นทางข้อมูลที่อาจไม่ปลอดภัยสำหรับการตรวจสอบเพิ่มเติม

Hold

26. AI-accelerated shadow IT

AI ลดอุปสรรคให้คนที่ไม่เขียนโค้ดสามารถสร้างและเชื่อมต่อซอฟต์แวร์ได้ด้วยตนเอง แทนที่จะต้องรอฝ่าย IT
แม้จะตื่นเต้นกับศักยภาพที่สิ่งนี้ปลดล็อก แต่ก็เฝ้าระวังสัญญาณแรกของ AI-accelerated shadow IT
แพลตฟอร์ม no-code สำหรับทำ workflow automation ตอนนี้รองรับการเชื่อมต่อ AI API แล้ว เช่น OpenAI หรือ Anthropic ทำให้เกิดแรงจูงใจในการใช้ AI เป็นเหมือน duct tape เพื่อเชื่อมการบูรณาการที่ก่อนหน้านี้เป็นไปไม่ได้
ขณะเดียวกัน AI coding assistant ก็มีความเป็นเอเจนต์มากขึ้น ทำให้คนที่ไม่เขียนโค้ดแต่ผ่านการฝึกพื้นฐานสามารถสร้างแอปพลิเคชันยูทิลิตีภายในได้

27. Capacity-driven development

หัวใจสำคัญของความสำเร็จในแนวปฏิบัติการพัฒนาซอฟต์แวร์สมัยใหม่คือการคงโฟกัสไว้ที่การไหลของงาน
ทีมแบบ Stream-aligned มุ่งเน้นไปที่สตรีมคุณค่าหนึ่งเดียว เช่น user journey หรือผลิตภัณฑ์ เพื่อส่งมอบคุณค่าแบบ end-to-end ได้อย่างมีประสิทธิภาพ
อย่างไรก็ตาม พบแนวโน้มที่น่ากังวลไปสู่ capacity-driven development ซึ่งทีมที่จัดแนวแบบนี้เมื่อมีความสามารถเหลือ จะไปรับงานฟีเจอร์ของผลิตภัณฑ์หรือสตรีมอื่น
ในระยะสั้นอาจดูมีประสิทธิภาพ แต่เป็นการเพิ่มประสิทธิภาพเฉพาะจุดที่เหมาะกับการรับมือความต้องการพุ่งสูง และหากกลายเป็นเรื่องปกติจะเพิ่มภาระทางความคิดและหนี้ทางเทคนิค

28. Complacency with AI-generated code

เมื่อ AI coding assistant และเอเจนต์ได้รับความสนใจมากขึ้น ก็มีข้อมูลและงานวิจัยเพิ่มขึ้นที่ตอกย้ำความกังวลเรื่อง complacency with AI-generated code
แม้จะมีหลักฐานมากพอว่าเครื่องมือเหล่านี้ช่วยเร่งการพัฒนาได้ แต่งานวิจัยแสดงให้เห็นว่าคุณภาพโค้ดอาจลดลงเมื่อเวลาผ่านไป
งานวิจัย 2024 research ของ GitClear พบว่าโค้ดซ้ำและ code churn เพิ่มขึ้นมากกว่าที่คาดไว้ ขณะที่กิจกรรม refactoring ในประวัติคอมมิตกลับลดลง
งาน research ของ Microsoft กับกลุ่ม knowledge worker แสดงให้เห็นว่าความมั่นใจที่ขับเคลื่อนด้วย AI มักเกิดขึ้นพร้อมกับการลดลงของการคิดเชิงวิพากษ์

29. Naive API-to-MCP conversion

องค์กรต่างๆ ต้องการแปลง API ภายในของตนเป็น Model Context Protocol (MCP) อย่างราบรื่นและตรงไปตรงมา เพื่อให้ AI agent โต้ตอบกับระบบที่มีอยู่ได้
มีเครื่องมือจำนวนเพิ่มขึ้นที่พยายามรองรับการแปลงนี้ เช่น MCP link และ FastAPI-MCP
มีจุดยืนคัดค้าน naive API-to-MCP conversion ลักษณะนี้ เพราะ API มักถูกออกแบบมาสำหรับนักพัฒนามนุษย์ และประกอบด้วยงานย่อยระดับอะตอมที่ละเอียดเกินไป ซึ่งเมื่อ AI นำไปเชื่อมต่อกันอาจทำให้ใช้โทเค็นมากเกินจำเป็น บริบทปนเปื้อน และประสิทธิภาพของเอเจนต์ลดลง
API เหล่านี้ โดยเฉพาะ API ภายใน มักเปิดเผยข้อมูลอ่อนไหวหรืออนุญาตให้ทำงานที่สร้างความเสียหายได้

30. Standalone data engineering teams

การจัดทีมวิศวกรรมข้อมูลแยกต่างหากที่พัฒนาและเป็นเจ้าของ data pipeline และผลิตภัณฑ์ โดยแยกจากโดเมนธุรกิจสตรีมที่ให้บริการ เป็น anti-pattern ที่นำไปสู่ความไม่มีประสิทธิภาพและผลลัพธ์ทางธุรกิจที่อ่อนแอ
โครงสร้างนี้ทำซ้ำความผิดพลาดในอดีตจากการแยกความสามารถด้าน DevOps การทดสอบ หรือการ deploy ออกจากกัน ก่อให้เกิด knowledge silo, คอขวด และการสูญเปล่าของความพยายาม
หากไม่มีการทำงานร่วมกันอย่างใกล้ชิด วิศวกรข้อมูลมักขาดบริบทธุรกิจและโดเมนที่จำเป็นต่อการออกแบบ data product ที่มีความหมาย ทำให้ทั้งการยอมรับใช้งานและคุณค่าถูกจำกัด
ทางเลือกที่ดีกว่าคือให้ทีม data platform มุ่งเน้นการดูแลโครงสร้างพื้นฐานที่ใช้ร่วมกัน และให้ทีมธุรกิจข้ามสายงานสร้างและเป็นเจ้าของ data products ของตนเองตามหลักการ data mesh

31. Text to SQL

Text to SQL ใช้ LLM แปลภาษาธรรมชาติเป็น SQL ที่รันได้ แต่ความน่าเชื่อถือมักยังไม่ถึงระดับที่คาดหวัง
จึงย้าย blip นี้ไปไว้ใน Hold เพื่อไม่แนะนำให้ใช้ใน workflow ที่ไม่มีการกำกับดูแล เช่น การซ่อนเอาต์พุตไว้ หรือการแปลงคิวรีที่ผู้ใช้สร้างขึ้นแบบอัตโนมัติอย่างไดนามิก
ในกรณีเหล่านี้ LLM มักเกิด hallucination เนื่องจากมีความเข้าใจ schema หรือโดเมนอย่างจำกัด ทำให้เสี่ยงต่อการดึงข้อมูลผิดพลาดหรือแก้ไขข้อมูลโดยไม่ตั้งใจ
สำหรับ agentic business intelligence ควรหลีกเลี่ยงการเข้าถึงฐานข้อมูลโดยตรง และใช้ semantic layer สำหรับ data abstraction ที่มีการจัดการแทน เช่น Cube หรือ dbt's semantic layer

[Platforms]

Adopt

32. Arm in the cloud

Arm compute instances บนคลาวด์ได้รับความนิยมมากขึ้นเรื่อย ๆ ในช่วงไม่กี่ปีที่ผ่านมา เพราะมีประสิทธิภาพด้านต้นทุนและพลังงานเมื่อเทียบกับอินสแตนซ์แบบ x86 ดั้งเดิม
ผู้ให้บริการคลาวด์รายใหญ่รวมถึง AWS, Azure และ GCP ต่างก็มีตัวเลือก Arm ที่แข็งแกร่งแล้วในตอนนี้
หลายทีมย้าย workload อย่าง microservices, ฐานข้อมูลโอเพนซอร์ส และแม้แต่ high-performance computing ไปยัง Arm ได้สำเร็จ โดยแทบไม่ต้องแก้โค้ดมากนักและปรับเพียง build script เล็กน้อย
เครื่องมือสมัยใหม่อย่าง multi-arch Docker images ช่วยให้การ build และ deploy บนทั้งสภาพแวดล้อม Arm และ x86 ง่ายขึ้น

Trial

33. Apache Paimon

Apache Paimon เป็นฟอร์แมต data lake แบบโอเพนซอร์สที่ออกแบบมาเพื่อรองรับ lakehouse architecture
ผสานการทำงานได้อย่างราบรื่นกับเอนจินประมวลผลอย่าง Flink และ Spark จึงรองรับทั้งงานสตรีมมิงและงานแบตช์
จุดเด่นสำคัญของสถาปัตยกรรม Paimon คือการผสานระหว่างฟอร์แมต data lake มาตรฐานกับโครงสร้าง LSM (log-structured merge tree)
การผสานนี้ช่วยแก้โจทย์ดั้งเดิมของ data lake เรื่องการอัปเดตประสิทธิภาพสูงและการอ่านที่มี latency ต่ำ

34. DataDog LLM Observability

Datadog LLM Observability ให้ความสามารถด้านการติดตาม มอนิเตอร์ และวินิจฉัยแบบ end-to-end สำหรับ workflow ของ large language model และแอปพลิเคชัน agent
ระบบจะจับคู่แต่ละ prompt, การเรียกใช้เครื่องมือ และขั้นตอนกลางเป็น span และ trace พร้อมติดตาม latency, ปริมาณ token, ข้อผิดพลาด และ metric ด้านคุณภาพ และผสานเข้ากับชุดผลิตภัณฑ์ APM และ observability ที่กว้างขวางของ Datadog
องค์กรที่ใช้ Datadog อยู่แล้วและคุ้นเคยกับโครงสร้างค่าใช้จ่ายของมัน อาจพบว่าความสามารถด้าน LLM observability เป็นวิธีที่ตรงไปตรงมาในการมองเห็น AI workload ตราบใดที่สามารถ instrument workload เหล่านั้นได้
การตั้งค่าและใช้งาน LLM instrumentation ต้องอาศัยความระมัดระวังและความเข้าใจที่ชัดเจนต่อ workload และการนำไปใช้งาน และแนะนำให้วิศวกรข้อมูลกับบุคลากรฝ่ายปฏิบัติการทำงานร่วมกันอย่างใกล้ชิดระหว่างการ deploy

35. Delta Sharing

Delta Sharing เป็นมาตรฐานเปิดและโปรโตคอลสำหรับการแชร์ข้อมูลข้ามแพลตฟอร์มอย่างปลอดภัย ที่พัฒนาโดย Databricks และ Linux Foundation
มีความเป็นอิสระจากคลาวด์ และเปิดให้องค์กรแชร์ข้อมูลแบบ live ข้ามผู้ให้บริการคลาวด์และตำแหน่ง on-premises ได้โดยไม่ต้องคัดลอกหรือทำสำเนาข้อมูล
ใช้ REST API แบบเรียบง่ายเพื่อออก URL ที่มีการ presign แบบระยะสั้น ทำให้ผู้รับสามารถดึงชุดข้อมูลขนาดใหญ่ด้วยเครื่องมืออย่าง pandas, Spark หรือ Power BI
รองรับการแชร์ตารางข้อมูล, view, โมเดล AI และโน้ตบุ๊ก พร้อมมอบความสามารถด้าน governance และ audit แบบรวมศูนย์ที่แข็งแกร่ง

36. Dovetail

Dovetail platform เข้ามาแก้ปัญหาท้าทายที่ดำเนินมาอย่างต่อเนื่องในการจัดการข้อมูลวิจัยเชิงคุณภาพที่กระจัดกระจาย
ให้คลังข้อมูลส่วนกลางสำหรับบทสัมภาษณ์ผู้ใช้ บันทึกถอดความ และ insight ช่วยเปลี่ยนข้อมูลดิบให้เป็นทรัพย์สินที่มีโครงสร้างและวิเคราะห์ได้
มีประโยชน์อย่างยิ่งใน workflow ด้าน product discovery โดยเฉพาะการสร้าง evidence trail ที่เชื่อมคำพูดของลูกค้าและธีมที่สังเคราะห์แล้วเข้ากับสมมติฐานของผลิตภัณฑ์และ ROI ที่คาดไว้โดยตรง
ด้วยวิธีนี้ Dovetail จึงช่วยเสริมบทบาทของข้อมูลเชิงคุณภาพในการตัดสินใจด้านผลิตภัณฑ์

37. Langdock

Langdock เป็นแพลตฟอร์มสำหรับให้องค์กรพัฒนาและรันเอเจนต์ generative AI และ workflow สำหรับการดำเนินงานภายใน
ให้สภาพแวดล้อมแบบรวมศูนย์ที่มีทั้งผู้ช่วยแชตภายใน, API layer สำหรับเชื่อมต่อกับ LLM หลายตัว และเครื่องมือสร้าง agent workflow ที่เชื่อมกับระบบอย่าง Slack, Confluence และ Google Drive
แพลตฟอร์มนี้มีตัวเลือกทั้ง on-premises และการโฮสต์ใน EU พร้อมมาตรฐานด้าน compliance ระดับองค์กร จึงเน้นเรื่อง data sovereignty
องค์กรที่นำ Langdock ไปใช้งานยังคงต้องใส่ใจกับ data governance อย่างมาก และใช้เทคนิคอย่าง toxic flow analysis เพื่อป้องกัน lethal trifecta

38. LangSmith

LangSmith เป็นแพลตฟอร์มแบบโฮสต์จากทีม LangChain ที่ให้ความสามารถด้าน observability, tracing และ evaluation สำหรับแอปพลิเคชัน LLM
มันบันทึก trace อย่างละเอียดของ chain, tool และ prompt ทำให้ทีมสามารถดีบักและวัดพฤติกรรมของโมเดล ติดตาม performance regression และจัดการชุดข้อมูลสำหรับการประเมินได้
LangSmith เป็นแพลตฟอร์ม SaaS แบบ proprietary ที่รองรับ workflow ที่ไม่ใช่ LangChain ได้อย่างจำกัด จึงน่าสนใจที่สุดสำหรับทีมที่ลงทุนกับ ecosystem นี้อยู่แล้ว
การรองรับแบบบูรณาการสำหรับการประเมิน prompt และการทดลองต่าง ๆ นั้นดูสมบูรณ์ยิ่งกว่าเมื่อเทียบกับทางเลือกโอเพนซอร์สอย่าง Langfuse

39. Model Context Protocol (MCP)

Model Context Protocol (MCP) คือมาตรฐานเปิดที่กำหนดวิธีที่แอปพลิเคชันและเอเจนต์ LLM จะผสานรวมกับแหล่งข้อมูลและเครื่องมือภายนอก
MCP แตกต่างจากโปรโตคอล Agent2Agent (A2A) ที่ใช้จัดการการสื่อสารระหว่างเอเจนต์ โดย MCP มุ่งเน้นที่บริบทและการเข้าถึงเครื่องมือ
หลังจาก blip ครั้งก่อน การนำ MCP ไปใช้เพิ่มขึ้นอย่างมาก โดยบริษัทใหญ่ ๆ เช่น JetBrains (IntelliJ) และ Apple ได้เข้าร่วมระบบนิเวศนี้ พร้อมกับเฟรมเวิร์กเกิดใหม่อย่าง FastMCP
มาตรฐาน MCP Registry ที่อยู่ในสถานะพรีวิว ตอนนี้รองรับการค้นหาเครื่องมือทั้งแบบสาธารณะและแบบปิดแล้ว

40. n8n

n8n เป็นแพลตฟอร์มอัตโนมัติเวิร์กโฟลว์ภายใต้ไลเซนส์ fair-code คล้ายกับ Zapier หรือ Make (เดิมชื่อ Integromat) แต่สร้างมาสำหรับนักพัฒนาที่ต้องการตัวเลือกแบบ self-hosted, ขยายต่อได้ และควบคุมด้วยโค้ดได้
มีแนวทางแบบ low-code และภาพกราฟิกสำหรับการสร้างเวิร์กโฟลว์มากกว่า Apache Airflow ขณะเดียวกันก็รองรับโค้ดคัสตอมด้วย JavaScript หรือ Python
กรณีใช้งานหลักคือการรวมหลายบริการเข้าด้วยกันเป็นเวิร์กโฟลว์อัตโนมัติ แต่ก็สามารถเชื่อม LLM เข้ากับแหล่งข้อมูล หน่วยความจำ และเครื่องมือที่กำหนดค่าได้เช่นกัน
หลายทีมใช้ n8n เพื่อทำต้นแบบเวิร์กโฟลว์เอเจนต์อย่างรวดเร็วผ่านแอปแชตหรือเว็บฮุกที่เป็นตัวกระตุ้น และมักใช้ความสามารถ import และ export เพื่อสร้างเวิร์กโฟลว์ด้วยการช่วยเหลือจาก AI

41. OpenThread

OpenThread คืออิมพลีเมนเทชันโอเพนซอร์สของโปรโตคอลเครือข่าย Thread ที่พัฒนาโดย Google
รองรับความสามารถหลักทั้งหมดของข้อกำหนด Thread รวมถึงเลเยอร์เครือข่ายอย่าง IPv6, 6LoWPAN และ LR-WPAN รวมถึงความสามารถด้าน mesh network ที่ทำให้อุปกรณ์ทำงานเป็นทั้งโหนดและ border router ได้
OpenThread ทำงานได้บนฮาร์ดแวร์หลากหลายแพลตฟอร์ม โดยใช้ abstraction layer ที่ยืดหยุ่นและ integration hook ที่ช่วยให้ผู้ผลิตรวมวิทยุและความสามารถด้านการเข้ารหัสของตนเองเข้าไปได้
โปรโตคอลที่เติบโตเต็มที่นี้ถูกใช้แพร่หลายในผลิตภัณฑ์เชิงพาณิชย์ และจากประสบการณ์พบว่าเชื่อถือได้สำหรับการสร้างโซลูชัน IoT ที่หลากหลาย ตั้งแต่อุปกรณ์พลังงานต่ำที่ใช้แบตเตอรี่ไปจนถึงเครือข่ายเซ็นเซอร์ mesh ขนาดใหญ่

Assess

42. AG-UI Protocol

AG-UI คือโปรโตคอลและไลบรารีแบบเปิดที่ออกแบบมาเพื่อทำให้ user interface แบบสมบูรณ์และการสื่อสารระหว่างเอเจนต์เป็นมาตรฐานเดียวกัน
มุ่งเน้นไปที่เอเจนต์ที่ติดต่อกับผู้ใช้โดยตรง และทำให้ใช้งานได้ทั่วไปกับทุก frontend และ backend ผ่านการผสานรวมฝั่ง middleware และ client
โปรโตคอลนี้กำหนดวิธีที่สอดคล้องกันให้เอเจนต์ฝั่ง backend สื่อสารกับแอปพลิเคชันฝั่ง frontend ทำให้เกิดการทำงานร่วมกันแบบเรียลไทม์ที่มีการเก็บสถานะระหว่าง AI กับผู้ใช้มนุษย์ได้
รองรับโปรโตคอลขนส่งหลายแบบ รวมถึง SSE และ WebSockets และมีประเภทอีเวนต์ที่เป็นมาตรฐานเพื่อแสดงสถานะต่าง ๆ ของการทำงานของเอเจนต์

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) คือโปรโตคอลที่กำหนดมาตรฐานสำหรับการสื่อสารและปฏิสัมพันธ์ระหว่างเอเจนต์ในเวิร์กโฟลว์แบบหลายเอเจนต์ที่ซับซ้อน
ใช้ Agent Cards เพื่ออธิบายองค์ประกอบหลักของการสื่อสารระหว่างเอเจนต์ รวมถึงข้อกำหนดด้านการค้นพบความสามารถ การถ่ายโอน และโครงร่างความปลอดภัย
A2A ช่วยเสริม Model Context Protocol (MCP) โดยมุ่งเน้นที่การสื่อสารระหว่างเอเจนต์โดยไม่เปิดเผยรายละเอียดภายใน เช่น สถานะ หน่วยความจำ หรือ internals ของเอเจนต์
โปรโตคอลนี้ส่งเสริมแนวปฏิบัติที่ดี เช่น แนวทางแบบ asynchronous-first สำหรับงานที่ใช้เวลานาน การตอบสนองแบบสตรีมสำหรับอัปเดตแบบค่อยเป็นค่อยไป และการรับส่งข้อมูลอย่างปลอดภัยด้วย HTTPS, authentication และ authorization

44. Amazon S3 Vectors

Amazon S3 Vectors ขยาย S3 object storage ด้วยความสามารถด้านเวกเตอร์แบบเนทีฟ พร้อมฟังก์ชัน vector storage และ similarity search ในตัว
ผสานรวมกับระบบนิเวศ AWS ได้อย่างราบรื่น รวมถึง Amazon Bedrock และ OpenSearch และมีความสามารถเพิ่มเติมอย่างการกรองเมทาดาทาและการกำกับดูแลผ่าน IAM
แม้ยังอยู่ในสถานะพรีวิวและมีข้อจำกัดอยู่ แต่คุณค่าที่นำเสนอนั้นน่าสนใจ — แนวทางด้าน vector storage ที่คุ้มค่าและเข้าถึงได้ง่ายนี้สามารถใช้กับแอปพลิเคชันหลากหลายประเภทที่มีข้อมูลปริมาณมากและไม่ได้กังวลเรื่อง latency ต่ำเป็นหลัก

45. Ardoq

Ardoq คือแพลตฟอร์ม enterprise architecture (EA) ที่ช่วยให้องค์กรสร้าง จัดการ และขยายฐานความรู้ด้านสถาปัตยกรรมเพื่อวางแผนอนาคตได้อย่างมีประสิทธิภาพยิ่งขึ้น
ต่างจากเอกสารแบบคงที่ดั้งเดิมที่มักเกิด drift และแยกเป็นไซโล แนวทางที่ขับเคลื่อนด้วยข้อมูลของ Ardoq จะดึงข้อมูลจากระบบที่มีอยู่เพื่อสร้าง knowledge graph แบบไดนามิกที่คงความทันสมัยตามการเปลี่ยนแปลงของ landscape
ความสามารถที่มีประโยชน์อย่างยิ่งคือ Ardoq Scenarios ซึ่งใช้แนวทาง branching และ merging คล้าย Git เพื่อสร้างแบบจำลองและกำหนดสถานะอนาคตแบบ what-if ได้ในเชิงภาพ
องค์กรที่กำลังผลักดันการเปลี่ยนผ่านด้านสถาปัตยกรรมควรประเมินแพลตฟอร์ม EA เฉพาะทางอย่าง Ardoq เพื่อดูศักยภาพในการทำให้กระบวนการนี้ง่ายและเร็วขึ้น

46. CloudNativePG

CloudNativePG คือ Kubernetes Operator ที่ช่วยทำให้การโฮสต์และจัดการคลัสเตอร์ PostgreSQL แบบ high availability บน Kubernetes ง่ายขึ้น
การรันบริการแบบ stateful อย่าง PostgreSQL บน Kubernetes อาจซับซ้อน เพราะต้องมีความรู้เชิงลึกทั้งเรื่อง Kubernetes และการทำ replication ของ PostgreSQL
CloudNativePG ซ่อนความซับซ้อนส่วนใหญ่ไว้ด้วยการปฏิบัติต่อคลัสเตอร์ PostgreSQL ทั้งหมดเป็นรีซอร์ซเชิงประกาศเดียวที่กำหนดค่าได้
มีสถาปัตยกรรม primary/standby ที่ราบรื่นด้วย native streaming replication และมาพร้อมความสามารถด้าน high availability ตั้งแต่ต้น เช่น self-healing, automatic failover ที่โปรโมต replica ที่ตามทันที่สุด และการสร้าง replica ที่ล้มเหลวขึ้นมาใหม่โดยอัตโนมัติ

47. Coder

Coder คือแพลตฟอร์มที่ช่วย provision สภาพแวดล้อมการเขียนโค้ดแบบมาตรฐานได้อย่างรวดเร็ว ตามแนวปฏิบัติ development environments in the cloud ที่กล่าวถึงก่อนหน้านี้
เมื่อเทียบกับเครื่องมือที่คล้ายกันอย่าง Gitpod (ปัจจุบันรีแบรนด์เป็น Ona) และ GitHub Codespaces, Coder ให้การควบคุมการปรับแต่ง workstation ได้มากกว่าผ่าน Terraform
โฮสต์ workstation บนโครงสร้างพื้นฐานของคุณเองในคลาวด์หรือดาต้าเซ็นเตอร์ แทนที่จะใช้เซิร์ฟเวอร์ของผู้ขาย
แนวทางนี้ให้ความยืดหยุ่นมากขึ้น รวมถึงความสามารถในการรันเอเจนต์เขียนโค้ด AI และเข้าถึงระบบภายในขององค์กร

48. Graft

Graft คือเอนจินทรานแซกชันสตอเรจที่ทำให้การซิงก์ข้อมูลที่มีความสอดคล้องกันสูงและมีประสิทธิภาพเป็นไปได้ในสภาพแวดล้อมแบบ edge และแบบกระจาย
ใช้ lazy replication เพื่อซิงก์ข้อมูลเฉพาะเมื่อจำเป็น, ใช้ partial replication เพื่อลดการใช้แบนด์วิดท์ และใช้ serializable snapshot isolation เพื่อรับประกันความถูกต้องของข้อมูล
แม้ Radar จะเคยกล่าวถึง Electric สำหรับกรณีใช้งานที่คล้ายกัน แต่ Graft มีความโดดเด่นตรงที่เปลี่ยน object storage ให้เป็นระบบทรานแซกชันที่รองรับการอัปเดตระดับเพจอย่างสอดคล้อง โดยไม่บังคับรูปแบบข้อมูล
เหมาะสำหรับขับเคลื่อนแอปพลิเคชันมือถือแบบ local-first, จัดการการซิงก์ข้ามแพลตฟอร์มที่ซับซ้อน และทำหน้าที่เป็นแกนหลักของ replica แบบ stateless ในระบบ serverless หรือ embedded

49. groundcover

groundcover คือแพลตฟอร์ม observability แบบ cloud-native ที่รวม logs, traces, metrics และเหตุการณ์ของ Kubernetes ไว้ในหน้าต่างเดียว
ใช้ eBPF เพื่อเก็บข้อมูล observability แบบละเอียดด้วย zero-code instrumentation โดยไม่ต้องแทรกเอเจนต์หรือ SDK ลงในโค้ดแอปพลิเคชัน
eBPF sensor ของ groundcover ทำงานบนโหนดเฉพาะของแต่ละคลัสเตอร์ที่ถูกมอนิเตอร์ และทำงานแยกจากแอปพลิเคชันที่มันเฝ้าสังเกต
ความสามารถหลักประกอบด้วย observability ระดับเคอร์เนลเชิงลึก, bring-your-own-cloud (BYOC) architecture เพื่อความเป็นส่วนตัวของข้อมูล และโมเดลราคาที่ไม่ขึ้นกับปริมาณข้อมูลเพื่อให้คาดการณ์ค่าใช้จ่ายได้

50. Karmada

Karmada ("Kubernetes Armada") คือแพลตฟอร์มสำหรับ orchestration เวิร์กโหลดข้ามหลาย Kubernetes คลัสเตอร์, คลาวด์ และดาต้าเซ็นเตอร์
ปัจจุบันหลายทีมยังคงผสานเครื่องมือ GitOps อย่าง Flux หรือ ArgoCD เข้ากับสคริปต์แบบคัสตอมเพื่อดีพลอยทั่วทั้งคลัสเตอร์ ดังนั้นโซลูชันที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะจึงเป็นที่ต้อนรับ
Karmada ใช้ Kubernetes-native API จึงไม่จำเป็นต้องแก้ไขแอปพลิเคชันที่สร้างไว้แล้วสำหรับสภาพแวดล้อม cloud-native
มีความสามารถด้าน scheduling ขั้นสูงสำหรับการจัดการแบบ multi-cloud, high availability, disaster recovery และ traffic scheduling

51. OpenFeature

เมื่อธุรกิจขยายตัว การจัดการ feature flag มักซับซ้อนขึ้นเรื่อยๆ และทีมต่างๆ ต้องการ abstraction layer ที่ไปไกลกว่า feature toggle แบบพื้นฐานที่สุด
OpenFeature มอบเลเยอร์นี้ผ่านข้อกำหนด API ที่เป็นกลางต่อผู้ให้บริการและขับเคลื่อนโดยชุมชน เพื่อสร้างมาตรฐานให้กับวิธีที่ feature flag ถูกนิยามและถูกใช้งาน
CLI รองรับการนิยามสคีมาหลากหลายอย่างกว้างขวาง ตั้งแต่การตั้งค่าพื้นฐานด้วย environment variable หรือ in-memory configuration ไปจนถึงแพลตฟอร์มที่成熟แล้วอย่าง ConfigCat หรือ LaunchDarkly
อย่างไรก็ตาม ยังมีข้อควรระวังสำคัญอยู่ข้อหนึ่ง: ทีมควรแยกจัดการ categories of flags แต่ละประเภทอย่างมีวินัย เพื่อหลีกเลี่ยงการเพิ่มจำนวน flag เกินควบคุม, ความซับซ้อนของแอปพลิเคชัน และภาระการทดสอบที่มากเกินไป

52. Oxide

การสร้างและปฏิบัติการโครงสร้างพื้นฐานแบบ private มีความซับซ้อน และนี่คือหนึ่งในเหตุผลหลักที่ public cloud กลายเป็นตัวเลือกเริ่มต้นสำหรับองค์กรส่วนใหญ่
แต่สำหรับผู้ที่จำเป็นต้องใช้ Oxide มอบทางเลือกที่ประกอบและบูรณาการทั้งฮาร์ดแวร์และซอฟต์แวร์ขึ้นมาใหม่ตั้งแต่ต้น
ให้บริการแร็กที่ประกอบสำเร็จล่วงหน้าซึ่งมีทั้งคอมพิวต์ เครือข่าย และสตอเรจ พร้อมรัน system software ที่บูรณาการอย่างสมบูรณ์
ทีมสามารถจัดการทรัพยากรผ่าน IaaS API ของ Oxide โดยใช้ Terraform และเครื่องมืออัตโนมัติอื่นๆ ซึ่งเป็นสิ่งที่ Oxide เรียกว่าโครงสร้างพื้นฐานแบบยืดหยุ่น on-premises

53. Restate

Restate คือแพลตฟอร์มสำหรับ persistent execution ที่ออกแบบมาเพื่อแก้โจทย์ระบบกระจายที่ซับซ้อนเมื่อสร้างแอปพลิเคชันแบบ stateful และ fault-tolerant
ผ่าน execution journaling แพลตฟอร์มจะบันทึกทุกขั้นตอนเพื่อรับประกัน fault tolerance, การกู้คืนที่เชื่อถือได้ และการสื่อสารระหว่างบริการแบบ exactly-once
ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของแพลตฟอร์มคือการแยก application logic ออกเป็นบริการแบบ persistent สามประเภท: Basic Services สำหรับฟังก์ชันแบบ stateless, Virtual Objects สำหรับจำลองเอนทิตีแบบ concurrent ที่มีสถานะ, และ Workflows สำหรับ orchestration กระบวนการหลายขั้นตอนที่ซับซ้อน
กำลังประเมิน Restate อย่างรอบคอบในระบบประกันภัยขนาดใหญ่ และจนถึงตอนนี้พึงพอใจกับประสิทธิภาพอย่างมาก

54. SkyPilot

SkyPilot คือแพลตฟอร์มโอเพนซอร์สสำหรับรันและสเกลเวิร์กโหลด AI ทั้ง on-premises หรือบนคลาวด์
SkyPilot ซึ่งพัฒนาโดย Sky Computing Lab แห่ง UC Berkeley ทำหน้าที่เป็น intelligent broker ที่ค้นหาและ provision GPU ที่ถูกที่สุดและพร้อมใช้งานโดยอัตโนมัติบนคลาวด์รายใหญ่และ Kubernetes คลัสเตอร์ ซึ่งมักช่วยลดต้นทุนคอมพิวต์ได้
สำหรับทีมโครงสร้างพื้นฐาน มันช่วยทำให้การรัน AI บน Kubernetes ง่ายขึ้นด้วยความสะดวกในการใช้งานแบบ Slurm, ความแข็งแกร่งแบบ cloud-native, การเข้าถึง pod โดยตรงผ่าน SSH และความสามารถอย่าง gang scheduling และการรองรับ multi-cluster
รองรับการสเกลเวิร์กโหลดฝึกสอนหรืออนุมานได้อย่างราบรื่น

55. StarRocks

StarRocks คือฐานข้อมูลเชิงวิเคราะห์ที่นิยามใหม่ของ business intelligence แบบเรียลไทม์ โดยผสานความเร็วของระบบ OLAP แบบดั้งเดิมเข้ากับความยืดหยุ่นของ data lakehouse สมัยใหม่
บรรลุ query latency ต่ำกว่า 1 วินาทีในระดับขนาดใหญ่ด้วย SIMD-optimized execution engine, column store และ cost-based optimizer ที่ซับซ้อน
สถาปัตยกรรมประสิทธิภาพสูงนี้ทำให้ผู้ใช้สามารถรันวิเคราะห์ที่ซับซ้อนกับรูปแบบข้อมูลแบบเปิดอย่าง Apache Iceberg ได้โดยตรง โดยไม่ต้องคำนวณล่วงหน้าหรือคัดลอกข้อมูล
แม้จะมีหลายแพลตฟอร์มในพื้นที่นี้ แต่ StarRocks ถูกมองว่าเป็นตัวเลือกที่แข็งแกร่งสำหรับโซลูชันที่คุ้มค่า ซึ่งต้องรองรับทั้ง concurrency ระดับสูงมากและความสดใหม่ของข้อมูลล่าสุดอย่างสม่ำเสมอ

56. Uncloud

Uncloud คือเครื่องมือ orchestration และ clustering สำหรับคอนเทนเนอร์แบบน้ำหนักเบา ที่ช่วยให้นักพัฒนานำแอปพลิเคชัน Docker Compose ขึ้นสู่ production ได้
มอบประสบการณ์ที่เรียบง่ายและให้ความรู้สึกเหมือนคลาวด์โดยไม่มี operational overhead แบบ Kubernetes
สามารถสเกลข้ามหลายเครื่องและดีพลอยแบบไม่มี downtime ได้ ด้วยการตั้งค่า mesh network ที่ปลอดภัยด้วย WireGuard สำหรับการสื่อสารโดยอัตโนมัติ และใช้ reverse proxy ของ Caddy เพื่อให้มี HTTPS อัตโนมัติและ load balancing
ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของ Uncloud คือการออกแบบแบบกระจายศูนย์อย่างสมบูรณ์ ซึ่งตัดความจำเป็นของ central control plane ออกไป และรับประกันว่าการทำงานของคลัสเตอร์จะยังคงใช้งานได้แม้เครื่องบางเครื่องจะออฟไลน์

[Tools]

Adopt

57. ClickHouse

ClickHouse คือฐานข้อมูล OLAP แบบ distributed และโอเพนซอร์สสำหรับการวิเคราะห์แบบเรียลไทม์
เติบโตเป็นเอนจินที่มีประสิทธิภาพสูงมากและสเกลได้ดีสำหรับรองรับการวิเคราะห์ข้อมูลขนาดใหญ่
ด้วย incremental materialized views, query engine ที่มีประสิทธิภาพ และการบีบอัดข้อมูลที่แข็งแกร่ง ทำให้เหมาะอย่างยิ่งกับ interactive queries
การรองรับ approximate aggregate functions ในตัวช่วยให้สามารถเลือกระหว่างความแม่นยำกับประสิทธิภาพได้ ซึ่งมีประโยชน์อย่างยิ่งสำหรับการวิเคราะห์ข้อมูลที่มี cardinality สูง

58. NeMo Guardrails

NeMo Guardrails คือชุดเครื่องมือโอเพนซอร์สจาก NVIDIA ที่ช่วยเพิ่มกลไกความปลอดภัยและการควบคุมแบบโปรแกรมได้ให้กับแอปพลิเคชันสนทนาที่ขับเคลื่อนด้วย LLM ได้อย่างง่ายดาย
ช่วยกำหนดและบังคับใช้กฎพฤติกรรมเพื่อให้มั่นใจว่าเอาต์พุตมีความปลอดภัย ตรงประเด็น และเป็นไปตามข้อกำหนด
นักพัฒนาใช้ Colang ซึ่งเป็นภาษาที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะ เพื่อสร้าง conversation flow ที่ยืดหยุ่น จัดการบทสนทนา และบังคับใช้เส้นทางกับขั้นตอนการปฏิบัติงานที่กำหนดไว้ล่วงหน้า
NeMo Guardrails มี asynchronous-first API เพื่อประสิทธิภาพ และรองรับ guardrails สำหรับความปลอดภัยของเนื้อหา ความมั่นคงปลอดภัย ตลอดจนการปรับแต่งอินพุตและเอาต์พุต

59. pnpm

นับตั้งแต่ Radar ครั้งก่อน เรายังคงได้รับคำติชมเชิงบวกเกี่ยวกับ pnpm จากทีมอย่างต่อเนื่อง
pnpm เป็นตัวจัดการแพ็กเกจสำหรับ Node.js ที่ให้ประสิทธิภาพดีขึ้นอย่างมากเมื่อเทียบกับทางเลือกอื่น ทั้งในด้านความเร็วและประสิทธิภาพการใช้พื้นที่ดิสก์
รองรับการเพิ่มประสิทธิภาพระดับไฟล์แบบ incremental โดยทำ hard link ให้แพ็กเกจที่ซ้ำกันจากโฟลเดอร์ node_modules ของหลายโปรเจ็กต์ไปยังตำแหน่งเดียวบนดิสก์ ซึ่งช่วยเพิ่มประสิทธิภาพได้อีก
pnpm กลายเป็นตัวเลือกเริ่มต้นสำหรับการจัดการแพ็กเกจของ Node.js เพราะให้วงจร feedback ที่เร็วขึ้นมากโดยมีปัญหาความเข้ากันได้เพียงเล็กน้อย

60. Pydantic

Pydantic เป็นไลบรารี Python สำหรับกำหนดโมเดลข้อมูลด้วย type hint มาตรฐาน และบังคับใช้ schema ของข้อมูลในขณะรันไทม์
เดิมที type annotation ถูกเพิ่มเข้ามาใน Python เพื่อการวิเคราะห์แบบสถิต แต่ความหลากหลายที่เพิ่มขึ้นทำให้ถูกนำไปใช้อย่างกว้างขวางขึ้น รวมถึงการตรวจสอบความถูกต้องในขณะรันไทม์
สร้างขึ้นบน Rust core ที่รวดเร็ว จึงให้ความสามารถในการตรวจสอบข้อมูล การแยกวิเคราะห์ และการทำ serialization ได้อย่างมีประสิทธิภาพ
กลายเป็นสิ่งจำเป็นในแอปพลิเคชัน LLM และโดยทั่วไปใช้เทคนิค structured output from LLMs เพื่อจัดการกับธรรมชาติที่คาดเดาไม่ได้ของ LLM

Trial

61. AI Design Reviewer

AI Design Reviewer เป็นปลั๊กอิน Figma สำหรับทำ design audit หรือ heuristic evaluation และรวบรวม feedback ที่นำไปปฏิบัติได้กับดีไซน์เดิมหรือดีไซน์ใหม่
การตรวจประเมินครอบคลุมทั้ง UX critique, ความไม่สอดคล้องของ UI, ช่องว่างด้านการเข้าถึง, คุณภาพของเนื้อหา และสถานการณ์ edge case
นอกจากการระบุปัญหาแล้ว ยังให้คำแนะนำที่รับรู้บริบทของโดเมนซึ่งช่วยให้ทีมสร้างภาษาการออกแบบร่วมกันและเหตุผลเบื้องหลังการเลือกดีไซน์
ทีมใช้ AI Design Reviewer เพื่อวิเคราะห์ดีไซน์แบบ legacy โดยระบุทั้งประสบการณ์เชิงบวกที่ควรรักษาไว้และประสบการณ์เชิงลบที่ควรแก้ไข เพื่อใช้ประกอบการกำหนดเป้าหมาย UX สำหรับการออกแบบใหม่

62. Barman

Barman (Backup and Recovery Manager) เป็นเครื่องมือโอเพนซอร์สสำหรับจัดการการสำรองข้อมูลและการกู้คืนจากภัยพิบัติของเซิร์ฟเวอร์ PostgreSQL
ช่วยทำให้การสร้าง physical backup ง่ายขึ้นผ่านวิธีการที่หลากหลาย จัดระเบียบด้วยแค็ตตาล็อกที่ครอบคลุม และรองรับกระบวนการกู้คืนจากภัยพิบัติทั้งหมดด้วยการกู้คืนข้อมูลตามจุดเวลาไปยังเซิร์ฟเวอร์ที่กำลังทำงานอยู่
พบว่า Barman ทั้งทรงพลังและใช้งานง่าย และประทับใจอย่างมากกับความเร็วของการกู้คืนตามจุดเวลาระหว่างกิจกรรมการย้ายระบบ
ยังทำงานกับการสำรองข้อมูลตามกำหนดเวลาได้ดี และมีความสามารถในการจัดการการตั้งค่าด้านการจัดตารางและการเก็บรักษาที่ซับซ้อนและผสมผสานกัน

63. Claude Code

Claude Code ของ Anthropic เป็นเครื่องมือ AI coding แบบ agentic ที่มีอินเทอร์เฟซภาษาธรรมชาติและโมเดลการทำงานแบบเอเจนต์สำหรับวางแผนและลงมือทำเวิร์กโฟลว์หลายขั้นตอนที่ซับซ้อน
แม้จะเปิดตัวมาไม่ถึงหนึ่งปี แต่ก็ถูกนำไปใช้กันอย่างแพร่หลายแล้วในหมู่นักพัฒนาทั้งภายในและภายนอก Thoughtworks จึงถูกจัดไว้ใน Trial
มีการเปิดตัว coding agent แบบคอนโซลอย่าง Codex CLI ของ OpenAI, Gemini CLI ของ Google และ OpenCode แบบโอเพนซอร์ส ขณะที่ผู้ช่วยแบบอยู่บน IDE อย่าง Cursor, Windsurf และ GitHub Copilot ตอนนี้ก็มี agent mode แล้ว
เราเห็นทีมต่าง ๆ ใช้มันไม่เพียงเพื่อเขียนและแก้ไขโค้ด แต่ยังใช้เป็น AI agent อเนกประสงค์สำหรับจัดการสเปก สตอรี การตั้งค่า โครงสร้างพื้นฐาน และเอกสารด้วย

64. Cleanlab

ในแนวคิด data-centric AI การปรับปรุงคุณภาพของชุดข้อมูลมักให้ผลด้านประสิทธิภาพมากกว่าการจูนโมเดลเอง
Cleanlab เป็นไลบรารี Python แบบโอเพนซอร์สที่ออกแบบมาเพื่อแก้ปัญหานี้ โดยระบุปัญหาข้อมูลทั่วไป เช่น การติดป้ายกำกับผิด outlier และข้อมูลซ้ำ ในชุดข้อมูลข้อความ รูปภาพ ตาราง และเสียง ได้โดยอัตโนมัติ
Cleanlab สร้างขึ้นบนหลักการของ confident learning โดยใช้ความน่าจะเป็นของการคาดการณ์จากโมเดลเพื่อประเมิน label noise และวัดคุณภาพข้อมูลเชิงปริมาณ
แนวทางที่ไม่ขึ้นกับโมเดลนี้ช่วยให้นักพัฒนาวินิจฉัยและแก้ไขข้อผิดพลาดของชุดข้อมูล จากนั้นฝึกโมเดลใหม่เพื่อเพิ่มความทนทานและความแม่นยำ

65. Context7

Context7 เป็นเซิร์ฟเวอร์ MCP ที่แก้ปัญหาความไม่ถูกต้องของโค้ดที่สร้างโดย AI
ในขณะที่ LLM พึ่งพาข้อมูลฝึกที่ล้าสมัย Context7 ช่วยให้แน่ใจว่าสามารถสร้างโค้ดที่ถูกต้อง ทันสมัย และตรงกับเวอร์ชันของไลบรารีและเฟรมเวิร์กที่ใช้ในโปรเจ็กต์
มันดึงเอกสารล่าสุดและตัวอย่างโค้ดที่ใช้งานได้จริงโดยตรงจาก source repository ของเฟรมเวิร์ก แล้วฉีดเข้าไปใน context window ของ LLM ในจังหวะที่ทำ prompting
จากประสบการณ์ Context7 ช่วยลดอาการหลอนของโค้ดและการพึ่งพาข้อมูลฝึกที่ล้าสมัยได้อย่างมาก

66. Data Contract CLI

Data Contract CLI เป็นเครื่องมือบรรทัดคำสั่งแบบโอเพนซอร์สที่ออกแบบมาสำหรับการทำงานกับสเปก Data Contract
ช่วยให้สามารถสร้างและแก้ไข data contract ได้ และที่สำคัญคือสามารถตรวจสอบข้อมูลเทียบกับสัญญาได้ ซึ่งจำเป็นต่อการรับประกันความถูกต้องครบถ้วนและคุณภาพของ data product
CLI รองรับ schema definition ได้อย่างกว้างขวางหลายแบบ เช่น Avro, SQL DDL และ Open Data Contract Standard และยังสามารถเปรียบเทียบเวอร์ชันของสัญญาหลายเวอร์ชันเพื่อตรวจจับ breaking change ได้ทันที
พบว่ามีประโยชน์อย่างยิ่งต่อการทำให้ contract governance ระหว่าง data product ต่าง ๆ ใช้งานได้จริงผ่านการผสานรวมกับ CI/CD โดยเฉพาะในบริบทของ data mesh

67. Databricks Assistant

Databricks Assistant เป็นเครื่องมือเชิงสนทนาที่ขับเคลื่อนด้วย AI และผสานรวมอยู่ในแพลตฟอร์ม Databricks โดยตรง ทำหน้าที่เป็น pair programmer ตามบริบทสำหรับผู้เชี่ยวชาญด้านข้อมูล
ต่างจากผู้ช่วยเขียนโค้ดทั่วไป มันได้เปรียบจากความเข้าใจพื้นฐานเกี่ยวกับสภาพแวดล้อม Databricks และบริบทข้อมูล รวมถึงเมทาดาทาจาก Unity Catalog
Assistant ทำได้มากกว่าการสร้าง code snippet โดยสามารถเขียนคำสั่ง SQL และ Python แบบหลายขั้นตอนที่ซับซ้อน วินิจฉัยข้อผิดพลาด และให้คำอธิบายอย่างละเอียดที่อิงกับเวิร์กสเปซนั้น ๆ
สำหรับองค์กรที่ลงทุนกับ ecosystem ของ Databricks อยู่แล้ว มันสามารถเร่งประสิทธิภาพการทำงานและลดอุปสรรคในการเริ่มต้นงานข้อมูลที่ซับซ้อนได้

68. Hoppscotch

Hoppscotch เป็นเครื่องมือโอเพนซอร์สน้ำหนักเบาสำหรับการพัฒนา ดีบัก ทดสอบ และแชร์ API
รองรับหลายโปรโตคอล รวมถึง HTTP, GraphQL และ WebSocket และมีไคลเอนต์ข้ามแพลตฟอร์มสำหรับสภาพแวดล้อมเว็บ เดสก์ท็อป และ CLI
แม้พื้นที่ของเครื่องมือ API จะมีทางเลือกอย่าง Postman, Insomnia และ Bruno อยู่หนาแน่น แต่ Hoppscotch โดดเด่นด้วยขนาดที่เบาและการออกแบบที่เป็นมิตรต่อความเป็นส่วนตัว
มันตัดระบบ analytics ออก ใช้ local-first storage และรองรับ self-hosting จึงเป็นตัวเลือกที่แข็งแกร่งสำหรับองค์กรที่มองหาวิธีแชร์ API script อย่างเป็นธรรมชาติ พร้อมรักษาความเป็นส่วนตัวของข้อมูลไว้อย่างเข้มแข็ง

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter เป็นเครื่องมือโอเพนซอร์สที่ช่วยให้ทีมมอนิเตอร์การเทรน GPU แบบกระจายศูนย์ในระดับขนาดใหญ่ได้
มันแปลง telemetry แบบ proprietary ของ NVIDIA Data Center GPU Manager (DCGM) ให้อยู่ในรูปแบบเปิดที่เข้ากันได้กับระบบมอนิเตอร์มาตรฐาน
เปิดเผยเมตริกแบบเรียลไทม์ที่สำคัญจากทั้ง GPU และโฮสต์เซิร์ฟเวอร์ เช่น การใช้งาน GPU อุณหภูมิ พลังงาน และจำนวนข้อผิดพลาด ECC
การมองเห็นระดับนี้เป็นสิ่งจำเป็นสำหรับองค์กรที่ทำการ fine-tune LLM แบบกำหนดเองหรือรันงานเทรนระยะยาวที่ใช้ GPU หนัก

70. RelationalAI

เมื่อมีการนำเข้าข้อมูลปริมาณมากและหลากหลายเข้าสู่ Snowflake ความสัมพันธ์เฉพาะตัวและกฎโดยนัยภายในข้อมูลนั้นอาจไม่ชัดเจน
RelationalAI ที่สร้างขึ้นเป็น Snowflake Native App ช่วยให้ทีมสามารถสร้างโมเดลที่ซับซ้อนเพื่อจับแนวคิดที่มีความหมาย กำหนดเอนทิตีทางธุรกิจหลัก และฝังตรรกะที่ซับซ้อนไว้กับตาราง Snowflake ได้โดยตรง
ด้วย Graph Reasoner อันทรงพลัง ผู้ใช้สามารถสร้าง วิเคราะห์ และแสดงภาพกราฟความรู้เชิงสัมพันธ์บนพื้นฐานของโมเดลเหล่านี้ได้
สำหรับองค์กรที่ต้องจัดการชุดข้อมูลขนาดใหญ่ซึ่งเปลี่ยนแปลงอย่างรวดเร็ว การสร้างกราฟความรู้อาจเป็นสิ่งจำเป็นต่อการมอนิเตอร์เชิงรุกล่วงหน้าและการสร้างข้อมูลเชิงลึกที่ลึกขึ้นและนำไปใช้ได้จริง

71. UX Pilot

UX Pilot เป็นเครื่องมือ AI ที่รองรับหลายขั้นตอนของกระบวนการออกแบบ UX ตั้งแต่การทำ wireframing ไปจนถึงการออกแบบภาพความละเอียดสูงและการรีวิว
รองรับอินพุตทั้งข้อความและภาพ และสามารถสร้างหน้าจอ โฟลว์ และเลย์เอาต์ได้โดยอัตโนมัติ
ฟีเจอร์ Autoflow สร้างการเปลี่ยนผ่านของ user flow และ Deep Design ช่วยสร้างผลลัพธ์ที่สมบูรณ์และละเอียดมากขึ้น
UX Pilot ยังมีปลั๊กอิน Figma สำหรับส่งออกดีไซน์ที่สร้างขึ้นไปปรับแต่งต่อภายในเครื่องมือออกแบบมาตรฐาน

72. v0

v0 ได้พัฒนาต่อจากตอนที่ถูกแนะนำครั้งล่าสุดใน Radar
ตอนนี้มี design mode ที่ช่วยให้ผู้จัดการผลิตภัณฑ์สามารถสร้างและปรับแต่ง UI prototype แบบ self-service ได้ง่ายขึ้น
รุ่นล่าสุดได้เพิ่มโมเดลของตัวเองที่มี context window ขนาดใหญ่และความสามารถแบบ multimodal ทำให้ v0 สามารถสร้างและปรับปรุง UI ได้จากทั้งอินพุตข้อความและภาพ
อีกส่วนเสริมที่น่าสนใจคือ agent mode ซึ่งช่วยให้ระบบสามารถแยกงานที่ซับซ้อนออกเป็นส่วนย่อยและเลือกโมเดลที่เหมาะสมสำหรับแต่ละงานได้

Assess

73. Augment Code

Augment Code เป็น AI coding assistant ที่ให้การสนับสนุนโดยรับรู้บริบทเชิงลึกสำหรับโค้ดเบสขนาดใหญ่
โดดเด่นด้วย context engineering ขั้นสูงที่ช่วยให้อัปเดตดัชนีโค้ดและค้นหาได้อย่างรวดเร็ว แม้โค้ดจะมีการเปลี่ยนแปลงบ่อยครั้ง
Augment รองรับโมเดลอย่าง Claude Sonnet 4 และ 4.5 รวมถึง GPT-5 ผสานการทำงานกับ GitHub, Jira และ Confluence และรองรับ Model Context Protocol (MCP) เพื่อการทำงานร่วมกับเครื่องมือภายนอก
ให้คำแนะนำแบบเป็นขั้นตอนสำหรับการเปลี่ยนแปลงโค้ดเบสที่ซับซ้อน ตั้งแต่การรีแฟกเตอร์และอัปเกรด dependency ไปจนถึงการอัปเดตสคีมา

74. Azure AI Document Intelligence

Azure AI Document Intelligence (เดิมชื่อ Form Recognizer) ดึงข้อความ ตาราง และคู่คีย์-ค่าออกจากเอกสารที่ไม่มีโครงสร้าง แล้วแปลงเป็นข้อมูลที่มีโครงสร้าง
ใช้โมเดล deep learning ที่ฝึกไว้ล่วงหน้าเพื่อตีความเลย์เอาต์และความหมาย และสามารถฝึก custom model สำหรับรูปแบบเฉพาะได้ผ่านอินเทอร์เฟซแบบ no-code
หนึ่งในทีมรายงานว่า ADI ช่วยลดการป้อนข้อมูลด้วยมือได้อย่างมาก ปรับปรุงความถูกต้องของข้อมูล และเร่งการทำรายงาน ส่งผลให้ตัดสินใจบนพื้นฐานข้อมูลได้เร็วขึ้น
เช่นเดียวกับ Amazon Textract และ Google Document AI เครื่องมือนี้มอบการประมวลผลเอกสารระดับองค์กรด้วยความสามารถในการเข้าใจเลย์เอาต์ที่แข็งแกร่ง

75. Docling

Docling เป็นไลบรารี Python และ TypeScript แบบโอเพนซอร์สสำหรับการประมวลผลเอกสารขั้นสูงของข้อมูลที่ไม่มีโครงสร้าง
แก้ปัญหา "last mile" ที่มักถูกมองข้ามในการแปลงเอกสารจริง เช่น PDF และ PowerPoint ให้เป็นรูปแบบที่สะอาดและเครื่องอ่านได้
ต่างจากตัวแยกข้อมูลแบบดั้งเดิม Docling ใช้แนวทางที่อิง computer vision เพื่อตีความเลย์เอาต์เอกสารและโครงสร้างเชิงความหมาย ทำให้เอาต์พุตมีคุณค่าอย่างยิ่งสำหรับไปป์ไลน์ retrieval-augmented generation (RAG)
แปลงเอกสารที่ซับซ้อนเป็นรูปแบบที่มีโครงสร้าง เช่น JSON หรือ Markdown เพื่อรองรับเทคนิคอย่าง structured output from LLMs

76. E2B

E2B เป็นเครื่องมือโอเพนซอร์สสำหรับรันโค้ดที่ AI สร้างขึ้นภายใน sandbox ที่ปลอดภัยและแยกขาดในคลาวด์
เอเจนต์สามารถใช้ sandbox เหล่านี้ซึ่งสร้างอยู่บน microVM ของ Firecracker เพื่อรันโค้ดอย่างปลอดภัย วิเคราะห์ข้อมูล ทำวิจัย หรือใช้งาน virtual machine ได้
สิ่งนี้ช่วยให้สามารถสร้างและดีพลอย AI agent ระดับองค์กรได้ พร้อมทั้งมีการควบคุมสภาพแวดล้อมการรันและความปลอดภัยอย่างเต็มรูปแบบ

77. Helix editor

มีการฟื้นกลับมาบ้างของ text editor แบบเรียบง่ายที่มุ่งมาแทนที่ Vim ซึ่งเป็นของโปรดบนบรรทัดคำสั่ง
Helix เป็นหนึ่งในคู่แข่งของพื้นที่ที่คับคั่งนี้ ร่วมกับ Neovim และ Kakoune ที่เพิ่งได้รับความสนใจ
Helix นิยามตัวเองแบบขำ ๆ ว่าเป็น post-modern text editor และสิ่งที่ดึงดูดความสนใจของเราตั้งแต่แรกคือฟีเจอร์อย่างหลายเคอร์เซอร์ การรองรับ Tree-sitter และการรองรับ Language Server Protocol (LSP) ที่รวมมาในตัว
มีการพัฒนาอย่างต่อเนื่องพร้อมระบบปลั๊กอินที่กำลังดำเนินอยู่ และโดยรวมเป็น modal editor น้ำหนักเบาที่ให้ความรู้สึกคุ้นเคยกับผู้ใช้ Vim แต่เพิ่มความสะดวกสมัยใหม่บางอย่างเข้ามา

78. Kueue

Kueue เป็นคอนโทรลเลอร์แบบ Kubernetes-native สำหรับคิวงานที่ใช้จัดการโควตาและการใช้ทรัพยากร
มี API สำหรับจัดการเวิร์กโหลด Kubernetes ที่มีลำดับความสำคัญและความต้องการทรัพยากรแตกต่างกัน และทำหน้าที่เป็นตัวจัดการระดับงานที่ตัดสินใจว่าจะอนุญาตหรือนำงานออกเมื่อใด
Kueue ถูกออกแบบมาเพื่อการจัดการทรัพยากรอย่างมีประสิทธิภาพ การจัดลำดับความสำคัญของงาน และการตั้งเวลาแบบขั้นสูง ช่วยเพิ่มประสิทธิภาพการรันเวิร์กโหลดในสภาพแวดล้อม Kubernetes โดยเฉพาะเวิร์กโหลด ML ที่ใช้เครื่องมืออย่าง Kubeflow
มันไม่ได้มาแทนที่ cluster-autoscaler และ kube-scheduler แต่ทำงานร่วมกัน โดยมุ่งเน้นที่การอนุญาตงานตามลำดับ โควตา ลำดับความสำคัญ และการรับรู้โทโพโลยี

79. MCPScan.ai

MCPScan.ai เป็นสแกนเนอร์ความปลอดภัยสำหรับเซิร์ฟเวอร์ Model Context Protocol (MCP) ที่ทำงานได้สองโหมดคือ scan และ proxy
ในโหมด scan จะวิเคราะห์การตั้งค่าและคำอธิบายของเครื่องมือเพื่อตรวจหาช่องโหว่ที่รู้จัก เช่น prompt injection, tool poisoning และ toxic flows
ในโหมด proxy, MCPScan.ai ทำหน้าที่เป็นสะพานเชื่อมระหว่างระบบเอเจนต์กับเซิร์ฟเวอร์ MCP และคอยตรวจสอบทราฟฟิกรันไทม์อย่างต่อเนื่อง
โหมดนี้ยังบังคับใช้กฎความปลอดภัยและ guardrail แบบกำหนดเอง รวมถึงการตรวจสอบการเรียกใช้เครื่องมือ การตรวจจับ PII และข้อจำกัดด้านการไหลของข้อมูลด้วย

80. oRPC

oRPC (OpenAPI Remote Procedure Call) มอบ API แบบ type-safe ครบวงจรใน TypeScript พร้อมทั้งสอดคล้องกับข้อกำหนด OpenAPI อย่างสมบูรณ์
สามารถสร้างข้อกำหนด OpenAPI แบบสมบูรณ์ได้โดยอัตโนมัติ ช่วยให้การผสานรวมและการจัดทำเอกสารง่ายขึ้น
ขณะที่ทางเลือกอย่าง tRPC และ ElysiaJS มักต้องนำเฟรมเวิร์กใหม่มาใช้เพื่อให้ได้ type safety แต่ oRPC สามารถผสานรวมกับเฟรมเวิร์ก Node.js เดิมได้อย่างราบรื่น รวมถึง Express, Fastify, Hono, Next.js
ความยืดหยุ่นนี้ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับทีมที่ต้องการนำ end-to-end type safety มาใช้กับ API เดิมโดยไม่ต้องรีแฟกเตอร์ครั้งใหญ่

81. Power user for dbt

Power user for dbt คือส่วนขยายสำหรับ Visual Studio Code ที่ผสานรวมโดยตรงกับทั้งสภาพแวดล้อม dbt และ dbt Cloud
เนื่องจาก dbt ยังคงเป็นหนึ่งในเครื่องมือที่เราชื่นชอบ สิ่งใดก็ตามที่ช่วยปรับปรุงการใช้งานจึงเป็นส่วนเสริมที่ระบบนิเวศนี้ยินดีต้อนรับ
ก่อนหน้านี้นักพัฒนาต้องพึ่งพาเครื่องมือหลายตัวนอก IDE เพื่อตรวจสอบโค้ด SQL หรือดู lineage ของโมเดล
ส่วนขยายนี้ทำให้ความสามารถเหล่านั้นถูกฝังอยู่ใน VS Code แล้ว พร้อมมี code autocompletion, ผลลัพธ์คิวรีแบบเรียลไทม์, และการแสดง lineage ของโมเดลและคอลัมน์แบบภาพ

82. Serena

Serena คือชุดเครื่องมือเขียนโค้ดที่ทรงพลัง ซึ่งมอบความสามารถคล้าย IDE สำหรับการค้นหาและแก้ไขโค้ดเชิงความหมายให้กับ coding agent อย่าง Claude Code
ด้วยการทำงานในระดับสัญลักษณ์และความเข้าใจโครงสร้างเชิงความสัมพันธ์ของโค้ด Serena จึงช่วยเพิ่มประสิทธิภาพด้านโทเคนได้อย่างมาก
แทนที่จะต้องอ่านทั้งไฟล์หรือพึ่งการแทนที่สตริงแบบหยาบ ๆ coding agent สามารถใช้เครื่องมือ Serena ที่แม่นยำอย่าง find_symbol, find_referencing_symbols, insert_after_symbol เพื่อค้นหาและแก้ไขโค้ดได้
แม้ผลกระทบจะเล็กน้อยในโปรเจกต์ขนาดเล็ก แต่เมื่อ codebase ใหญ่ขึ้น ประสิทธิภาพลักษณะนี้จะมีคุณค่ามาก

83. SweetPad

ส่วนขยาย SweetPad ช่วยให้นักพัฒนาสามารถใช้ VS Code หรือ Cursor สำหรับวงจรชีวิตการพัฒนาแอปพลิเคชัน Swift บนแพลตฟอร์ม Apple ได้ครบถ้วน
โดยรวมเครื่องมือสำคัญอย่าง xcodebuild, xcode-build-server, swift-format เข้าไว้ด้วยกัน จึงไม่จำเป็นต้องสลับไปใช้ Xcode ตลอดเวลา
นักพัฒนาสามารถจัดการ simulator, deploy ไปยังอุปกรณ์, รวมถึง build, run และ debug แอป Swift สำหรับ iOS, macOS และ watchOS ได้จากใน IDE โดยตรงโดยไม่ต้องเปิด Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) คือชุดเครื่องมือที่กำลังพัฒนาสำหรับวิเคราะห์โค้ดเมนเฟรม HLASM (High-Level Assembler)
พัฒนาโดย Thoughtworker และมีความสามารถอย่างการพาร์ส, การสร้าง control flow graph, การติดตาม dependency, และการแสดง flowchart
เราได้กล่าวถึงมานานแล้วว่าพื้นที่เมนเฟรมขาดแคลนเครื่องมือแบบเปิดและขับเคลื่อนโดยชุมชน โดยตัวเลือกส่วนใหญ่เป็นซอฟต์แวร์กรรมสิทธิ์หรือผูกกับ ecosystem ของผู้ขาย
Tape/Z ช่วยอุดช่องว่างนี้ด้วยการมอบความสามารถด้านการวิเคราะห์ที่เข้าถึงได้และเขียนสคริปต์ได้

[Languages and Frameworks]

Adopt

85. Fastify

เรายังคงมีประสบการณ์เชิงบวกกับ Fastify อย่างต่อเนื่อง — เว็บเฟรมเวิร์กสำหรับ Node.js ที่รวดเร็ว ไม่ยัดเยียดแนวทาง และมี overhead ต่ำ
มีความสามารถสำคัญทั้งหมดที่เว็บเฟรมเวิร์กขนาดเล็กควรมี รวมถึงการพาร์ส การตรวจสอบความถูกต้อง การซีเรียลไลซ์ ตลอดจนระบบปลั๊กอินที่แข็งแกร่งและการสนับสนุนจากชุมชนที่ดี
ทีมไม่พบข้อเสียสำคัญของ Fastify เมื่อเทียบกับทางเลือกอย่าง Express.js และยังได้ประโยชน์ด้านประสิทธิภาพที่วัดผลได้ ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการพัฒนาเว็บแบบมินิมัลบน Node.js

86. LangGraph

LangGraph คือ orchestration framework สำหรับสร้างแอปพลิเคชัน multi-agent แบบมีสถานะโดยใช้ LLM
มอบ primitive ระดับล่างอย่าง node และ edge พร้อมความสามารถในตัวที่ให้ผู้พัฒนาควบคุม agent workflow, การจัดการหน่วยความจำ, และการคงอยู่ของสถานะได้อย่างละเอียด
ซึ่งหมายความว่านักพัฒนาสามารถเริ่มจากกราฟสำเร็จรูปแบบง่าย ๆ แล้วขยายไปสู่สถาปัตยกรรมเอเจนต์ที่ซับซ้อนและพัฒนาเปลี่ยนแปลงได้
ด้วยการรองรับรูปแบบความทนทาน เช่น streaming, การจัดการ context ขั้นสูง, model fallback, และการจัดการข้อผิดพลาดของเครื่องมือ LangGraph จึงช่วยสร้างแอปพลิเคชันเอเจนต์ระดับ production ที่แข็งแกร่งได้

87. vLLM

vLLM คือ inference engine สำหรับ LLM ที่มี throughput สูงและใช้หน่วยความจำอย่างมีประสิทธิภาพ ซึ่งสามารถรันได้ทั้งบนคลาวด์หรือ on-premises
รองรับสถาปัตยกรรมโมเดลหลายแบบและโมเดลโอเพนซอร์สยอดนิยม
ทีมได้ deploy vLLM worker แบบ dockerized บนแพลตฟอร์ม GPU เช่น NVIDIA DGX และ Intel HPC เพื่อโฮสต์โมเดลอย่าง Llama 3.1 (8B และ 70B), Mistral 7B และ Llama-SQL สำหรับการช่วยเขียนโค้ดของนักพัฒนา, การค้นคืนความรู้, และการโต้ตอบกับฐานข้อมูลด้วยภาษาธรรมชาติ
vLLM เข้ากันได้กับมาตรฐาน OpenAI SDK ทำให้ให้บริการโมเดลได้อย่างสม่ำเสมอ

Trial

88. Crossplane

นับตั้งแต่ปรากฏบน Radar ครั้งล่าสุด การนำ Crossplane ไปใช้ยังคงเพิ่มขึ้นอย่างต่อเนื่อง โดยเฉพาะในการขยาย Kubernetes cluster
จากการใช้งานจริง เราพบว่า Crossplane โดดเด่นในกรณีใช้งานเฉพาะ มากกว่าจะเป็นเครื่องมือ infrastructure as code (IaC) แบบอเนกประสงค์
ข้อสังเกตก่อนหน้ายังคงใช้ได้: Crossplane ทำงานได้ดีที่สุดในฐานะตัวเสริมของ workload ที่ deploy อยู่ภายใน Kubernetes และไม่ใช่ตัวแทนเต็มรูปแบบของเครื่องมืออย่าง Terraform
ทีมที่ "ทุ่มทั้งหมด" ให้ Crossplane เป็นโซลูชัน IaC หลักมักประสบปัญหา แต่ทีมที่ใช้อย่างเหมาะสม — สำหรับกรณีใช้งานแบบกำหนดเป้าหมายเฉพาะ — กลับเห็นผลลัพธ์ที่แข็งแกร่ง

89. DeepEval

DeepEval คือเฟรมเวิร์กประเมินผลแบบโอเพนซอร์สบนพื้นฐาน Python สำหรับการวัดประสิทธิภาพของ LLM
สามารถใช้ประเมิน retrieval-augmented generation (RAG) และแอปพลิเคชันอื่น ๆ ที่สร้างด้วย LlamaIndex หรือ LangChain รวมถึงใช้สำหรับการตั้ง baseline และ benchmark ของโมเดล
DeepEval ประเมินทั้งความถูกต้อง ความเกี่ยวข้อง และความสอดคล้อง เพื่อให้การประเมินที่เชื่อถือได้มากขึ้นในสถานการณ์จริง นอกเหนือจากคะแนนจับคู่คำเพียงอย่างเดียว
มีเมตริกอย่างการตรวจจับ hallucination, ความเกี่ยวข้องของคำตอบ, การปรับแต่ง hyperparameter และรองรับ GEval สำหรับสร้างเมตริกแบบกำหนดเองตาม use case

90. FastMCP

Model Context Protocol (MCP) กำลังกลายเป็นมาตรฐานอย่างรวดเร็วสำหรับการมอบคอนเท็กซ์และเครื่องมือให้กับแอปพลิเคชัน LLM
อย่างไรก็ตาม การนำ MCP server ไปใช้งานโดยทั่วไปมักมี boilerplate จำนวนมากสำหรับการตั้งค่า การจัดการโปรโตคอล และการจัดการข้อผิดพลาด
FastMCP เป็นเฟรมเวิร์ก Python ที่ทำให้กระบวนการนี้ง่ายขึ้น โดยซ่อนความซับซ้อนของโปรโตคอลและทำให้นักพัฒนาสามารถกำหนด MCP resource และเครื่องมือผ่าน Python decorator ที่เข้าใจได้ง่าย
การทำ abstraction นี้ช่วยให้ทีมโฟกัสกับ business logic ได้มากขึ้น ส่งผลให้การใช้งาน MCP สะอาดตาและดูแลรักษาง่ายกว่าเดิม

91. LiteLLM

LiteLLM เป็น SDK ที่ให้การผสานรวมกับผู้ให้บริการ LLM หลายรายได้อย่างราบรื่นผ่านรูปแบบ OpenAI API มาตรฐาน
รองรับผู้ให้บริการและโมเดลได้อย่างกว้างขวาง พร้อมมอบอินเทอร์เฟซแบบรวมศูนย์สำหรับ text completion, embedding และการสร้างภาพ
ด้วยการซ่อนความแตกต่างของ API เฉพาะแต่ละผู้ให้บริการ LiteLLM จึงช่วยให้การผสานรวมง่ายขึ้นและ route คำขอไปยัง model endpoint ที่ถูกต้องโดยอัตโนมัติ
ยังมีความสามารถระดับ production ผ่าน proxy framework เช่น guardrails, caching, logging, rate limiting และ load balancing

92. MLForecast

MLForecast เป็นเฟรมเวิร์กและไลบรารี Python สำหรับการพยากรณ์อนุกรมเวลา โดยนำโมเดล machine learning ไปใช้กับชุดข้อมูลขนาดใหญ่
ช่วยให้กระบวนการทำ feature engineering แบบอัตโนมัติที่มักซับซ้อนง่ายขึ้น รวมถึง lag, rolling statistics และฟีเจอร์ที่อิงตามวันที่
เป็นหนึ่งในไม่กี่ไลบรารีที่มีการรองรับแบบ native สำหรับ distributed computing framework อย่าง Spark และ Dask จึงช่วยรับประกันเรื่อง scalability
ยังรองรับการพยากรณ์เชิงความน่าจะเป็นด้วยวิธีอย่าง conformal prediction เพื่อให้การวัดความไม่แน่นอนของการคาดการณ์ในเชิงปริมาณ

93. Nuxt

Nuxt เป็น meta-framework แบบมีแนวทางชัดเจนที่สร้างอยู่บน Vue.js สำหรับการสร้างเว็บแอปพลิเคชันแบบฟูลสแตก และมักถูกเรียกว่า “Next.js สำหรับ Vue.js”
เช่นเดียวกับฝั่ง React, Nuxt มีความสามารถที่เป็นมิตรต่อ SEO เช่น pre-rendering, server-side rendering (SSR) และการจัดการ metadata
Nuxt ได้รับการสนับสนุนจาก Vercel บริษัทเดียวกับที่อยู่เบื้องหลัง Next.js พร้อมทั้งมีชุมชนที่แข็งแกร่งและ ecosystem ของโมดูลทั้งทางการและจากภายนอก
โมดูลเหล่านี้ช่วยให้การผสานรวมฟีเจอร์อย่างการประมวลผลภาพ, sitemap และ Tailwind CSS ง่ายขึ้น

94. Phoenix

ยังคงมีประสบการณ์เชิงบวกกับ Phoenix อย่างต่อเนื่อง — เว็บ MVC framework ฝั่งเซิร์ฟเวอร์ที่เขียนด้วย Elixir
Phoenix พัฒนาต่อยอดจากแนวคิดด้านการพัฒนาแอปอย่างรวดเร็วและประสบการณ์นักพัฒนาของ Ruby on Rails ขณะเดียวกันก็ขยายไปสู่กระบวนทัศน์การเขียนโปรแกรมเชิงฟังก์ชัน
ในฉบับนี้มีการเน้นย้ำการเปิดตัว Phoenix LiveView 1.0
LiveView เป็นโซลูชันแบบ HTML-over-the-wire ที่คล้ายกับ HTMX หรือ Hotwire ซึ่งช่วยให้นักพัฒนาสร้างประสบการณ์ผู้ใช้ที่สมบูรณ์และเรียลไทม์ได้ด้วย HTML ที่เรนเดอร์จากเซิร์ฟเวอร์ทั้งหมด

95. Presidio

Presidio เป็น SDK ด้านการปกป้องข้อมูลสำหรับการระบุ และทำข้อมูลนิรนาม ของข้อมูลอ่อนไหวในข้อความทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง
ใช้ named entity recognition, regular expression และตรรกะแบบอิงกฎเพื่อตรวจจับข้อมูลที่ระบุตัวบุคคลได้ (PII) เช่น หมายเลขบัตรเครดิต ชื่อ และสถานที่
Presidio รองรับตัวรู้จำเอนทิตีแบบ custom และ pipeline การทำข้อมูลนิรนาม ทำให้องค์กรสามารถปรับให้เข้ากับข้อกำหนดด้านความเป็นส่วนตัวและการปฏิบัติตามกฎระเบียบของตนเองได้
ทีมงานใช้ Presidio ในสภาพแวดล้อมระดับองค์กรที่ต้องควบคุมการแชร์ข้อมูลอย่างเข้มงวดเมื่อผสานรวมกับ LLM

96. Pydantic AI

Pydantic AI ยังคงพิสูจน์ตัวเองว่าเป็นเฟรมเวิร์กโอเพนซอร์สที่เสถียรและได้รับการสนับสนุนอย่างดีสำหรับการสร้าง GenAI agent ในระดับ production
สร้างอยู่บนรากฐาน Pydantic ที่เชื่อถือได้ จึงมอบ type safety ที่แข็งแกร่ง การสังเกตการณ์แบบ first-class ผ่าน OpenTelemetry และเครื่องมือประเมินผลในตัว
การออกเวอร์ชัน 1.0 เมื่อวันที่ 4 กันยายน 2025 ถือเป็นหมุดหมายสำคัญด้านความพร้อมใช้งาน
นับจากนั้นมา เฟรมเวิร์กนี้ได้รับความไว้วางใจและการยอมรับอย่างกว้างขวางจากความเรียบง่ายและการดูแลรักษาที่ง่าย จนเข้าร่วมแถวเดียวกับเฟรมเวิร์ก agent ยอดนิยมอื่น ๆ เช่น LangChain และ LangGraph

97. Tauri

Tauri เป็นเฟรมเวิร์กสำหรับการสร้างเดสก์ท็อปแอปพลิเคชันประสิทธิภาพสูงโดยใช้โค้ดเบสเว็บ UI ชุดเดียว
ต่างจาก web wrapper แบบดั้งเดิมอย่าง Electron, Tauri สร้างบนพื้นฐานของ Rust และใช้ native webview ของระบบปฏิบัติการ จึงให้ทั้งไฟล์ไบนารีที่เล็กกว่าและความปลอดภัยที่แข็งแกร่งกว่า
เคยประเมิน Tauri ครั้งแรกเมื่อหลายปีก่อน และหลังจากนั้นก็ได้ขยายจากเดสก์ท็อปไปสู่การรองรับ iOS และ Android
เวอร์ชันล่าสุดมีจุดเด่นคือการนำโมเดลสิทธิ์และขอบเขตที่ยืดหยุ่นยิ่งขึ้นเข้ามาใช้แทนรายการสิทธิ์แบบเดิม รองรับการส่งข้อมูลดิบ และมีชั้นการสื่อสารระหว่างโปรเซส (IPC) ที่ได้รับการปรับปรุงเพื่อเพิ่มประสิทธิภาพ

Assess

98. Agent Development Kit (ADK)

Agent Development Kit (ADK) เป็นเฟรมเวิร์กสำหรับการพัฒนาและนำ AI agent ไปใช้งาน โดยใช้ระเบียบวิธีวิศวกรรมซอฟต์แวร์สมัยใหม่แทนที่จะพึ่งพาเพียงการ prompt
นำ abstraction ที่คุ้นเคยเข้ามาใช้ เช่น class, method, workflow pattern และการรองรับ CLI
เมื่อเทียบกับเฟรมเวิร์กอย่าง LangGraph หรือ CrewAI จุดแข็งของ ADK คือการผสานรวมอย่างลึกซึ้งกับโครงสร้างพื้นฐาน AI ของ Google ซึ่งให้ความพร้อมระดับองค์กรทั้งด้าน grounding, การเข้าถึงข้อมูล และการมอนิเตอร์
ออกแบบมาโดยคำนึงถึง interoperability และรองรับ A2A protocol สำหรับ tool wrapper และการสื่อสารระหว่าง agent

99. Agno

Agno เป็นเฟรมเวิร์กสำหรับการสร้าง รัน และจัดการระบบ multi-agent
ให้ความยืดหยุ่นในการสร้างทั้ง agent ที่ทำงานอัตโนมัติเต็มรูปแบบหรือ workflow แบบควบคุมเป็นขั้นตอน พร้อมการรองรับ human-in-the-loop, session management, memory และ knowledge ในตัว
ชื่นชมการให้ความสำคัญกับประสิทธิภาพผ่านเวลาเริ่มต้นของ agent ที่น่าประทับใจและการใช้หน่วยความจำที่ต่ำ
Agno มาพร้อม runtime ของตัวเองชื่อ AgentOS ซึ่งเป็นแอปพลิเคชัน FastAPI ที่มี control plane แบบรวมศูนย์สำหรับการทดสอบ การมอนิเตอร์ และการจัดการระบบ agent อย่างคล่องตัว

100. assistant-ui

assistant-ui เป็นไลบรารีโอเพนซอร์ส TypeScript และ React สำหรับอินเทอร์เฟซแชต AI
จัดการส่วนที่ซับซ้อนของการทำแชต UI เช่น streaming, state management และฟีเจอร์ UX ทั่วไปสำหรับการแก้ไขข้อความและสลับ branch ขณะที่ยังเปิดให้นักพัฒนาสามารถออกแบบคอมโพเนนต์ของตนเองด้วย Radix primitive
รองรับการผสานรวมกับ runtime ยอดนิยม รวมถึง Vercel AI SDK และ LangGraph และยังมี runtime solution ที่ปรับแต่งได้สำหรับกรณีใช้งานที่ซับซ้อน
ประสบความสำเร็จในการสร้างอินเทอร์เฟซแชตแบบเรียบง่ายด้วย assistant-ui และพอใจกับผลลัพธ์

101. AutoRound

AutoRound ของ Intel เป็นอัลกอริทึม quantization ขั้นสูงสำหรับบีบอัดโมเดล AI ขนาดใหญ่ เช่น LLM และ vision language models (VLM) โดยลดการสูญเสียความแม่นยำให้น้อยที่สุด
ใช้การเพิ่มประสิทธิภาพแบบ sign-gradient descent เพื่อลดขนาดโมเดลลงสู่ระดับบิตต่ำมาก (2-4 บิต) และใช้ความกว้างบิตแบบผสมในแต่ละเลเยอร์เพื่อประสิทธิภาพที่เหมาะสมที่สุด
กระบวนการ quantization นี้ยังรวดเร็วมากอีกด้วย: สามารถ quantize โมเดลขนาด 7 พันล้านพารามิเตอร์ได้ภายในไม่กี่นาทีบน GPU เดียว
AutoRound ผสานรวมกับ inference engine ยอดนิยมอย่าง vLLM และ Transformers ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการ quantize โมเดล

102. Browser Use

Browser Use เป็นไลบรารี Python แบบโอเพนซอร์สที่ช่วยให้เอเจนต์ที่ใช้ LLM สามารถควบคุมเว็บเบราว์เซอร์และโต้ตอบกับเว็บแอปพลิเคชันได้
สามารถนำทาง กรอกข้อมูล และดึงข้อความได้ รวมถึงจัดการหลายแท็บเพื่อประสานงานงานข้ามแอปพลิเคชัน
ไลบรารีนี้มีประโยชน์อย่างยิ่งเมื่อ AI agent จำเป็นต้องเข้าถึง จัดการ หรือดึงข้อมูลจากคอนเทนต์บนเว็บ
รองรับ LLM หลากหลายตัว และใช้ Playwright โดยผสานความเข้าใจเชิงภาพเข้ากับการดึงโครงสร้าง HTML เพื่อการโต้ตอบบนเว็บที่สมบูรณ์ยิ่งขึ้น

103. DeepSpeed

DeepSpeed เป็นไลบรารี Python ที่เพิ่มประสิทธิภาพ distributed deep learning สำหรับทั้งการฝึกและการอนุมาน
สำหรับการฝึก มีการรวมเทคนิคอย่าง Zero Redundancy Optimizer (ZeRO) และ 3D parallelism เพื่อขยายโมเดลอย่างมีประสิทธิภาพบน GPU หลายพันตัว
สำหรับการอนุมาน มีการผสาน tensor, pipeline, expert และ ZeRO parallelism เข้ากับ custom kernel และการเพิ่มประสิทธิภาพการสื่อสารเพื่อลด latency ให้ต่ำที่สุด
DeepSpeed ขับเคลื่อนโมเดลภาษาขนาดใหญ่ที่สุดบางส่วนของโลก รวมถึง Megatron-Turing NLG (530B) และ BLOOM (176B)

104. Drizzle

Drizzle เป็น ORM สำหรับ TypeScript ที่มีน้ำหนักเบา
ต่างจาก Prisma ORM ตรงที่มอบทั้ง API แบบคล้าย SQL ที่เรียบง่ายและอินเทอร์เฟซคิวรีสไตล์ ORM แบบดั้งเดิมให้กับนักพัฒนา
ยังรองรับการดึงสคีมาจากฐานข้อมูลเดิม ทำให้รองรับได้ทั้งแนวทาง database-first และ code-first
Drizzle ถูกออกแบบโดยคำนึงถึงสภาพแวดล้อมแบบ serverless มีขนาด bundle เล็ก และรองรับ prepared statements

105. Java post-quantum cryptography

คอมพิวเตอร์ควอนตัมยังคงพัฒนาอย่างรวดเร็วต่อเนื่อง และบริการแบบ SaaS อย่าง AWS Braket ก็เปิดให้เข้าถึงอัลกอริทึมควอนตัมบนหลายสถาปัตยกรรมแล้ว
ตั้งแต่เดือนมีนาคม Java 24 ได้เพิ่ม Java post-quantum cryptography โดยรองรับอัลกอริทึมเข้ารหัสหลังยุคควอนตัมอย่าง ML-KEM และ ML-DSA
.Net 10 ก็ขยายการรองรับเช่นกัน
คำแนะนำนั้นง่ายมาก: หากคุณกำลังสร้างซอฟต์แวร์ด้วยภาษาเหล่านี้ ก็ควรเริ่มนำอัลกอริทึมที่ปลอดภัยต่อยุคควอนตัมมาใช้ตั้งแต่ตอนนี้เพื่อทำให้ระบบพร้อมสำหรับอนาคต

106. kagent

Kagent เป็นเฟรมเวิร์กโอเพนซอร์สสำหรับรัน agentic AI ภายในคลัสเตอร์ Kubernetes
ช่วยให้เอเจนต์ที่ใช้ LLM สามารถวางแผนและดำเนินงานด้านปฏิบัติการ เช่น การวินิจฉัยปัญหา การแก้ไขคอนฟิก และการโต้ตอบกับเครื่องมือด้านการมองเห็นระบบ ผ่าน Kubernetes native API และการผสานรวม Model Context Protocol (MCP)
เป้าหมายคือการนำ "AgentOps" มาสู่โครงสร้างพื้นฐาน cloud-native ด้วยการผสานการจัดการแบบ declarative เข้ากับการให้เหตุผลแบบอัตโนมัติ
ในฐานะโปรเจกต์ CNCF Sandbox ควรนำ Kagent ไปใช้อย่างระมัดระวัง โดยเฉพาะเมื่อพิจารณาถึงความเสี่ยงของการมอบความสามารถด้านการจัดการปฏิบัติการให้กับ LLM และเทคนิคอย่าง toxic flow analysis อาจมีคุณค่าอย่างมากในการประเมินและลดความเสี่ยงเหล่านี้

107. LangExtract

LangExtract เป็นไลบรารี Python ที่ใช้ LLM เพื่อดึงข้อมูลแบบมีโครงสร้างจากข้อความที่ไม่มีโครงสร้างตามคำสั่งที่ผู้ใช้กำหนดเอง
สามารถประมวลผลเนื้อหาเฉพาะโดเมน เช่น clinical notes และรายงาน เพื่อระบุและจัดระเบียบรายละเอียดสำคัญ โดยยังคงติดตามย้อนกลับแต่ละจุดข้อมูลที่ดึงออกมาไปยังแหล่งที่มาได้
เอนทิตีที่ดึงออกมาสามารถส่งออกเป็นไฟล์ .jsonl (รูปแบบมาตรฐานสำหรับข้อมูลโมเดลภาษา) และแสดงผลผ่านอินเทอร์เฟซ HTML แบบโต้ตอบเพื่อทบทวนบริบทได้
ทีมได้ประเมิน LangExtract สำหรับการดึงเอนทิตีเพื่อนำไปเติม knowledge graph เฉพาะโดเมน และพบว่ามันมีประสิทธิภาพในการแปลงเอกสารที่ซับซ้อนให้เป็นรูปแบบเชิงโครงสร้างที่เครื่องอ่านได้

108. Langflow

Langflow เป็นแพลตฟอร์ม low-code แบบโอเพนซอร์สสำหรับสร้างและทำให้เห็นภาพเวิร์กโฟลว์ของ LLM
สร้างอยู่บน LangChain และช่วยให้นักพัฒนาสามารถเชื่อมโยง prompt, tools, vector databases และองค์ประกอบด้าน memory ผ่านอินเทอร์เฟซแบบลากและวาง พร้อมทั้งรองรับโค้ด Python แบบกำหนดเองสำหรับตรรกะขั้นสูง
มีประโยชน์อย่างยิ่งสำหรับการทำต้นแบบแอปพลิเคชันเอเจนต์โดยไม่ต้องเขียนโค้ดแบ็กเอนด์ครบทั้งหมด
อย่างไรก็ตาม Langflow ยังถือว่าใหม่พอสมควรและยังมีจุดที่ไม่เรียบร้อยอยู่บ้างสำหรับการใช้งานจริงในโปรดักชัน และข้อควรระวังทั่วไปเกี่ยวกับแพลตฟอร์ม low-code ก็ใช้ได้กับกรณีนี้เช่นกัน

109. LMCache

LMCache เป็นโซลูชันแคช key-value (KV) สำหรับเร่งโครงสร้างพื้นฐานการให้บริการ LLM
มันทำหน้าที่เป็นชั้นแคชเฉพาะทางครอบคลุมทั้งพูลของ inference engine สำหรับ LLM โดยเก็บรายการแคช KV ที่คำนวณไว้ล่วงหน้าสำหรับข้อความที่มีแนวโน้มจะถูกประมวลผลซ้ำหลายครั้ง เช่น ประวัติแชตหรือชุดเอกสาร
การคงค่าดังกล่าวไว้บนดิสก์ช่วย offload การคำนวณ prefill ออกจาก GPU เพื่อลด time-to-first-token (TTFT) และลดต้นทุนการอนุมานในเวิร์กโหลดที่ท้าทาย เช่น RAG pipelines, แอปพลิเคชันแชตหลายรอบ และระบบเอเจนต์
สามารถผสาน LMCache เข้ากับเซิร์ฟเวอร์อนุมานหลักอย่าง vLLM หรือ NVIDIA Dynamo ได้ และคุ้มค่าที่จะประเมินผลกระทบต่อการตั้งค่า

110. Mem0

Mem0 เป็น memory layer ที่ออกแบบมาสำหรับ AI agent
แนวทางแบบพื้นฐานมักจะเก็บประวัติการแชตทั้งหมดไว้ในฐานข้อมูลและนำกลับมาใช้ในการสนทนาในอนาคต ซึ่งนำไปสู่การใช้โทเคนมากเกินไป
Mem0 เข้ามาแทนที่ด้วยสถาปัตยกรรมที่ซับซ้อนกว่านั้น โดยแยกหน่วยความจำออกเป็นการระลึกระยะสั้นและเลเยอร์ระยะยาวอัจฉริยะที่ดึงและเก็บเฉพาะข้อเท็จจริงและความสัมพันธ์ที่สำคัญ
สถาปัตยกรรมนี้ผสาน vector store สำหรับความคล้ายคลึงเชิงความหมายเข้ากับ knowledge graph เพื่อทำความเข้าใจข้อมูลเชิงเวลาและเชิงความสัมพันธ์

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) เป็นรูปแบบการแลกเปลี่ยนข้อมูลแบบเปิดและเครื่องอ่านได้ ที่ออกแบบมาเพื่อเพิ่มระบบอัตโนมัติในการปฏิบัติตามข้อกำหนดและการบริหารความเสี่ยง พร้อมช่วยให้ทีมก้าวพ้นจากแนวทางทำงานด้วยมือที่อิงข้อความ
นำโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐฯ (NIST) โดย OSCAL มอบ standard representations in XML, JSON and YAML สำหรับการแสดง security controls ที่เกี่ยวข้องกับเฟรมเวิร์กอุตสาหกรรมอย่าง SOC 2 และ PCI รวมถึงเฟรมเวิร์กภาครัฐอย่าง FedRAMP ของสหรัฐฯ, Cybersecurity Control Catalogue ของสิงคโปร์ และ Information Security Manual ของออสเตรเลีย
แม้ OSCAL จะยังไม่ได้รับการยอมรับอย่างแพร่หลายนอกภาครัฐ และระบบนิเวศยังอยู่ระหว่างการพัฒนา แต่เราตื่นเต้นกับศักยภาพของมันในการทำให้การประเมินความปลอดภัยง่ายขึ้น ลดการพึ่งพาสเปรดชีตและการทำงานแบบติ๊กช่อง และเปิดทางให้เกิดการปฏิบัติตามข้อกำหนดแบบอัตโนมัติเมื่อผสานเข้ากับแพลตฟอร์ม compliance-as-code และ continuous compliance

112. OpenInference

OpenInference เป็นชุดของข้อกำหนดและปลั๊กอินที่ออกแบบมาเพื่อสังเกตการณ์แอปพลิเคชัน AI โดยทำงานเสริม OpenTelemetry
มอบ instrumentation ที่เป็นมาตรฐานสำหรับเฟรมเวิร์กและไลบรารีด้านแมชชีนเลิร์นนิง เพื่อช่วยให้นักพัฒนาติดตามการเรียกใช้ LLM พร้อมบริบทแวดล้อม เช่น การค้นคืนจาก vector store หรือการเรียกใช้เครื่องมือภายนอกไปยัง API และ search engine
span สามารถส่งออกไปยังตัวเก็บข้อมูลที่รองรับ OTEL ใดก็ได้ ทำให้สอดคล้องกับ telemetry pipeline ที่มีอยู่เดิม
ก่อนหน้านี้เราเคยบลิป Langfuse ซึ่งเป็นแพลตฟอร์มด้าน LLM visibility ที่ใช้งานกันอย่างแพร่หลาย และ OpenInference SDK สามารถบันทึก trace ไปยัง Langfuse และแพลตฟอร์ม visibility อื่น ๆ ที่รองรับ OpenTelemetry ได้

113. Valibot

Valibot เป็นไลบรารี schema validation สำหรับ TypeScript
เช่นเดียวกับไลบรารี validation ยอดนิยมอื่น ๆ ของ TypeScript อย่าง Zod และ Ajv มันรองรับ type inference แต่สิ่งที่ทำให้แตกต่างคือการออกแบบแบบโมดูลาร์
สถาปัตยกรรมนี้ช่วยให้ bundler ทำ tree shaking และ code splitting ได้อย่างมีประสิทธิภาพ จึงรวมเฉพาะฟังก์ชัน validation ที่ถูกใช้งานจริงเท่านั้น
Valibot สามารถลดขนาด bundle ได้มากถึง 95% เมื่อเทียบกับ Zod ในสถานการณ์ที่เหมาะสม ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับ schema validation ในสภาพแวดล้อมที่ขนาด bundle สำคัญ เช่น client-side validation หรือฟังก์ชัน serverless

114. Vercel AI SDK

Vercel AI SDK เป็นชุดเครื่องมือโอเพนซอร์สแบบฟูลสแตกสำหรับสร้างแอปพลิเคชันและเอเจนต์ที่ขับเคลื่อนด้วย AI ใน ecosystem ของ TypeScript
ประกอบด้วยองค์ประกอบหลักสองส่วน: AI SDK Core ทำหน้าที่ทำให้การเรียกใช้ LLM เป็นมาตรฐานโดยไม่ยึดติดกับโมเดล พร้อมรองรับการสร้างข้อความ การสร้างอ็อบเจ็กต์แบบมีโครงสร้าง และการเรียกใช้เครื่องมือ
AI SDK UI มีลักษณะคล้าย assistant-ui โดยช่วยลดความซับซ้อนของการพัฒนาฝั่งฟรอนต์เอนด์ใน React, Vue, Next.js และ Svelte ด้วยการสตรีม การจัดการสถานะ และการอัปเดต UI แบบเรียลไทม์
สำหรับทีมที่ทำงานอยู่ใน ecosystem ของ TypeScript และ Next.js อยู่แล้ว Vercel AI SDK มอบวิธีที่รวดเร็วและลื่นไหลในการสร้างแอปพลิเคชัน AI พร้อมประสบการณ์ฝั่งไคลเอนต์ที่ครบถ้วน

เปิดตัว Thoughtworks Technology Radar, Volume 33

นำ orchestration มาใช้กับ AI infrastructure

การเติบโตของเอเจนต์ที่อิง MCP

เวิร์กโฟลว์การเขียนโค้ดด้วย AI

การเกิดขึ้นของ anti-pattern ด้าน AI แบบใหม่

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น