เปิดตัว Thoughtworks Technology Radar, Volume 33
(thoughtworks.com)- แสดงภาพและอธิบายเทรนด์ล่าสุดในหมวด เทคนิค/เครื่องมือ/แพลตฟอร์ม/ภาษาและเฟรมเวิร์กสำหรับการพัฒนา ด้วย 4 ระดับ ได้แก่ Adopt (แนะนำให้นำไปใช้), Trial (ทดลองใช้), Assess (ประเมิน), Hold (ระวัง)
- 4 ธีมหลัก: การนำ orchestration มาใช้กับโครงสร้างพื้นฐาน AI, การเติบโตของเอเจนต์ที่อิง MCP, เวิร์กโฟลว์การเขียนโค้ดด้วย AI, การเกิดขึ้นของ anti-pattern ด้าน AI
นำ orchestration มาใช้กับ AI infrastructure
- เวิร์กโหลด AI กำลังทำให้องค์กรต้องใช้ การ orchestration ของ GPU fleet ขนาดใหญ่ สำหรับการฝึกและการอนุมาน
- เมื่อโมเดลขนาดใหญ่ที่เกินข้อจำกัดของความจุ HBM (80GB) ของ GPU เดี่ยวมีมากขึ้น การฝึกแบบกระจายและการอนุมานแบบหลาย GPU จึงกลายเป็นสิ่งจำเป็น
- ทีมแพลตฟอร์มต้องสร้างไปป์ไลน์หลายขั้นที่ซับซ้อน และปรับ throughput กับ latency อย่างต่อเนื่อง
- ใช้ Nvidia DCGM Exporter ทำ fleet telemetry ระยะไกล และใช้ topology-aware scheduling เพื่อวางงานในตำแหน่งที่มี interconnect bandwidth สูงที่สุด
- Kubernetes เป็นรากฐานหลักในการจัดการเวิร์กโหลด AI ในระดับใหญ่ แต่แพลตฟอร์มทางเลือกอย่าง microVM(Firecracker) และ Uncloud ก็ได้รับความสนใจเช่นกัน
- กลยุทธ์การจัดวางที่คำนึงถึงการสื่อสารความเร็วสูงระหว่างลิงก์ GPU เช่น การจัดการคิวและโควตาผ่าน Kueue, topology-aware scheduling, และ gang scheduling กำลังพัฒนาอย่างต่อเนื่อง
- จัดวางงานแบบหลาย GPU ภายใน “island” ของดาต้าเซ็นเตอร์แบบต่อเนื่อง (rack หรือ pod) ที่มีลิงก์ความเร็วสูงระหว่าง GPU เช่น NVLink/NVSwitch และ RDMA
- การปรับปรุงล่าสุดของ Kubernetes ในด้าน API ที่รับรู้หลาย GPU และ NUMA ช่วยเสริมความสามารถเหล่านี้ ทั้งการเพิ่มแบนด์วิดท์ระหว่างอุปกรณ์ ลด tail latency และเพิ่มอัตราการใช้งานอย่างมีประสิทธิภาพ
- จากความต้องการเวิร์กโฟลว์การเขียนโค้ดด้วย AI ที่เพิ่มขึ้น และเอเจนต์ที่ดีขึ้นด้วย MCP ทำให้คาดว่าจะเกิดนวัตกรรมอย่างรวดเร็วใน AI infrastructure
- GPU-aware orchestration กำลังกลายเป็นข้อกำหนดพื้นฐาน และ topology กำลังกลายเป็นปัจจัยด้าน scheduling ระดับชั้นหนึ่ง
การเติบโตของเอเจนต์ที่อิง MCP
- การเติบโตขึ้นพร้อมกันของ MCP และเอเจนต์ รวมถึงการขยายตัวของระบบนิเวศโปรโตคอลและเครื่องมือที่สร้างรอบสิ่งเหล่านี้ เป็นหัวข้อหลักของ Radar ครั้งนี้
- MCP กำลังวางตัวเป็น โปรโตคอลรวมศูนย์ขั้นสุดท้ายสำหรับการขับเคลื่อนเอเจนต์และการทำงานแบบมีประสิทธิภาพ/กึ่งอัตโนมัติ
- ผู้ขายรายใหญ่แทบทั้งหมดกำลังเพิ่มการรองรับ MCP และ เวิร์กโฟลว์ที่มีเอเจนต์เป็นศูนย์กลาง กำลังเติบโตอย่างรวดเร็ว
- มีการสังเกตเห็นนวัตกรรมอย่างต่อเนื่องในเวิร์กโฟลว์ของเอเจนต์ และ context engineering กำลังก้าวขึ้นมาเป็นหัวใจของการปรับพฤติกรรมโมเดลและประสิทธิภาพการใช้ทรัพยากรให้เหมาะสมที่สุด
- โปรโตคอลใหม่อย่าง A2A(Agent-to-Agent) และ AG-UI ช่วยลดความซับซ้อนในการสร้างแอปความร่วมมือแบบหลายเอเจนต์
- เทคโนโลยีอย่าง AGENTS.md, Anchoring coding agents, และ Context7 MCP server กำลังถูกนำไปใช้ในเวิร์กโฟลว์การพัฒนาจริง
- ด้วยลักษณะของระบบนิเวศ AI ทำให้ใน Radar แต่ละครั้งมีนวัตกรรมใหม่เกิดขึ้นอย่างรวดเร็ว
— ครั้งก่อนคือ RAG ส่วนครั้งนี้คือ เวิร์กโฟลว์ของเอเจนต์ และกลุ่มดาว (constellation) ของเครื่องมือ เทคนิค และแพลตฟอร์มที่เติบโตขึ้นเพื่อรองรับมัน- และยังมี anti-pattern ด้าน AI ที่น่าจับตาบางส่วนเริ่มปรากฏขึ้น
เวิร์กโฟลว์การเขียนโค้ดด้วย AI
- AI กำลังเปลี่ยนวิธีการสร้างและบำรุงรักษาซอฟต์แวร์ และเป็นหัวข้อที่ครองการพูดคุยในช่วงหลัง
- ตั้งแต่ การใช้ AI เพื่อทำความเข้าใจ codebase แบบ legacy ไปจนถึง GenAI สำหรับ forward engineering มันกำลังถูกฝังเชิงกลยุทธ์ตลอดห่วงโซ่มูลค่าของซอฟต์แวร์
- กำลังเรียนรู้วิธีป้อนความรู้ให้ coding agent ได้มีประสิทธิภาพยิ่งขึ้น
- ทีมต่าง ๆ กำลังทดลองแนวปฏิบัติใหม่ เช่น การกำหนดคำแนะนำแบบปรับแต่งผ่านไฟล์ AGENTS.md และการผสานกับ MCP server อย่าง Context7 เพื่อดึงเอกสาร dependency ล่าสุด
- มีการตระหนักมากขึ้นว่า AI ควรช่วยเพิ่มศักยภาพไม่ใช่แค่ผู้มีส่วนร่วมรายบุคคล แต่รวมถึง ทั้งทีม
- คำแนะนำร่วมที่ผ่านการคัดสรร และ คำสั่งแบบกำหนดเอง จึงเริ่มเกิดขึ้นเพื่อรับประกันการกระจายความรู้อย่างเท่าเทียม
- ภูมิทัศน์ของเครื่องมือกำลังพัฒนาอย่างคึกคัก:
- นักออกแบบใช้ UX Pilot และ AI Design Reviewer ขณะที่นักพัฒนาใช้ v0 และ Bolt เพื่อสร้างต้นแบบอย่างรวดเร็วผ่าน self-service UI prototyping
- การถกเถียงเกี่ยวกับ spec-driven development ยังคงดำเนินต่อไป ทั้งเรื่องขอบเขต ระดับความละเอียด และความเป็นไปได้ที่จะทำหน้าที่เป็นแหล่งความจริงหนึ่งเดียวสำหรับการส่งมอบแบบค่อยเป็นค่อยไป
- แม้จะมีความตื่นเต้น แต่ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ยังเป็นข้อกังวลร่วมอยู่เสมอ เป็นการย้ำว่า AI อาจเร่งงานวิศวกรรมได้ แต่การตัดสินใจของมนุษย์ยังคงขาดไม่ได้
การเกิดขึ้นของ anti-pattern ด้าน AI แบบใหม่
- การเร่งนำ AI ไปใช้ทั่วทั้งอุตสาหกรรมทำให้ anti-pattern ที่กำลังเกิดขึ้นใหม่ เริ่มปรากฏควบคู่ไปกับแนวปฏิบัติที่มีประสิทธิภาพ
- แม้จะยอมรับประโยชน์ที่ชัดเจนของแนวคิดอย่าง self-service UI prototyping แบบใช้ครั้งคราวด้วย GenAI แต่ก็รับรู้ถึงศักยภาพที่จะพาองค์กรไปสู่ anti-pattern ของ Shadow IT ที่เร่งโดย AI
- เมื่อ MCP(Model Context Protocol) ได้รับความสนใจ หลายทีมกลับตกอยู่ใน anti-pattern ของ การแปลง API-to-MCP แบบไร้เดียงสา
- ประสิทธิผลของโซลูชัน Text-to-SQL ไม่เป็นไปตามความคาดหวังช่วงแรก และ ความชะล่าใจต่อโค้ดที่ AI สร้างขึ้น ก็ยังเป็นข้อกังวลที่เกี่ยวข้องต่อเนื่อง
- แม้แต่ในแนวปฏิบัติใหม่อย่าง spec-driven development ก็ยังมีความเสี่ยงที่จะย้อนกลับไปสู่ anti-pattern ของวิศวกรรมซอฟต์แวร์แบบดั้งเดิม
— โดยเฉพาะอคติต่อการทำสเปกล่วงหน้ามากเกินไปและการปล่อยแบบบิ๊กแบง
- แม้แต่ในแนวปฏิบัติใหม่อย่าง spec-driven development ก็ยังมีความเสี่ยงที่จะย้อนกลับไปสู่ anti-pattern ของวิศวกรรมซอฟต์แวร์แบบดั้งเดิม
- GenAI กำลังพัฒนาในความเร็วและขนาดที่ไม่เคยมีมาก่อน จึงคาดว่า anti-pattern ใหม่จะเกิดขึ้นอย่างรวดเร็ว
- ทีมงานจำเป็นต้องระวังรูปแบบที่ช่วงแรกดูมีประสิทธิภาพ แต่เมื่อเวลาผ่านไปกลับทำให้ประสิทธิภาพลดลง ทำให้ feedback ช้าลง บั่นทอนความสามารถในการปรับตัว หรือทำให้ความรับผิดชอบไม่ชัดเจน
ThoughtWorks Technology Radar Volume 33
[Techniques]
Adopt
1. Continuous compliance
- แนวปฏิบัติที่ทำให้มั่นใจว่ากระบวนการพัฒนาซอฟต์แวร์และเทคโนโลยีจะยังคงเป็นไปตามมาตรฐานด้านกฎระเบียบและความปลอดภัยอย่างต่อเนื่องผ่านระบบอัตโนมัติ
- ผสานเครื่องมือ policy-as-code อย่าง Open Policy Agent และสร้าง SBOM ภายใน CD pipeline เพื่อให้ตรวจพบและแก้ไขปัญหาด้าน compliance ตั้งแต่ระยะต้นตามแนวทาง SLSA
- เมื่อแปลงกฎและแนวปฏิบัติที่ดีเป็นโค้ด ก็สามารถบังคับใช้มาตรฐานได้อย่างสม่ำเสมอทั่วทั้งทีมโดยไม่เกิดคอขวด
- เมื่อความเสี่ยงจากความชะล่าใจต่อโค้ดที่ AI สร้างขึ้นเพิ่มขึ้น การฝัง compliance ไว้ในกระบวนการพัฒนาจึงสำคัญกว่าที่เคย
2. Curated shared instructions for software teams
- สำหรับทีมที่ใช้ AI อย่างจริงจังในการส่งมอบซอฟต์แวร์ กำลังขยับจากการ prompting แบบรายบุคคลไปสู่คำแนะนำร่วมที่ผ่านการคัดสรร
- วิธีนำไปใช้ที่ตรงไปตรงมาที่สุดคือการ commit ไฟล์คำแนะนำอย่าง AGENTS.md ลงใน project repository โดยตรง
- เครื่องมือเขียนโค้ดด้วย AI ส่วนใหญ่ เช่น Cursor, Windsurf, Claude Code รองรับการแชร์คำแนะนำผ่าน custom slash command หรือ workflow
- ทันทีที่ prompt ได้รับการปรับปรุง ทั้งทีมก็จะได้รับประโยชน์ พร้อมรับประกันการเข้าถึงคำแนะนำ AI ที่ดีที่สุดอย่างสม่ำเสมอ
3. Pre-commit hooks
- Git hooks มีมานานแล้ว แต่ก็ยังถูกใช้งานไม่เต็มที่
- การเติบโตของการเขียนโค้ดแบบมี AI ช่วยและ agent coding ทำให้ความเสี่ยงในการ commit ความลับหรือโค้ดที่มีปัญหาโดยไม่ตั้งใจเพิ่มขึ้น
- แม้จะมีกลไกตรวจสอบโค้ดมากมาย เช่น continuous integration แต่ pre-commit hook คือมาตรการป้องกันที่เรียบง่ายและมีประสิทธิภาพซึ่งควรมีทีมจำนวนมากขึ้นนำไปใช้
- แนวทางที่ดีที่สุดคือทำให้มันเรียบง่ายและมีเป้าหมายชัดเจน โดยมุ่งเน้นความเสี่ยงที่ตรวจจับได้มีประสิทธิภาพที่สุดในขั้นตอนนี้ของเวิร์กโฟลว์ เช่น การสแกนหาความลับ
4. การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซี
- การใช้ GenAI เพื่อทำความเข้าใจโค้ดเบสแบบเลกาซีช่วยเร่งการทำความเข้าใจระบบขนาดใหญ่ที่ซับซ้อนได้อย่างมาก
- เครื่องมืออย่าง Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge ช่วยสนับสนุนการทำให้กฎทางธุรกิจปรากฏชัด การสรุปตรรกะ และการระบุการพึ่งพา
- เมื่อใช้ร่วมกับเฟรมเวิร์กแบบเปิดและการพรอมป์ต LLM โดยตรง จะช่วยลดเวลาที่ใช้ในการทำความเข้าใจโค้ดเบสแบบเลกาซีได้อย่างมาก
- ความพยายามในการตั้งค่าแนวทางขั้นสูงอย่าง GraphRAG จะแตกต่างกันไป โดยเฉพาะตามขนาดและความซับซ้อนของโค้ดเบสที่วิเคราะห์ แต่ผลกระทบต่อประสิทธิภาพการทำงานนั้นสม่ำเสมอและมีนัยสำคัญ
Trial
5. AGENTS.md
- รูปแบบทั่วไปสำหรับให้คำแนะนำแก่ AI coding agent ที่ทำงานในโปรเจ็กต์
- โดยพื้นฐานแล้วคือไฟล์ README สำหรับเอเจนต์ และไม่มีฟิลด์หรือฟอร์แมตบังคับนอกเหนือจาก Markdown
- อาศัยความสามารถของ coding agent ที่ใช้ LLM ในการตีความคำแนะนำที่มนุษย์เขียนและอ่านได้
- การใช้งานโดยทั่วไปมักรวมถึงเคล็ดลับการใช้เครื่องมือในสภาพแวดล้อมการเขียนโค้ด คำแนะนำในการทดสอบ และแนวปฏิบัติที่ต้องการสำหรับการจัดการ commit
6. AI สำหรับ code migration
- การย้ายโค้ดมีได้หลายรูปแบบ ตั้งแต่การเขียนใหม่ทั้งภาษาไปจนถึงการอัปเกรด dependency หรือเฟรมเวิร์ก และมักต้องใช้แรงงานแบบแมนนวลนานหลายเดือน
- ทีมที่อัปเกรด เวอร์ชัน .NET framework กำลังทดลองใช้ AI เพื่อย่นระยะกระบวนการ
- ในอดีตมีการใช้เครื่องมือ refactoring แบบกำหนดกฎเชิงกำหนดแน่นอนอย่าง OpenRewrite ขณะที่การใช้ AI เพียงอย่างเดียวอาจมีค่าใช้จ่ายสูงและทำให้บทสนทนาออกนอกทางได้ง่าย
- แทนที่จะมอบหมายการอัปเกรดทั้งหมด กระบวนการถูกแยกเป็นขั้นตอนย่อยที่เล็กลงและตรวจสอบได้ เช่น การวิเคราะห์ข้อผิดพลาดในการคอมไพล์ การสร้าง migration diff และการตรวจสอบการทดสอบแบบวนซ้ำ
- กรณีศึกษาในอุตสาหกรรมอย่าง int32-to-int64 migration ขนาดใหญ่ของ Google ก็สะท้อนแนวโน้มคล้ายกัน
7. Delta Lake liquid clustering
- เทคโนโลยีสำหรับตาราง Delta Lake ที่ทำหน้าที่เป็นทางเลือกแทน partitioning และ Z-ordering
- ในอดีต การเพิ่มประสิทธิภาพการอ่านของตาราง Delta จำเป็นต้องกำหนด partition และคีย์ Z-order ตั้งแต่ตอนสร้างตาราง โดยอิงตามรูปแบบคิวรีที่คาดการณ์ไว้
- liquid clustering ใช้อัลกอริทึมแบบ tree-based ในการจัดกลุ่มข้อมูลตามคีย์ที่ระบุ
- สามารถเปลี่ยนแปลงแบบค่อยเป็นค่อยไปได้โดยไม่ต้องเขียนข้อมูลทั้งหมดใหม่ จึงให้ความยืดหยุ่นมากขึ้นในการรองรับรูปแบบคิวรีที่หลากหลาย
- Databricks Runtime for Delta Lake รองรับ liquid clustering อัตโนมัติผ่านการวิเคราะห์เวิร์กโหลดคิวรีในอดีต การระบุคอลัมน์ที่เหมาะสมที่สุด และการจัดกลุ่มข้อมูลตามนั้น
8. การทำ UI prototype แบบ self-serve ด้วย GenAI
- เครื่องมืออย่าง Claude Code, Figma Make, Miro AI, v0 ช่วยให้ผู้จัดการผลิตภัณฑ์สร้างต้นแบบแบบโต้ตอบได้และนำไปทดสอบกับผู้ใช้ได้โดยตรงจาก text prompt
- แทนที่จะสร้าง wireframe ด้วยมือ ทีมสามารถสร้างอาร์ติแฟกต์ HTML, CSS, JS ที่ใช้งานได้ภายในไม่กี่นาที
- ต้นแบบแบบ "ใช้แล้วทิ้ง" เหล่านี้แลกความประณีตกับการเรียนรู้ที่รวดเร็ว จึงเหมาะอย่างยิ่งสำหรับการตรวจสอบเบื้องต้นระหว่าง design sprint
- ความสมจริงที่สูงขึ้นอาจนำไปสู่การโฟกัสผิดจุดในรายละเอียด หรือความคาดหวังที่ไม่สมจริงต่อความพยายามระดับโปรดักชัน จึงจำเป็นต้องมีการกำหนดกรอบและบริหารความคาดหวังอย่างชัดเจน
9. Structured output จาก LLMs
- แนวปฏิบัติในการจำกัดให้ LLM สร้างคำตอบในรูปแบบที่กำหนดไว้ล่วงหน้า เช่น JSON หรือคลาสของภาษาโปรแกรมเฉพาะ
- เป็นสิ่งจำเป็นต่อการสร้างแอปพลิเคชันระดับโปรดักชันที่เชื่อถือได้ เพราะช่วยแปลงข้อความที่โดยทั่วไปคาดเดาได้ยากของ LLM ให้เป็นสัญญาข้อมูลที่เครื่องอ่านได้และกำหนดแน่นอนได้
- มีแนวทางหลากหลาย ตั้งแต่การจัดฟอร์แมตด้วยพรอมป์ตแบบง่ายและ model-native structured outputs ไปจนถึงวิธี constrained decoding ที่แข็งแรงกว่าโดยใช้เครื่องมืออย่าง Outlines และ Instructor
- ถูกใช้อย่างประสบความสำเร็จในการดึงข้อมูลที่ซับซ้อนและไม่มีโครงสร้างจากเอกสารหลายประเภท แล้วแปลงเป็น JSON ที่มีโครงสร้างสำหรับ business logic ขั้นปลาย
10. TCR (Test && Commit || Revert)
- เวิร์กโฟลว์การเขียนโปรแกรมที่ต่อยอดจากการพัฒนาแบบ test-driven โดยใช้กฎง่าย ๆ เพื่อส่งเสริมการทำงานเป็นขั้นเล็ก ๆ อย่างต่อเนื่อง
- หลังการเปลี่ยนแปลงแต่ละครั้ง หากการทดสอบผ่าน การเปลี่ยนแปลงจะถูก commit และหากล้มเหลว การเปลี่ยนแปลงจะถูกย้อนกลับ
- นำไปใช้งานได้ไม่ยาก เพราะเพียงแค่กำหนดสคริปต์ที่ทำให้วงจรนี้เป็นอัตโนมัติภายในโค้ดเบส
- TCR ซึ่งถูกแนะนำครั้งแรกใน article อย่างเป็นทางการของ Kent Beck ช่วยเสริมแนวปฏิบัติการเขียนโค้ดเชิงบวกอย่าง YAGNI และ KISS
Assess
11. AI-powered UI testing
- ใน Radar ก่อนหน้านี้ การทดสอบ UI ที่ขับเคลื่อนด้วย AI มุ่งเน้นไปที่ exploratory testing เป็นหลัก และมีการกล่าวว่า non-determinism ของ LLM อาจก่อให้เกิดความไม่เสถียร
- ด้วยการเติบโตของ MCP, เฟรมเวิร์กทดสอบ UI หลักอย่าง Playwright และ Selenium ได้นำ MCP server ของตนเองมาใช้ (playwright-mcp, mcp-selenium)
- ด้วยการทำ browser automation ที่เชื่อถือได้ผ่านเทคโนโลยีเนทีฟ ทำให้ coding assistant สามารถสร้างการทดสอบ UI ที่เชื่อถือได้ใน Playwright หรือ Selenium
- มีความตื่นเต้นกับความคืบหน้าอย่าง Playwright Agents ในรีลีส Playwright ล่าสุด และคาดว่าจะได้เห็นแนวทางที่ใช้งานได้จริงมากขึ้นพร้อมประสบการณ์จากภาคสนาม
12. การยึด coding agents เข้ากับ reference application
- ก่อนหน้านี้เราเคยใส่ blip ให้กับแพตเทิร์น tailored service templates ซึ่งช่วยให้องค์กรที่นำไมโครเซอร์วิสมาใช้สามารถบูตสแตรปบริการใหม่และผสานเข้ากับโครงสร้างพื้นฐานเดิมได้อย่างราบรื่น
- เมื่อเวลาผ่านไป เมื่อมี dependency, framework และแพตเทิร์นสถาปัตยกรรมใหม่ ๆ เกิดขึ้น ก็มีแนวโน้มที่ code drift ระหว่างเทมเพลตเหล่านี้กับบริการเดิมจะเพิ่มมากขึ้น
- ในยุคของ coding agent เรากำลังทดลอง anchoring coding agents to a reference application เพื่อรักษาแนวปฏิบัติที่ดีและความสอดคล้องของสถาปัตยกรรม
- เซิร์ฟเวอร์ Model Context Protocol (MCP) สามารถเปิดเผยทั้งโค้ดเทมเพลตอ้างอิงและ commit diff เพื่อให้เอเจนต์ตรวจจับ drift และเสนอแนวทางแก้ไขได้
13. Context engineering
- การออกแบบและเพิ่มประสิทธิภาพข้อมูลที่ป้อนให้ LLM อย่างเป็นระบบระหว่างการอนุมาน เพื่อให้สร้างผลลัพธ์ที่ต้องการได้อย่างสม่ำเสมอ
- ครอบคลุมการจัดโครงสร้าง การคัดเลือก และการจัดลำดับขององค์ประกอบบริบท เช่น prompt, ข้อมูลที่ดึงมา, memory, คำสั่ง และสัญญาณจากสภาพแวดล้อม
- ต่างจาก prompt engineering ที่เน้นเฉพาะถ้อยคำใน prompt, context engineering พิจารณาองค์ประกอบของบริบททั้งหมด
- ปัจจุบันวิศวกรใช้เทคนิคย่อยที่หลากหลาย ซึ่งจัดกลุ่มได้เป็น 3 ด้าน: Context setup, Context management for long-horizon tasks, Dynamic information retrieval
14. GenAI for forward engineering
- เทคนิคเกิดใหม่ในการทำให้ระบบเลกาซีทันสมัยขึ้น โดยใช้คำอธิบายของ codebase เลกาซีที่สร้างโดย AI
- มีการเพิ่มขั้นตอนที่ชัดเจนซึ่งมุ่งเน้นว่าโค้ดเลกาซีทำอะไรอยู่ (สเปก) พร้อมกับจงใจซ่อนวิธีการ implement ในปัจจุบัน
- มีความเกี่ยวข้องกับ spec-driven development แต่ประยุกต์ใช้กับการทำระบบเลกาซีให้ทันสมัยโดยเฉพาะ
- ตามลูป reverse-engineering → design/solutioning → forward-engineering ทั้งมนุษย์และ AI agent สามารถให้เหตุผลในระดับที่สูงขึ้นได้ก่อนจะ commit ลงไปที่ implementation
15. GraphQL as data access pattern for LLMs
- แนวทางเกิดใหม่สำหรับการสร้างชั้นการเข้าถึงข้อมูลที่เป็นแบบเดียวกันและเป็นมิตรต่อโมเดล เพื่อยกระดับ context engineering
- สามารถเปิดเผยข้อมูลที่มีโครงสร้างและ query ได้ โดยไม่ต้องให้สิทธิ์โมเดลเข้าถึงฐานข้อมูลโดยตรง
- ต่างจาก REST API ที่ต้องมี endpoint หรือ filter ใหม่สำหรับแต่ละ use case, GraphQL ช่วยให้โมเดลดึงเฉพาะข้อมูลที่ต้องการได้
- GraphQL schema ที่นิยามไว้อย่างชัดเจนให้ metadata ที่ LLM สามารถใช้อนุมานเกี่ยวกับเอนทิตีและความสัมพันธ์ที่มีอยู่ได้
16. Knowledge flows over knowledge stocks
- เรามักถูกถามบ่อย ๆ ว่า “จะปรับปรุงวิธีที่ทีมต่าง ๆ แบ่งปันข้อมูลกันอย่างไร”
- แนวคิด knowledge flows and knowledge stocks ซึ่งยืมมาจากการคิดเชิงระบบ เป็นมุมมองที่มีคุณค่า
- แนวคิดนี้ส่งเสริมให้มองความรู้ขององค์กรเป็นระบบ โดย stock คือความรู้ที่สะสมไว้ ส่วน flow คือวิธีที่ความรู้เคลื่อนผ่านและพัฒนาไปทั่วทั้งองค์กร
- การเพิ่ม flow ของความรู้จากภายนอกเข้าสู่องค์กรมักช่วยกระตุ้นนวัตกรรม และการตั้ง communities of practice เป็นวิธีที่พิสูจน์แล้วว่าช่วยปรับปรุง flow ได้
17. LLM as a judge
- การใช้ LLM เป็นผู้ตัดสินเพื่อประเมินผลลัพธ์ของระบบอื่น ๆ (โดยทั่วไปคือ generator ที่อิง LLM) ได้รับความสนใจจากศักยภาพในการทำ evaluation ของ generative AI แบบอัตโนมัติและขยายขนาดได้
- เพื่อสะท้อนความซับซ้อนและความเสี่ยงที่เพิ่งถูกรับรู้ blip นี้จึงถูกย้ายจาก Trial ไปเป็น Assess
- การประเมินมีความเปราะบางต่อ position bias, verbosity bias และความทนทานต่ำ ขณะที่ปัญหาที่ร้ายแรงกว่าคือ scaling contamination
- เพื่อรับมือกับข้อบกพร่องเหล่านี้ จึงมีการสำรวจเทคนิคที่ดีขึ้น เช่น LLMs as a jury (ใช้หลายโมเดลเพื่อหาฉันทามติ) หรือการใช้เหตุผลแบบ chain-of-thought ระหว่างการประเมิน
18. On-device information retrieval
- เทคนิคที่ทำให้การค้นหา, การรับรู้บริบท และ retrieval-augmented generation (RAG) ทำงานได้ทั้งหมดบนอุปกรณ์ของผู้ใช้เอง (มือถือ เดสก์ท็อป หรืออุปกรณ์ edge)
- ให้ความสำคัญกับความเป็นส่วนตัวและประสิทธิภาพเชิงคำนวณ โดยผสานฐานข้อมูลโลคัลแบบน้ำหนักเบาเข้ากับโมเดลที่ปรับให้เหมาะกับการอนุมานบนอุปกรณ์
- การใช้งานที่มีอนาคตสดใสคือการรวม sqlite-vec (ส่วนขยายของ SQLite ที่รองรับการค้นหาเวกเตอร์ในฐานข้อมูลแบบฝังตัว) กับ EmbeddingGemma (โมเดล embedding ขนาด 300 ล้านพารามิเตอร์ที่อิงสถาปัตยกรรม Gemma 3)
- แนะนำให้ประเมินสำหรับแอปพลิเคชันแบบ local-first รวมถึง use case อื่น ๆ ที่ให้ความสำคัญกับอธิปไตยของข้อมูล, latency ต่ำ และความเป็นส่วนตัว
19. SAIF
- SAIF (Secure AI Framework) คือเฟรมเวิร์กที่ Google พัฒนาขึ้นเพื่อให้คำแนะนำเชิงปฏิบัติสำหรับการจัดการความเสี่ยงด้านความปลอดภัยของ AI
- จัดการภัยคุกคามที่พบบ่อยอย่างเป็นระบบ เช่น data poisoning และ prompt injection ผ่านแผนที่ความเสี่ยงที่ชัดเจน การวิเคราะห์องค์ประกอบ และกลยุทธ์การบรรเทาที่ใช้งานได้จริง
- การเน้นไปที่ความเสี่ยงที่เปลี่ยนแปลงอยู่ตลอดของการสร้างระบบ agentic มีความเหมาะสมกับช่วงเวลาและมีคุณค่าเป็นพิเศษ
- มอบเพลย์บุ๊กที่กระชับและนำไปใช้ได้จริงสำหรับการเสริมความแข็งแกร่งให้แนวปฏิบัติด้านความปลอดภัยของการใช้ LLM และแอปพลิเคชันที่ขับเคลื่อนด้วย AI
20. Service mesh without sidecar
- เนื่องจากต้นทุนและความซับซ้อนในการปฏิบัติการของ service mesh แบบ sidecar ยังคงมีอยู่ เราจึงรู้สึกตื่นเต้นกับตัวเลือก service mesh แบบไม่มี sidecar อย่าง Istio ambient mode
- Ambient mode นำเสนอสถาปัตยกรรมแบบแบ่งชั้นที่แยกขอบเขตความรับผิดชอบออกเป็น 2 องค์ประกอบหลัก: L4 proxy ต่อโหนด (ztunnel) และ L7 proxy ต่อ namespace (Waypoint proxy)
- ztunnel ช่วยให้มั่นใจว่าทราฟฟิก L3 และ L4 ถูกส่งต่ออย่างมีประสิทธิภาพและปลอดภัย จัดการทั้งการดึงใบรับรองสำหรับทุก identity ของโหนด และการเปลี่ยนเส้นทางทราฟฟิกไปยัง workload ที่รองรับ ambient
- Waypoints proxy เป็นองค์ประกอบเสริมของ ambient mode ที่เปิดใช้ความสามารถของ Istio ที่สมบูรณ์ยิ่งขึ้น เช่น การจัดการทราฟฟิก ความปลอดภัย และการมองเห็นระบบ
21. Small language models
- สังเกตเห็นพัฒนาการอย่างต่อเนื่องของ small language models (SLMs) ตลอดหลายเล่มของ Technology Radar
- ความสนใจที่เพิ่มขึ้นต่อการสร้างโซลูชันเอเจนต์ ทำให้มีหลักฐานเพิ่มขึ้นว่า SLM สามารถขับเคลื่อน agentic AI ได้อย่างมีประสิทธิภาพ
- เวิร์กโฟลว์เอเจนต์ส่วนใหญ่ในปัจจุบันมุ่งเน้นงานเฉพาะทางและทำซ้ำที่ไม่ต้องการการให้เหตุผลขั้นสูง จึงเหมาะกับ SLM
- การพัฒนาอย่างต่อเนื่องของ SLM เช่น Phi-3, SmolLM2, DeepSeek ทำให้มีความสามารถเพียงพอสำหรับงานลักษณะนี้
22. Spec-driven development
- แนวทางเกิดใหม่สำหรับเวิร์กโฟลว์การเขียนโค้ดที่มี AI ช่วยเหลือ โดยคำจำกัดความของคำนี้ยังคงอยู่ระหว่างการพัฒนา
- โดยทั่วไปหมายถึงเวิร์กโฟลว์ที่เริ่มจากสเปกฟีเจอร์แบบมีโครงสร้าง จากนั้นค่อยแตกย่อยผ่านหลายขั้นตอนเป็นส่วนย่อย โซลูชัน และงานต่างๆ
- Kiro ของ Amazon จะพาผู้ใช้ผ่านเวิร์กโฟลว์ 3 ขั้น ได้แก่ requirements, design และการสร้างงาน
- spec-kit ของ GitHub ใช้กระบวนการ 3 ขั้นที่คล้ายกัน แต่เพิ่ม orchestration ที่สมบูรณ์ขึ้น, prompt ที่ปรับแต่งได้ และ "constitution" ที่กำหนดหลักการคงที่ซึ่งต้องปฏิบัติตามเสมอ
23. Team of coding agents
- เทคนิคที่นักพัฒนาประสานงาน AI coding agent หลายตัว โดยแต่ละตัวมีบทบาทเฉพาะของตนเอง เช่น architect, back-end specialist และ tester
- เครื่องมืออย่าง Claude Code, Roo Code, Kilo Code รองรับ subagent และหลายโหมดการทำงาน
- อาศัยหลักการที่พิสูจน์แล้วว่าการกำหนดบทบาทและ persona เฉพาะให้ LLM ช่วยปรับปรุงคุณภาพผลลัพธ์ โดยได้ผลลัพธ์ที่ดีกว่าจากการประสานงานเอเจนต์หลายบทบาท แทนการพึ่งเอเจนต์อเนกประสงค์เพียงตัวเดียว
- เป็นสัญญาณของการเปลี่ยนผ่านไปสู่ไปป์ไลน์การพัฒนาที่มี AI ช่วยเหลือแบบหลายขั้นและมีการ orchestration
24. Topology-aware scheduling
- GPU และ LPU ไม่ได้เป็นอุปกรณ์เดี่ยวอีกต่อไป แต่เป็นเครือข่ายตัวเร่งความเร็วที่เชื่อมโยงกันแน่นแฟ้น ซึ่งประสิทธิภาพขึ้นอยู่กับการจัดวางและโทโพโลยี
- ในระบบระดับแร็กอย่าง NVL72 ของ NVIDIA นั้น GPU 72 ตัวแชร์ VRAM มากกว่า 13TB และทำงานเสมือนเป็นตัวเร่งความเร็วตัวเดียว แต่เมื่อเวิร์กโหลดต้องข้าม switch island งานแบบ collective จะกลายเป็นคอขวด
- สถาปัตยกรรมที่กำหนดตารางด้วยซอฟต์แวร์ ณ เวลา compile ของ Groq ตั้งอยู่บนสมมติฐานเรื่องการเคลื่อนย้ายข้อมูลแบบกำหนดแน่นอน และการจัดตารางแบบสุ่มจะทำลายสมมติฐานและความสามารถในการคาดการณ์นี้
- ตัวจัดตารางแบบง่ายที่ไม่สนใจโทโพโลยีมักกระจายเวิร์กโหลดแบบมัลติ-GPU แบบตามอำเภอใจ ส่งผลให้เวลาในแต่ละสเต็ปและประสิทธิภาพลดลง
25. Toxic flow analysis for AI
- มุกคุ้นหูที่ว่า S ใน MCP ย่อมาจาก "security" กำลังซ่อนปัญหาที่เกิดขึ้นจริงอย่างมาก
- เมื่อเอเจนต์สื่อสารกันผ่านการเรียกใช้เครื่องมือหรือ API พวกมันอาจเจอกับสิ่งที่เรียกว่า lethal trifecta ได้อย่างรวดเร็ว: การเข้าถึงข้อมูลส่วนบุคคล, การเปิดรับเนื้อหาที่ไม่น่าเชื่อถือ และความสามารถในการสื่อสารออกสู่ภายนอก
- เอเจนต์ที่มีทั้งสามอย่างนี้มีความเปราะบางมาก และเพราะ LLM มีแนวโน้มทำตามคำสั่งในอินพุต เนื้อหาจากแหล่งที่ไม่น่าเชื่อถือซึ่งมีคำสั่งให้รั่วไหลข้อมูลจึงอาจนำไปสู่การรั่วไหลของข้อมูลได้ง่าย
- toxic flow analysis จะตรวจสอบกราฟการไหลของระบบเอเจนต์เพื่อระบุเส้นทางข้อมูลที่อาจไม่ปลอดภัยสำหรับการตรวจสอบเพิ่มเติม
Hold
26. AI-accelerated shadow IT
- AI ลดอุปสรรคให้คนที่ไม่เขียนโค้ดสามารถสร้างและเชื่อมต่อซอฟต์แวร์ได้ด้วยตนเอง แทนที่จะต้องรอฝ่าย IT
- แม้จะตื่นเต้นกับศักยภาพที่สิ่งนี้ปลดล็อก แต่ก็เฝ้าระวังสัญญาณแรกของ AI-accelerated shadow IT
- แพลตฟอร์ม no-code สำหรับทำ workflow automation ตอนนี้รองรับการเชื่อมต่อ AI API แล้ว เช่น OpenAI หรือ Anthropic ทำให้เกิดแรงจูงใจในการใช้ AI เป็นเหมือน duct tape เพื่อเชื่อมการบูรณาการที่ก่อนหน้านี้เป็นไปไม่ได้
- ขณะเดียวกัน AI coding assistant ก็มีความเป็นเอเจนต์มากขึ้น ทำให้คนที่ไม่เขียนโค้ดแต่ผ่านการฝึกพื้นฐานสามารถสร้างแอปพลิเคชันยูทิลิตีภายในได้
27. Capacity-driven development
- หัวใจสำคัญของความสำเร็จในแนวปฏิบัติการพัฒนาซอฟต์แวร์สมัยใหม่คือการคงโฟกัสไว้ที่การไหลของงาน
- ทีมแบบ Stream-aligned มุ่งเน้นไปที่สตรีมคุณค่าหนึ่งเดียว เช่น user journey หรือผลิตภัณฑ์ เพื่อส่งมอบคุณค่าแบบ end-to-end ได้อย่างมีประสิทธิภาพ
- อย่างไรก็ตาม พบแนวโน้มที่น่ากังวลไปสู่ capacity-driven development ซึ่งทีมที่จัดแนวแบบนี้เมื่อมีความสามารถเหลือ จะไปรับงานฟีเจอร์ของผลิตภัณฑ์หรือสตรีมอื่น
- ในระยะสั้นอาจดูมีประสิทธิภาพ แต่เป็นการเพิ่มประสิทธิภาพเฉพาะจุดที่เหมาะกับการรับมือความต้องการพุ่งสูง และหากกลายเป็นเรื่องปกติจะเพิ่มภาระทางความคิดและหนี้ทางเทคนิค
28. Complacency with AI-generated code
- เมื่อ AI coding assistant และเอเจนต์ได้รับความสนใจมากขึ้น ก็มีข้อมูลและงานวิจัยเพิ่มขึ้นที่ตอกย้ำความกังวลเรื่อง complacency with AI-generated code
- แม้จะมีหลักฐานมากพอว่าเครื่องมือเหล่านี้ช่วยเร่งการพัฒนาได้ แต่งานวิจัยแสดงให้เห็นว่าคุณภาพโค้ดอาจลดลงเมื่อเวลาผ่านไป
- งานวิจัย 2024 research ของ GitClear พบว่าโค้ดซ้ำและ code churn เพิ่มขึ้นมากกว่าที่คาดไว้ ขณะที่กิจกรรม refactoring ในประวัติคอมมิตกลับลดลง
- งาน research ของ Microsoft กับกลุ่ม knowledge worker แสดงให้เห็นว่าความมั่นใจที่ขับเคลื่อนด้วย AI มักเกิดขึ้นพร้อมกับการลดลงของการคิดเชิงวิพากษ์
29. Naive API-to-MCP conversion
- องค์กรต่างๆ ต้องการแปลง API ภายในของตนเป็น Model Context Protocol (MCP) อย่างราบรื่นและตรงไปตรงมา เพื่อให้ AI agent โต้ตอบกับระบบที่มีอยู่ได้
- มีเครื่องมือจำนวนเพิ่มขึ้นที่พยายามรองรับการแปลงนี้ เช่น MCP link และ FastAPI-MCP
- มีจุดยืนคัดค้าน naive API-to-MCP conversion ลักษณะนี้ เพราะ API มักถูกออกแบบมาสำหรับนักพัฒนามนุษย์ และประกอบด้วยงานย่อยระดับอะตอมที่ละเอียดเกินไป ซึ่งเมื่อ AI นำไปเชื่อมต่อกันอาจทำให้ใช้โทเค็นมากเกินจำเป็น บริบทปนเปื้อน และประสิทธิภาพของเอเจนต์ลดลง
- API เหล่านี้ โดยเฉพาะ API ภายใน มักเปิดเผยข้อมูลอ่อนไหวหรืออนุญาตให้ทำงานที่สร้างความเสียหายได้
30. Standalone data engineering teams
- การจัดทีมวิศวกรรมข้อมูลแยกต่างหากที่พัฒนาและเป็นเจ้าของ data pipeline และผลิตภัณฑ์ โดยแยกจากโดเมนธุรกิจสตรีมที่ให้บริการ เป็น anti-pattern ที่นำไปสู่ความไม่มีประสิทธิภาพและผลลัพธ์ทางธุรกิจที่อ่อนแอ
- โครงสร้างนี้ทำซ้ำความผิดพลาดในอดีตจากการแยกความสามารถด้าน DevOps การทดสอบ หรือการ deploy ออกจากกัน ก่อให้เกิด knowledge silo, คอขวด และการสูญเปล่าของความพยายาม
- หากไม่มีการทำงานร่วมกันอย่างใกล้ชิด วิศวกรข้อมูลมักขาดบริบทธุรกิจและโดเมนที่จำเป็นต่อการออกแบบ data product ที่มีความหมาย ทำให้ทั้งการยอมรับใช้งานและคุณค่าถูกจำกัด
- ทางเลือกที่ดีกว่าคือให้ทีม data platform มุ่งเน้นการดูแลโครงสร้างพื้นฐานที่ใช้ร่วมกัน และให้ทีมธุรกิจข้ามสายงานสร้างและเป็นเจ้าของ data products ของตนเองตามหลักการ data mesh
31. Text to SQL
- Text to SQL ใช้ LLM แปลภาษาธรรมชาติเป็น SQL ที่รันได้ แต่ความน่าเชื่อถือมักยังไม่ถึงระดับที่คาดหวัง
- จึงย้าย blip นี้ไปไว้ใน Hold เพื่อไม่แนะนำให้ใช้ใน workflow ที่ไม่มีการกำกับดูแล เช่น การซ่อนเอาต์พุตไว้ หรือการแปลงคิวรีที่ผู้ใช้สร้างขึ้นแบบอัตโนมัติอย่างไดนามิก
- ในกรณีเหล่านี้ LLM มักเกิด hallucination เนื่องจากมีความเข้าใจ schema หรือโดเมนอย่างจำกัด ทำให้เสี่ยงต่อการดึงข้อมูลผิดพลาดหรือแก้ไขข้อมูลโดยไม่ตั้งใจ
- สำหรับ agentic business intelligence ควรหลีกเลี่ยงการเข้าถึงฐานข้อมูลโดยตรง และใช้ semantic layer สำหรับ data abstraction ที่มีการจัดการแทน เช่น Cube หรือ dbt's semantic layer
[Platforms]
Adopt
32. Arm in the cloud
- Arm compute instances บนคลาวด์ได้รับความนิยมมากขึ้นเรื่อย ๆ ในช่วงไม่กี่ปีที่ผ่านมา เพราะมีประสิทธิภาพด้านต้นทุนและพลังงานเมื่อเทียบกับอินสแตนซ์แบบ x86 ดั้งเดิม
- ผู้ให้บริการคลาวด์รายใหญ่รวมถึง AWS, Azure และ GCP ต่างก็มีตัวเลือก Arm ที่แข็งแกร่งแล้วในตอนนี้
- หลายทีมย้าย workload อย่าง microservices, ฐานข้อมูลโอเพนซอร์ส และแม้แต่ high-performance computing ไปยัง Arm ได้สำเร็จ โดยแทบไม่ต้องแก้โค้ดมากนักและปรับเพียง build script เล็กน้อย
- เครื่องมือสมัยใหม่อย่าง multi-arch Docker images ช่วยให้การ build และ deploy บนทั้งสภาพแวดล้อม Arm และ x86 ง่ายขึ้น
Trial
33. Apache Paimon
- Apache Paimon เป็นฟอร์แมต data lake แบบโอเพนซอร์สที่ออกแบบมาเพื่อรองรับ lakehouse architecture
- ผสานการทำงานได้อย่างราบรื่นกับเอนจินประมวลผลอย่าง Flink และ Spark จึงรองรับทั้งงานสตรีมมิงและงานแบตช์
- จุดเด่นสำคัญของสถาปัตยกรรม Paimon คือการผสานระหว่างฟอร์แมต data lake มาตรฐานกับโครงสร้าง LSM (log-structured merge tree)
- การผสานนี้ช่วยแก้โจทย์ดั้งเดิมของ data lake เรื่องการอัปเดตประสิทธิภาพสูงและการอ่านที่มี latency ต่ำ
34. DataDog LLM Observability
- Datadog LLM Observability ให้ความสามารถด้านการติดตาม มอนิเตอร์ และวินิจฉัยแบบ end-to-end สำหรับ workflow ของ large language model และแอปพลิเคชัน agent
- ระบบจะจับคู่แต่ละ prompt, การเรียกใช้เครื่องมือ และขั้นตอนกลางเป็น span และ trace พร้อมติดตาม latency, ปริมาณ token, ข้อผิดพลาด และ metric ด้านคุณภาพ และผสานเข้ากับชุดผลิตภัณฑ์ APM และ observability ที่กว้างขวางของ Datadog
- องค์กรที่ใช้ Datadog อยู่แล้วและคุ้นเคยกับโครงสร้างค่าใช้จ่ายของมัน อาจพบว่าความสามารถด้าน LLM observability เป็นวิธีที่ตรงไปตรงมาในการมองเห็น AI workload ตราบใดที่สามารถ instrument workload เหล่านั้นได้
- การตั้งค่าและใช้งาน LLM instrumentation ต้องอาศัยความระมัดระวังและความเข้าใจที่ชัดเจนต่อ workload และการนำไปใช้งาน และแนะนำให้วิศวกรข้อมูลกับบุคลากรฝ่ายปฏิบัติการทำงานร่วมกันอย่างใกล้ชิดระหว่างการ deploy
35. Delta Sharing
- Delta Sharing เป็นมาตรฐานเปิดและโปรโตคอลสำหรับการแชร์ข้อมูลข้ามแพลตฟอร์มอย่างปลอดภัย ที่พัฒนาโดย Databricks และ Linux Foundation
- มีความเป็นอิสระจากคลาวด์ และเปิดให้องค์กรแชร์ข้อมูลแบบ live ข้ามผู้ให้บริการคลาวด์และตำแหน่ง on-premises ได้โดยไม่ต้องคัดลอกหรือทำสำเนาข้อมูล
- ใช้ REST API แบบเรียบง่ายเพื่อออก URL ที่มีการ presign แบบระยะสั้น ทำให้ผู้รับสามารถดึงชุดข้อมูลขนาดใหญ่ด้วยเครื่องมืออย่าง pandas, Spark หรือ Power BI
- รองรับการแชร์ตารางข้อมูล, view, โมเดล AI และโน้ตบุ๊ก พร้อมมอบความสามารถด้าน governance และ audit แบบรวมศูนย์ที่แข็งแกร่ง
36. Dovetail
- Dovetail platform เข้ามาแก้ปัญหาท้าทายที่ดำเนินมาอย่างต่อเนื่องในการจัดการข้อมูลวิจัยเชิงคุณภาพที่กระจัดกระจาย
- ให้คลังข้อมูลส่วนกลางสำหรับบทสัมภาษณ์ผู้ใช้ บันทึกถอดความ และ insight ช่วยเปลี่ยนข้อมูลดิบให้เป็นทรัพย์สินที่มีโครงสร้างและวิเคราะห์ได้
- มีประโยชน์อย่างยิ่งใน workflow ด้าน product discovery โดยเฉพาะการสร้าง evidence trail ที่เชื่อมคำพูดของลูกค้าและธีมที่สังเคราะห์แล้วเข้ากับสมมติฐานของผลิตภัณฑ์และ ROI ที่คาดไว้โดยตรง
- ด้วยวิธีนี้ Dovetail จึงช่วยเสริมบทบาทของข้อมูลเชิงคุณภาพในการตัดสินใจด้านผลิตภัณฑ์
37. Langdock
- Langdock เป็นแพลตฟอร์มสำหรับให้องค์กรพัฒนาและรันเอเจนต์ generative AI และ workflow สำหรับการดำเนินงานภายใน
- ให้สภาพแวดล้อมแบบรวมศูนย์ที่มีทั้งผู้ช่วยแชตภายใน, API layer สำหรับเชื่อมต่อกับ LLM หลายตัว และเครื่องมือสร้าง agent workflow ที่เชื่อมกับระบบอย่าง Slack, Confluence และ Google Drive
- แพลตฟอร์มนี้มีตัวเลือกทั้ง on-premises และการโฮสต์ใน EU พร้อมมาตรฐานด้าน compliance ระดับองค์กร จึงเน้นเรื่อง data sovereignty
- องค์กรที่นำ Langdock ไปใช้งานยังคงต้องใส่ใจกับ data governance อย่างมาก และใช้เทคนิคอย่าง toxic flow analysis เพื่อป้องกัน lethal trifecta
38. LangSmith
- LangSmith เป็นแพลตฟอร์มแบบโฮสต์จากทีม LangChain ที่ให้ความสามารถด้าน observability, tracing และ evaluation สำหรับแอปพลิเคชัน LLM
- มันบันทึก trace อย่างละเอียดของ chain, tool และ prompt ทำให้ทีมสามารถดีบักและวัดพฤติกรรมของโมเดล ติดตาม performance regression และจัดการชุดข้อมูลสำหรับการประเมินได้
- LangSmith เป็นแพลตฟอร์ม SaaS แบบ proprietary ที่รองรับ workflow ที่ไม่ใช่ LangChain ได้อย่างจำกัด จึงน่าสนใจที่สุดสำหรับทีมที่ลงทุนกับ ecosystem นี้อยู่แล้ว
- การรองรับแบบบูรณาการสำหรับการประเมิน prompt และการทดลองต่าง ๆ นั้นดูสมบูรณ์ยิ่งกว่าเมื่อเทียบกับทางเลือกโอเพนซอร์สอย่าง Langfuse
39. Model Context Protocol (MCP)
- Model Context Protocol (MCP) คือมาตรฐานเปิดที่กำหนดวิธีที่แอปพลิเคชันและเอเจนต์ LLM จะผสานรวมกับแหล่งข้อมูลและเครื่องมือภายนอก
- MCP แตกต่างจากโปรโตคอล Agent2Agent (A2A) ที่ใช้จัดการการสื่อสารระหว่างเอเจนต์ โดย MCP มุ่งเน้นที่บริบทและการเข้าถึงเครื่องมือ
- หลังจาก blip ครั้งก่อน การนำ MCP ไปใช้เพิ่มขึ้นอย่างมาก โดยบริษัทใหญ่ ๆ เช่น JetBrains (IntelliJ) และ Apple ได้เข้าร่วมระบบนิเวศนี้ พร้อมกับเฟรมเวิร์กเกิดใหม่อย่าง FastMCP
- มาตรฐาน MCP Registry ที่อยู่ในสถานะพรีวิว ตอนนี้รองรับการค้นหาเครื่องมือทั้งแบบสาธารณะและแบบปิดแล้ว
40. n8n
- n8n เป็นแพลตฟอร์มอัตโนมัติเวิร์กโฟลว์ภายใต้ไลเซนส์ fair-code คล้ายกับ Zapier หรือ Make (เดิมชื่อ Integromat) แต่สร้างมาสำหรับนักพัฒนาที่ต้องการตัวเลือกแบบ self-hosted, ขยายต่อได้ และควบคุมด้วยโค้ดได้
- มีแนวทางแบบ low-code และภาพกราฟิกสำหรับการสร้างเวิร์กโฟลว์มากกว่า Apache Airflow ขณะเดียวกันก็รองรับโค้ดคัสตอมด้วย JavaScript หรือ Python
- กรณีใช้งานหลักคือการรวมหลายบริการเข้าด้วยกันเป็นเวิร์กโฟลว์อัตโนมัติ แต่ก็สามารถเชื่อม LLM เข้ากับแหล่งข้อมูล หน่วยความจำ และเครื่องมือที่กำหนดค่าได้เช่นกัน
- หลายทีมใช้ n8n เพื่อทำต้นแบบเวิร์กโฟลว์เอเจนต์อย่างรวดเร็วผ่านแอปแชตหรือเว็บฮุกที่เป็นตัวกระตุ้น และมักใช้ความสามารถ import และ export เพื่อสร้างเวิร์กโฟลว์ด้วยการช่วยเหลือจาก AI
41. OpenThread
- OpenThread คืออิมพลีเมนเทชันโอเพนซอร์สของโปรโตคอลเครือข่าย Thread ที่พัฒนาโดย Google
- รองรับความสามารถหลักทั้งหมดของข้อกำหนด Thread รวมถึงเลเยอร์เครือข่ายอย่าง IPv6, 6LoWPAN และ LR-WPAN รวมถึงความสามารถด้าน mesh network ที่ทำให้อุปกรณ์ทำงานเป็นทั้งโหนดและ border router ได้
- OpenThread ทำงานได้บนฮาร์ดแวร์หลากหลายแพลตฟอร์ม โดยใช้ abstraction layer ที่ยืดหยุ่นและ integration hook ที่ช่วยให้ผู้ผลิตรวมวิทยุและความสามารถด้านการเข้ารหัสของตนเองเข้าไปได้
- โปรโตคอลที่เติบโตเต็มที่นี้ถูกใช้แพร่หลายในผลิตภัณฑ์เชิงพาณิชย์ และจากประสบการณ์พบว่าเชื่อถือได้สำหรับการสร้างโซลูชัน IoT ที่หลากหลาย ตั้งแต่อุปกรณ์พลังงานต่ำที่ใช้แบตเตอรี่ไปจนถึงเครือข่ายเซ็นเซอร์ mesh ขนาดใหญ่
Assess
42. AG-UI Protocol
- AG-UI คือโปรโตคอลและไลบรารีแบบเปิดที่ออกแบบมาเพื่อทำให้ user interface แบบสมบูรณ์และการสื่อสารระหว่างเอเจนต์เป็นมาตรฐานเดียวกัน
- มุ่งเน้นไปที่เอเจนต์ที่ติดต่อกับผู้ใช้โดยตรง และทำให้ใช้งานได้ทั่วไปกับทุก frontend และ backend ผ่านการผสานรวมฝั่ง middleware และ client
- โปรโตคอลนี้กำหนดวิธีที่สอดคล้องกันให้เอเจนต์ฝั่ง backend สื่อสารกับแอปพลิเคชันฝั่ง frontend ทำให้เกิดการทำงานร่วมกันแบบเรียลไทม์ที่มีการเก็บสถานะระหว่าง AI กับผู้ใช้มนุษย์ได้
- รองรับโปรโตคอลขนส่งหลายแบบ รวมถึง SSE และ WebSockets และมีประเภทอีเวนต์ที่เป็นมาตรฐานเพื่อแสดงสถานะต่าง ๆ ของการทำงานของเอเจนต์
43. Agent-to-Agent (A2A) Protocol
- Agent2Agent (A2A) คือโปรโตคอลที่กำหนดมาตรฐานสำหรับการสื่อสารและปฏิสัมพันธ์ระหว่างเอเจนต์ในเวิร์กโฟลว์แบบหลายเอเจนต์ที่ซับซ้อน
- ใช้ Agent Cards เพื่ออธิบายองค์ประกอบหลักของการสื่อสารระหว่างเอเจนต์ รวมถึงข้อกำหนดด้านการค้นพบความสามารถ การถ่ายโอน และโครงร่างความปลอดภัย
- A2A ช่วยเสริม Model Context Protocol (MCP) โดยมุ่งเน้นที่การสื่อสารระหว่างเอเจนต์โดยไม่เปิดเผยรายละเอียดภายใน เช่น สถานะ หน่วยความจำ หรือ internals ของเอเจนต์
- โปรโตคอลนี้ส่งเสริมแนวปฏิบัติที่ดี เช่น แนวทางแบบ asynchronous-first สำหรับงานที่ใช้เวลานาน การตอบสนองแบบสตรีมสำหรับอัปเดตแบบค่อยเป็นค่อยไป และการรับส่งข้อมูลอย่างปลอดภัยด้วย HTTPS, authentication และ authorization
44. Amazon S3 Vectors
- Amazon S3 Vectors ขยาย S3 object storage ด้วยความสามารถด้านเวกเตอร์แบบเนทีฟ พร้อมฟังก์ชัน vector storage และ similarity search ในตัว
- ผสานรวมกับระบบนิเวศ AWS ได้อย่างราบรื่น รวมถึง Amazon Bedrock และ OpenSearch และมีความสามารถเพิ่มเติมอย่างการกรองเมทาดาทาและการกำกับดูแลผ่าน IAM
- แม้ยังอยู่ในสถานะพรีวิวและมีข้อจำกัดอยู่ แต่คุณค่าที่นำเสนอนั้นน่าสนใจ — แนวทางด้าน vector storage ที่คุ้มค่าและเข้าถึงได้ง่ายนี้สามารถใช้กับแอปพลิเคชันหลากหลายประเภทที่มีข้อมูลปริมาณมากและไม่ได้กังวลเรื่อง latency ต่ำเป็นหลัก
45. Ardoq
- Ardoq คือแพลตฟอร์ม enterprise architecture (EA) ที่ช่วยให้องค์กรสร้าง จัดการ และขยายฐานความรู้ด้านสถาปัตยกรรมเพื่อวางแผนอนาคตได้อย่างมีประสิทธิภาพยิ่งขึ้น
- ต่างจากเอกสารแบบคงที่ดั้งเดิมที่มักเกิด drift และแยกเป็นไซโล แนวทางที่ขับเคลื่อนด้วยข้อมูลของ Ardoq จะดึงข้อมูลจากระบบที่มีอยู่เพื่อสร้าง knowledge graph แบบไดนามิกที่คงความทันสมัยตามการเปลี่ยนแปลงของ landscape
- ความสามารถที่มีประโยชน์อย่างยิ่งคือ Ardoq Scenarios ซึ่งใช้แนวทาง branching และ merging คล้าย Git เพื่อสร้างแบบจำลองและกำหนดสถานะอนาคตแบบ what-if ได้ในเชิงภาพ
- องค์กรที่กำลังผลักดันการเปลี่ยนผ่านด้านสถาปัตยกรรมควรประเมินแพลตฟอร์ม EA เฉพาะทางอย่าง Ardoq เพื่อดูศักยภาพในการทำให้กระบวนการนี้ง่ายและเร็วขึ้น
46. CloudNativePG
- CloudNativePG คือ Kubernetes Operator ที่ช่วยทำให้การโฮสต์และจัดการคลัสเตอร์ PostgreSQL แบบ high availability บน Kubernetes ง่ายขึ้น
- การรันบริการแบบ stateful อย่าง PostgreSQL บน Kubernetes อาจซับซ้อน เพราะต้องมีความรู้เชิงลึกทั้งเรื่อง Kubernetes และการทำ replication ของ PostgreSQL
- CloudNativePG ซ่อนความซับซ้อนส่วนใหญ่ไว้ด้วยการปฏิบัติต่อคลัสเตอร์ PostgreSQL ทั้งหมดเป็นรีซอร์ซเชิงประกาศเดียวที่กำหนดค่าได้
- มีสถาปัตยกรรม primary/standby ที่ราบรื่นด้วย native streaming replication และมาพร้อมความสามารถด้าน high availability ตั้งแต่ต้น เช่น self-healing, automatic failover ที่โปรโมต replica ที่ตามทันที่สุด และการสร้าง replica ที่ล้มเหลวขึ้นมาใหม่โดยอัตโนมัติ
47. Coder
- Coder คือแพลตฟอร์มที่ช่วย provision สภาพแวดล้อมการเขียนโค้ดแบบมาตรฐานได้อย่างรวดเร็ว ตามแนวปฏิบัติ development environments in the cloud ที่กล่าวถึงก่อนหน้านี้
- เมื่อเทียบกับเครื่องมือที่คล้ายกันอย่าง Gitpod (ปัจจุบันรีแบรนด์เป็น Ona) และ GitHub Codespaces, Coder ให้การควบคุมการปรับแต่ง workstation ได้มากกว่าผ่าน Terraform
- โฮสต์ workstation บนโครงสร้างพื้นฐานของคุณเองในคลาวด์หรือดาต้าเซ็นเตอร์ แทนที่จะใช้เซิร์ฟเวอร์ของผู้ขาย
- แนวทางนี้ให้ความยืดหยุ่นมากขึ้น รวมถึงความสามารถในการรันเอเจนต์เขียนโค้ด AI และเข้าถึงระบบภายในขององค์กร
48. Graft
- Graft คือเอนจินทรานแซกชันสตอเรจที่ทำให้การซิงก์ข้อมูลที่มีความสอดคล้องกันสูงและมีประสิทธิภาพเป็นไปได้ในสภาพแวดล้อมแบบ edge และแบบกระจาย
- ใช้ lazy replication เพื่อซิงก์ข้อมูลเฉพาะเมื่อจำเป็น, ใช้ partial replication เพื่อลดการใช้แบนด์วิดท์ และใช้ serializable snapshot isolation เพื่อรับประกันความถูกต้องของข้อมูล
- แม้ Radar จะเคยกล่าวถึง Electric สำหรับกรณีใช้งานที่คล้ายกัน แต่ Graft มีความโดดเด่นตรงที่เปลี่ยน object storage ให้เป็นระบบทรานแซกชันที่รองรับการอัปเดตระดับเพจอย่างสอดคล้อง โดยไม่บังคับรูปแบบข้อมูล
- เหมาะสำหรับขับเคลื่อนแอปพลิเคชันมือถือแบบ local-first, จัดการการซิงก์ข้ามแพลตฟอร์มที่ซับซ้อน และทำหน้าที่เป็นแกนหลักของ replica แบบ stateless ในระบบ serverless หรือ embedded
49. groundcover
- groundcover คือแพลตฟอร์ม observability แบบ cloud-native ที่รวม logs, traces, metrics และเหตุการณ์ของ Kubernetes ไว้ในหน้าต่างเดียว
- ใช้ eBPF เพื่อเก็บข้อมูล observability แบบละเอียดด้วย zero-code instrumentation โดยไม่ต้องแทรกเอเจนต์หรือ SDK ลงในโค้ดแอปพลิเคชัน
- eBPF sensor ของ groundcover ทำงานบนโหนดเฉพาะของแต่ละคลัสเตอร์ที่ถูกมอนิเตอร์ และทำงานแยกจากแอปพลิเคชันที่มันเฝ้าสังเกต
- ความสามารถหลักประกอบด้วย observability ระดับเคอร์เนลเชิงลึก, bring-your-own-cloud (BYOC) architecture เพื่อความเป็นส่วนตัวของข้อมูล และโมเดลราคาที่ไม่ขึ้นกับปริมาณข้อมูลเพื่อให้คาดการณ์ค่าใช้จ่ายได้
50. Karmada
- Karmada ("Kubernetes Armada") คือแพลตฟอร์มสำหรับ orchestration เวิร์กโหลดข้ามหลาย Kubernetes คลัสเตอร์, คลาวด์ และดาต้าเซ็นเตอร์
- ปัจจุบันหลายทีมยังคงผสานเครื่องมือ GitOps อย่าง Flux หรือ ArgoCD เข้ากับสคริปต์แบบคัสตอมเพื่อดีพลอยทั่วทั้งคลัสเตอร์ ดังนั้นโซลูชันที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะจึงเป็นที่ต้อนรับ
- Karmada ใช้ Kubernetes-native API จึงไม่จำเป็นต้องแก้ไขแอปพลิเคชันที่สร้างไว้แล้วสำหรับสภาพแวดล้อม cloud-native
- มีความสามารถด้าน scheduling ขั้นสูงสำหรับการจัดการแบบ multi-cloud, high availability, disaster recovery และ traffic scheduling
51. OpenFeature
- เมื่อธุรกิจขยายตัว การจัดการ feature flag มักซับซ้อนขึ้นเรื่อยๆ และทีมต่างๆ ต้องการ abstraction layer ที่ไปไกลกว่า feature toggle แบบพื้นฐานที่สุด
- OpenFeature มอบเลเยอร์นี้ผ่านข้อกำหนด API ที่เป็นกลางต่อผู้ให้บริการและขับเคลื่อนโดยชุมชน เพื่อสร้างมาตรฐานให้กับวิธีที่ feature flag ถูกนิยามและถูกใช้งาน
- CLI รองรับการนิยามสคีมาหลากหลายอย่างกว้างขวาง ตั้งแต่การตั้งค่าพื้นฐานด้วย environment variable หรือ in-memory configuration ไปจนถึงแพลตฟอร์มที่成熟แล้วอย่าง ConfigCat หรือ LaunchDarkly
- อย่างไรก็ตาม ยังมีข้อควรระวังสำคัญอยู่ข้อหนึ่ง: ทีมควรแยกจัดการ categories of flags แต่ละประเภทอย่างมีวินัย เพื่อหลีกเลี่ยงการเพิ่มจำนวน flag เกินควบคุม, ความซับซ้อนของแอปพลิเคชัน และภาระการทดสอบที่มากเกินไป
52. Oxide
- การสร้างและปฏิบัติการโครงสร้างพื้นฐานแบบ private มีความซับซ้อน และนี่คือหนึ่งในเหตุผลหลักที่ public cloud กลายเป็นตัวเลือกเริ่มต้นสำหรับองค์กรส่วนใหญ่
- แต่สำหรับผู้ที่จำเป็นต้องใช้ Oxide มอบทางเลือกที่ประกอบและบูรณาการทั้งฮาร์ดแวร์และซอฟต์แวร์ขึ้นมาใหม่ตั้งแต่ต้น
- ให้บริการแร็กที่ประกอบสำเร็จล่วงหน้าซึ่งมีทั้งคอมพิวต์ เครือข่าย และสตอเรจ พร้อมรัน system software ที่บูรณาการอย่างสมบูรณ์
- ทีมสามารถจัดการทรัพยากรผ่าน IaaS API ของ Oxide โดยใช้ Terraform และเครื่องมืออัตโนมัติอื่นๆ ซึ่งเป็นสิ่งที่ Oxide เรียกว่าโครงสร้างพื้นฐานแบบยืดหยุ่น on-premises
53. Restate
- Restate คือแพลตฟอร์มสำหรับ persistent execution ที่ออกแบบมาเพื่อแก้โจทย์ระบบกระจายที่ซับซ้อนเมื่อสร้างแอปพลิเคชันแบบ stateful และ fault-tolerant
- ผ่าน execution journaling แพลตฟอร์มจะบันทึกทุกขั้นตอนเพื่อรับประกัน fault tolerance, การกู้คืนที่เชื่อถือได้ และการสื่อสารระหว่างบริการแบบ exactly-once
- ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของแพลตฟอร์มคือการแยก application logic ออกเป็นบริการแบบ persistent สามประเภท: Basic Services สำหรับฟังก์ชันแบบ stateless, Virtual Objects สำหรับจำลองเอนทิตีแบบ concurrent ที่มีสถานะ, และ Workflows สำหรับ orchestration กระบวนการหลายขั้นตอนที่ซับซ้อน
- กำลังประเมิน Restate อย่างรอบคอบในระบบประกันภัยขนาดใหญ่ และจนถึงตอนนี้พึงพอใจกับประสิทธิภาพอย่างมาก
54. SkyPilot
- SkyPilot คือแพลตฟอร์มโอเพนซอร์สสำหรับรันและสเกลเวิร์กโหลด AI ทั้ง on-premises หรือบนคลาวด์
- SkyPilot ซึ่งพัฒนาโดย Sky Computing Lab แห่ง UC Berkeley ทำหน้าที่เป็น intelligent broker ที่ค้นหาและ provision GPU ที่ถูกที่สุดและพร้อมใช้งานโดยอัตโนมัติบนคลาวด์รายใหญ่และ Kubernetes คลัสเตอร์ ซึ่งมักช่วยลดต้นทุนคอมพิวต์ได้
- สำหรับทีมโครงสร้างพื้นฐาน มันช่วยทำให้การรัน AI บน Kubernetes ง่ายขึ้นด้วยความสะดวกในการใช้งานแบบ Slurm, ความแข็งแกร่งแบบ cloud-native, การเข้าถึง pod โดยตรงผ่าน SSH และความสามารถอย่าง gang scheduling และการรองรับ multi-cluster
- รองรับการสเกลเวิร์กโหลดฝึกสอนหรืออนุมานได้อย่างราบรื่น
55. StarRocks
- StarRocks คือฐานข้อมูลเชิงวิเคราะห์ที่นิยามใหม่ของ business intelligence แบบเรียลไทม์ โดยผสานความเร็วของระบบ OLAP แบบดั้งเดิมเข้ากับความยืดหยุ่นของ data lakehouse สมัยใหม่
- บรรลุ query latency ต่ำกว่า 1 วินาทีในระดับขนาดใหญ่ด้วย SIMD-optimized execution engine, column store และ cost-based optimizer ที่ซับซ้อน
- สถาปัตยกรรมประสิทธิภาพสูงนี้ทำให้ผู้ใช้สามารถรันวิเคราะห์ที่ซับซ้อนกับรูปแบบข้อมูลแบบเปิดอย่าง Apache Iceberg ได้โดยตรง โดยไม่ต้องคำนวณล่วงหน้าหรือคัดลอกข้อมูล
- แม้จะมีหลายแพลตฟอร์มในพื้นที่นี้ แต่ StarRocks ถูกมองว่าเป็นตัวเลือกที่แข็งแกร่งสำหรับโซลูชันที่คุ้มค่า ซึ่งต้องรองรับทั้ง concurrency ระดับสูงมากและความสดใหม่ของข้อมูลล่าสุดอย่างสม่ำเสมอ
56. Uncloud
- Uncloud คือเครื่องมือ orchestration และ clustering สำหรับคอนเทนเนอร์แบบน้ำหนักเบา ที่ช่วยให้นักพัฒนานำแอปพลิเคชัน Docker Compose ขึ้นสู่ production ได้
- มอบประสบการณ์ที่เรียบง่ายและให้ความรู้สึกเหมือนคลาวด์โดยไม่มี operational overhead แบบ Kubernetes
- สามารถสเกลข้ามหลายเครื่องและดีพลอยแบบไม่มี downtime ได้ ด้วยการตั้งค่า mesh network ที่ปลอดภัยด้วย WireGuard สำหรับการสื่อสารโดยอัตโนมัติ และใช้ reverse proxy ของ Caddy เพื่อให้มี HTTPS อัตโนมัติและ load balancing
- ข้อได้เปรียบเชิงสถาปัตยกรรมหลักของ Uncloud คือการออกแบบแบบกระจายศูนย์อย่างสมบูรณ์ ซึ่งตัดความจำเป็นของ central control plane ออกไป และรับประกันว่าการทำงานของคลัสเตอร์จะยังคงใช้งานได้แม้เครื่องบางเครื่องจะออฟไลน์
[Tools]
Adopt
57. ClickHouse
- ClickHouse คือฐานข้อมูล OLAP แบบ distributed และโอเพนซอร์สสำหรับการวิเคราะห์แบบเรียลไทม์
- เติบโตเป็นเอนจินที่มีประสิทธิภาพสูงมากและสเกลได้ดีสำหรับรองรับการวิเคราะห์ข้อมูลขนาดใหญ่
- ด้วย incremental materialized views, query engine ที่มีประสิทธิภาพ และการบีบอัดข้อมูลที่แข็งแกร่ง ทำให้เหมาะอย่างยิ่งกับ interactive queries
- การรองรับ approximate aggregate functions ในตัวช่วยให้สามารถเลือกระหว่างความแม่นยำกับประสิทธิภาพได้ ซึ่งมีประโยชน์อย่างยิ่งสำหรับการวิเคราะห์ข้อมูลที่มี cardinality สูง
58. NeMo Guardrails
- NeMo Guardrails คือชุดเครื่องมือโอเพนซอร์สจาก NVIDIA ที่ช่วยเพิ่มกลไกความปลอดภัยและการควบคุมแบบโปรแกรมได้ให้กับแอปพลิเคชันสนทนาที่ขับเคลื่อนด้วย LLM ได้อย่างง่ายดาย
- ช่วยกำหนดและบังคับใช้กฎพฤติกรรมเพื่อให้มั่นใจว่าเอาต์พุตมีความปลอดภัย ตรงประเด็น และเป็นไปตามข้อกำหนด
- นักพัฒนาใช้ Colang ซึ่งเป็นภาษาที่สร้างมาเพื่อจุดประสงค์นี้โดยเฉพาะ เพื่อสร้าง conversation flow ที่ยืดหยุ่น จัดการบทสนทนา และบังคับใช้เส้นทางกับขั้นตอนการปฏิบัติงานที่กำหนดไว้ล่วงหน้า
- NeMo Guardrails มี asynchronous-first API เพื่อประสิทธิภาพ และรองรับ guardrails สำหรับความปลอดภัยของเนื้อหา ความมั่นคงปลอดภัย ตลอดจนการปรับแต่งอินพุตและเอาต์พุต
59. pnpm
- นับตั้งแต่ Radar ครั้งก่อน เรายังคงได้รับคำติชมเชิงบวกเกี่ยวกับ pnpm จากทีมอย่างต่อเนื่อง
- pnpm เป็นตัวจัดการแพ็กเกจสำหรับ Node.js ที่ให้ประสิทธิภาพดีขึ้นอย่างมากเมื่อเทียบกับทางเลือกอื่น ทั้งในด้านความเร็วและประสิทธิภาพการใช้พื้นที่ดิสก์
- รองรับการเพิ่มประสิทธิภาพระดับไฟล์แบบ incremental โดยทำ hard link ให้แพ็กเกจที่ซ้ำกันจากโฟลเดอร์ node_modules ของหลายโปรเจ็กต์ไปยังตำแหน่งเดียวบนดิสก์ ซึ่งช่วยเพิ่มประสิทธิภาพได้อีก
- pnpm กลายเป็นตัวเลือกเริ่มต้นสำหรับการจัดการแพ็กเกจของ Node.js เพราะให้วงจร feedback ที่เร็วขึ้นมากโดยมีปัญหาความเข้ากันได้เพียงเล็กน้อย
60. Pydantic
- Pydantic เป็นไลบรารี Python สำหรับกำหนดโมเดลข้อมูลด้วย type hint มาตรฐาน และบังคับใช้ schema ของข้อมูลในขณะรันไทม์
- เดิมที type annotation ถูกเพิ่มเข้ามาใน Python เพื่อการวิเคราะห์แบบสถิต แต่ความหลากหลายที่เพิ่มขึ้นทำให้ถูกนำไปใช้อย่างกว้างขวางขึ้น รวมถึงการตรวจสอบความถูกต้องในขณะรันไทม์
- สร้างขึ้นบน Rust core ที่รวดเร็ว จึงให้ความสามารถในการตรวจสอบข้อมูล การแยกวิเคราะห์ และการทำ serialization ได้อย่างมีประสิทธิภาพ
- กลายเป็นสิ่งจำเป็นในแอปพลิเคชัน LLM และโดยทั่วไปใช้เทคนิค structured output from LLMs เพื่อจัดการกับธรรมชาติที่คาดเดาไม่ได้ของ LLM
Trial
61. AI Design Reviewer
- AI Design Reviewer เป็นปลั๊กอิน Figma สำหรับทำ design audit หรือ heuristic evaluation และรวบรวม feedback ที่นำไปปฏิบัติได้กับดีไซน์เดิมหรือดีไซน์ใหม่
- การตรวจประเมินครอบคลุมทั้ง UX critique, ความไม่สอดคล้องของ UI, ช่องว่างด้านการเข้าถึง, คุณภาพของเนื้อหา และสถานการณ์ edge case
- นอกจากการระบุปัญหาแล้ว ยังให้คำแนะนำที่รับรู้บริบทของโดเมนซึ่งช่วยให้ทีมสร้างภาษาการออกแบบร่วมกันและเหตุผลเบื้องหลังการเลือกดีไซน์
- ทีมใช้ AI Design Reviewer เพื่อวิเคราะห์ดีไซน์แบบ legacy โดยระบุทั้งประสบการณ์เชิงบวกที่ควรรักษาไว้และประสบการณ์เชิงลบที่ควรแก้ไข เพื่อใช้ประกอบการกำหนดเป้าหมาย UX สำหรับการออกแบบใหม่
62. Barman
- Barman (Backup and Recovery Manager) เป็นเครื่องมือโอเพนซอร์สสำหรับจัดการการสำรองข้อมูลและการกู้คืนจากภัยพิบัติของเซิร์ฟเวอร์ PostgreSQL
- ช่วยทำให้การสร้าง physical backup ง่ายขึ้นผ่านวิธีการที่หลากหลาย จัดระเบียบด้วยแค็ตตาล็อกที่ครอบคลุม และรองรับกระบวนการกู้คืนจากภัยพิบัติทั้งหมดด้วยการกู้คืนข้อมูลตามจุดเวลาไปยังเซิร์ฟเวอร์ที่กำลังทำงานอยู่
- พบว่า Barman ทั้งทรงพลังและใช้งานง่าย และประทับใจอย่างมากกับความเร็วของการกู้คืนตามจุดเวลาระหว่างกิจกรรมการย้ายระบบ
- ยังทำงานกับการสำรองข้อมูลตามกำหนดเวลาได้ดี และมีความสามารถในการจัดการการตั้งค่าด้านการจัดตารางและการเก็บรักษาที่ซับซ้อนและผสมผสานกัน
63. Claude Code
- Claude Code ของ Anthropic เป็นเครื่องมือ AI coding แบบ agentic ที่มีอินเทอร์เฟซภาษาธรรมชาติและโมเดลการทำงานแบบเอเจนต์สำหรับวางแผนและลงมือทำเวิร์กโฟลว์หลายขั้นตอนที่ซับซ้อน
- แม้จะเปิดตัวมาไม่ถึงหนึ่งปี แต่ก็ถูกนำไปใช้กันอย่างแพร่หลายแล้วในหมู่นักพัฒนาทั้งภายในและภายนอก Thoughtworks จึงถูกจัดไว้ใน Trial
- มีการเปิดตัว coding agent แบบคอนโซลอย่าง Codex CLI ของ OpenAI, Gemini CLI ของ Google และ OpenCode แบบโอเพนซอร์ส ขณะที่ผู้ช่วยแบบอยู่บน IDE อย่าง Cursor, Windsurf และ GitHub Copilot ตอนนี้ก็มี agent mode แล้ว
- เราเห็นทีมต่าง ๆ ใช้มันไม่เพียงเพื่อเขียนและแก้ไขโค้ด แต่ยังใช้เป็น AI agent อเนกประสงค์สำหรับจัดการสเปก สตอรี การตั้งค่า โครงสร้างพื้นฐาน และเอกสารด้วย
64. Cleanlab
- ในแนวคิด data-centric AI การปรับปรุงคุณภาพของชุดข้อมูลมักให้ผลด้านประสิทธิภาพมากกว่าการจูนโมเดลเอง
- Cleanlab เป็นไลบรารี Python แบบโอเพนซอร์สที่ออกแบบมาเพื่อแก้ปัญหานี้ โดยระบุปัญหาข้อมูลทั่วไป เช่น การติดป้ายกำกับผิด outlier และข้อมูลซ้ำ ในชุดข้อมูลข้อความ รูปภาพ ตาราง และเสียง ได้โดยอัตโนมัติ
- Cleanlab สร้างขึ้นบนหลักการของ confident learning โดยใช้ความน่าจะเป็นของการคาดการณ์จากโมเดลเพื่อประเมิน label noise และวัดคุณภาพข้อมูลเชิงปริมาณ
- แนวทางที่ไม่ขึ้นกับโมเดลนี้ช่วยให้นักพัฒนาวินิจฉัยและแก้ไขข้อผิดพลาดของชุดข้อมูล จากนั้นฝึกโมเดลใหม่เพื่อเพิ่มความทนทานและความแม่นยำ
65. Context7
- Context7 เป็นเซิร์ฟเวอร์ MCP ที่แก้ปัญหาความไม่ถูกต้องของโค้ดที่สร้างโดย AI
- ในขณะที่ LLM พึ่งพาข้อมูลฝึกที่ล้าสมัย Context7 ช่วยให้แน่ใจว่าสามารถสร้างโค้ดที่ถูกต้อง ทันสมัย และตรงกับเวอร์ชันของไลบรารีและเฟรมเวิร์กที่ใช้ในโปรเจ็กต์
- มันดึงเอกสารล่าสุดและตัวอย่างโค้ดที่ใช้งานได้จริงโดยตรงจาก source repository ของเฟรมเวิร์ก แล้วฉีดเข้าไปใน context window ของ LLM ในจังหวะที่ทำ prompting
- จากประสบการณ์ Context7 ช่วยลดอาการหลอนของโค้ดและการพึ่งพาข้อมูลฝึกที่ล้าสมัยได้อย่างมาก
66. Data Contract CLI
- Data Contract CLI เป็นเครื่องมือบรรทัดคำสั่งแบบโอเพนซอร์สที่ออกแบบมาสำหรับการทำงานกับสเปก Data Contract
- ช่วยให้สามารถสร้างและแก้ไข data contract ได้ และที่สำคัญคือสามารถตรวจสอบข้อมูลเทียบกับสัญญาได้ ซึ่งจำเป็นต่อการรับประกันความถูกต้องครบถ้วนและคุณภาพของ data product
- CLI รองรับ schema definition ได้อย่างกว้างขวางหลายแบบ เช่น Avro, SQL DDL และ Open Data Contract Standard และยังสามารถเปรียบเทียบเวอร์ชันของสัญญาหลายเวอร์ชันเพื่อตรวจจับ breaking change ได้ทันที
- พบว่ามีประโยชน์อย่างยิ่งต่อการทำให้ contract governance ระหว่าง data product ต่าง ๆ ใช้งานได้จริงผ่านการผสานรวมกับ CI/CD โดยเฉพาะในบริบทของ data mesh
67. Databricks Assistant
- Databricks Assistant เป็นเครื่องมือเชิงสนทนาที่ขับเคลื่อนด้วย AI และผสานรวมอยู่ในแพลตฟอร์ม Databricks โดยตรง ทำหน้าที่เป็น pair programmer ตามบริบทสำหรับผู้เชี่ยวชาญด้านข้อมูล
- ต่างจากผู้ช่วยเขียนโค้ดทั่วไป มันได้เปรียบจากความเข้าใจพื้นฐานเกี่ยวกับสภาพแวดล้อม Databricks และบริบทข้อมูล รวมถึงเมทาดาทาจาก Unity Catalog
- Assistant ทำได้มากกว่าการสร้าง code snippet โดยสามารถเขียนคำสั่ง SQL และ Python แบบหลายขั้นตอนที่ซับซ้อน วินิจฉัยข้อผิดพลาด และให้คำอธิบายอย่างละเอียดที่อิงกับเวิร์กสเปซนั้น ๆ
- สำหรับองค์กรที่ลงทุนกับ ecosystem ของ Databricks อยู่แล้ว มันสามารถเร่งประสิทธิภาพการทำงานและลดอุปสรรคในการเริ่มต้นงานข้อมูลที่ซับซ้อนได้
68. Hoppscotch
- Hoppscotch เป็นเครื่องมือโอเพนซอร์สน้ำหนักเบาสำหรับการพัฒนา ดีบัก ทดสอบ และแชร์ API
- รองรับหลายโปรโตคอล รวมถึง HTTP, GraphQL และ WebSocket และมีไคลเอนต์ข้ามแพลตฟอร์มสำหรับสภาพแวดล้อมเว็บ เดสก์ท็อป และ CLI
- แม้พื้นที่ของเครื่องมือ API จะมีทางเลือกอย่าง Postman, Insomnia และ Bruno อยู่หนาแน่น แต่ Hoppscotch โดดเด่นด้วยขนาดที่เบาและการออกแบบที่เป็นมิตรต่อความเป็นส่วนตัว
- มันตัดระบบ analytics ออก ใช้ local-first storage และรองรับ self-hosting จึงเป็นตัวเลือกที่แข็งแกร่งสำหรับองค์กรที่มองหาวิธีแชร์ API script อย่างเป็นธรรมชาติ พร้อมรักษาความเป็นส่วนตัวของข้อมูลไว้อย่างเข้มแข็ง
69. NVIDIA DCGM Exporter
- NVIDIA DCGM Exporter เป็นเครื่องมือโอเพนซอร์สที่ช่วยให้ทีมมอนิเตอร์การเทรน GPU แบบกระจายศูนย์ในระดับขนาดใหญ่ได้
- มันแปลง telemetry แบบ proprietary ของ NVIDIA Data Center GPU Manager (DCGM) ให้อยู่ในรูปแบบเปิดที่เข้ากันได้กับระบบมอนิเตอร์มาตรฐาน
- เปิดเผยเมตริกแบบเรียลไทม์ที่สำคัญจากทั้ง GPU และโฮสต์เซิร์ฟเวอร์ เช่น การใช้งาน GPU อุณหภูมิ พลังงาน และจำนวนข้อผิดพลาด ECC
- การมองเห็นระดับนี้เป็นสิ่งจำเป็นสำหรับองค์กรที่ทำการ fine-tune LLM แบบกำหนดเองหรือรันงานเทรนระยะยาวที่ใช้ GPU หนัก
70. RelationalAI
- เมื่อมีการนำเข้าข้อมูลปริมาณมากและหลากหลายเข้าสู่ Snowflake ความสัมพันธ์เฉพาะตัวและกฎโดยนัยภายในข้อมูลนั้นอาจไม่ชัดเจน
- RelationalAI ที่สร้างขึ้นเป็น Snowflake Native App ช่วยให้ทีมสามารถสร้างโมเดลที่ซับซ้อนเพื่อจับแนวคิดที่มีความหมาย กำหนดเอนทิตีทางธุรกิจหลัก และฝังตรรกะที่ซับซ้อนไว้กับตาราง Snowflake ได้โดยตรง
- ด้วย Graph Reasoner อันทรงพลัง ผู้ใช้สามารถสร้าง วิเคราะห์ และแสดงภาพกราฟความรู้เชิงสัมพันธ์บนพื้นฐานของโมเดลเหล่านี้ได้
- สำหรับองค์กรที่ต้องจัดการชุดข้อมูลขนาดใหญ่ซึ่งเปลี่ยนแปลงอย่างรวดเร็ว การสร้างกราฟความรู้อาจเป็นสิ่งจำเป็นต่อการมอนิเตอร์เชิงรุกล่วงหน้าและการสร้างข้อมูลเชิงลึกที่ลึกขึ้นและนำไปใช้ได้จริง
71. UX Pilot
- UX Pilot เป็นเครื่องมือ AI ที่รองรับหลายขั้นตอนของกระบวนการออกแบบ UX ตั้งแต่การทำ wireframing ไปจนถึงการออกแบบภาพความละเอียดสูงและการรีวิว
- รองรับอินพุตทั้งข้อความและภาพ และสามารถสร้างหน้าจอ โฟลว์ และเลย์เอาต์ได้โดยอัตโนมัติ
- ฟีเจอร์ Autoflow สร้างการเปลี่ยนผ่านของ user flow และ Deep Design ช่วยสร้างผลลัพธ์ที่สมบูรณ์และละเอียดมากขึ้น
- UX Pilot ยังมีปลั๊กอิน Figma สำหรับส่งออกดีไซน์ที่สร้างขึ้นไปปรับแต่งต่อภายในเครื่องมือออกแบบมาตรฐาน
72. v0
- v0 ได้พัฒนาต่อจากตอนที่ถูกแนะนำครั้งล่าสุดใน Radar
- ตอนนี้มี design mode ที่ช่วยให้ผู้จัดการผลิตภัณฑ์สามารถสร้างและปรับแต่ง UI prototype แบบ self-service ได้ง่ายขึ้น
- รุ่นล่าสุดได้เพิ่มโมเดลของตัวเองที่มี context window ขนาดใหญ่และความสามารถแบบ multimodal ทำให้ v0 สามารถสร้างและปรับปรุง UI ได้จากทั้งอินพุตข้อความและภาพ
- อีกส่วนเสริมที่น่าสนใจคือ agent mode ซึ่งช่วยให้ระบบสามารถแยกงานที่ซับซ้อนออกเป็นส่วนย่อยและเลือกโมเดลที่เหมาะสมสำหรับแต่ละงานได้
Assess
73. Augment Code
- Augment Code เป็น AI coding assistant ที่ให้การสนับสนุนโดยรับรู้บริบทเชิงลึกสำหรับโค้ดเบสขนาดใหญ่
- โดดเด่นด้วย context engineering ขั้นสูงที่ช่วยให้อัปเดตดัชนีโค้ดและค้นหาได้อย่างรวดเร็ว แม้โค้ดจะมีการเปลี่ยนแปลงบ่อยครั้ง
- Augment รองรับโมเดลอย่าง Claude Sonnet 4 และ 4.5 รวมถึง GPT-5 ผสานการทำงานกับ GitHub, Jira และ Confluence และรองรับ Model Context Protocol (MCP) เพื่อการทำงานร่วมกับเครื่องมือภายนอก
- ให้คำแนะนำแบบเป็นขั้นตอนสำหรับการเปลี่ยนแปลงโค้ดเบสที่ซับซ้อน ตั้งแต่การรีแฟกเตอร์และอัปเกรด dependency ไปจนถึงการอัปเดตสคีมา
74. Azure AI Document Intelligence
- Azure AI Document Intelligence (เดิมชื่อ Form Recognizer) ดึงข้อความ ตาราง และคู่คีย์-ค่าออกจากเอกสารที่ไม่มีโครงสร้าง แล้วแปลงเป็นข้อมูลที่มีโครงสร้าง
- ใช้โมเดล deep learning ที่ฝึกไว้ล่วงหน้าเพื่อตีความเลย์เอาต์และความหมาย และสามารถฝึก custom model สำหรับรูปแบบเฉพาะได้ผ่านอินเทอร์เฟซแบบ no-code
- หนึ่งในทีมรายงานว่า ADI ช่วยลดการป้อนข้อมูลด้วยมือได้อย่างมาก ปรับปรุงความถูกต้องของข้อมูล และเร่งการทำรายงาน ส่งผลให้ตัดสินใจบนพื้นฐานข้อมูลได้เร็วขึ้น
- เช่นเดียวกับ Amazon Textract และ Google Document AI เครื่องมือนี้มอบการประมวลผลเอกสารระดับองค์กรด้วยความสามารถในการเข้าใจเลย์เอาต์ที่แข็งแกร่ง
75. Docling
- Docling เป็นไลบรารี Python และ TypeScript แบบโอเพนซอร์สสำหรับการประมวลผลเอกสารขั้นสูงของข้อมูลที่ไม่มีโครงสร้าง
- แก้ปัญหา "last mile" ที่มักถูกมองข้ามในการแปลงเอกสารจริง เช่น PDF และ PowerPoint ให้เป็นรูปแบบที่สะอาดและเครื่องอ่านได้
- ต่างจากตัวแยกข้อมูลแบบดั้งเดิม Docling ใช้แนวทางที่อิง computer vision เพื่อตีความเลย์เอาต์เอกสารและโครงสร้างเชิงความหมาย ทำให้เอาต์พุตมีคุณค่าอย่างยิ่งสำหรับไปป์ไลน์ retrieval-augmented generation (RAG)
- แปลงเอกสารที่ซับซ้อนเป็นรูปแบบที่มีโครงสร้าง เช่น JSON หรือ Markdown เพื่อรองรับเทคนิคอย่าง structured output from LLMs
76. E2B
- E2B เป็นเครื่องมือโอเพนซอร์สสำหรับรันโค้ดที่ AI สร้างขึ้นภายใน sandbox ที่ปลอดภัยและแยกขาดในคลาวด์
- เอเจนต์สามารถใช้ sandbox เหล่านี้ซึ่งสร้างอยู่บน microVM ของ Firecracker เพื่อรันโค้ดอย่างปลอดภัย วิเคราะห์ข้อมูล ทำวิจัย หรือใช้งาน virtual machine ได้
- สิ่งนี้ช่วยให้สามารถสร้างและดีพลอย AI agent ระดับองค์กรได้ พร้อมทั้งมีการควบคุมสภาพแวดล้อมการรันและความปลอดภัยอย่างเต็มรูปแบบ
77. Helix editor
- มีการฟื้นกลับมาบ้างของ text editor แบบเรียบง่ายที่มุ่งมาแทนที่ Vim ซึ่งเป็นของโปรดบนบรรทัดคำสั่ง
- Helix เป็นหนึ่งในคู่แข่งของพื้นที่ที่คับคั่งนี้ ร่วมกับ Neovim และ Kakoune ที่เพิ่งได้รับความสนใจ
- Helix นิยามตัวเองแบบขำ ๆ ว่าเป็น post-modern text editor และสิ่งที่ดึงดูดความสนใจของเราตั้งแต่แรกคือฟีเจอร์อย่างหลายเคอร์เซอร์ การรองรับ Tree-sitter และการรองรับ Language Server Protocol (LSP) ที่รวมมาในตัว
- มีการพัฒนาอย่างต่อเนื่องพร้อมระบบปลั๊กอินที่กำลังดำเนินอยู่ และโดยรวมเป็น modal editor น้ำหนักเบาที่ให้ความรู้สึกคุ้นเคยกับผู้ใช้ Vim แต่เพิ่มความสะดวกสมัยใหม่บางอย่างเข้ามา
78. Kueue
- Kueue เป็นคอนโทรลเลอร์แบบ Kubernetes-native สำหรับคิวงานที่ใช้จัดการโควตาและการใช้ทรัพยากร
- มี API สำหรับจัดการเวิร์กโหลด Kubernetes ที่มีลำดับความสำคัญและความต้องการทรัพยากรแตกต่างกัน และทำหน้าที่เป็นตัวจัดการระดับงานที่ตัดสินใจว่าจะอนุญาตหรือนำงานออกเมื่อใด
- Kueue ถูกออกแบบมาเพื่อการจัดการทรัพยากรอย่างมีประสิทธิภาพ การจัดลำดับความสำคัญของงาน และการตั้งเวลาแบบขั้นสูง ช่วยเพิ่มประสิทธิภาพการรันเวิร์กโหลดในสภาพแวดล้อม Kubernetes โดยเฉพาะเวิร์กโหลด ML ที่ใช้เครื่องมืออย่าง Kubeflow
- มันไม่ได้มาแทนที่ cluster-autoscaler และ kube-scheduler แต่ทำงานร่วมกัน โดยมุ่งเน้นที่การอนุญาตงานตามลำดับ โควตา ลำดับความสำคัญ และการรับรู้โทโพโลยี
79. MCPScan.ai
- MCPScan.ai เป็นสแกนเนอร์ความปลอดภัยสำหรับเซิร์ฟเวอร์ Model Context Protocol (MCP) ที่ทำงานได้สองโหมดคือ scan และ proxy
- ในโหมด scan จะวิเคราะห์การตั้งค่าและคำอธิบายของเครื่องมือเพื่อตรวจหาช่องโหว่ที่รู้จัก เช่น prompt injection, tool poisoning และ toxic flows
- ในโหมด proxy, MCPScan.ai ทำหน้าที่เป็นสะพานเชื่อมระหว่างระบบเอเจนต์กับเซิร์ฟเวอร์ MCP และคอยตรวจสอบทราฟฟิกรันไทม์อย่างต่อเนื่อง
- โหมดนี้ยังบังคับใช้กฎความปลอดภัยและ guardrail แบบกำหนดเอง รวมถึงการตรวจสอบการเรียกใช้เครื่องมือ การตรวจจับ PII และข้อจำกัดด้านการไหลของข้อมูลด้วย
80. oRPC
- oRPC (OpenAPI Remote Procedure Call) มอบ API แบบ type-safe ครบวงจรใน TypeScript พร้อมทั้งสอดคล้องกับข้อกำหนด OpenAPI อย่างสมบูรณ์
- สามารถสร้างข้อกำหนด OpenAPI แบบสมบูรณ์ได้โดยอัตโนมัติ ช่วยให้การผสานรวมและการจัดทำเอกสารง่ายขึ้น
- ขณะที่ทางเลือกอย่าง tRPC และ ElysiaJS มักต้องนำเฟรมเวิร์กใหม่มาใช้เพื่อให้ได้ type safety แต่ oRPC สามารถผสานรวมกับเฟรมเวิร์ก Node.js เดิมได้อย่างราบรื่น รวมถึง Express, Fastify, Hono, Next.js
- ความยืดหยุ่นนี้ทำให้เป็นตัวเลือกที่ยอดเยี่ยมสำหรับทีมที่ต้องการนำ end-to-end type safety มาใช้กับ API เดิมโดยไม่ต้องรีแฟกเตอร์ครั้งใหญ่
81. Power user for dbt
- Power user for dbt คือส่วนขยายสำหรับ Visual Studio Code ที่ผสานรวมโดยตรงกับทั้งสภาพแวดล้อม dbt และ dbt Cloud
- เนื่องจาก dbt ยังคงเป็นหนึ่งในเครื่องมือที่เราชื่นชอบ สิ่งใดก็ตามที่ช่วยปรับปรุงการใช้งานจึงเป็นส่วนเสริมที่ระบบนิเวศนี้ยินดีต้อนรับ
- ก่อนหน้านี้นักพัฒนาต้องพึ่งพาเครื่องมือหลายตัวนอก IDE เพื่อตรวจสอบโค้ด SQL หรือดู lineage ของโมเดล
- ส่วนขยายนี้ทำให้ความสามารถเหล่านั้นถูกฝังอยู่ใน VS Code แล้ว พร้อมมี code autocompletion, ผลลัพธ์คิวรีแบบเรียลไทม์, และการแสดง lineage ของโมเดลและคอลัมน์แบบภาพ
82. Serena
- Serena คือชุดเครื่องมือเขียนโค้ดที่ทรงพลัง ซึ่งมอบความสามารถคล้าย IDE สำหรับการค้นหาและแก้ไขโค้ดเชิงความหมายให้กับ coding agent อย่าง Claude Code
- ด้วยการทำงานในระดับสัญลักษณ์และความเข้าใจโครงสร้างเชิงความสัมพันธ์ของโค้ด Serena จึงช่วยเพิ่มประสิทธิภาพด้านโทเคนได้อย่างมาก
- แทนที่จะต้องอ่านทั้งไฟล์หรือพึ่งการแทนที่สตริงแบบหยาบ ๆ coding agent สามารถใช้เครื่องมือ Serena ที่แม่นยำอย่าง find_symbol, find_referencing_symbols, insert_after_symbol เพื่อค้นหาและแก้ไขโค้ดได้
- แม้ผลกระทบจะเล็กน้อยในโปรเจกต์ขนาดเล็ก แต่เมื่อ codebase ใหญ่ขึ้น ประสิทธิภาพลักษณะนี้จะมีคุณค่ามาก
83. SweetPad
- ส่วนขยาย SweetPad ช่วยให้นักพัฒนาสามารถใช้ VS Code หรือ Cursor สำหรับวงจรชีวิตการพัฒนาแอปพลิเคชัน Swift บนแพลตฟอร์ม Apple ได้ครบถ้วน
- โดยรวมเครื่องมือสำคัญอย่าง xcodebuild, xcode-build-server, swift-format เข้าไว้ด้วยกัน จึงไม่จำเป็นต้องสลับไปใช้ Xcode ตลอดเวลา
- นักพัฒนาสามารถจัดการ simulator, deploy ไปยังอุปกรณ์, รวมถึง build, run และ debug แอป Swift สำหรับ iOS, macOS และ watchOS ได้จากใน IDE โดยตรงโดยไม่ต้องเปิด Xcode
84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)
- Tape/Z (Tools for Assembly Program Exploration for Z/OS) คือชุดเครื่องมือที่กำลังพัฒนาสำหรับวิเคราะห์โค้ดเมนเฟรม HLASM (High-Level Assembler)
- พัฒนาโดย Thoughtworker และมีความสามารถอย่างการพาร์ส, การสร้าง control flow graph, การติดตาม dependency, และการแสดง flowchart
- เราได้กล่าวถึงมานานแล้วว่าพื้นที่เมนเฟรมขาดแคลนเครื่องมือแบบเปิดและขับเคลื่อนโดยชุมชน โดยตัวเลือกส่วนใหญ่เป็นซอฟต์แวร์กรรมสิทธิ์หรือผูกกับ ecosystem ของผู้ขาย
- Tape/Z ช่วยอุดช่องว่างนี้ด้วยการมอบความสามารถด้านการวิเคราะห์ที่เข้าถึงได้และเขียนสคริปต์ได้
[Languages and Frameworks]
Adopt
85. Fastify
- เรายังคงมีประสบการณ์เชิงบวกกับ Fastify อย่างต่อเนื่อง — เว็บเฟรมเวิร์กสำหรับ Node.js ที่รวดเร็ว ไม่ยัดเยียดแนวทาง และมี overhead ต่ำ
- มีความสามารถสำคัญทั้งหมดที่เว็บเฟรมเวิร์กขนาดเล็กควรมี รวมถึงการพาร์ส การตรวจสอบความถูกต้อง การซีเรียลไลซ์ ตลอดจนระบบปลั๊กอินที่แข็งแกร่งและการสนับสนุนจากชุมชนที่ดี
- ทีมไม่พบข้อเสียสำคัญของ Fastify เมื่อเทียบกับทางเลือกอย่าง Express.js และยังได้ประโยชน์ด้านประสิทธิภาพที่วัดผลได้ ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการพัฒนาเว็บแบบมินิมัลบน Node.js
86. LangGraph
- LangGraph คือ orchestration framework สำหรับสร้างแอปพลิเคชัน multi-agent แบบมีสถานะโดยใช้ LLM
- มอบ primitive ระดับล่างอย่าง node และ edge พร้อมความสามารถในตัวที่ให้ผู้พัฒนาควบคุม agent workflow, การจัดการหน่วยความจำ, และการคงอยู่ของสถานะได้อย่างละเอียด
- ซึ่งหมายความว่านักพัฒนาสามารถเริ่มจากกราฟสำเร็จรูปแบบง่าย ๆ แล้วขยายไปสู่สถาปัตยกรรมเอเจนต์ที่ซับซ้อนและพัฒนาเปลี่ยนแปลงได้
- ด้วยการรองรับรูปแบบความทนทาน เช่น streaming, การจัดการ context ขั้นสูง, model fallback, และการจัดการข้อผิดพลาดของเครื่องมือ LangGraph จึงช่วยสร้างแอปพลิเคชันเอเจนต์ระดับ production ที่แข็งแกร่งได้
87. vLLM
- vLLM คือ inference engine สำหรับ LLM ที่มี throughput สูงและใช้หน่วยความจำอย่างมีประสิทธิภาพ ซึ่งสามารถรันได้ทั้งบนคลาวด์หรือ on-premises
- รองรับสถาปัตยกรรมโมเดลหลายแบบและโมเดลโอเพนซอร์สยอดนิยม
- ทีมได้ deploy vLLM worker แบบ dockerized บนแพลตฟอร์ม GPU เช่น NVIDIA DGX และ Intel HPC เพื่อโฮสต์โมเดลอย่าง Llama 3.1 (8B และ 70B), Mistral 7B และ Llama-SQL สำหรับการช่วยเขียนโค้ดของนักพัฒนา, การค้นคืนความรู้, และการโต้ตอบกับฐานข้อมูลด้วยภาษาธรรมชาติ
- vLLM เข้ากันได้กับมาตรฐาน OpenAI SDK ทำให้ให้บริการโมเดลได้อย่างสม่ำเสมอ
Trial
88. Crossplane
- นับตั้งแต่ปรากฏบน Radar ครั้งล่าสุด การนำ Crossplane ไปใช้ยังคงเพิ่มขึ้นอย่างต่อเนื่อง โดยเฉพาะในการขยาย Kubernetes cluster
- จากการใช้งานจริง เราพบว่า Crossplane โดดเด่นในกรณีใช้งานเฉพาะ มากกว่าจะเป็นเครื่องมือ infrastructure as code (IaC) แบบอเนกประสงค์
- ข้อสังเกตก่อนหน้ายังคงใช้ได้: Crossplane ทำงานได้ดีที่สุดในฐานะตัวเสริมของ workload ที่ deploy อยู่ภายใน Kubernetes และไม่ใช่ตัวแทนเต็มรูปแบบของเครื่องมืออย่าง Terraform
- ทีมที่ "ทุ่มทั้งหมด" ให้ Crossplane เป็นโซลูชัน IaC หลักมักประสบปัญหา แต่ทีมที่ใช้อย่างเหมาะสม — สำหรับกรณีใช้งานแบบกำหนดเป้าหมายเฉพาะ — กลับเห็นผลลัพธ์ที่แข็งแกร่ง
89. DeepEval
- DeepEval คือเฟรมเวิร์กประเมินผลแบบโอเพนซอร์สบนพื้นฐาน Python สำหรับการวัดประสิทธิภาพของ LLM
- สามารถใช้ประเมิน retrieval-augmented generation (RAG) และแอปพลิเคชันอื่น ๆ ที่สร้างด้วย LlamaIndex หรือ LangChain รวมถึงใช้สำหรับการตั้ง baseline และ benchmark ของโมเดล
- DeepEval ประเมินทั้งความถูกต้อง ความเกี่ยวข้อง และความสอดคล้อง เพื่อให้การประเมินที่เชื่อถือได้มากขึ้นในสถานการณ์จริง นอกเหนือจากคะแนนจับคู่คำเพียงอย่างเดียว
- มีเมตริกอย่างการตรวจจับ hallucination, ความเกี่ยวข้องของคำตอบ, การปรับแต่ง hyperparameter และรองรับ GEval สำหรับสร้างเมตริกแบบกำหนดเองตาม use case
90. FastMCP
- Model Context Protocol (MCP) กำลังกลายเป็นมาตรฐานอย่างรวดเร็วสำหรับการมอบคอนเท็กซ์และเครื่องมือให้กับแอปพลิเคชัน LLM
- อย่างไรก็ตาม การนำ MCP server ไปใช้งานโดยทั่วไปมักมี boilerplate จำนวนมากสำหรับการตั้งค่า การจัดการโปรโตคอล และการจัดการข้อผิดพลาด
- FastMCP เป็นเฟรมเวิร์ก Python ที่ทำให้กระบวนการนี้ง่ายขึ้น โดยซ่อนความซับซ้อนของโปรโตคอลและทำให้นักพัฒนาสามารถกำหนด MCP resource และเครื่องมือผ่าน Python decorator ที่เข้าใจได้ง่าย
- การทำ abstraction นี้ช่วยให้ทีมโฟกัสกับ business logic ได้มากขึ้น ส่งผลให้การใช้งาน MCP สะอาดตาและดูแลรักษาง่ายกว่าเดิม
91. LiteLLM
- LiteLLM เป็น SDK ที่ให้การผสานรวมกับผู้ให้บริการ LLM หลายรายได้อย่างราบรื่นผ่านรูปแบบ OpenAI API มาตรฐาน
- รองรับผู้ให้บริการและโมเดลได้อย่างกว้างขวาง พร้อมมอบอินเทอร์เฟซแบบรวมศูนย์สำหรับ text completion, embedding และการสร้างภาพ
- ด้วยการซ่อนความแตกต่างของ API เฉพาะแต่ละผู้ให้บริการ LiteLLM จึงช่วยให้การผสานรวมง่ายขึ้นและ route คำขอไปยัง model endpoint ที่ถูกต้องโดยอัตโนมัติ
- ยังมีความสามารถระดับ production ผ่าน proxy framework เช่น guardrails, caching, logging, rate limiting และ load balancing
92. MLForecast
- MLForecast เป็นเฟรมเวิร์กและไลบรารี Python สำหรับการพยากรณ์อนุกรมเวลา โดยนำโมเดล machine learning ไปใช้กับชุดข้อมูลขนาดใหญ่
- ช่วยให้กระบวนการทำ feature engineering แบบอัตโนมัติที่มักซับซ้อนง่ายขึ้น รวมถึง lag, rolling statistics และฟีเจอร์ที่อิงตามวันที่
- เป็นหนึ่งในไม่กี่ไลบรารีที่มีการรองรับแบบ native สำหรับ distributed computing framework อย่าง Spark และ Dask จึงช่วยรับประกันเรื่อง scalability
- ยังรองรับการพยากรณ์เชิงความน่าจะเป็นด้วยวิธีอย่าง conformal prediction เพื่อให้การวัดความไม่แน่นอนของการคาดการณ์ในเชิงปริมาณ
93. Nuxt
- Nuxt เป็น meta-framework แบบมีแนวทางชัดเจนที่สร้างอยู่บน Vue.js สำหรับการสร้างเว็บแอปพลิเคชันแบบฟูลสแตก และมักถูกเรียกว่า “Next.js สำหรับ Vue.js”
- เช่นเดียวกับฝั่ง React, Nuxt มีความสามารถที่เป็นมิตรต่อ SEO เช่น pre-rendering, server-side rendering (SSR) และการจัดการ metadata
- Nuxt ได้รับการสนับสนุนจาก Vercel บริษัทเดียวกับที่อยู่เบื้องหลัง Next.js พร้อมทั้งมีชุมชนที่แข็งแกร่งและ ecosystem ของโมดูลทั้งทางการและจากภายนอก
- โมดูลเหล่านี้ช่วยให้การผสานรวมฟีเจอร์อย่างการประมวลผลภาพ, sitemap และ Tailwind CSS ง่ายขึ้น
94. Phoenix
- ยังคงมีประสบการณ์เชิงบวกกับ Phoenix อย่างต่อเนื่อง — เว็บ MVC framework ฝั่งเซิร์ฟเวอร์ที่เขียนด้วย Elixir
- Phoenix พัฒนาต่อยอดจากแนวคิดด้านการพัฒนาแอปอย่างรวดเร็วและประสบการณ์นักพัฒนาของ Ruby on Rails ขณะเดียวกันก็ขยายไปสู่กระบวนทัศน์การเขียนโปรแกรมเชิงฟังก์ชัน
- ในฉบับนี้มีการเน้นย้ำการเปิดตัว Phoenix LiveView 1.0
- LiveView เป็นโซลูชันแบบ HTML-over-the-wire ที่คล้ายกับ HTMX หรือ Hotwire ซึ่งช่วยให้นักพัฒนาสร้างประสบการณ์ผู้ใช้ที่สมบูรณ์และเรียลไทม์ได้ด้วย HTML ที่เรนเดอร์จากเซิร์ฟเวอร์ทั้งหมด
95. Presidio
- Presidio เป็น SDK ด้านการปกป้องข้อมูลสำหรับการระบุ และทำข้อมูลนิรนาม ของข้อมูลอ่อนไหวในข้อความทั้งแบบมีโครงสร้างและไม่มีโครงสร้าง
- ใช้ named entity recognition, regular expression และตรรกะแบบอิงกฎเพื่อตรวจจับข้อมูลที่ระบุตัวบุคคลได้ (PII) เช่น หมายเลขบัตรเครดิต ชื่อ และสถานที่
- Presidio รองรับตัวรู้จำเอนทิตีแบบ custom และ pipeline การทำข้อมูลนิรนาม ทำให้องค์กรสามารถปรับให้เข้ากับข้อกำหนดด้านความเป็นส่วนตัวและการปฏิบัติตามกฎระเบียบของตนเองได้
- ทีมงานใช้ Presidio ในสภาพแวดล้อมระดับองค์กรที่ต้องควบคุมการแชร์ข้อมูลอย่างเข้มงวดเมื่อผสานรวมกับ LLM
96. Pydantic AI
- Pydantic AI ยังคงพิสูจน์ตัวเองว่าเป็นเฟรมเวิร์กโอเพนซอร์สที่เสถียรและได้รับการสนับสนุนอย่างดีสำหรับการสร้าง GenAI agent ในระดับ production
- สร้างอยู่บนรากฐาน Pydantic ที่เชื่อถือได้ จึงมอบ type safety ที่แข็งแกร่ง การสังเกตการณ์แบบ first-class ผ่าน OpenTelemetry และเครื่องมือประเมินผลในตัว
- การออกเวอร์ชัน 1.0 เมื่อวันที่ 4 กันยายน 2025 ถือเป็นหมุดหมายสำคัญด้านความพร้อมใช้งาน
- นับจากนั้นมา เฟรมเวิร์กนี้ได้รับความไว้วางใจและการยอมรับอย่างกว้างขวางจากความเรียบง่ายและการดูแลรักษาที่ง่าย จนเข้าร่วมแถวเดียวกับเฟรมเวิร์ก agent ยอดนิยมอื่น ๆ เช่น LangChain และ LangGraph
97. Tauri
- Tauri เป็นเฟรมเวิร์กสำหรับการสร้างเดสก์ท็อปแอปพลิเคชันประสิทธิภาพสูงโดยใช้โค้ดเบสเว็บ UI ชุดเดียว
- ต่างจาก web wrapper แบบดั้งเดิมอย่าง Electron, Tauri สร้างบนพื้นฐานของ Rust และใช้ native webview ของระบบปฏิบัติการ จึงให้ทั้งไฟล์ไบนารีที่เล็กกว่าและความปลอดภัยที่แข็งแกร่งกว่า
- เคยประเมิน Tauri ครั้งแรกเมื่อหลายปีก่อน และหลังจากนั้นก็ได้ขยายจากเดสก์ท็อปไปสู่การรองรับ iOS และ Android
- เวอร์ชันล่าสุดมีจุดเด่นคือการนำโมเดลสิทธิ์และขอบเขตที่ยืดหยุ่นยิ่งขึ้นเข้ามาใช้แทนรายการสิทธิ์แบบเดิม รองรับการส่งข้อมูลดิบ และมีชั้นการสื่อสารระหว่างโปรเซส (IPC) ที่ได้รับการปรับปรุงเพื่อเพิ่มประสิทธิภาพ
Assess
98. Agent Development Kit (ADK)
- Agent Development Kit (ADK) เป็นเฟรมเวิร์กสำหรับการพัฒนาและนำ AI agent ไปใช้งาน โดยใช้ระเบียบวิธีวิศวกรรมซอฟต์แวร์สมัยใหม่แทนที่จะพึ่งพาเพียงการ prompt
- นำ abstraction ที่คุ้นเคยเข้ามาใช้ เช่น class, method, workflow pattern และการรองรับ CLI
- เมื่อเทียบกับเฟรมเวิร์กอย่าง LangGraph หรือ CrewAI จุดแข็งของ ADK คือการผสานรวมอย่างลึกซึ้งกับโครงสร้างพื้นฐาน AI ของ Google ซึ่งให้ความพร้อมระดับองค์กรทั้งด้าน grounding, การเข้าถึงข้อมูล และการมอนิเตอร์
- ออกแบบมาโดยคำนึงถึง interoperability และรองรับ A2A protocol สำหรับ tool wrapper และการสื่อสารระหว่าง agent
99. Agno
- Agno เป็นเฟรมเวิร์กสำหรับการสร้าง รัน และจัดการระบบ multi-agent
- ให้ความยืดหยุ่นในการสร้างทั้ง agent ที่ทำงานอัตโนมัติเต็มรูปแบบหรือ workflow แบบควบคุมเป็นขั้นตอน พร้อมการรองรับ human-in-the-loop, session management, memory และ knowledge ในตัว
- ชื่นชมการให้ความสำคัญกับประสิทธิภาพผ่านเวลาเริ่มต้นของ agent ที่น่าประทับใจและการใช้หน่วยความจำที่ต่ำ
- Agno มาพร้อม runtime ของตัวเองชื่อ AgentOS ซึ่งเป็นแอปพลิเคชัน FastAPI ที่มี control plane แบบรวมศูนย์สำหรับการทดสอบ การมอนิเตอร์ และการจัดการระบบ agent อย่างคล่องตัว
100. assistant-ui
- assistant-ui เป็นไลบรารีโอเพนซอร์ส TypeScript และ React สำหรับอินเทอร์เฟซแชต AI
- จัดการส่วนที่ซับซ้อนของการทำแชต UI เช่น streaming, state management และฟีเจอร์ UX ทั่วไปสำหรับการแก้ไขข้อความและสลับ branch ขณะที่ยังเปิดให้นักพัฒนาสามารถออกแบบคอมโพเนนต์ของตนเองด้วย Radix primitive
- รองรับการผสานรวมกับ runtime ยอดนิยม รวมถึง Vercel AI SDK และ LangGraph และยังมี runtime solution ที่ปรับแต่งได้สำหรับกรณีใช้งานที่ซับซ้อน
- ประสบความสำเร็จในการสร้างอินเทอร์เฟซแชตแบบเรียบง่ายด้วย assistant-ui และพอใจกับผลลัพธ์
101. AutoRound
- AutoRound ของ Intel เป็นอัลกอริทึม quantization ขั้นสูงสำหรับบีบอัดโมเดล AI ขนาดใหญ่ เช่น LLM และ vision language models (VLM) โดยลดการสูญเสียความแม่นยำให้น้อยที่สุด
- ใช้การเพิ่มประสิทธิภาพแบบ sign-gradient descent เพื่อลดขนาดโมเดลลงสู่ระดับบิตต่ำมาก (2-4 บิต) และใช้ความกว้างบิตแบบผสมในแต่ละเลเยอร์เพื่อประสิทธิภาพที่เหมาะสมที่สุด
- กระบวนการ quantization นี้ยังรวดเร็วมากอีกด้วย: สามารถ quantize โมเดลขนาด 7 พันล้านพารามิเตอร์ได้ภายในไม่กี่นาทีบน GPU เดียว
- AutoRound ผสานรวมกับ inference engine ยอดนิยมอย่าง vLLM และ Transformers ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับการ quantize โมเดล
102. Browser Use
- Browser Use เป็นไลบรารี Python แบบโอเพนซอร์สที่ช่วยให้เอเจนต์ที่ใช้ LLM สามารถควบคุมเว็บเบราว์เซอร์และโต้ตอบกับเว็บแอปพลิเคชันได้
- สามารถนำทาง กรอกข้อมูล และดึงข้อความได้ รวมถึงจัดการหลายแท็บเพื่อประสานงานงานข้ามแอปพลิเคชัน
- ไลบรารีนี้มีประโยชน์อย่างยิ่งเมื่อ AI agent จำเป็นต้องเข้าถึง จัดการ หรือดึงข้อมูลจากคอนเทนต์บนเว็บ
- รองรับ LLM หลากหลายตัว และใช้ Playwright โดยผสานความเข้าใจเชิงภาพเข้ากับการดึงโครงสร้าง HTML เพื่อการโต้ตอบบนเว็บที่สมบูรณ์ยิ่งขึ้น
103. DeepSpeed
- DeepSpeed เป็นไลบรารี Python ที่เพิ่มประสิทธิภาพ distributed deep learning สำหรับทั้งการฝึกและการอนุมาน
- สำหรับการฝึก มีการรวมเทคนิคอย่าง Zero Redundancy Optimizer (ZeRO) และ 3D parallelism เพื่อขยายโมเดลอย่างมีประสิทธิภาพบน GPU หลายพันตัว
- สำหรับการอนุมาน มีการผสาน tensor, pipeline, expert และ ZeRO parallelism เข้ากับ custom kernel และการเพิ่มประสิทธิภาพการสื่อสารเพื่อลด latency ให้ต่ำที่สุด
- DeepSpeed ขับเคลื่อนโมเดลภาษาขนาดใหญ่ที่สุดบางส่วนของโลก รวมถึง Megatron-Turing NLG (530B) และ BLOOM (176B)
104. Drizzle
- Drizzle เป็น ORM สำหรับ TypeScript ที่มีน้ำหนักเบา
- ต่างจาก Prisma ORM ตรงที่มอบทั้ง API แบบคล้าย SQL ที่เรียบง่ายและอินเทอร์เฟซคิวรีสไตล์ ORM แบบดั้งเดิมให้กับนักพัฒนา
- ยังรองรับการดึงสคีมาจากฐานข้อมูลเดิม ทำให้รองรับได้ทั้งแนวทาง database-first และ code-first
- Drizzle ถูกออกแบบโดยคำนึงถึงสภาพแวดล้อมแบบ serverless มีขนาด bundle เล็ก และรองรับ prepared statements
105. Java post-quantum cryptography
- คอมพิวเตอร์ควอนตัมยังคงพัฒนาอย่างรวดเร็วต่อเนื่อง และบริการแบบ SaaS อย่าง AWS Braket ก็เปิดให้เข้าถึงอัลกอริทึมควอนตัมบนหลายสถาปัตยกรรมแล้ว
- ตั้งแต่เดือนมีนาคม Java 24 ได้เพิ่ม Java post-quantum cryptography โดยรองรับอัลกอริทึมเข้ารหัสหลังยุคควอนตัมอย่าง ML-KEM และ ML-DSA
- .Net 10 ก็ขยายการรองรับเช่นกัน
- คำแนะนำนั้นง่ายมาก: หากคุณกำลังสร้างซอฟต์แวร์ด้วยภาษาเหล่านี้ ก็ควรเริ่มนำอัลกอริทึมที่ปลอดภัยต่อยุคควอนตัมมาใช้ตั้งแต่ตอนนี้เพื่อทำให้ระบบพร้อมสำหรับอนาคต
106. kagent
- Kagent เป็นเฟรมเวิร์กโอเพนซอร์สสำหรับรัน agentic AI ภายในคลัสเตอร์ Kubernetes
- ช่วยให้เอเจนต์ที่ใช้ LLM สามารถวางแผนและดำเนินงานด้านปฏิบัติการ เช่น การวินิจฉัยปัญหา การแก้ไขคอนฟิก และการโต้ตอบกับเครื่องมือด้านการมองเห็นระบบ ผ่าน Kubernetes native API และการผสานรวม Model Context Protocol (MCP)
- เป้าหมายคือการนำ "AgentOps" มาสู่โครงสร้างพื้นฐาน cloud-native ด้วยการผสานการจัดการแบบ declarative เข้ากับการให้เหตุผลแบบอัตโนมัติ
- ในฐานะโปรเจกต์ CNCF Sandbox ควรนำ Kagent ไปใช้อย่างระมัดระวัง โดยเฉพาะเมื่อพิจารณาถึงความเสี่ยงของการมอบความสามารถด้านการจัดการปฏิบัติการให้กับ LLM และเทคนิคอย่าง toxic flow analysis อาจมีคุณค่าอย่างมากในการประเมินและลดความเสี่ยงเหล่านี้
107. LangExtract
- LangExtract เป็นไลบรารี Python ที่ใช้ LLM เพื่อดึงข้อมูลแบบมีโครงสร้างจากข้อความที่ไม่มีโครงสร้างตามคำสั่งที่ผู้ใช้กำหนดเอง
- สามารถประมวลผลเนื้อหาเฉพาะโดเมน เช่น clinical notes และรายงาน เพื่อระบุและจัดระเบียบรายละเอียดสำคัญ โดยยังคงติดตามย้อนกลับแต่ละจุดข้อมูลที่ดึงออกมาไปยังแหล่งที่มาได้
- เอนทิตีที่ดึงออกมาสามารถส่งออกเป็นไฟล์
.jsonl(รูปแบบมาตรฐานสำหรับข้อมูลโมเดลภาษา) และแสดงผลผ่านอินเทอร์เฟซ HTML แบบโต้ตอบเพื่อทบทวนบริบทได้ - ทีมได้ประเมิน LangExtract สำหรับการดึงเอนทิตีเพื่อนำไปเติม knowledge graph เฉพาะโดเมน และพบว่ามันมีประสิทธิภาพในการแปลงเอกสารที่ซับซ้อนให้เป็นรูปแบบเชิงโครงสร้างที่เครื่องอ่านได้
108. Langflow
- Langflow เป็นแพลตฟอร์ม low-code แบบโอเพนซอร์สสำหรับสร้างและทำให้เห็นภาพเวิร์กโฟลว์ของ LLM
- สร้างอยู่บน LangChain และช่วยให้นักพัฒนาสามารถเชื่อมโยง prompt, tools, vector databases และองค์ประกอบด้าน memory ผ่านอินเทอร์เฟซแบบลากและวาง พร้อมทั้งรองรับโค้ด Python แบบกำหนดเองสำหรับตรรกะขั้นสูง
- มีประโยชน์อย่างยิ่งสำหรับการทำต้นแบบแอปพลิเคชันเอเจนต์โดยไม่ต้องเขียนโค้ดแบ็กเอนด์ครบทั้งหมด
- อย่างไรก็ตาม Langflow ยังถือว่าใหม่พอสมควรและยังมีจุดที่ไม่เรียบร้อยอยู่บ้างสำหรับการใช้งานจริงในโปรดักชัน และข้อควรระวังทั่วไปเกี่ยวกับแพลตฟอร์ม low-code ก็ใช้ได้กับกรณีนี้เช่นกัน
109. LMCache
- LMCache เป็นโซลูชันแคช key-value (KV) สำหรับเร่งโครงสร้างพื้นฐานการให้บริการ LLM
- มันทำหน้าที่เป็นชั้นแคชเฉพาะทางครอบคลุมทั้งพูลของ inference engine สำหรับ LLM โดยเก็บรายการแคช KV ที่คำนวณไว้ล่วงหน้าสำหรับข้อความที่มีแนวโน้มจะถูกประมวลผลซ้ำหลายครั้ง เช่น ประวัติแชตหรือชุดเอกสาร
- การคงค่าดังกล่าวไว้บนดิสก์ช่วย offload การคำนวณ prefill ออกจาก GPU เพื่อลด time-to-first-token (TTFT) และลดต้นทุนการอนุมานในเวิร์กโหลดที่ท้าทาย เช่น RAG pipelines, แอปพลิเคชันแชตหลายรอบ และระบบเอเจนต์
- สามารถผสาน LMCache เข้ากับเซิร์ฟเวอร์อนุมานหลักอย่าง vLLM หรือ NVIDIA Dynamo ได้ และคุ้มค่าที่จะประเมินผลกระทบต่อการตั้งค่า
110. Mem0
- Mem0 เป็น memory layer ที่ออกแบบมาสำหรับ AI agent
- แนวทางแบบพื้นฐานมักจะเก็บประวัติการแชตทั้งหมดไว้ในฐานข้อมูลและนำกลับมาใช้ในการสนทนาในอนาคต ซึ่งนำไปสู่การใช้โทเคนมากเกินไป
- Mem0 เข้ามาแทนที่ด้วยสถาปัตยกรรมที่ซับซ้อนกว่านั้น โดยแยกหน่วยความจำออกเป็นการระลึกระยะสั้นและเลเยอร์ระยะยาวอัจฉริยะที่ดึงและเก็บเฉพาะข้อเท็จจริงและความสัมพันธ์ที่สำคัญ
- สถาปัตยกรรมนี้ผสาน vector store สำหรับความคล้ายคลึงเชิงความหมายเข้ากับ knowledge graph เพื่อทำความเข้าใจข้อมูลเชิงเวลาและเชิงความสัมพันธ์
111. Open Security Control Assessment Language (OSCAL)
- Open Security Controls Assessment Language (OSCAL) เป็นรูปแบบการแลกเปลี่ยนข้อมูลแบบเปิดและเครื่องอ่านได้ ที่ออกแบบมาเพื่อเพิ่มระบบอัตโนมัติในการปฏิบัติตามข้อกำหนดและการบริหารความเสี่ยง พร้อมช่วยให้ทีมก้าวพ้นจากแนวทางทำงานด้วยมือที่อิงข้อความ
- นำโดยสถาบันมาตรฐานและเทคโนโลยีแห่งชาติสหรัฐฯ (NIST) โดย OSCAL มอบ standard representations in XML, JSON and YAML สำหรับการแสดง security controls ที่เกี่ยวข้องกับเฟรมเวิร์กอุตสาหกรรมอย่าง SOC 2 และ PCI รวมถึงเฟรมเวิร์กภาครัฐอย่าง FedRAMP ของสหรัฐฯ, Cybersecurity Control Catalogue ของสิงคโปร์ และ Information Security Manual ของออสเตรเลีย
- แม้ OSCAL จะยังไม่ได้รับการยอมรับอย่างแพร่หลายนอกภาครัฐ และระบบนิเวศยังอยู่ระหว่างการพัฒนา แต่เราตื่นเต้นกับศักยภาพของมันในการทำให้การประเมินความปลอดภัยง่ายขึ้น ลดการพึ่งพาสเปรดชีตและการทำงานแบบติ๊กช่อง และเปิดทางให้เกิดการปฏิบัติตามข้อกำหนดแบบอัตโนมัติเมื่อผสานเข้ากับแพลตฟอร์ม compliance-as-code และ continuous compliance
112. OpenInference
- OpenInference เป็นชุดของข้อกำหนดและปลั๊กอินที่ออกแบบมาเพื่อสังเกตการณ์แอปพลิเคชัน AI โดยทำงานเสริม OpenTelemetry
- มอบ instrumentation ที่เป็นมาตรฐานสำหรับเฟรมเวิร์กและไลบรารีด้านแมชชีนเลิร์นนิง เพื่อช่วยให้นักพัฒนาติดตามการเรียกใช้ LLM พร้อมบริบทแวดล้อม เช่น การค้นคืนจาก vector store หรือการเรียกใช้เครื่องมือภายนอกไปยัง API และ search engine
- span สามารถส่งออกไปยังตัวเก็บข้อมูลที่รองรับ OTEL ใดก็ได้ ทำให้สอดคล้องกับ telemetry pipeline ที่มีอยู่เดิม
- ก่อนหน้านี้เราเคยบลิป Langfuse ซึ่งเป็นแพลตฟอร์มด้าน LLM visibility ที่ใช้งานกันอย่างแพร่หลาย และ OpenInference SDK สามารถบันทึก trace ไปยัง Langfuse และแพลตฟอร์ม visibility อื่น ๆ ที่รองรับ OpenTelemetry ได้
113. Valibot
- Valibot เป็นไลบรารี schema validation สำหรับ TypeScript
- เช่นเดียวกับไลบรารี validation ยอดนิยมอื่น ๆ ของ TypeScript อย่าง Zod และ Ajv มันรองรับ type inference แต่สิ่งที่ทำให้แตกต่างคือการออกแบบแบบโมดูลาร์
- สถาปัตยกรรมนี้ช่วยให้ bundler ทำ tree shaking และ code splitting ได้อย่างมีประสิทธิภาพ จึงรวมเฉพาะฟังก์ชัน validation ที่ถูกใช้งานจริงเท่านั้น
- Valibot สามารถลดขนาด bundle ได้มากถึง 95% เมื่อเทียบกับ Zod ในสถานการณ์ที่เหมาะสม ทำให้เป็นตัวเลือกที่น่าสนใจสำหรับ schema validation ในสภาพแวดล้อมที่ขนาด bundle สำคัญ เช่น client-side validation หรือฟังก์ชัน serverless
114. Vercel AI SDK
- Vercel AI SDK เป็นชุดเครื่องมือโอเพนซอร์สแบบฟูลสแตกสำหรับสร้างแอปพลิเคชันและเอเจนต์ที่ขับเคลื่อนด้วย AI ใน ecosystem ของ TypeScript
- ประกอบด้วยองค์ประกอบหลักสองส่วน: AI SDK Core ทำหน้าที่ทำให้การเรียกใช้ LLM เป็นมาตรฐานโดยไม่ยึดติดกับโมเดล พร้อมรองรับการสร้างข้อความ การสร้างอ็อบเจ็กต์แบบมีโครงสร้าง และการเรียกใช้เครื่องมือ
- AI SDK UI มีลักษณะคล้าย assistant-ui โดยช่วยลดความซับซ้อนของการพัฒนาฝั่งฟรอนต์เอนด์ใน React, Vue, Next.js และ Svelte ด้วยการสตรีม การจัดการสถานะ และการอัปเดต UI แบบเรียลไทม์
- สำหรับทีมที่ทำงานอยู่ใน ecosystem ของ TypeScript และ Next.js อยู่แล้ว Vercel AI SDK มอบวิธีที่รวดเร็วและลื่นไหลในการสร้างแอปพลิเคชัน AI พร้อมประสบการณ์ฝั่งไคลเอนต์ที่ครบถ้วน
ยังไม่มีความคิดเห็น