turbo-graph – ดัชนี constrained RAG ที่เพิ่มหน่วยความจำกราฟ/แคชฟิลเตอร์บน turbovec
(github.com/bigmacfive)สวัสดีครับ ผมได้สร้าง turbo-graph ซึ่งเป็นการต่อ graph memory layer สำหรับ constrained RAG บนพื้นฐานของ turbovec/TurboQuant
สำหรับกรณีที่มี flat top-k หรือ cheap allowlist นั้น turbovec ทำได้ดีอยู่แล้ว แต่ใน RAG จริง ๆ คิวรีมักมีหน้าตาแบบนี้บ่อยครั้ง
tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates
การผสมเงื่อนไขแบบนี้ต้องประกอบใหม่ทุกครั้งใน Python/SQL/app layer แล้วส่งต่อเข้า vector search อีกที จากนั้นก็นำผลลัพธ์ไป rerank กับ graph/BM25 และเขียนโค้ดอธิบายว่าเพราะอะไรถึงได้ผลลัพธ์แบบนี้ ซึ่งเป็นแพตเทิร์นที่ต้องทำซ้ำอยู่เรื่อย ๆ
turbo-graph เป็นการทดลองที่ยังคงแกนหลักแบบ turbovec-compatible ไว้ แล้วลองย้ายงานอย่าง graph/metadata view compilation, cache reuse, graph rerank และ explain telemetry รอบ ๆ มัน มาไว้ที่ชั้นดัชนี
ตอนนี้ยังเป็น Alpha ดังนั้นเป้าหมายไม่ได้ต้องการให้เอาไปใช้ใน production ทันที แต่ต้องการรับฟีดแบ็กว่าในเส้นทาง RAG จริง ๆ ควรต้องมี API แบบไหนบ้าง
ยังไม่มีความคิดเห็น