สวัสดีครับ ผมได้สร้าง turbo-graph ซึ่งเป็นการต่อ graph memory layer สำหรับ constrained RAG บนพื้นฐานของ turbovec/TurboQuant

สำหรับกรณีที่มี flat top-k หรือ cheap allowlist นั้น turbovec ทำได้ดีอยู่แล้ว แต่ใน RAG จริง ๆ คิวรีมักมีหน้าตาแบบนี้บ่อยครั้ง

tenant ACL ∩ tag ∩ source ∩ time window ∩ graph neighbors ∩ BM25 candidates

การผสมเงื่อนไขแบบนี้ต้องประกอบใหม่ทุกครั้งใน Python/SQL/app layer แล้วส่งต่อเข้า vector search อีกที จากนั้นก็นำผลลัพธ์ไป rerank กับ graph/BM25 และเขียนโค้ดอธิบายว่าเพราะอะไรถึงได้ผลลัพธ์แบบนี้ ซึ่งเป็นแพตเทิร์นที่ต้องทำซ้ำอยู่เรื่อย ๆ

turbo-graph เป็นการทดลองที่ยังคงแกนหลักแบบ turbovec-compatible ไว้ แล้วลองย้ายงานอย่าง graph/metadata view compilation, cache reuse, graph rerank และ explain telemetry รอบ ๆ มัน มาไว้ที่ชั้นดัชนี

ตอนนี้ยังเป็น Alpha ดังนั้นเป้าหมายไม่ได้ต้องการให้เอาไปใช้ใน production ทันที แต่ต้องการรับฟีดแบ็กว่าในเส้นทาง RAG จริง ๆ ควรต้องมี API แบบไหนบ้าง

GitHub:
https://github.com/bigmacfive/turbo-graph

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น