- เวกเตอร์ DB ที่สามารถ ฝังตรง داخلแอปพลิเคชัน ได้ ออกแบบมาเพื่อทำ การค้นหาความคล้ายคลึง ขนาดใหญ่ด้วยการตั้งค่าน้อยที่สุด
- สร้างบน เอนจิน Proxima ของ Alibaba มอบ ความสามารถในการขยายระดับโปรดักชันและประสิทธิภาพการค้นหาแบบหน่วงต่ำ
- รองรับทั้ง เวกเตอร์หนาแน่น (dense) และ เวกเตอร์แบบเบาบาง (sparse) และสามารถทำ คำสั่งค้นหาแบบหลายเวกเตอร์ ได้ในครั้งเดียว
- รองรับการค้นหาที่แม่นยำด้วย ความสามารถด้านการค้นหาแบบไฮบริด ที่ผสาน ความคล้ายคลึงเชิงความหมาย กับ การกรองเชิงโครงสร้าง
- มาในรูปแบบ ไลบรารี in-process ที่ รันได้ทันทีโดยไม่ต้องมีเซิร์ฟเวอร์หรือขั้นตอนการตั้งค่า จึงใช้งานได้ทุกที่ทั้งโน้ตบุ๊ก เซิร์ฟเวอร์ CLI และสภาพแวดล้อม edge
- รองรับแพลตฟอร์ม Linux (x86/ARM) และ macOS และติดตั้งได้ง่ายในสภาพแวดล้อม Python/Node.js
- ประกอบด้วย เอนจินหลักที่พัฒนาด้วย C++ และโครงสร้าง SWIG·Python bindings รองรับทั้งการประมวลผลประสิทธิภาพสูงและการผสานรวมกับหลายภาษา
- ปรับแต่ง
unordered_map เพื่อให้ การค้นหาคีย์เฉลี่ยระดับ O(1) ช่วย ลดเวลาในการโหลดดัชนีและเพิ่มประสิทธิภาพการใช้หน่วยความจำ
- ใช้ การคำนวณแบบควอนไทซ์ Int4/Int8 เพื่อรักษา สมดุลระหว่างความเร็วกับความแม่นยำ เมื่อต้องจัดการเวกเตอร์ขนาดใหญ่
- ไลเซนส์ Apache-2.0
2 ความคิดเห็น
Alibaba เคยออกสิ่งที่เป็นการ fork MySQL ในนาม AliSQL ในโพสต์ที่เกี่ยวข้องด้านล่าง พร้อมทั้งรวม DuckDB สำหรับการค้นหาเวกเตอร์เข้าไปด้วย ดูเหมือนช่วงนี้จะกำลังลองอะไรใหม่ ๆ เยอะเลยนะครับ
QWEN ก็ด้วยเหมือนกัน ในยุค AI นี้ Alibaba ดูเหมือนจะเป็นบริษัทจีนที่ขยันทำกิจกรรมโอเพนซอร์สมากที่สุดเลยครับ
เห็นบ่อยมากจริงๆ