R2R V2 - เอนจิน RAG โอเพนซอร์สที่พร้อมสำหรับการใช้งานจริง
(github.com/SciPhi-AI)- ออกแบบมาเพื่อเชื่อมช่องว่างระหว่างการทดลองใช้ LLM แบบโลคัลกับระบบ Retrieval-Augmented Generation (RAG) ระดับโปรดักชัน
- มอบระบบ RAG ที่ครบถ้วนและทันสมัย ซึ่งสร้างขึ้นให้ใช้งานง่ายโดยมี RESTful API เป็นศูนย์กลางสำหรับนักพัฒนา
คุณสมบัติหลัก
- รองรับมัลติโหมด: รองรับไฟล์หลากหลายรูปแบบ เช่น
.txt,.pdf,.json,.png,.mp3 - การค้นหาแบบไฮบริด: ผสานการค้นหาเชิงความหมายและคีย์เวิร์ดเพื่อเพิ่มความเกี่ยวข้อง
- Graph RAG: ดึงความสัมพันธ์ออกมาโดยอัตโนมัติและสร้างกราฟความรู้
- การจัดการแอป: จัดการเอกสารและผู้ใช้ได้อย่างมีประสิทธิภาพ พร้อมมอบความสามารถด้าน observability และการวิเคราะห์ที่หลากหลาย
- ไคลเอนต์-เซิร์ฟเวอร์: รองรับ RESTful API
- ปรับแต่งได้: สามารถ provision แอปพลิเคชันได้ด้วยไฟล์คอนฟิกที่ใช้งานง่าย
- ขยายได้: ขยายแอปพลิเคชันได้ง่ายผ่าน builder + factory pattern
- แดชบอร์ด: มี R2R Dashboard ซึ่งเป็นแอป React+Next.js แบบโอเพนซอร์สสำหรับการโต้ตอบที่เป็นมิตรต่อผู้ใช้
R2R Dashboard
สามารถโต้ตอบกับ R2R ได้ผ่านแดชบอร์ด React+Next.js แบบโอเพนซอร์ส โดยสามารถเริ่มต้นได้จาก Dashboard Cookbook
1 ความคิดเห็น
ความเห็นจาก Hacker News
ความแม่นยำและประสิทธิภาพของการดึงข้อมูล: กระบวนการดึงข้อมูลเป็นความท้าทายสำคัญในระบบ RAG โดยแนวทาง OCR แบบดั้งเดิมยังไม่เพียงพอ จึงใช้แนวทาง multimodal LLM + OCR เพื่อเพิ่มความแม่นยำและความสม่ำเสมอ
ประสบการณ์ในการใช้งานสแตกที่คล้ายกัน: มีประสบการณ์ใช้งานสแตกที่คล้ายกันมา 2 ปี โดยใช้เทคโนโลยีอย่าง Pgvector, HyDe, การค้นหาเว็บ + การค้นหาเอกสาร และมีแดชบอร์ดที่ดีพร้อมล็อกและการวิเคราะห์
ความยากของการเริ่มต้นอย่างรวดเร็ว: quickstart ไม่ได้รวดเร็วอย่างที่คิด ควรมีการตั้งค่าที่รวม Docker Compose และอิมเมจ Postgres เอาไว้ด้วย และหากต้องการใช้แดชบอร์ดก็ยังต้องโคลนรีโปแยกต่างหากซึ่งไม่สะดวก
ความซับซ้อนของโปรเจกต์: โปรเจกต์มีองค์ประกอบจำนวนมาก แต่ไม่ได้ทำให้การพัฒนาง่ายขึ้น จึงสับสนว่าเป็น SDK หรือเป็นชุดแอปกันแน่ ควรมีประสบการณ์ติดตั้งแบบ "1 คลิก" เพื่อให้สามารถพรีวิวฟีเจอร์ทั้งหมดได้
การตรวจสอบความถูกต้อง: มีคำถามว่าสามารถตรวจสอบความถูกต้องของคำตอบได้อย่างไร และสงสัยว่ามีวิธีติดตามกระบวนการที่ทำให้เกิดคำตอบนั้นหรือไม่
ความยากของการเก็บรวบรวมข้อมูล: หลายโปรเจกต์ RAG ยังแก้ปัญหาการเก็บข้อมูลได้ไม่ดี มีคำถามเกี่ยวกับวิธีรวบรวมเอกสาร HTML จำนวนมากเข้าสู่ระบบแบบเป็นชุด
การเก็บข้อมูลแบบมัลติโหมด: ขอคำอธิบายโดยละเอียดเกี่ยวกับกระบวนการเก็บข้อมูลแบบมัลติโหมด พร้อมถามว่า R2R รองรับข้อมูลประเภทใดได้บ้างในตอนนี้ และมีวิธีสร้าง embedding สำหรับข้อมูลที่ไม่ใช่ข้อความอย่างไร
การเพิ่มประสิทธิภาพให้ทีมพัฒนา: ขอคำอธิบายว่ากระบวนการนี้ช่วยให้ทีมพัฒนาทำงานได้เร็วขึ้นและเหมาะสมขึ้นอย่างไร ซึ่งมีศักยภาพสูงในการเร่งเวลาในการพัฒนา MVP (Minimum Viable Product)
การทำงานกับซอร์สโค้ด: กำลังมองหาโซลูชัน RAG ที่สามารถเข้าใจซอร์สโค้ดได้ เช่น สามารถเข้าใจว่า "เหตุการณ์วิเคราะห์ที่ถูกเรียกเมื่อคลิกปุ่มส่ง" คืออะไร
ไม่ต้องการใช้ Neo4j: ไม่ต้องการใช้ Neo4j เพราะใช้ทรัพยากรมาก
การผสานรวมกับแชตฟรอนต์เอนด์ยอดนิยม: มีคำถามว่าสามารถผสานรวมกับแชตฟรอนต์เอนด์ยอดนิยมอย่าง OpenWebUI ได้หรือไม่