5 คะแนน โดย GN⁺ 2024-06-28 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ออกแบบมาเพื่อเชื่อมช่องว่างระหว่างการทดลองใช้ LLM แบบโลคัลกับระบบ Retrieval-Augmented Generation (RAG) ระดับโปรดักชัน
  • มอบระบบ RAG ที่ครบถ้วนและทันสมัย ซึ่งสร้างขึ้นให้ใช้งานง่ายโดยมี RESTful API เป็นศูนย์กลางสำหรับนักพัฒนา

คุณสมบัติหลัก

  • รองรับมัลติโหมด: รองรับไฟล์หลากหลายรูปแบบ เช่น .txt, .pdf, .json, .png, .mp3
  • การค้นหาแบบไฮบริด: ผสานการค้นหาเชิงความหมายและคีย์เวิร์ดเพื่อเพิ่มความเกี่ยวข้อง
  • Graph RAG: ดึงความสัมพันธ์ออกมาโดยอัตโนมัติและสร้างกราฟความรู้
  • การจัดการแอป: จัดการเอกสารและผู้ใช้ได้อย่างมีประสิทธิภาพ พร้อมมอบความสามารถด้าน observability และการวิเคราะห์ที่หลากหลาย
  • ไคลเอนต์-เซิร์ฟเวอร์: รองรับ RESTful API
  • ปรับแต่งได้: สามารถ provision แอปพลิเคชันได้ด้วยไฟล์คอนฟิกที่ใช้งานง่าย
  • ขยายได้: ขยายแอปพลิเคชันได้ง่ายผ่าน builder + factory pattern
  • แดชบอร์ด: มี R2R Dashboard ซึ่งเป็นแอป React+Next.js แบบโอเพนซอร์สสำหรับการโต้ตอบที่เป็นมิตรต่อผู้ใช้

R2R Dashboard

สามารถโต้ตอบกับ R2R ได้ผ่านแดชบอร์ด React+Next.js แบบโอเพนซอร์ส โดยสามารถเริ่มต้นได้จาก Dashboard Cookbook

1 ความคิดเห็น

 
GN⁺ 2024-06-28
ความเห็นจาก Hacker News
  • ความแม่นยำและประสิทธิภาพของการดึงข้อมูล: กระบวนการดึงข้อมูลเป็นความท้าทายสำคัญในระบบ RAG โดยแนวทาง OCR แบบดั้งเดิมยังไม่เพียงพอ จึงใช้แนวทาง multimodal LLM + OCR เพื่อเพิ่มความแม่นยำและความสม่ำเสมอ

  • ประสบการณ์ในการใช้งานสแตกที่คล้ายกัน: มีประสบการณ์ใช้งานสแตกที่คล้ายกันมา 2 ปี โดยใช้เทคโนโลยีอย่าง Pgvector, HyDe, การค้นหาเว็บ + การค้นหาเอกสาร และมีแดชบอร์ดที่ดีพร้อมล็อกและการวิเคราะห์

  • ความยากของการเริ่มต้นอย่างรวดเร็ว: quickstart ไม่ได้รวดเร็วอย่างที่คิด ควรมีการตั้งค่าที่รวม Docker Compose และอิมเมจ Postgres เอาไว้ด้วย และหากต้องการใช้แดชบอร์ดก็ยังต้องโคลนรีโปแยกต่างหากซึ่งไม่สะดวก

  • ความซับซ้อนของโปรเจกต์: โปรเจกต์มีองค์ประกอบจำนวนมาก แต่ไม่ได้ทำให้การพัฒนาง่ายขึ้น จึงสับสนว่าเป็น SDK หรือเป็นชุดแอปกันแน่ ควรมีประสบการณ์ติดตั้งแบบ "1 คลิก" เพื่อให้สามารถพรีวิวฟีเจอร์ทั้งหมดได้

  • การตรวจสอบความถูกต้อง: มีคำถามว่าสามารถตรวจสอบความถูกต้องของคำตอบได้อย่างไร และสงสัยว่ามีวิธีติดตามกระบวนการที่ทำให้เกิดคำตอบนั้นหรือไม่

  • ความยากของการเก็บรวบรวมข้อมูล: หลายโปรเจกต์ RAG ยังแก้ปัญหาการเก็บข้อมูลได้ไม่ดี มีคำถามเกี่ยวกับวิธีรวบรวมเอกสาร HTML จำนวนมากเข้าสู่ระบบแบบเป็นชุด

  • การเก็บข้อมูลแบบมัลติโหมด: ขอคำอธิบายโดยละเอียดเกี่ยวกับกระบวนการเก็บข้อมูลแบบมัลติโหมด พร้อมถามว่า R2R รองรับข้อมูลประเภทใดได้บ้างในตอนนี้ และมีวิธีสร้าง embedding สำหรับข้อมูลที่ไม่ใช่ข้อความอย่างไร

  • การเพิ่มประสิทธิภาพให้ทีมพัฒนา: ขอคำอธิบายว่ากระบวนการนี้ช่วยให้ทีมพัฒนาทำงานได้เร็วขึ้นและเหมาะสมขึ้นอย่างไร ซึ่งมีศักยภาพสูงในการเร่งเวลาในการพัฒนา MVP (Minimum Viable Product)

  • การทำงานกับซอร์สโค้ด: กำลังมองหาโซลูชัน RAG ที่สามารถเข้าใจซอร์สโค้ดได้ เช่น สามารถเข้าใจว่า "เหตุการณ์วิเคราะห์ที่ถูกเรียกเมื่อคลิกปุ่มส่ง" คืออะไร

  • ไม่ต้องการใช้ Neo4j: ไม่ต้องการใช้ Neo4j เพราะใช้ทรัพยากรมาก

  • การผสานรวมกับแชตฟรอนต์เอนด์ยอดนิยม: มีคำถามว่าสามารถผสานรวมกับแชตฟรอนต์เอนด์ยอดนิยมอย่าง OpenWebUI ได้หรือไม่