RLama - DocumentAI โอเพนซอร์สที่ใช้ Ollama
(rlama.dev)- เครื่องมือถาม-ตอบเอกสารด้วย AI ที่เชื่อมต่อและใช้งานร่วมกับโมเดล Ollama แบบโลคัล
- สามารถสร้าง จัดการ และโต้ตอบกับระบบ RAG (Retrieval-Augmented Generation) ให้ตรงกับความต้องการด้านเอกสารได้
- ใช้งานได้บน macOS, Linux และ Windows
- จัดทำดัชนีโฟลเดอร์เอกสาร: สามารถจัดทำดัชนีโฟลเดอร์เอกสารเพื่อการค้นหาและการสืบค้นอย่างชาญฉลาด และรองรับรูปแบบเอกสารหลากหลาย เช่น ข้อความ โค้ด PDF และ DOCX
- การประมวลผลแบบโลคัล: ประมวลผลข้อมูลทั้งหมดแบบโลคัลด้วยโมเดล Ollama ทำให้ข้อมูลไม่รั่วไหลออกไปภายนอก
- เซสชัน RAG แบบโต้ตอบ: สามารถสร้างเซสชันแบบโต้ตอบเพื่อสืบค้นคลังความรู้จากเอกสารได้
- จัดการได้ง่าย : มีคำสั่งแบบง่ายสำหรับสร้าง แสดงรายการ และลบระบบ RAG
- เป็นมิตรกับนักพัฒนา: ออกแบบด้วยภาษา Go สำหรับนักพัฒนาและผู้ใช้สายเทคนิค
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ระบบนี้ส่งเอกสารทั้งฉบับไปยัง Ollama เพื่อขอ embedding โดยไม่แบ่งเอกสารเป็นชังก์ ดังนั้นจึงมีประโยชน์เฉพาะเมื่อเอกสารมีขนาดเล็ก
bge-m3มีความยาวซีเควนซ์ 8192 โทเค็น ขณะที่ rlama พยายามทำ embedding ให้ทั้งเล่ม แต่ Ollama ใส่ได้เพียงไม่กี่หน้าแรกในคำขอ embeddingแนะนำให้แสดงผลการค้นหาแก่ผู้ใช้ด้วย แค่เอนจินค้นหาแบบเวกเตอร์ก็มีประโยชน์มากแล้ว
ขอชื่นชมโปรเจกต์นี้ พร้อมโน้ตสั้น ๆ บางประการ
หมายเหตุด้านโค้ด: แปลกใจที่ไม่มี
.ts(typescript) อยู่ในรายการเว็บไซต์สะอาดมาก สงสัยว่าเขียนโค้ดเองตั้งแต่ต้นหรือใช้เทมเพลต
การทำ RAG ใช้เองนั้นง่ายมาก Ollama มีทูโทเรียลเริ่มต้นแบบรวดเร็วอยู่แล้ว และสามารถปรับกระบวนการให้ตรงกับความต้องการได้
ยังสงสัยในประโยชน์ใช้สอยของเครื่องมือแบบนี้ อยากรู้ว่าจะเชื่อถือได้แค่ไหนเมื่อมีปัญหา hallucination และอ้างอิงแหล่งที่มาได้ดีเพียงใด
ไม่มีข้อมูลเกี่ยวกับสถาปัตยกรรม/เทคโนโลยีสแต็กของโปรเจกต์นี้ ทั้งใน GitHub README หรือบนเว็บไซต์ก็ไม่มี
ในฐานะนักประวัติศาสตร์สมัครเล่น ฉันสแกนเอกสารจากคลังเอกสารและเก็บเป็นไฟล์ JPG เลยสงสัยว่าวิธีที่ดีที่สุดในการทำความเข้าใจชุดความรู้นี้คืออะไร
สงสัยว่าสามารถทำงานร่วมกับ
llama.cppซึ่งเป็นเอนจินของ Ollama ได้หรือไม่llama.cppจากซอร์สและดาวน์โหลดโมเดลแบบ quantized จาก Huggingface ไม่เคยใช้ Ollama มาก่อนน่าจะดีถ้ามี API interface เพื่อให้รวมเข้ากับระบบอื่นได้
เป็นโปรเจกต์ที่ยอดเยี่ยม สงสัยว่าออกภายใต้ไลเซนส์อะไร เพราะไม่ได้มีการระบุไว้ในเอกสาร
อยากรู้ประสิทธิภาพของ RAG แค่โยนเวกเตอร์ดาต้าเบสเข้าไปอย่างเดียวไม่ได้ทำให้มีประโยชน์