OpenDocuments – แพลตฟอร์ม RAG โอเพนซอร์สสำหรับค้นหาเอกสารที่กระจัดกระจายทั่วองค์กรด้วยภาษาธรรมชาติ
(github.com/joungminsung)นี่คือแพลตฟอร์ม RAG แบบ self-hosted ที่สร้างขึ้นเพื่อแก้ปัญหาการค้นหาเอกสารของทีมที่กระจัดกระจายอยู่บน GitHub, Notion, Drive, Confluence และที่อื่น ๆ ได้ยาก
เมื่อเชื่อมต่อแหล่งเอกสารแล้ว ระบบจะทำการ parsing/chunking/embedding เพื่อสร้างดัชนี และเมื่อถามด้วยภาษาธรรมชาติ ก็จะตอบพร้อมแหล่งอ้างอิง
- คอนเน็กเตอร์: GitHub, Notion, GDrive, S3, Confluence, Swagger, เว็บครอว์เลอร์, การค้นหาเว็บด้วย Tavily
- รูปแบบไฟล์: PDF, DOCX, XLSX, HTML, Jupyter, ซอร์สโค้ด, อีเมล และอื่น ๆ รวม 12 ประเภท
- LLM: รันแบบโลคัลได้ด้วย Ollama (ไม่มีข้อมูลรั่วไหล) รองรับ OpenAI/Claude/Gemini/Grok ด้วย
- การค้นหา: ไฮบริดระหว่างเวกเตอร์ + คีย์เวิร์ด, reranking, ตัวป้องกัน hallucination
- การค้นหาข้ามภาษาเกาหลี-อังกฤษ
- เชื่อมต่อกับ Claude Code/Cursor ผ่านเซิร์ฟเวอร์ MCP
- Web UI, คำสั่ง CLI 17 รายการ, TypeScript SDK
- ระบบปลั๊กอิน (parser/connector/model/middleware)
- รองรับการดีพลอยด้วย Docker
สแตก: TypeScript, Hono, React, SQLite, LanceDB, Turborepo
ทดสอบ 51 สวีต / ประมาณ 300 รายการ
ใช้สัญญาอนุญาต MIT
3 ความคิดเห็น
ขอแจ้งอัปเดต v0.2.0
หัวใจสำคัญของเวอร์ชันนี้คือการลดอุปสรรคในการติดตั้งและปรับปรุงการใช้งานจริง
การผสานรวม Ollama แบบวันทัช - ตรวจจับการติดตั้งโดยอัตโนมัติ → ถ้ายังไม่มีจะติดตั้งอัตโนมัติตามแต่ละ OS → ไปจนถึงดึง embedding model ให้อัตโนมัติในครั้งเดียว แค่บรรทัดเดียว
docker compose upก็ยกทั้งสแตกขึ้นมาพร้อม local LLM ได้เลยการสนทนาแบบหลายเทิร์น - เวอร์ชันก่อนหน้ารองรับได้แค่คำถามแบบครั้งเดียว ตอนนี้สามารถสนทนาต่อเนื่องโดยคงบริบทไว้ได้แล้ว
แพตช์ความปลอดภัยมากกว่า 10 รายการ - แก้ไขรวดเดียวทั้ง FTS5 SQL injection, path traversal, การโจมตีแบบ OAuth state fixation, ReDoS ฯลฯ ที่พบจากฟีดแบ็กของชุมชนและการตรวจสอบภายในของเรา
อื่น ๆ: โหลด .env อัตโนมัติ, รีทราย 3 ครั้งเมื่อเชื่อมต่อโมเดลล้มเหลวพร้อมข้อความ error ที่ชัดเจน, ขยายเอกสาร Plugin API ครั้งใหญ่
บันทึกประจำรุ่น: https://github.com/joungminsung/OpenDocuments/releases/
หากมี error หรือพบความไม่สะดวกในการใช้งาน รบกวนช่วยเปิด GitHub Issue ให้ด้วยครับ
จะรีบดำเนินการตอบสนองทันทีที่มีการแจ้งเข้ามา
มีการตกหล่นในการเผยแพร่แพ็กเกจ npm ต้องขออภัยสำหรับผู้ที่โคลนแล้วติดตั้งไม่ได้ ตอนนี้เผยแพร่เรียบร้อยตามปกติแล้ว รบกวนลองอีกครั้งด้วยคำสั่งที่แก้ไขแล้วใน README ขอบคุณครับ