ผมได้ลองทำเดโม RAG สำหรับค้นหากฎหมาย 7 ประเภทในที่เดียว — MiniLex
(minilex.wellsa.ai)เวลาเราค้นหากฎหมาย มักน่าหงุดหงิดที่ต้องรู้ก่อนว่าเป็น "มาตรา 14 ของกฎหมายลงโทษความรุนแรงทางเพศ" ถึงจะหาเจอ เลยลองทำเดโม RAG ที่ให้ประชาชนถามด้วยภาษาที่ใช้ในชีวิตประจำวัน แล้วระบบจะส่งบทกฎหมายที่เกี่ยวข้องกลับมาให้
ข้อมูลนำมาจาก Public OpenAPI ของ Ministry of Government Legislation แล้วจัดให้อยู่ในรูป Markdown และอัปเดตทุกวันด้วย cron
• กฎหมาย (law-kr): 5,589
• กฎระเบียบทางปกครอง (regulate-kr): 10,765
• คำพิพากษา (precedent-kr): 171,014
• ตัวอย่างการตีความกฎหมาย (interpretation-kr): 8,728
• คำวินิจฉัยศาลรัฐธรรมนูญ (constitution-kr): 38,092
• ข้อบัญญัติท้องถิ่น (localrule-kr): 159,910
• สนธิสัญญา (treaty-kr): 6,907
รวมเอกสาร Markdown ทั้งหมด 397K+ ฉบับ
ทำดัชนีบทกฎหมายใน DB สำหรับระบบจริงแล้ว 1.36M+ รายการ
• เดโม: https://minilex.wellsa.ai
• ข้อมูล/โค้ด (MIT): https://github.com/wellsa-ai
• HF Mirror: https://huggingface.co/wellsa-ai
ได้ตรวจสอบแล้วว่าระบบสามารถคืนบทกฎหมายอ้างอิงพร้อมแหล่งที่มาได้สำหรับ 5 สถานการณ์ของประชาชน (ดีปเฟก / ค้างจ่ายค่าแรง / เลิกจ้างไม่เป็นธรรม / ข้อมูลส่วนบุคคลรั่วไหล / การสะกดรอยตาม) แต่ยังอีกไกลกว่าจะทำให้ทั่วไปได้ดี
ตอนนี้ยังพึ่งพาการขยายคีย์เวิร์ด + คำพ้องความหมายค่อนข้างมาก ดังนั้นโจทย์ถัดไปคือการทำให้การจัดอันดับทั่วไปดีขึ้น
สแตกก็เป็นแบบมาตรฐานคือ Next.js + FastAPI + Celery + PostgreSQL + pgvector โดยใช้อิมเบดดิง nomic-embed-text-v2-moe(768d)
เบนช์ตัวอย่างความปลอดภัยที่ทำเองได้ผลประมาณ R@5 0.86 / MRR 0.753
นี่ไม่ใช่เครื่องมือทดแทนการให้คำปรึกษากฎหมาย แต่เป็นตัวช่วยสำหรับค้นหาบทกฎหมายต้นทาง
การตัดสินใจจริงควรปรึกษาผู้เชี่ยวชาญที่มีคุณสมบัติเหมาะสม
ยินดีรับฟีดแบ็ก / PR
ยังไม่มีความคิดเห็น