legalQ – แชตบอตสาธารณะที่ใช้ถามกฎหมายและคำพิพากษาของเกาหลีด้วยภาษาธรรมชาติ
(legalq.dnotitia.ai)ขอแชร์ legalQ แชตบอตสาธารณะที่ใช้ถามกฎหมายและคำพิพากษาของเกาหลีด้วยภาษาธรรมชาติ
ผมเป็นวิศวกรที่มีส่วนร่วมในการพัฒนา legalQ ที่ Dnotitia ครับ นี่เป็นการแชร์ผ่านบัญชีส่วนตัวเพื่อขอฟีดแบ็กเชิงเทคนิคจากผู้ใช้ GeekNews แยกต่างหากจากประกาศอย่างเป็นทางการของบริษัท
กฎหมายหรือคำพิพากษาหลายครั้งค้นหาด้วยคีย์เวิร์ดอย่างเดียวได้ยาก ในทางกลับกัน ถ้าถาม LLM ทั่วไปอย่าง ChatGPT หรือ Claude ตรง ๆ แม้จะสะดวก แต่หมายเลขมาตราหรือการอ้างอิงคำพิพากษาอาจไม่แม่นยำได้
legalQ ทำงานบนพื้นฐานของ RAG เพื่อลดปัญหาเหล่านี้ โดยจะแปลงคำถามภาษาธรรมชาติของผู้ใช้ให้อยู่ในรูปแบบที่เหมาะกับการค้นหา ค้นหาข้อมูลกฎหมายและคำพิพากษาที่เกี่ยวข้อง แล้วพยายามแสดงมาตรากฎหมายและข้อมูลคำพิพากษาที่ใช้อ้างอิงในการตอบร่วมกันให้มากที่สุด
ข้อมูลที่ใช้ อ้างอิงจาก legalize-kr ที่เพิ่งถูกแนะนำใน GN ไม่นานนี้
ขณะนี้การประมวลผลข้อมูลในภาคผนวกที่ทำเครื่องหมายดอกจันด้านล่างยังไม่สมบูรณ์พอ ดังนั้นคำถามที่มีเนื้อหาสำคัญอยู่ในภาคผนวกจึงยังจัดการโดยแสดงลิงก์กฎหมายที่เกี่ยวข้องร่วมด้วย มากกว่าจะพึ่งคำตอบอย่างเดียวให้ครบถ้วน
จุดที่ต่างจากวิธีเดิม
- บริการค้นหากฎหมายและคำพิพากษาแบบเดิม
มีจุดแข็งด้านการค้นหาด้วยคีย์เวิร์ด แต่ในบางกรณีอาจไม่สะดวกนักหากผู้ใช้ต้องการอธิบายสถานการณ์ของตนเองแล้วถามด้วยภาษาธรรมชาติ - ถาม ChatGPT หรือ Claude โดยตรง
ใช้งานสะดวก แต่หมายเลขมาตราหรือการอ้างอิงคำพิพากษาอาจผิดได้ legalQ ถูกออกแบบให้ตอบบนพื้นฐานของดัชนีการค้นหา และพยายามแสดงมาตรากฎหมายและข้อมูลคำพิพากษาที่เป็นหลักฐานประกอบร่วมกันให้มากที่สุด - เครื่องมืออย่าง Beommang, Korean Law MCP
ผมเข้าใจว่าเป็นเครื่องมือที่ใกล้เคียงกับ API หรือเลเยอร์ MCP มากกว่า ส่วน legalQ มุ่งไปที่ UI ที่สามารถลองใช้ได้ทันทีบนเบราว์เซอร์โดยไม่ต้องติดตั้งเพิ่มเติม
สแตก
แบ็กเอนด์ใช้ FastAPI ฟรอนต์เอนด์ใช้ React การเรียก LLM ประมวลผลผ่าน OpenRouter และการค้นหาใช้ข้อมูล legalize-kr ที่ทำดัชนีไว้ในเวกเตอร์ DB ภายในบริษัท (Seahorse Cloud)
ส่วนการเรียกใช้เครื่องมือแยกออกเป็น MCP โดยจะแปลงคำถามภาษาธรรมชาติเป็นคำค้นสำหรับการค้นหา ดึงข้อมูลกฎหมายและคำพิพากษาที่จำเป็น จากนั้นจึงสร้างคำตอบบนพื้นฐานของผลลัพธ์เหล่านั้น
ความเป็นส่วนตัว
คำถามเกี่ยวกับกฎหมายหรือคำพิพากษาเป็นพื้นที่ที่อาจเผยให้เห็นสถานการณ์เฉพาะของผู้ใช้ จึงออกแบบให้ลดการเก็บบทสนทนาให้น้อยที่สุด
- ไม่มีการสมัครสมาชิกหรือเข้าสู่ระบบ
- ไม่บันทึกเนื้อหาบทสนทนาลงใน DB ของเซิร์ฟเวอร์
- เป็นสถาปัตยกรรมแบบ stateless ที่ไคลเอนต์จะส่ง history ที่จำเป็นมาพร้อมทุกคำขอ
- ประวัติบทสนทนาจะคงอยู่เฉพาะใน
localStorageของเบราว์เซอร์ และจะถูกลบเมื่อผู้ใช้ล้างที่เก็บข้อมูลของเบราว์เซอร์ - IP ถูกใช้เฉพาะใน in-memory bucket สำหรับทำ rate limit
- เมทาดาทาของคำขอใน access log มาตรฐานจะถูกหมุนเวียนจัดเก็บเป็นรอบ 30 วัน
- คำถามของผู้ใช้อาจถูกส่งไปยัง LLM API เพื่อสร้างคำตอบ
ข้อจำกัด
ยังเป็นเวอร์ชันเริ่มต้น จึงมีข้อจำกัดอยู่มาก
- ไม่ใช่บริการให้คำปรึกษากฎหมาย แต่เป็นเครื่องมือค้นหาข้อมูลกฎหมายและคำพิพากษาทั่วไป
- คำตอบอาจผิดได้ ดังนั้นในประเด็นสำคัญจำเป็นต้องตรวจสอบต้นฉบับกฎหมายและให้ผู้เชี่ยวชาญตรวจทานเสมอ
- ข้อมูลภาคผนวกยังประมวลผลได้ไม่เพียงพอ จึงอาจมีกรณีที่แนะนำด้วยลิงก์กฎหมายที่เกี่ยวข้อง
- การค้นหาและการอ้างอิงคำพิพากษาอาจมีการตกหล่นหรือไม่แม่นยำได้ ขึ้นอยู่กับขอบเขตข้อมูลและคุณภาพการค้นหา
- ในคำถามที่ต้องอ้างอิงข้อมูลจากกฎหมายหลายฉบับร่วมกัน อาจมี tool call จำนวนมาก ทำให้ตอบช้าลงหรือข้อมูลบางส่วนตกหล่นได้
ส่วนที่อยากได้ฟีดแบ็ก
เพิ่งเปิดให้ใช้งานช่วงแรก เลยอยากรับฟังจุดที่ยังขาดอีกมาก โดยเฉพาะฟีดแบ็กต่อไปนี้จะมีประโยชน์มาก
- คำตอบต่อคำถามบางอย่างดูแปลก
- การอ้างอิงมาตราหรือคำพิพากษาผิด
- ค้นหากฎหมายที่เกี่ยวข้องได้ไม่ดีพอ
- มีจุดที่ติดขัดใน UX
- เมื่อเทียบกับบริการหรือเครื่องมือเดิม ยังมีมุมมองที่ตกหล่น
- มีถ้อยคำที่ดูเหมือนคำปรึกษากฎหมายซึ่งอาจล้าสมัยได้
ลองใช้ดูแล้วถ้ามีฟีดแบ็กแบบตรงไปตรงมาจะขอบคุณมากครับ
ขอบคุณที่อ่านครับ
2 ความคิดเห็น
ผมเองก็เคยลองทำบริการที่คล้ายกันในด้านภาษีมาก่อน เลยรู้สึกยินดีที่ได้เห็นครับ
ผมลองถามเกี่ยวกับภาษีนิติบุคคลและกฎหมายพิเศษด้านภาษีที่เกี่ยวกับเครดิตภาษีจากการลงทุน แล้วพบว่าสามารถตอบโดยอ้างอิงกฎหมายและมาตราที่ถูกต้องได้ จุดที่น่าประทับใจคือแสดงต้นฉบับให้ดูโดยตรงตอนตอบ และอธิบายแยกตาม case ที่เป็นไปได้
หากมีแผนจะขยายไปด้านภาษี ในแวดวงภาษีโดยทั่วไปคำวินิจฉัยและการตีความทางปกครองจากกระทรวงยุทธศาสตร์และการคลัง, กรมสรรพากร, คณะกรรมการพิจารณาอุทธรณ์ภาษี ฯลฯ รวมถึงคำวินิจฉัยอุทธรณ์ภาษี, ระเบียบตีความ, และหนังสือตอบข้อหารือ มักให้ข้อมูลที่ละเอียดกว่าอยู่มาก (ปกติบริการด้านภาษีก็มักรวมข้อมูลเหล่านี้ไว้ใน corpus เป็นข้อมูลสำคัญอยู่แล้ว) ดังนั้นถ้าเสริมส่วนนี้ได้ก็น่าจะดียิ่งขึ้นครับ
ขอบคุณสำหรับฟีดแบ็กและข้อมูลอันมีค่าครับ!
ดูเหมือนว่าฝั่งภาษีก็มีข้อมูลที่จัดการได้ไม่ง่ายเหมือนกัน
เราจะลองหาวิธีปรับปรุงเพิ่มเติมดูครับ