7 คะแนน โดย ninebow 13 일 전 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

หลังจากที่เคยแนะนำผ่าน Show GN ไปก่อนหน้านี้ ขอมาสรุปอัปเดตของโปรเจกต์ legalize-kr ตลอด 1 เดือน (31 วัน) ที่ผ่านมาเพื่อแบ่งปันครับ/ค่ะ ด้วยความสนใจและกำลังใจจากหลาย ๆ ท่าน ทำให้สามารถปรับปรุงหลายอย่างได้ ขอบคุณมากครับ/ค่ะ!

legalize-kr คืออะไร?

legalize-kr เป็นโปรเจกต์ที่เก็บถาวรกฎหมายและคำพิพากษาของสาธารณรัฐเกาหลีซึ่งให้บริการโดย National Legal Information Integrated Utilization ของกระทรวงนิติบัญญัติ ไว้ในรูปแบบ Markdown + ประวัติ Git โดยเก็บกฎหมายทั้งหมดเป็นเอกสาร Markdown และเก็บประวัติการแก้ไขทั้งหมดเป็น Git Commit ส่วนคำพิพากษาก็ถูกเก็บเป็นเอกสาร Markdown และเก็บ Git History ตามวันที่มีคำพิพากษาเช่นกัน

ทำไมถึงสร้างขึ้นมา?

เมื่อวันที่ 30 มีนาคมที่ผ่านมา ผม/ฉันพบโปรเจกต์ชื่อ legalize.dev บน GitHub Trending ซึ่งจัดการกฎหมายของสเปนและประเทศในกลุ่มภาษาอังกฤษด้วย Markdown และ Git Commit ตอนแรกคิดว่าน่าจะมีที่จัดการกฎหมายเกาหลีอยู่แล้ว แต่พอลองค้นดูกลับไม่พบ จึงคิดว่าน่าจะดีถ้ามีสักอันเลยสร้างขึ้นมาครับ/ค่ะ

อัปเดต 1. เพิ่ม repository สำหรับกฎระเบียบทางปกครอง / ข้อบัญญัติท้องถิ่น

เดิมทีรองรับเฉพาะกฎหมายและคำพิพากษา แต่ตอนนี้ได้เพิ่มกฎระเบียบทางปกครองและข้อบัญญัติท้องถิ่นที่ให้บริการจากระบบข้อมูลกฎหมายเดียวกันนี้เป็น repository แยกต่างหากแล้ว ตอนนี้จึงสามารถติดตามเอกสารกฎหมายสาธารณะที่สำคัญของเกาหลีใต้ในรูปแบบ Markdown + Git History ได้จากที่เดียว:

กฎระเบียบทางปกครองคือคำสั่ง/ระเบียบ/ประกาศของแต่ละกระทรวง ส่วนข้อบัญญัติท้องถิ่นคือข้อบัญญัติ/ระเบียบขององค์กรปกครองส่วนท้องถิ่น ซึ่งมีทั้งปริมาณมากกว่ากฎหมายและมีการแก้ไขบ่อยกว่า จึงน่าจะมีคุณค่าไม่น้อยเมื่อสามารถติดตามผ่าน Git History ได้ อย่างไรก็ตาม ในกรณีของกฎระเบียบทางปกครอง การติดตามการเปลี่ยนชื่อหน่วยงานแต่ละกระทรวงหรือการแบ่งบทบาทหน้าที่ค่อนข้างซับซ้อน แม้จะปรับปรุงมาหลายครั้งแล้ว แต่ก็ยังมีทางต้องไปอีกพอสมควร รบกวนทุกท่านช่วยติดตามและมีส่วนร่วมด้วยครับ/ค่ะ T_T

อัปเดต 2. เพิ่มเครื่องมือ CLI, MCP และ Agent Skill

แน่นอนว่าการ git clone ทั้ง repository มาใช้งานนั้นสะดวกและดีที่สุด แต่การต้องดาวน์โหลด repository ขนาดหลายสิบ GB ทุกครั้งอาจเป็นภาระ จึงได้สร้างเครื่องมือ CLI ที่อิงกับ GitHub REST API ขึ้นมา นอกจากนี้ยังมี MCP server จาก codebase เดียวกัน และเพิ่ม Agent Skill ที่สามารถนำไปใช้ได้ทันทีใน Claude Code / Codex เป็นต้น:

คุณสามารถค้นหากฎหมาย/คำพิพากษาเฉพาะรายการ ดูข้อมูลในระดับมาตรา หรือไล่ประวัติการแก้ไขได้โดยไม่ต้องดาวน์โหลดทั้ง repository และยังให้ LLM/Agent เรียกใช้งานผ่าน MCP ได้โดยตรงด้วย ใน AGENT SKILL ยังมีคู่มือแนะนำด้วยว่าในสถานการณ์แบบใดควรใช้ CLI / MCP / git clone / หรือเข้าถึง GitHub โดยตรง ทั้งนี้ GitHub REST API อนุญาตให้เรียกได้เพียง 60 ครั้งต่อชั่วโมงหากไม่ยืนยันตัวตน ดังนั้นหากจำเป็น ควรออก GitHub token มาใช้งาน (จะเพิ่มได้ถึง 5,000 ครั้งต่อชั่วโมง)

อัปเดต 3. เพิ่มหน้า use case / ecosystem

ตอนนี้เริ่มมีโปรเจกต์ที่ใช้ dataset จาก legalize-kr เกิดขึ้นทีละน้อย จึงเริ่มรวบรวมไว้ที่ส่วนล่างของหน้าแรกใน เว็บไซต์ และในเมนู 'วิธีใช้งาน' นอกจากโปรเจกต์ที่นำไปใช้โดยตรงแล้ว ยังแนะนำโปรเจกต์หรือเครื่องมืออื่นที่มีเป้าหมายคล้ายกันด้วย (เช่น Beommang, Korean Law MCP ที่เคยแนะนำใน GN ก่อนหน้านี้)

หากคุณกำลังใช้ dataset ของ legalize-kr อย่างน้อยหนึ่งรายการอยู่ หรือมีโปรเจกต์ที่ทำงานในขอบเขตใกล้เคียงกัน สามารถแจ้งผ่าน PR, issue หรือคอมเมนต์ใต้โพสต์นี้ได้ แล้วจะช่วยรวบรวมไว้ด้วยกันครับ/ค่ะ

อัปเดต 4. การปรับปรุงอื่น ๆ เพื่อให้ใช้งานข้อมูลได้ดียิ่งขึ้น

ขณะนี้กำลังอ้างอิง issue จากหลาย repository เพื่อปรับปรุงกฎการ parse ข้อมูลและการจัดระเบียบ metadata ต่าง ๆ โดยการเปลี่ยนแปลงหลักมีดังนี้:

  • ปรับปรุงกฎ parse หน่วยเพิ่มเติม เช่น 'มาตราย่อย/หน่วยย่อย' นอกเหนือจาก 'ภาค/บท/หมวด/ส่วน' เดิม (legalize-kr/legalize-kr#32)
  • แก้ปัญหาการหายไปของแพตเทิร์น <제M조의 N> (legalize-kr/legalize-kr#31 และ legalize-kr/legalize-pipeline#2)
  • เติมกฎหมายที่ตกหล่น เช่น ประมวลกฎหมายพาณิชย์และพระราชกฤษฎีกาบังคับใช้ประมวลกฎหมายพาณิชย์ (legalize-kr/legalize-kr#9)
  • แก้ปัญหาที่ไฟล์กฎบังคับใช้ก่อนการแก้ไขยังคงค้างอยู่ ทำให้ git log แสดงเป็น 'เพิ่ม' แทนที่จะเป็น 'แก้ไข' (legalize-kr/legalize-kr#24)
  • เปลี่ยนชื่อไฟล์คำพิพากษาและจัดหมวดหมู่ไดเรกทอรีตามวันที่มีคำพิพากษา (legalize-kr/precedent-kr#4)
  • แก้ปัญหารูปแบบที่อยู่ภาษาเกาหลีใน URL แหล่งอ้างอิงคำพิพากษาเสียหาย (law.go.kr 404) (legalize-kr/precedent-kr#3)
  • เติม Git commit ที่ตกหล่น 17 รายการสำหรับวันที่มีคำพิพากษาที่ใช้ศักราช Dangi (檀紀) (legalize-kr/precedent-kr#1)
  • เพิ่มลิงก์ไฟล์แนบที่เกี่ยวข้องกับกฎหมาย / คำพิพากษา / กฎระเบียบทางปกครอง / ข้อบัญญัติท้องถิ่นแต่ละรายการใน Markdown Frontmatter เป็นรูปแบบ List

รายละเอียดเพิ่มเติมสามารถดูได้จาก closed issues ของ repository หลักต่าง ๆ:

สุดท้ายนี้

ตอนแรกก็คิดเพียงว่า "ลองทำไว้ก่อน เดี๋ยวก็น่าจะมีคนเอาไปใช้เอง" แต่หลังจาก Show GN ครั้งก่อน ก็ได้รับทั้งดาว ⭐ และ issue จำนวนมาก ทำให้ขอบเขตของโปรเจกต์ค่อย ๆ กว้างขึ้นตามธรรมชาติ ตอนนี้ยังคงดูแลและบำรุงรักษาอย่างต่อเนื่อง ฝากติดตาม ให้กำลังใจ และช่วยบอกต่อกันด้วยนะครับ/ค่ะ ขอบคุณครับ/ค่ะ!

2 ความคิดเห็น

 
ptlkiki 13 일 전

หน่วยงานของพวกเรามีสิ่งที่กำลังพัฒนาเป็น RAG อยู่ อยากโคลนแล้วดึงมาใช้เฉพาะกฎหมายที่เกี่ยวข้องกับฝั่งเราเท่านั้น
สามารถทำแบบนั้นได้ไหมครับ/คะ?

 
ninebow 12 일 전

ครับ ตอนนี้ผมยังไม่ทราบว่า pipeline ถูกจัดวางไว้อย่างไร แต่โดยพื้นฐานแล้วดูเหมือนว่าสามารถเพิ่มงานที่เกี่ยวข้องได้ก่อนนำเอกสารใส่เข้าไปใน Vector DB สำหรับการตั้งค่า RAG ปัจจุบัน

อย่างไรก็ตาม ประเด็นสำคัญน่าจะอยู่ที่ว่าจะดึง "กฎหมายที่เกี่ยวข้อง" ออกมาอย่างไร ซึ่งอาจลองกรองโดยอิงจากชื่อกฎหมายหรือคำสำคัญหลัก ๆ ได้ครับ ^^;

ขอบคุณครับ!