การค้นหาภาษาเกาหลีใน Python 4 คะแนน โดย brainer 2023-12-10 | 4 ความคิดเห็น | แชร์ทาง WhatsApp มีไลบรารีหรือแนวทางใน Python ที่ค้นหาได้ดีพอสมควรแม้จะมีคำพิมพ์ผิดเยอะไหมครับ? บทความที่เกี่ยวข้อง การค้นหาสตริงแบบฟัซซีที่รองรับการค้นหาด้วยพยัญชนะต้นของอักษรเกาหลีด้วย 36 คะแนน · 4 ความคิดเห็น · 2021-01-25 ติดตั้ง `fzf` แล้ว ต่อไปควรทำอะไร? (2023) 10 คะแนน · 1 ความคิดเห็น · 14 일 전 Konglish/Kanabarum – ไลบรารีแปลงการออกเสียงคำยืมภาษาเกาหลี 3 คะแนน · 0 ความคิดเห็น · 2026-03-15 ตัวแยกประโยคภาษาเกาหลี · The Missing Papers 7 คะแนน · 1 ความคิดเห็น · 2019-09-03 สร้างเอนจินค้นหาแบบ Full-Text ด้วยโค้ด Python 150 บรรทัด 30 คะแนน · 1 ความคิดเห็น · 2021-04-05 4 ความคิดเห็น n0roo 2023-12-10 ถ้าใช้ rdbms และเป็นงานที่เกี่ยวกับ full-text ส่วนใหญ่ก็จะโฟกัสไปที่ postgresql ครับ ถ้าจะเลือกทางที่ง่ายกว่านั้นก็ mongodb ถ้าจะเดินเส้นทางที่ยากและหวาดเสียว ก็มีวิธีอย่างแยกอักขระเกาหลีแบบ canonical decomposition แล้วเทียบแฮช หรือแปลงเป็นค่า ASCII เพื่อทำดัชนี เป็นต้น แต่พื้นฐานคือต้องรองรับเรื่อง nfd หรือ nfc ก่อน brainer 2023-12-11 ขอบคุณสำหรับคำตอบที่ละเอียดมาก คงต้องไปหาข้อมูลเพิ่มเติมเกี่ยวกับเนื้อหาที่เกี่ยวข้องแล้วครับ joyfui 2023-12-10 พอนึกดูก็มีบทความหนึ่งที่นึกขึ้นมาได้ครับ เพียงแต่มันเป็นไลบรารี JavaScript และดูจะมีประสิทธิภาพกับการค้นหาแบบพยัญชนะต้นมากกว่าการแก้คำพิมพ์ผิด..? https://taegon.kim/archives/10671 brainer 2023-12-11 เหมือนว่าเคยเห็นใน GeekNews นะครับ ขอบคุณสำหรับคำตอบครับ
4 ความคิดเห็น
ถ้าใช้ rdbms และเป็นงานที่เกี่ยวกับ full-text ส่วนใหญ่ก็จะโฟกัสไปที่ postgresql ครับ ถ้าจะเลือกทางที่ง่ายกว่านั้นก็ mongodb
ถ้าจะเดินเส้นทางที่ยากและหวาดเสียว ก็มีวิธีอย่างแยกอักขระเกาหลีแบบ canonical decomposition แล้วเทียบแฮช หรือแปลงเป็นค่า ASCII เพื่อทำดัชนี เป็นต้น แต่พื้นฐานคือต้องรองรับเรื่อง nfd หรือ nfc ก่อน
ขอบคุณสำหรับคำตอบที่ละเอียดมาก
คงต้องไปหาข้อมูลเพิ่มเติมเกี่ยวกับเนื้อหาที่เกี่ยวข้องแล้วครับ
พอนึกดูก็มีบทความหนึ่งที่นึกขึ้นมาได้ครับ เพียงแต่มันเป็นไลบรารี JavaScript และดูจะมีประสิทธิภาพกับการค้นหาแบบพยัญชนะต้นมากกว่าการแก้คำพิมพ์ผิด..?
https://taegon.kim/archives/10671
เหมือนว่าเคยเห็นใน GeekNews นะครับ
ขอบคุณสำหรับคำตอบครับ