4 คะแนน โดย brainer 2023-12-10 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

มีไลบรารีหรือแนวทางใน Python ที่ค้นหาได้ดีพอสมควรแม้จะมีคำพิมพ์ผิดเยอะไหมครับ?

4 ความคิดเห็น

 
n0roo 2023-12-10

ถ้าใช้ rdbms และเป็นงานที่เกี่ยวกับ full-text ส่วนใหญ่ก็จะโฟกัสไปที่ postgresql ครับ ถ้าจะเลือกทางที่ง่ายกว่านั้นก็ mongodb
ถ้าจะเดินเส้นทางที่ยากและหวาดเสียว ก็มีวิธีอย่างแยกอักขระเกาหลีแบบ canonical decomposition แล้วเทียบแฮช หรือแปลงเป็นค่า ASCII เพื่อทำดัชนี เป็นต้น แต่พื้นฐานคือต้องรองรับเรื่อง nfd หรือ nfc ก่อน

 
brainer 2023-12-11

ขอบคุณสำหรับคำตอบที่ละเอียดมาก

คงต้องไปหาข้อมูลเพิ่มเติมเกี่ยวกับเนื้อหาที่เกี่ยวข้องแล้วครับ

 
joyfui 2023-12-10

พอนึกดูก็มีบทความหนึ่งที่นึกขึ้นมาได้ครับ เพียงแต่มันเป็นไลบรารี JavaScript และดูจะมีประสิทธิภาพกับการค้นหาแบบพยัญชนะต้นมากกว่าการแก้คำพิมพ์ผิด..?
https://taegon.kim/archives/10671

 
brainer 2023-12-11

เหมือนว่าเคยเห็นใน GeekNews นะครับ

ขอบคุณสำหรับคำตอบครับ