1 คะแนน โดย spilist2 2024-03-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

ผมทำงานอยู่ที่บริษัทแปลสื่อ และให้บริการโปรแกรมแก้ไขซับไตเติล

ในตัวแก้ไขมีฟังก์ชันตรวจสะกด โดยจะแปลงซับไตเติลทั้งหมดเป็นข้อความแล้ว (ตัดแบ่ง) เรียกใช้ API

ตอนนี้ใช้ Bing API อยู่ แต่ประสิทธิภาพไม่ค่อยดีมากนัก สิ่งที่ควรจับก็จับไม่ได้ และสิ่งที่ไม่ควรจับกลับจับขึ้นมา

ทางเลือกที่ลองมามีดังนี้

  • AWS spellcheck จำกัด 20 ตัวอักษรต่อการเรียกหนึ่งครั้ง ทำให้ใช้งานยากมาก
  • Grammarly ยุติการรองรับ API ไปตั้งแต่ปีที่แล้ว
  • ลองทดสอบ https://sapling.ai/ แล้ว แต่คุณภาพกลับสู้ Bing ไม่ได้
  • ที่อยู่ใน https://rapidapi.com/collection/grammar-spellcheck-api ก็ลองทดสอบมาหมดแล้ว แต่ก็ยากจะบอกว่าดีกว่า Bing อย่างชัดเจน

ต่อให้ไม่จำเป็นต้องเป็น "หลายภาษา" แค่ถ้าจับภาษาอังกฤษได้ดีมากก็ยังโอเค แต่ดูเหมือนจะไม่มีทางเลือกที่ดีนักเลยครับ ถ้าไม่ใช่การแนะนำผลิตภัณฑ์ อย่างน้อยถ้าเคยมีประสบการณ์ทำระบบตรวจสะกดก็ยินดีมากหากช่วยแชร์กันครับ

1 ความคิดเห็น

 
libner 2024-04-01

https://huggingface.co/mzbac/mistral-grammar/tree/main
พอสะดุดกับคำว่า "รองรับหลายภาษา" ก็เลยลองหาตระกูล Mistral ดู แล้วไปเจอตัวนี้เข้า แต่ก็ยังไม่แน่ใจว่าไปถึงระดับที่ตอบโจทย์การใช้งานในโปรดักชันได้หรือเปล่า...
ดูเหมือนว่าจะถูก fine-tune มาให้เหมาะกับภาษาอังกฤษ ลองเอาโมเดลนี้ไปทดสอบดูไหมครับ