ผมทำงานอยู่ที่บริษัทแปลสื่อ และให้บริการโปรแกรมแก้ไขซับไตเติล
ในตัวแก้ไขมีฟังก์ชันตรวจสะกด โดยจะแปลงซับไตเติลทั้งหมดเป็นข้อความแล้ว (ตัดแบ่ง) เรียกใช้ API
ตอนนี้ใช้ Bing API อยู่ แต่ประสิทธิภาพไม่ค่อยดีมากนัก สิ่งที่ควรจับก็จับไม่ได้ และสิ่งที่ไม่ควรจับกลับจับขึ้นมา
ทางเลือกที่ลองมามีดังนี้
- AWS spellcheck จำกัด 20 ตัวอักษรต่อการเรียกหนึ่งครั้ง ทำให้ใช้งานยากมาก
- Grammarly ยุติการรองรับ API ไปตั้งแต่ปีที่แล้ว
- ลองทดสอบ https://sapling.ai/ แล้ว แต่คุณภาพกลับสู้ Bing ไม่ได้
- ที่อยู่ใน https://rapidapi.com/collection/grammar-spellcheck-api ก็ลองทดสอบมาหมดแล้ว แต่ก็ยากจะบอกว่าดีกว่า Bing อย่างชัดเจน
ต่อให้ไม่จำเป็นต้องเป็น "หลายภาษา" แค่ถ้าจับภาษาอังกฤษได้ดีมากก็ยังโอเค แต่ดูเหมือนจะไม่มีทางเลือกที่ดีนักเลยครับ ถ้าไม่ใช่การแนะนำผลิตภัณฑ์ อย่างน้อยถ้าเคยมีประสบการณ์ทำระบบตรวจสะกดก็ยินดีมากหากช่วยแชร์กันครับ
1 ความคิดเห็น
https://huggingface.co/mzbac/mistral-grammar/tree/main
พอสะดุดกับคำว่า "รองรับหลายภาษา" ก็เลยลองหาตระกูล Mistral ดู แล้วไปเจอตัวนี้เข้า แต่ก็ยังไม่แน่ใจว่าไปถึงระดับที่ตอบโจทย์การใช้งานในโปรดักชันได้หรือเปล่า...
ดูเหมือนว่าจะถูก fine-tune มาให้เหมาะกับภาษาอังกฤษ ลองเอาโมเดลนี้ไปทดสอบดูไหมครับ