Mozilla Common Voice
(voice.mozilla.org)ฐานข้อมูลเสียงแบบโอเพนซอร์สที่รวบรวมและคัดกรองข้อมูลจากหลากหลายภาษา เพื่อสร้างและทำให้เทคโนโลยีรู้จำเสียงที่ทุกคนใช้งานได้เป็นจริง
ข้อมูลภาษาเกาหลียังมีไม่เพียงพอมากนัก มาร่วมกันสร้างด้วยการเข้าร่วมกันเถอะ
ชุดข้อมูลเสียงที่บริษัทส่วนใหญ่สร้างขึ้น มักนำไปใช้งานภายนอกได้ยาก
ดังนั้นข้อมูลที่สร้างแบบเปิดจึงมีความสำคัญ โดยเฉพาะภาษาเกาหลียิ่งสำคัญมากขึ้นไปอีก
7 ความคิดเห็น
ตรงส่วนตั้งค่า Goal ไม่มีภาษาเกาหลี เลยดำเนินการต่อไม่ได้ครับ..
สรุปว่าชุดข้อมูลภาษาเกาหลียังใช้ไม่ได้เพราะยังขาดทั้งการแปลหน้าเว็บประโยคให้รองรับภาษาในท้องถิ่น และชุดประโยคก็ยังมีไม่พอสินะ
การแปลเว็บไซต์ภาษาเกาหลี: https://pontoon.mozilla.org/projects/common-voice/
เว็บไซต์รวบรวมประโยค: https://common-voice.github.io/sentence-collector
ดูเหมือนว่าต้องแปลเว็บไซต์ให้เสร็จและรวบรวมประโยคให้ได้มากกว่า 5,000 ประโยคก่อน จึงจะสามารถเริ่มเก็บรวบรวมและตรวจสอบเสียงได้ ขอเชิญผู้ที่สนใจเข้าร่วมกันเยอะ ๆ
ผมก็เคยคอมเมนต์แบบเดียวกันแล้วลบไปเหมือนกันครับ ฮ่าๆๆ
https://discourse.mozilla.org/t/…
ที่นี่ก็อธิบายไว้แบบนั้นครับ
อ๊ะ.. ครับ 555 ผมก็จะลบเหมือนกัน แต่ไม่มีปุ่มลบเลยตกใจเหมือนกัน..
ที่เกี่ยวกันก็เห็นว่ามีคอร์ปัสภาษาเกาหลีอยู่พอสมควร แต่ไม่แน่ใจว่าเพราะปัญหาลิขสิทธิ์จะเอามาลงได้ไหมครับ
อ๋อ การลบคอมเมนต์สามารถทำได้โดยคลิกลิงก์เวลาที่อยู่ข้างไอดีเหนือคอมเมนต์ แล้วจะสามารถลบได้จากในหน้าคอมเมนต์นั้น
โอเพนซอร์สสำหรับการรู้จำเสียงภาษาเกาหลีที่เปิดเผยมาก่อนหน้านี้ ยังมีโปรเจกต์ Zeroth ที่ใช้ Kaldi อยู่ด้วย
( จากข้อมูลใน GitHub ดูเหมือนว่าโมเดลสุดท้ายจะเป็นเวอร์ชันเดือนกรกฎาคม 2018 )
https://github.com/goodatlas/zeroth