5 คะแนน โดย xguru 2019-12-06 | 7 ความคิดเห็น | แชร์ทาง WhatsApp

ฐานข้อมูลเสียงแบบโอเพนซอร์สที่รวบรวมและคัดกรองข้อมูลจากหลากหลายภาษา เพื่อสร้างและทำให้เทคโนโลยีรู้จำเสียงที่ทุกคนใช้งานได้เป็นจริง

ข้อมูลภาษาเกาหลียังมีไม่เพียงพอมากนัก มาร่วมกันสร้างด้วยการเข้าร่วมกันเถอะ

ชุดข้อมูลเสียงที่บริษัทส่วนใหญ่สร้างขึ้น มักนำไปใช้งานภายนอกได้ยาก

ดังนั้นข้อมูลที่สร้างแบบเปิดจึงมีความสำคัญ โดยเฉพาะภาษาเกาหลียิ่งสำคัญมากขึ้นไปอีก

7 ความคิดเห็น

 
sduck4 2019-12-06

ตรงส่วนตั้งค่า Goal ไม่มีภาษาเกาหลี เลยดำเนินการต่อไม่ได้ครับ..

 
sduck4 2019-12-06

สรุปว่าชุดข้อมูลภาษาเกาหลียังใช้ไม่ได้เพราะยังขาดทั้งการแปลหน้าเว็บประโยคให้รองรับภาษาในท้องถิ่น และชุดประโยคก็ยังมีไม่พอสินะ

 
sduck4 2019-12-06

การแปลเว็บไซต์ภาษาเกาหลี: https://pontoon.mozilla.org/projects/common-voice/

เว็บไซต์รวบรวมประโยค: https://common-voice.github.io/sentence-collector

ดูเหมือนว่าต้องแปลเว็บไซต์ให้เสร็จและรวบรวมประโยคให้ได้มากกว่า 5,000 ประโยคก่อน จึงจะสามารถเริ่มเก็บรวบรวมและตรวจสอบเสียงได้ ขอเชิญผู้ที่สนใจเข้าร่วมกันเยอะ ๆ

 
xguru 2019-12-06

ผมก็เคยคอมเมนต์แบบเดียวกันแล้วลบไปเหมือนกันครับ ฮ่าๆๆ

https://discourse.mozilla.org/t/…

ที่นี่ก็อธิบายไว้แบบนั้นครับ

 
sduck4 2019-12-06

อ๊ะ.. ครับ 555 ผมก็จะลบเหมือนกัน แต่ไม่มีปุ่มลบเลยตกใจเหมือนกัน..

ที่เกี่ยวกันก็เห็นว่ามีคอร์ปัสภาษาเกาหลีอยู่พอสมควร แต่ไม่แน่ใจว่าเพราะปัญหาลิขสิทธิ์จะเอามาลงได้ไหมครับ

 
xguru 2019-12-06

อ๋อ การลบคอมเมนต์สามารถทำได้โดยคลิกลิงก์เวลาที่อยู่ข้างไอดีเหนือคอมเมนต์ แล้วจะสามารถลบได้จากในหน้าคอมเมนต์นั้น

 
xguru 2019-12-06

โอเพนซอร์สสำหรับการรู้จำเสียงภาษาเกาหลีที่เปิดเผยมาก่อนหน้านี้ ยังมีโปรเจกต์ Zeroth ที่ใช้ Kaldi อยู่ด้วย

( จากข้อมูลใน GitHub ดูเหมือนว่าโมเดลสุดท้ายจะเป็นเวอร์ชันเดือนกรกฎาคม 2018 )

https://github.com/goodatlas/zeroth