- Linux, Windows, Android และ OS อื่น ๆ
- พัฒนาบนเอนจิน eSpeak ที่ใช้วิธี "Formant Synthesis (การสังเคราะห์แบบฟอร์แมนต์)"
- ด้วยขนาดที่เล็กและรองรับหลายภาษา จึงเคยถูกใช้ใน Windows และเอนจิน Google Translate เป็นต้น (ปัจจุบันหลายแห่งแทนที่ด้วยเอนจินภายในของตนเองแล้ว)
- เสียงพูดมีความชัดเจนและใช้งานได้ที่ความเร็วสูง แต่ไม่เป็นธรรมชาติหรือนุ่มนวลเท่าโปรแกรมสังเคราะห์เสียงขนาดใหญ่ที่อิงจากการบันทึกเสียงมนุษย์
- นอกจากนี้ยังรองรับการสังเคราะห์แบบฟอร์แมนต์ของ Klatt และสามารถใช้ MBROLA เป็นแบ็กเอนด์สำหรับการสังเคราะห์เสียงได้
- รูปแบบที่รองรับ
- โปรแกรมบรรทัดคำสั่ง: Linux & Windows อ่านสตริงที่รับมาจากไฟล์และ
stdin
- ไลบรารีแบบ Shared (บน Windows คือ DLL)
- เวอร์ชัน SAPI5 สำหรับ Windows สามารถใช้งานผ่านอินเทอร์เฟซ SAPI5 จากโปรแกรมอ่านหน้าจอและโปรแกรมอื่น ๆ ได้
- พอร์ตไปยังหลายแพลตฟอร์ม รวมถึง Solaris และ MacOS
- ความสามารถ
- มีเสียงพูดหลากหลายแบบที่สามารถปรับลักษณะเฉพาะได้
- สามารถสร้างเอาต์พุตเสียงเป็นไฟล์ WAV ได้
- รองรับ SSML (ภาษามาร์กอัปสำหรับการสังเคราะห์เสียง) แม้จะยังไม่สมบูรณ์ และรองรับ HTML ด้วย
- ขนาดกะทัดรัด ขนาดรวมของโปรแกรมและข้อมูลที่มีหลายภาษาอยู่ที่ประมาณไม่กี่ MB
- ใช้เป็นฟรอนต์เอนด์ของ MBROLA diphone Voices ได้ โดย eSpeak NG จะแปลงข้อความเป็นหน่วยเสียงพร้อมข้อมูลระดับเสียงและความยาว
- MBROLA คือเอนจินเสียงโอเพนซอร์สที่ประกอบด้วยชุดหน่วยเสียงพยางค์สำหรับการสังเคราะห์เสียง
- เสียงพูดให้ใช้ฟรีหากไม่ใช่เพื่อการค้า แต่ไม่ใช่โอเพนซอร์ส
- สามารถแปลข้อความเป็นรหัสหน่วยเสียงได้ จึงนำไปใช้เป็นฟรอนต์เอนด์ให้เอนจินสังเคราะห์เสียงอื่นได้
- สามารถเพิ่มการรองรับภาษาอื่น ๆ ได้ โดยมีหลายภาษาถูกรวมไว้ในระดับความสมบูรณ์ที่ต่างกัน
- เขียนด้วย C
ยังไม่มีความคิดเห็น