• Linux, Windows, Android และ OS อื่น ๆ
  • พัฒนาบนเอนจิน eSpeak ที่ใช้วิธี "Formant Synthesis (การสังเคราะห์แบบฟอร์แมนต์)"
    • ด้วยขนาดที่เล็กและรองรับหลายภาษา จึงเคยถูกใช้ใน Windows และเอนจิน Google Translate เป็นต้น (ปัจจุบันหลายแห่งแทนที่ด้วยเอนจินภายในของตนเองแล้ว)
    • เสียงพูดมีความชัดเจนและใช้งานได้ที่ความเร็วสูง แต่ไม่เป็นธรรมชาติหรือนุ่มนวลเท่าโปรแกรมสังเคราะห์เสียงขนาดใหญ่ที่อิงจากการบันทึกเสียงมนุษย์
    • นอกจากนี้ยังรองรับการสังเคราะห์แบบฟอร์แมนต์ของ Klatt และสามารถใช้ MBROLA เป็นแบ็กเอนด์สำหรับการสังเคราะห์เสียงได้
  • รูปแบบที่รองรับ
    • โปรแกรมบรรทัดคำสั่ง: Linux & Windows อ่านสตริงที่รับมาจากไฟล์และ stdin
    • ไลบรารีแบบ Shared (บน Windows คือ DLL)
    • เวอร์ชัน SAPI5 สำหรับ Windows สามารถใช้งานผ่านอินเทอร์เฟซ SAPI5 จากโปรแกรมอ่านหน้าจอและโปรแกรมอื่น ๆ ได้
    • พอร์ตไปยังหลายแพลตฟอร์ม รวมถึง Solaris และ MacOS
  • ความสามารถ
    • มีเสียงพูดหลากหลายแบบที่สามารถปรับลักษณะเฉพาะได้
    • สามารถสร้างเอาต์พุตเสียงเป็นไฟล์ WAV ได้
    • รองรับ SSML (ภาษามาร์กอัปสำหรับการสังเคราะห์เสียง) แม้จะยังไม่สมบูรณ์ และรองรับ HTML ด้วย
    • ขนาดกะทัดรัด ขนาดรวมของโปรแกรมและข้อมูลที่มีหลายภาษาอยู่ที่ประมาณไม่กี่ MB
    • ใช้เป็นฟรอนต์เอนด์ของ MBROLA diphone Voices ได้ โดย eSpeak NG จะแปลงข้อความเป็นหน่วยเสียงพร้อมข้อมูลระดับเสียงและความยาว
      • MBROLA คือเอนจินเสียงโอเพนซอร์สที่ประกอบด้วยชุดหน่วยเสียงพยางค์สำหรับการสังเคราะห์เสียง
      • เสียงพูดให้ใช้ฟรีหากไม่ใช่เพื่อการค้า แต่ไม่ใช่โอเพนซอร์ส
    • สามารถแปลข้อความเป็นรหัสหน่วยเสียงได้ จึงนำไปใช้เป็นฟรอนต์เอนด์ให้เอนจินสังเคราะห์เสียงอื่นได้
    • สามารถเพิ่มการรองรับภาษาอื่น ๆ ได้ โดยมีหลายภาษาถูกรวมไว้ในระดับความสมบูรณ์ที่ต่างกัน
    • เขียนด้วย C

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น