- รองรับ 31 ภาษา รวมภาษาเกาหลี
- รองรับ แท็กอารมณ์ ใหม่: สามารถแทรกแท็ก 10 ประเภท เช่น
<laugh>, <breath>, <scream> ลงในข้อความเพื่อแสดงอารมณ์ได้
- ปรับปรุงคุณภาพ: เพิ่มความแม่นยำในการออกเสียง ลดปัญหาการพูดซ้ำ/ข้ามคำ และปรับปรุงประสิทธิภาพการโคลนเสียง
- ขนาดโมเดล: 99M Parameters
- TTS แบบออนดีไวซ์: รับประกันความเป็นส่วนตัวอย่างสมบูรณ์, ไม่มีความหน่วงจากเครือข่าย
- ความสะดวกในการนำไปใช้งาน: สามารถรันได้บนเบราว์เซอร์, PC, มือถือ, Raspberry Pi เป็นต้น
- มีเสียงพรีเซ็ตให้ 10 แบบ
- โมเดลเปิด: ใช้งานเชิงพาณิชย์ได้ (OpenRAIL-M)
3 ความคิดเห็น
เมื่อเทียบกับโมเดลขนาดเล็กตัวอื่น ๆ แล้ว ถือว่าเสถียรพอสมควรเลยครับ
โอ้ ต้องลองทดสอบบน Pi 5 ดูแล้ว
ผมใช้งาน supertonic อยู่ในโฮมเอเจนต์อยู่แล้ว ของเดิมก็ไม่ได้แย่อะไร แต่มีอัปเดตแล้วสินะ คงต้องลองทดสอบดูหน่อยครับ