Supertonic 3 - เปิดตัว TTS แบบออนดีไวซ์ที่มีน้ำหนักเบามาก รองรับ 31 ภาษาและแท็กอารมณ์
(github.com/supertone-inc)- รองรับ 31 ภาษา รวมภาษาเกาหลี
- รองรับ แท็กอารมณ์ ใหม่: สามารถแทรกแท็ก 10 ประเภท เช่น
<laugh>,<breath>,<scream>ลงในข้อความเพื่อแสดงอารมณ์ได้ - ปรับปรุงคุณภาพ: เพิ่มความแม่นยำในการออกเสียง ลดปัญหาการพูดซ้ำ/ข้ามคำ และปรับปรุงประสิทธิภาพการโคลนเสียง
- ขนาดโมเดล: 99M Parameters
- TTS แบบออนดีไวซ์: รับประกันความเป็นส่วนตัวอย่างสมบูรณ์, ไม่มีความหน่วงจากเครือข่าย
- ความสะดวกในการนำไปใช้งาน: สามารถรันได้บนเบราว์เซอร์, PC, มือถือ, Raspberry Pi เป็นต้น
- มีเสียงพรีเซ็ตให้ 10 แบบ
- โมเดลเปิด: ใช้งานเชิงพาณิชย์ได้ (OpenRAIL-M)
4 ความคิดเห็น
สงสัยว่าเมื่อเทียบกับพรีเซ็ต 10 แบบแล้ว การสร้างเสียงของตัวเองจะยากไหม
เมื่อเทียบกับโมเดลขนาดเล็กตัวอื่น ๆ แล้ว ถือว่าเสถียรพอสมควรเลยครับ
โอ้ ต้องลองทดสอบบน Pi 5 ดูแล้ว
ผมใช้งาน supertonic อยู่ในโฮมเอเจนต์อยู่แล้ว ของเดิมก็ไม่ได้แย่อะไร แต่มีอัปเดตแล้วสินะ คงต้องลองทดสอบดูหน่อยครับ