- เปิดตัว v2 พร้อม_คุณภาพเสียงที่ดียิ่งขึ้น รองรับหลายภาษารวมถึงภาษาเกาหลี และใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์_
- โคลนเสียงจากคลิปเสียงสั้น ๆ ของผู้พูด และสร้างเสียงพูดได้ในหลายภาษา
- ไม่เพียงโคลนโทนเสียงของผู้พูดต้นแบบเท่านั้น แต่ยังควบคุมสไตล์เสียงได้อย่างละเอียด เช่น อารมณ์ น้ำเสียง จังหวะ การเว้นช่วง และการขึ้นลงเสียง
- รองรับการโคลนเสียงข้ามภาษาแบบ zero-shot แม้กับภาษาที่ไม่ได้อยู่ในชุดฝึก
- ให้ประสิทธิภาพที่ยอดเยี่ยมโดยใช้ต้นทุนการประมวลผลน้อยกว่า API ที่ใช้งานเชิงพาณิชย์ได้หลายสิบเท่า
- ความเปลี่ยนแปลงของ V2 ที่รวมความสามารถทั้งหมดของ V1 ไว้ด้วย (เปิดตัว 2024/04)
- คุณภาพเสียงดียิ่งขึ้น: V2 ใช้กลยุทธ์การเทรนแบบใหม่ที่ให้คุณภาพเสียงดีกว่า
- รองรับหลายภาษาโดยพื้นฐาน: OpenVoice V2 รองรับภาษาอังกฤษ สเปน ฝรั่งเศส จีน ญี่ปุ่น และเกาหลีโดยพื้นฐาน
- ใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์: ตั้งแต่เดือนเมษายน 2024 เป็นต้นไป ทั้ง V2 และ V1 เปิดตัวภายใต้สัญญาอนุญาต MIT จึงสามารถใช้งานเชิงพาณิชย์ได้ฟรี
1 ความคิดเห็น
GN⁺: OpenVoice : เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย
GN⁺: OpenVoice - เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย
มีการโพสต์ผ่าน GN+ มาหลายครั้งแล้ว และครั้งนี้เมื่อ V2 ออกมา ก็รองรับหลายภาษาและได้เพิ่มภาษาเกาหลีเข้ามาด้วย