OpenVoice v2 - โคลนเสียงแบบทันใจที่ใช้งานได้หลากหลาย

xguru · 2024-04-29T09:31:01+09:00

เปิดตัว v2 พร้อม_คุณภาพเสียงที่ดียิ่งขึ้น รองรับหลายภาษารวมถึงภาษาเกาหลี และใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์_ โคลนเสียงจากคลิปเสียงสั้น ๆ ของผู้พูด และสร้างเสียงพูดได้ในหลายภาษา ไม่เพียงโคลนโทนเสียงของผู้พูดต้นแบบเท่านั้น แต่ยังควบคุมสไตล์เสียงได้อย่างละเอียด เช่น อารมณ์ น้ำเสียง จังหวะ การเว้นช่วง และการขึ้นลงเสียง รองรับการโคลนเสียงข้ามภาษาแบบ zero-shot แม้กับภาษาที่ไม่ได้อยู่ในชุดฝึก ให้ประสิทธิภาพที่ยอดเยี่ยมโดยใช้ต้นทุนการประมวลผลน้อยกว่า API ที่ใช้งานเชิงพาณิชย์ได้หลายสิบเท่า ความเปลี่ยนแปลงของ V2 ที่รวมความสามารถทั้งหมดของ V1 ไว้ด้วย (เปิดตัว 2024/04) คุณภาพเสียงดียิ่งขึ้น: V2 ใช้กลยุทธ์การเทรนแบบใหม่ที่ให้คุณภาพเสียงดีกว่า รองรับหลายภาษาโดยพื้นฐาน: OpenVoice V2 รองรับภาษาอังกฤษ สเปน ฝรั่งเศส จีน ญี่ปุ่น และเกาหลีโดยพื้นฐาน ใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์: ตั้งแต่เดือนเมษายน 2024 เป็นต้นไป ทั้ง V2 และ V1 เปิดตัวภายใต้สัญญาอนุญาต MIT จึงสามารถใช้งานเชิงพาณิชย์ได้ฟรี

(github.com/myshell-ai)

34 คะแนน โดย xguru 2024-04-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

เปิดตัว v2 พร้อม_คุณภาพเสียงที่ดียิ่งขึ้น รองรับหลายภาษารวมถึงภาษาเกาหลี และใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์_
โคลนเสียงจากคลิปเสียงสั้น ๆ ของผู้พูด และสร้างเสียงพูดได้ในหลายภาษา
ไม่เพียงโคลนโทนเสียงของผู้พูดต้นแบบเท่านั้น แต่ยังควบคุมสไตล์เสียงได้อย่างละเอียด เช่น อารมณ์ น้ำเสียง จังหวะ การเว้นช่วง และการขึ้นลงเสียง
รองรับการโคลนเสียงข้ามภาษาแบบ zero-shot แม้กับภาษาที่ไม่ได้อยู่ในชุดฝึก
ให้ประสิทธิภาพที่ยอดเยี่ยมโดยใช้ต้นทุนการประมวลผลน้อยกว่า API ที่ใช้งานเชิงพาณิชย์ได้หลายสิบเท่า
ความเปลี่ยนแปลงของ V2 ที่รวมความสามารถทั้งหมดของ V1 ไว้ด้วย (เปิดตัว 2024/04)
- คุณภาพเสียงดียิ่งขึ้น: V2 ใช้กลยุทธ์การเทรนแบบใหม่ที่ให้คุณภาพเสียงดีกว่า
- รองรับหลายภาษาโดยพื้นฐาน: OpenVoice V2 รองรับภาษาอังกฤษ สเปน ฝรั่งเศส จีน ญี่ปุ่น และเกาหลีโดยพื้นฐาน
- ใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์: ตั้งแต่เดือนเมษายน 2024 เป็นต้นไป ทั้ง V2 และ V1 เปิดตัวภายใต้สัญญาอนุญาต MIT จึงสามารถใช้งานเชิงพาณิชย์ได้ฟรี

1 ความคิดเห็น

xguru 2024-04-29

GN⁺: OpenVoice : เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย
GN⁺: OpenVoice - เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย

มีการโพสต์ผ่าน GN+ มาหลายครั้งแล้ว และครั้งนี้เมื่อ V2 ออกมา ก็รองรับหลายภาษาและได้เพิ่มภาษาเกาหลีเข้ามาด้วย

OpenVoice v2 - โคลนเสียงแบบทันใจที่ใช้งานได้หลากหลาย

บทความที่เกี่ยวข้อง

1 ความคิดเห็น