34 คะแนน โดย xguru 2024-04-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • เปิดตัว v2 พร้อม_คุณภาพเสียงที่ดียิ่งขึ้น รองรับหลายภาษารวมถึงภาษาเกาหลี และใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์_
  • โคลนเสียงจากคลิปเสียงสั้น ๆ ของผู้พูด และสร้างเสียงพูดได้ในหลายภาษา
  • ไม่เพียงโคลนโทนเสียงของผู้พูดต้นแบบเท่านั้น แต่ยังควบคุมสไตล์เสียงได้อย่างละเอียด เช่น อารมณ์ น้ำเสียง จังหวะ การเว้นช่วง และการขึ้นลงเสียง
  • รองรับการโคลนเสียงข้ามภาษาแบบ zero-shot แม้กับภาษาที่ไม่ได้อยู่ในชุดฝึก
  • ให้ประสิทธิภาพที่ยอดเยี่ยมโดยใช้ต้นทุนการประมวลผลน้อยกว่า API ที่ใช้งานเชิงพาณิชย์ได้หลายสิบเท่า
  • ความเปลี่ยนแปลงของ V2 ที่รวมความสามารถทั้งหมดของ V1 ไว้ด้วย (เปิดตัว 2024/04)
    • คุณภาพเสียงดียิ่งขึ้น: V2 ใช้กลยุทธ์การเทรนแบบใหม่ที่ให้คุณภาพเสียงดีกว่า
    • รองรับหลายภาษาโดยพื้นฐาน: OpenVoice V2 รองรับภาษาอังกฤษ สเปน ฝรั่งเศส จีน ญี่ปุ่น และเกาหลีโดยพื้นฐาน
    • ใช้ฟรีสำหรับการใช้งานเชิงพาณิชย์: ตั้งแต่เดือนเมษายน 2024 เป็นต้นไป ทั้ง V2 และ V1 เปิดตัวภายใต้สัญญาอนุญาต MIT จึงสามารถใช้งานเชิงพาณิชย์ได้ฟรี

1 ความคิดเห็น

 
xguru 2024-04-29

GN⁺: OpenVoice : เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย
GN⁺: OpenVoice - เทคโนโลยีโคลนเสียงแบบทันทีที่ใช้งานได้หลากหลาย

มีการโพสต์ผ่าน GN+ มาหลายครั้งแล้ว และครั้งนี้เมื่อ V2 ออกมา ก็รองรับหลายภาษาและได้เพิ่มภาษาเกาหลีเข้ามาด้วย