- ช่วยให้สร้างข้อมูลเสียงคุณภาพสูงความยาวสูงสุด 47 วินาทีได้จากข้อความพรอมป์ต์สั้น ๆ
- ด้วยการฝึกเฉพาะทาง จึงเหมาะอย่างยิ่งสำหรับการสร้างบีตกลอง, ริฟฟ์เครื่องดนตรี, เสียงแอมเบียนต์, การบันทึก Foley และตัวอย่างเสียงอื่น ๆ สำหรับการผลิตเพลงและการออกแบบเสียง
- ข้อได้เปรียบสำคัญของการเปิดซอร์สครั้งนี้คือ ผู้ใช้สามารถทำ fine-tune โมเดลกับข้อมูลเสียงคัสตอมของตนเองได้
- ตัวอย่างเช่น มือกลองสามารถทำ fine-tune กับตัวอย่างเสียงบันทึกกลองของตนเองเพื่อสร้างบีตใหม่ได้
- แตกต่างจาก Stable Audio อย่างไร?
- Stable Audio ซึ่งเป็นผลิตภัณฑ์เชิงพาณิชย์ มอบฟีเจอร์ขั้นสูง เช่น แทร็กเต็มคุณภาพสูงที่มีโครงสร้างดนตรีสอดคล้องกันยาวสูงสุด 3 นาที, การสร้างแบบ audio-to-audio และการประพันธ์ดนตรีหลายพาร์ตที่สอดคล้องกัน
- ในทางกลับกัน Stable Audio Open ถูกออกแบบมาเฉพาะสำหรับตัวอย่างเสียง, เอฟเฟกต์เสียง และองค์ประกอบสำหรับการโปรดักชัน
- แม้จะสร้างคลิปดนตรีสั้น ๆ ได้ แต่ไม่ได้ปรับแต่งมาให้เหมาะกับเพลงเต็ม, เมโลดี้ หรือเสียงร้อง
- โมเดลโอเพนนี้มอบข้อมูลเชิงลึกเกี่ยวกับ generative AI สำหรับการออกแบบเสียง โดยให้ความสำคัญกับการพัฒนาอย่างมีความรับผิดชอบร่วมกับชุมชนครีเอเตอร์
- สามารถใช้น้ำหนักโมเดล Stable Audio Open ได้บน Hugging Face
- แนะนำให้นักออกแบบเสียง, นักดนตรี, นักพัฒนา และผู้ที่ชื่นชอบงานเสียงดาวน์โหลดโมเดลไปสำรวจความสามารถและส่งฟีดแบ็ก
ยังไม่มีความคิดเห็น