• ช่วยให้สร้างข้อมูลเสียงคุณภาพสูงความยาวสูงสุด 47 วินาทีได้จากข้อความพรอมป์ต์สั้น ๆ
  • ด้วยการฝึกเฉพาะทาง จึงเหมาะอย่างยิ่งสำหรับการสร้างบีตกลอง, ริฟฟ์เครื่องดนตรี, เสียงแอมเบียนต์, การบันทึก Foley และตัวอย่างเสียงอื่น ๆ สำหรับการผลิตเพลงและการออกแบบเสียง
  • ข้อได้เปรียบสำคัญของการเปิดซอร์สครั้งนี้คือ ผู้ใช้สามารถทำ fine-tune โมเดลกับข้อมูลเสียงคัสตอมของตนเองได้
    • ตัวอย่างเช่น มือกลองสามารถทำ fine-tune กับตัวอย่างเสียงบันทึกกลองของตนเองเพื่อสร้างบีตใหม่ได้
  • แตกต่างจาก Stable Audio อย่างไร?
    • Stable Audio ซึ่งเป็นผลิตภัณฑ์เชิงพาณิชย์ มอบฟีเจอร์ขั้นสูง เช่น แทร็กเต็มคุณภาพสูงที่มีโครงสร้างดนตรีสอดคล้องกันยาวสูงสุด 3 นาที, การสร้างแบบ audio-to-audio และการประพันธ์ดนตรีหลายพาร์ตที่สอดคล้องกัน
    • ในทางกลับกัน Stable Audio Open ถูกออกแบบมาเฉพาะสำหรับตัวอย่างเสียง, เอฟเฟกต์เสียง และองค์ประกอบสำหรับการโปรดักชัน
      • แม้จะสร้างคลิปดนตรีสั้น ๆ ได้ แต่ไม่ได้ปรับแต่งมาให้เหมาะกับเพลงเต็ม, เมโลดี้ หรือเสียงร้อง
      • โมเดลโอเพนนี้มอบข้อมูลเชิงลึกเกี่ยวกับ generative AI สำหรับการออกแบบเสียง โดยให้ความสำคัญกับการพัฒนาอย่างมีความรับผิดชอบร่วมกับชุมชนครีเอเตอร์
  • สามารถใช้น้ำหนักโมเดล Stable Audio Open ได้บน Hugging Face
    • แนะนำให้นักออกแบบเสียง, นักดนตรี, นักพัฒนา และผู้ที่ชื่นชอบงานเสียงดาวน์โหลดโมเดลไปสำรวจความสามารถและส่งฟีดแบ็ก

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น