เปิดตัว Stable Audio Open - โมเดลโอเพนซอร์สสำหรับตัวอย่างเสียงและการออกแบบเสียง

xguru · 2024-06-08T09:31:01+09:00

ช่วยให้สร้างข้อมูลเสียงคุณภาพสูงความยาวสูงสุด 47 วินาทีได้จากข้อความพรอมป์ต์สั้น ๆ ด้วยการฝึกเฉพาะทาง จึงเหมาะอย่างยิ่งสำหรับการสร้างบีตกลอง, ริฟฟ์เครื่องดนตรี, เสียงแอมเบียนต์, การบันทึก Foley และตัวอย่างเสียงอื่น ๆ สำหรับการผลิตเพลงและการออกแบบเสียง ข้อได้เปรียบสำคัญของการเปิดซอร์สครั้งนี้คือ ผู้ใช้สามารถทำ fine-tune โมเดลกับข้อมูลเสียงคัสตอมของตนเองได้ ตัวอย่างเช่น มือกลองสามารถทำ fine-tune กับตัวอย่างเสียงบันทึกกลองของตนเองเพื่อสร้างบีตใหม่ได้ แตกต่างจาก Stable Audio อย่างไร? Stable Audio ซึ่งเป็นผลิตภัณฑ์เชิงพาณิชย์ มอบฟีเจอร์ขั้นสูง เช่น แทร็กเต็มคุณภาพสูงที่มีโครงสร้างดนตรีสอดคล้องกันยาวสูงสุด 3 นาที, การสร้างแบบ audio-to-audio และการประพันธ์ดนตรีหลายพาร์ตที่สอดคล้องกัน ในทางกลับกัน Stable Audio Open ถูกออกแบบมาเฉพาะสำหรับตัวอย่างเสียง, เอฟเฟกต์เสียง และองค์ประกอบสำหรับการโปรดักชัน แม้จะสร้างคลิปดนตรีสั้น ๆ ได้ แต่ไม่ได้ปรับแต่งมาให้เหมาะกับเพลงเต็ม, เมโลดี้ หรือเสียงร้อง โมเดลโอเพนนี้มอบข้อมูลเชิงลึกเกี่ยวกับ generative AI สำหรับการออกแบบเสียง โดยให้ความสำคัญกับการพัฒนาอย่างมีความรับผิดชอบร่วมกับชุมชนครีเอเตอร์ สามารถใช้น้ำหนักโมเดล Stable Audio Open ได้บน Hugging Face แนะนำให้นักออกแบบเสียง, นักดนตรี, นักพัฒนา และผู้ที่ชื่นชอบงานเสียงดาวน์โหลดโมเดลไปสำรวจความสามารถและส่งฟีดแบ็ก

(stability.ai)

7 คะแนน โดย xguru 2024-06-08 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

ช่วยให้สร้างข้อมูลเสียงคุณภาพสูงความยาวสูงสุด 47 วินาทีได้จากข้อความพรอมป์ต์สั้น ๆ
ด้วยการฝึกเฉพาะทาง จึงเหมาะอย่างยิ่งสำหรับการสร้างบีตกลอง, ริฟฟ์เครื่องดนตรี, เสียงแอมเบียนต์, การบันทึก Foley และตัวอย่างเสียงอื่น ๆ สำหรับการผลิตเพลงและการออกแบบเสียง
ข้อได้เปรียบสำคัญของการเปิดซอร์สครั้งนี้คือ ผู้ใช้สามารถทำ fine-tune โมเดลกับข้อมูลเสียงคัสตอมของตนเองได้
- ตัวอย่างเช่น มือกลองสามารถทำ fine-tune กับตัวอย่างเสียงบันทึกกลองของตนเองเพื่อสร้างบีตใหม่ได้
แตกต่างจาก Stable Audio อย่างไร?
- Stable Audio ซึ่งเป็นผลิตภัณฑ์เชิงพาณิชย์ มอบฟีเจอร์ขั้นสูง เช่น แทร็กเต็มคุณภาพสูงที่มีโครงสร้างดนตรีสอดคล้องกันยาวสูงสุด 3 นาที, การสร้างแบบ audio-to-audio และการประพันธ์ดนตรีหลายพาร์ตที่สอดคล้องกัน
- ในทางกลับกัน Stable Audio Open ถูกออกแบบมาเฉพาะสำหรับตัวอย่างเสียง, เอฟเฟกต์เสียง และองค์ประกอบสำหรับการโปรดักชัน
  - แม้จะสร้างคลิปดนตรีสั้น ๆ ได้ แต่ไม่ได้ปรับแต่งมาให้เหมาะกับเพลงเต็ม, เมโลดี้ หรือเสียงร้อง
  - โมเดลโอเพนนี้มอบข้อมูลเชิงลึกเกี่ยวกับ generative AI สำหรับการออกแบบเสียง โดยให้ความสำคัญกับการพัฒนาอย่างมีความรับผิดชอบร่วมกับชุมชนครีเอเตอร์
โฆษณา
สามารถใช้น้ำหนักโมเดล Stable Audio Open ได้บน Hugging Face
- แนะนำให้นักออกแบบเสียง, นักดนตรี, นักพัฒนา และผู้ที่ชื่นชอบงานเสียงดาวน์โหลดโมเดลไปสำรวจความสามารถและส่งฟีดแบ็ก

เปิดตัว Stable Audio Open - โมเดลโอเพนซอร์สสำหรับตัวอย่างเสียงและการออกแบบเสียง

บทความที่เกี่ยวข้อง

ยังไม่มีความคิดเห็น