- โมเดลสร้างเพลงโอเพนซอร์ส ที่ให้ คุณภาพการสร้างเพลงระดับเชิงพาณิชย์แบบ Suno ได้แม้บนฮาร์ดแวร์สำหรับผู้ใช้ทั่วไป
- สร้างเพลงเต็มได้อย่างรวดเร็วภายใน 10 วินาที (RTX 3090)
- รันแบบโลคัลได้แม้ในสภาพแวดล้อมที่มี VRAM ต่ำกว่า 4GB และรองรับการสะท้อนสไตล์เพลงของผู้ใช้ด้วย การฝึกปรับแต่งเฉพาะบุคคลแบบ LoRA
- รองรับ การสร้างคัฟเวอร์, repaint (การสร้างใหม่บางส่วน), แปลงเสียงร้อง→BGM, แยกแทร็กและผสมแบบมัลติแทร็ก
- ควบคุมโครงสร้างและสไตล์ได้ด้วย พรอมป์ต์เนื้อเพลงมากกว่า 50 ภาษา
- คุณสมบัติด้านประสิทธิภาพและคุณภาพ
- ให้คุณภาพเสียงและความหลากหลายของสไตล์เหนือกว่า โมเดลเชิงพาณิชย์ (ระดับ Suno v4.5~v5)
- รองรับเครื่องดนตรีและแนวเพลงมากกว่า 1,000 แบบ พร้อมการควบคุมโทนเสียงอย่างละเอียด
- รองรับการสร้างเสียงความยาว สูงสุด 10 นาที (600 วินาที) และ การสร้างแบบแบตช์พร้อมกัน 8 เพลง
- มีฟังก์ชันฝึก LoRA ในตัว
- ใส่คำอธิบายประกอบและฝึกได้ในคลิกเดียวผ่าน Gradio UI
- บน RTX 3090 (12GB) ใช้เวลา ฝึก 8 เพลงเสร็จภายใน 1 ชั่วโมง
- รองรับการปรับจูนละเอียดขั้นสูงแบบ LoRA/LoKR และการเพิ่มประสิทธิภาพ VRAM ผ่าน โมดูล Side-Step
- รองรับหลายแพลตฟอร์ม : รองรับ Mac(MLX), AMD ROCm, Intel XPU, CUDA GPU และ CPU พร้อมระบบตรวจจับสภาพแวดล้อมอัตโนมัติและสคริปต์ตั้งค่า
- มีอินเทอร์เฟซให้เลือกหลากหลาย
- Gradio Web UI: อินเทอร์เฟซสร้างเพลงผ่านเว็บที่ใช้งานเข้าใจง่าย
- Studio UI: สภาพแวดล้อมแก้ไขขั้นสูงคล้าย DAW
- Python API / REST API / CLI: รองรับการผสานเข้ากับบริการและงานอัตโนมัติ
- มี ชุดเอกสารหลายภาษา ให้ใช้งานในภาษาอังกฤษ จีน ญี่ปุ่น และเกาหลี
- MIT License : แนะนำให้ใช้เพื่อวัตถุประสงค์ด้านการสร้างสรรค์ การศึกษา และความบันเทิง โดยควรปฏิบัติตามลิขสิทธิ์และความอ่อนไหวทางวัฒนธรรม
- เว็บไซต์ทางการ: acemusic.ai
- รายงานทางเทคนิค: arXiv:2602.00744
- ฟังตัวอย่าง
3 ความคิดเห็น
ช่วงนี้ผมเพิ่งสมัคร suno ไปเพื่อทำเพลงประกอบ
สำหรับเคสใช้งานง่าย ๆ ก็น่าจะช่วยลดค่าสมาชิกได้บ้างนะ
วันนี้คงต้องลองใช้สักครั้งแล้ว
ในตัวอย่างมีเพลง k-pop ด้วยนะ ถ้าสร้างได้ระดับนี้จากโมเดลรันบนเครื่องโลคัลก็ถือว่าดีมากเลย สำหรับเกมหรือวิดีโอที่ทำเองคนเดียว เพลงประกอบพื้นหลังก็น่าจะทำได้ง่ายมากแล้วจริง ๆ