MusicLM, AI ที่สร้างเพลงจากข้อความ
(google-research.github.io)- งานวิจัยที่ Google Research เผยแพร่
- สร้างเพลงที่สอดคล้องกับคำบรรยายข้อความได้อย่างมาก เช่น "เมโลดีไวโอลินที่สงบนิ่งโดยมีริฟฟ์กีตาร์ที่ใส่ distortion คลออยู่"
- สร้างเพลงความยาวหลายนาทีที่ 24kHz โดยวางปัญหาให้อยู่ในรูปของงาน hierarchical sequence-to-sequence modeling
- เหนือกว่าระบบเดิมอย่างมากทั้งด้านคุณภาพเสียงและการทำตามคำอธิบายข้อความ
- นอกจากนี้ยังสามารถดัดแปลงสไตล์ของเมโลดีจากการผิวปากหรือการฮัมได้
- สามารถสร้างเสียงแบบโหมดเรื่องราวได้โดยป้อนพรอมป์ต์หลายรายการตามลำดับ
- เปิดเผยชุดข้อมูล MusicCaps ที่ประกอบด้วยคู่ข้อมูลเพลง-ข้อความ 5.5k คู่
2 ความคิดเห็น
น่าทึ่งจริง ๆ ที่สามารถสร้างผลงานคุณภาพระดับนี้ได้ด้วยแค่ข้อความอย่างเดียว!
แต่ตอนนี้ก็ยังมีหลายอย่างที่ดูแปลก ๆ อยู่มาก เลยคิดว่าน่าจะถูกนำไปใช้เพื่อช่วยให้ครีเอเตอร์หาไอเดียกันมากกว่า
Riffusion - Stable Diffusion ที่ถูกปรับจูนเพิ่มเติมเพื่อสร้างเพลง