ElevenLabs Voice Isolator - แยกเฉพาะเสียงพูดออกมาอย่างคมชัด
(elevenlabs.io)- ลบเสียงรบกวนพื้นหลังออกจากภาพยนตร์ พอดแคสต์ บทสัมภาษณ์ ฯลฯ และแยกออกมาเฉพาะเสียงพูดได้อย่างคมชัด
- รองรับไฟล์ขนาดสูงสุด 500MB และเสียงความยาวไม่เกิน 1 ชั่วโมง
- ไม่ได้ออกแบบหรือปรับแต่งมาเพื่อเสียงร้องในเพลงโดยเฉพาะ (แต่อาจใช้ได้ผลขึ้นอยู่กับคอนเทนต์)
- แม้จะยังไม่เปิดเผย API สำหรับสตรีมมิงแบบเรียลไทม์ แต่มีแผนจะเปิดตัวในเร็ว ๆ นี้
- ค่าบริการอยู่ที่ 1000 ตัวอักษรต่อนาทีของเสียง
6 ความคิดเห็น
นี่หมายความว่าอะไรครับ? ทำไมถึงเป็นจำนวนตัวอักษร ผมไม่เข้าใจเลย
มันไม่ใช่แนวคิดแบบเดียวกับ token เหรอครับ?
เหมือนกับที่ใน GPT รูปภาพก็ถูกคำนวณแบบเดียวกับ text token น่ะครับ
พอดูบริการอื่น ๆ ที่บริษัทมีให้แล้วก็เข้าใจได้ครับ น่าจะเป็นวิธีแบบ Speech to Text to Speech เลยคิดค่าบริการกับข้อความตรงกลางด้วย
ขณะเดียวกัน MVSep ซึ่งให้บริการแยกเสียงร้องผ่านโมเดลแบบเปิดหลากหลายทั้งแบบฟรีและเสียเงิน ก็มีโมเดลแยกเสียงพูด/เสียงรบกวนหลายประเภทให้ใช้งานเช่นกัน
https://mvsep.com
Adobe Podcast AI ก็มีฟีเจอร์คล้ายกันให้ใช้งานเหมือนกัน ดูเหมือนว่าจะมีเวอร์ชันฟรีด้วยนะ https://podcast.adobe.com/enhance
สำหรับเวอร์ชันฟรี ดูเหมือนว่ายังไม่ได้ปรับแต่งให้เหมาะกับภาษาเกาหลีเท่าไรนัก..