ElevenLabs Voice Isolator - แยกเฉพาะเสียงพูดออกมาอย่างคมชัด

xguru · 2024-07-06T10:02:02+09:00

ลบเสียงรบกวนพื้นหลังออกจากภาพยนตร์ พอดแคสต์ บทสัมภาษณ์ ฯลฯ และแยกออกมาเฉพาะเสียงพูดได้อย่างคมชัด รองรับไฟล์ขนาดสูงสุด 500MB และเสียงความยาวไม่เกิน 1 ชั่วโมง ไม่ได้ออกแบบหรือปรับแต่งมาเพื่อเสียงร้องในเพลงโดยเฉพาะ (แต่อาจใช้ได้ผลขึ้นอยู่กับคอนเทนต์) แม้จะยังไม่เปิดเผย API สำหรับสตรีมมิงแบบเรียลไทม์ แต่มีแผนจะเปิดตัวในเร็ว ๆ นี้ ค่าบริการอยู่ที่ 1000 ตัวอักษรต่อนาทีของเสียง

(elevenlabs.io)

22 คะแนน โดย xguru 2024-07-06 | 6 ความคิดเห็น | แชร์ทาง WhatsApp

ลบเสียงรบกวนพื้นหลังออกจากภาพยนตร์ พอดแคสต์ บทสัมภาษณ์ ฯลฯ และแยกออกมาเฉพาะเสียงพูดได้อย่างคมชัด
รองรับไฟล์ขนาดสูงสุด 500MB และเสียงความยาวไม่เกิน 1 ชั่วโมง
ไม่ได้ออกแบบหรือปรับแต่งมาเพื่อเสียงร้องในเพลงโดยเฉพาะ (แต่อาจใช้ได้ผลขึ้นอยู่กับคอนเทนต์)
แม้จะยังไม่เปิดเผย API สำหรับสตรีมมิงแบบเรียลไทม์ แต่มีแผนจะเปิดตัวในเร็ว ๆ นี้
ค่าบริการอยู่ที่ 1000 ตัวอักษรต่อนาทีของเสียง

6 ความคิดเห็น

savvykang 2024-07-06

Voice Isolator มีค่าใช้จ่ายเท่าไร?
Voice Isolator คิด 1000 ตัวอักษรต่อนาทีของเสียงทุก 1 นาที

นี่หมายความว่าอะไรครับ? ทำไมถึงเป็นจำนวนตัวอักษร ผมไม่เข้าใจเลย

brainer 2024-07-06

มันไม่ใช่แนวคิดแบบเดียวกับ token เหรอครับ?

เหมือนกับที่ใน GPT รูปภาพก็ถูกคำนวณแบบเดียวกับ text token น่ะครับ

savvykang 2024-07-06

พอดูบริการอื่น ๆ ที่บริษัทมีให้แล้วก็เข้าใจได้ครับ น่าจะเป็นวิธีแบบ Speech to Text to Speech เลยคิดค่าบริการกับข้อความตรงกลางด้วย

qyurila 2024-07-06

ขณะเดียวกัน MVSep ซึ่งให้บริการแยกเสียงร้องผ่านโมเดลแบบเปิดหลากหลายทั้งแบบฟรีและเสียเงิน ก็มีโมเดลแยกเสียงพูด/เสียงรบกวนหลายประเภทให้ใช้งานเช่นกัน
https://mvsep.com

xguru 2024-07-06

Adobe Podcast AI ก็มีฟีเจอร์คล้ายกันให้ใช้งานเหมือนกัน ดูเหมือนว่าจะมีเวอร์ชันฟรีด้วยนะ https://podcast.adobe.com/enhance

brainer 2024-07-06

สำหรับเวอร์ชันฟรี ดูเหมือนว่ายังไม่ได้ปรับแต่งให้เหมาะกับภาษาเกาหลีเท่าไรนัก..

ElevenLabs Voice Isolator - แยกเฉพาะเสียงพูดออกมาอย่างคมชัด

บทความที่เกี่ยวข้อง

6 ความคิดเห็น