WaaS - Whisper as a Service
(github.com/schibsted)- GUI และ API โอเพนซอร์สสำหรับใช้งาน OpenAI Whisper (โมเดลรู้จำเสียงพูด) บนเครื่องโลคัลได้อย่างง่ายดาย
- ให้บริการฟังก์ชันอย่าง
transcribe/detect/downloadเป็นต้น ผ่าน REST API - สามารถอัปโหลดไฟล์เสียง/วิดีโอจากหน้าเว็บเพื่อเริ่มงานได้
- รันและใช้งานด้วย
docker-compose(รัน Docker container 3 ตัว ได้แก่ redis/api/worker) - โมเดลขนาดเล็กสุด
tinyต้องการ VRAM ราว 1GB (ส่วนlargeซึ่งเป็นขนาดใหญ่สุดต้องการ 10GB)
1 ความคิดเห็น
Whisper - ระบบรู้จำเสียงพูดหลายภาษาภาษา (ASR) ที่ OpenAI เปิดซอร์ส
OpenAI เปิดตัวโมเดล Whisper v2