WaaS - Whisper as a Service

xguru · 2023-02-15T10:47:02+09:00

GUI และ API โอเพนซอร์สสำหรับใช้งาน OpenAI Whisper (โมเดลรู้จำเสียงพูด) บนเครื่องโลคัลได้อย่างง่ายดาย ให้บริการฟังก์ชันอย่าง transcribe/detect/download เป็นต้น ผ่าน REST API สามารถอัปโหลดไฟล์เสียง/วิดีโอจากหน้าเว็บเพื่อเริ่มงานได้ รันและใช้งานด้วย docker-compose (รัน Docker container 3 ตัว ได้แก่ redis/api/worker) โมเดลขนาดเล็กสุด tiny ต้องการ VRAM ราว 1GB (ส่วน large ซึ่งเป็นขนาดใหญ่สุดต้องการ 10GB)

(github.com/schibsted)

11 คะแนน โดย xguru 2023-02-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

GUI และ API โอเพนซอร์สสำหรับใช้งาน OpenAI Whisper (โมเดลรู้จำเสียงพูด) บนเครื่องโลคัลได้อย่างง่ายดาย
ให้บริการฟังก์ชันอย่าง transcribe/detect/download เป็นต้น ผ่าน REST API
สามารถอัปโหลดไฟล์เสียง/วิดีโอจากหน้าเว็บเพื่อเริ่มงานได้
รันและใช้งานด้วย docker-compose (รัน Docker container 3 ตัว ได้แก่ redis/api/worker)
โมเดลขนาดเล็กสุด tiny ต้องการ VRAM ราว 1GB (ส่วน large ซึ่งเป็นขนาดใหญ่สุดต้องการ 10GB)

1 ความคิดเห็น

xguru 2023-02-15

Whisper - ระบบรู้จำเสียงพูดหลายภาษาภาษา (ASR) ที่ OpenAI เปิดซอร์ส
OpenAI เปิดตัวโมเดล Whisper v2

WaaS - Whisper as a Service

บทความที่เกี่ยวข้อง

1 ความคิดเห็น