11 คะแนน โดย xguru 2023-02-15 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • GUI และ API โอเพนซอร์สสำหรับใช้งาน OpenAI Whisper (โมเดลรู้จำเสียงพูด) บนเครื่องโลคัลได้อย่างง่ายดาย
  • ให้บริการฟังก์ชันอย่าง transcribe/detect/download เป็นต้น ผ่าน REST API
  • สามารถอัปโหลดไฟล์เสียง/วิดีโอจากหน้าเว็บเพื่อเริ่มงานได้
  • รันและใช้งานด้วย docker-compose (รัน Docker container 3 ตัว ได้แก่ redis/api/worker)
  • โมเดลขนาดเล็กสุด tiny ต้องการ VRAM ราว 1GB (ส่วน large ซึ่งเป็นขนาดใหญ่สุดต้องการ 10GB)