• โอเพนซอร์สที่ใช้โมเดลรู้จำเสียง Whisper เพื่อรู้จำเสียงจากไฟล์หลากหลายประเภทที่อยู่ในเครื่อง และสร้างเป็นไฟล์ซับไตเติล (srt, vtt, txt)
  • รองรับเวอร์ชันเร่งความเร็วด้วย GPU/CUDA
  • Ubuntu/MacOS/Win32 (ใน git-bash)
  • ใช้ yt-dlp + static-ffmpeg

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น