WhisperFusion - สนทนากับแชตบอต AI ด้วยเวลาแฝงที่สั้น
(github.com/collabora)- มอบการสนทนากับ AI ที่ลื่นไหลโดยทำงานร่วมกับ Mistral LLM บนพื้นฐานความสามารถของ WhisperLive และ WhisperSpeech
- WhisperLive : นำ OpenAI Whisper มาทำงานได้เกือบแบบเรียลไทม์เพื่อแปลงเสียงเป็นข้อความ
- WhisperSpeech : ระบบ TTS ที่สร้างขึ้นโดยกลับกระบวนการของ Whisper
- ทั้ง LLM และ Whisper ได้รับการปรับแต่งให้ทำงานอย่างมีประสิทธิภาพด้วยเอนจิน TensorRT เพื่อเพิ่มประสิทธิภาพและความสามารถในการประมวลผลแบบเรียลไทม์สูงสุด และ WhisperSpeech ปรับแต่งด้วย
torch.compile
3 ความคิดเห็น
ถ้าแปลแบบเรียลไทม์ได้ก็คงจะรวดเร็วและดีมากนะครับ
WhisperSpeech – ระบบสังเคราะห์เสียงพูดโอเพนซอร์สที่สร้าง Whisper แบบย้อนกลับ
ความคิดเห็นจาก Hacker News