- แอป เสียง → ข้อความแบบโอเพนซอร์สฟรี ที่ทำงานแบบ ออฟไลน์ทั้งหมด สร้างบน Tauri desktop app ด้วย Rust + React/TypeScript
- กดคีย์ลัดเพื่อ เริ่มบันทึก → พูดได้ทันที → แปลงเป็นข้อความบนเครื่องแบบโลคัลโดยอัตโนมัติ โดยไม่ส่งขึ้นคลาวด์
- ใช้งานโมเดล Whisper และ Parakeet V3 โดยรองรับทั้งการเร่งความเร็วด้วย GPU และการปรับแต่งให้เหมาะกับ CPU พร้อมรองรับ Windows, macOS, Linux
- เป้าหมายของโปรเจกต์ไม่ใช่การเป็น “แอปจดจำเสียงพูดที่สมบูรณ์แบบที่สุด” แต่คือการสร้าง แอปที่เหมาะกับการ fork มากที่สุด ซึ่ง ทุกคนสามารถแก้ไขและขยายต่อได้ง่าย และรองรับความเป็น โอเพนซอร์ส ฟรี และออฟไลน์
- เทคสแตก
- ฟรอนต์เอนด์: React + TypeScript + Tailwind CSS
- แบ็กเอนด์: พัฒนาด้วย Rust รับผิดชอบการประมวลผลเสียงและการอนุมานของแมชชีนเลิร์นนิง
- ไลบรารีหลัก:
whisper-rs (การจดจำเสียงพูดบนพื้นฐาน Whisper)
transcription-rs (โมเดล Parakeet ที่ปรับแต่งสำหรับ CPU)
cpal (audio I/O ข้ามแพลตฟอร์ม)
vad-rs (การตรวจจับกิจกรรมเสียงพูด)
rdev (คีย์ลัดแบบ global และการจัดการอีเวนต์)
rubato (การ resample เสียง)
- เว็บไซต์ทางการ: https://handy.computer/
1 ความคิดเห็น
เจ๋งมากครับ