31 คะแนน โดย xguru 2025-10-04 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • แอป เสียง → ข้อความแบบโอเพนซอร์สฟรี ที่ทำงานแบบ ออฟไลน์ทั้งหมด สร้างบน Tauri desktop app ด้วย Rust + React/TypeScript
  • กดคีย์ลัดเพื่อ เริ่มบันทึก → พูดได้ทันที → แปลงเป็นข้อความบนเครื่องแบบโลคัลโดยอัตโนมัติ โดยไม่ส่งขึ้นคลาวด์
  • ใช้งานโมเดล Whisper และ Parakeet V3 โดยรองรับทั้งการเร่งความเร็วด้วย GPU และการปรับแต่งให้เหมาะกับ CPU พร้อมรองรับ Windows, macOS, Linux
  • เป้าหมายของโปรเจกต์ไม่ใช่การเป็น “แอปจดจำเสียงพูดที่สมบูรณ์แบบที่สุด” แต่คือการสร้าง แอปที่เหมาะกับการ fork มากที่สุด ซึ่ง ทุกคนสามารถแก้ไขและขยายต่อได้ง่าย และรองรับความเป็น โอเพนซอร์ส ฟรี และออฟไลน์
  • เทคสแตก
    • ฟรอนต์เอนด์: React + TypeScript + Tailwind CSS
    • แบ็กเอนด์: พัฒนาด้วย Rust รับผิดชอบการประมวลผลเสียงและการอนุมานของแมชชีนเลิร์นนิง
    • ไลบรารีหลัก:
      • whisper-rs (การจดจำเสียงพูดบนพื้นฐาน Whisper)
      • transcription-rs (โมเดล Parakeet ที่ปรับแต่งสำหรับ CPU)
      • cpal (audio I/O ข้ามแพลตฟอร์ม)
      • vad-rs (การตรวจจับกิจกรรมเสียงพูด)
      • rdev (คีย์ลัดแบบ global และการจัดการอีเวนต์)
      • rubato (การ resample เสียง)
  • เว็บไซต์ทางการ: https://handy.computer/

1 ความคิดเห็น

 
shakespeares 2025-10-07

เจ๋งมากครับ