vvrite — แอปพิมพ์ด้วยเสียง AI แบบ on-device โอเพนซอร์สสำหรับ macOS
(github.com/shaircast)สวัสดีครับ เดิมทีผมใช้งานเครื่องมือพิมพ์ด้วยเสียงที่มีอยู่แล้วอย่าง superwhisper หรือ spokenly ควบคู่กับการเชื่อมต่อเกมแพด 8bitdo micro อยู่ครับ แต่มีอาการหน่วงจากเครือข่ายที่ชวนรำคาญอยู่แปลก ๆ
ผมเลยทดลองโมเดลแบบรันในเครื่องมาเรื่อย ๆ และพอได้ลองใช้โมเดล Qwen3-ASR ครั้งนี้ก็รู้สึกเลยว่าใช่เลยครับ ทั้งตอบสนองไวและให้ประสิทธิภาพไม่แพ้โมเดลบนคลาวด์ จึงสร้าง vvrite ขึ้นมาเพื่อมอบประสบการณ์ใช้งานแบบเดียวกันโดยรันทั้งหมดแบบโลคัล ประสิทธิภาพจริงอาจต่างกันตามสเปกเครื่อง แต่โดยรวมถือว่าเร็วพอสมควรและใช้หน่วยความจำไม่มากครับ
vvrite เป็นแอปที่เมื่อกดฮอตคีย์จากเมนูบาร์ของ macOS (ค่าเริ่มต้นคือ Option+Space) จะเริ่มอัดเสียงได้ทันที และเมื่อกดอีกครั้ง แอปจะใช้ on-device AI รู้จำเสียงพูดแล้ววางข้อความลงในช่องป้อนข้อมูลที่กำลังใช้งานอยู่โดยอัตโนมัติ รองรับ Apple Silicon Mac ที่ใช้ macOS 13 ขึ้นไป และสามารถติดตั้งได้ทันทีผ่านไฟล์ DMG ที่เซ็นรับรองและ notarized แล้วจาก GitHub Releases.
13 ความคิดเห็น
กำลังจะลองใช้ handy อยู่พอดี แต่พอได้ยินว่าตัวนี้รองรับภาษาเกาหลีได้ดีกว่าก็คงต้องลองใช้ดูแล้ว ขอบคุณครับ
สิ่งที่รำคาญใจจากการใช้เครื่องมือรู้จำเสียงภาษาเกาหลีอยู่
พอดี
grokแนะนำโอเพนซอร์สตัวนี้มาให้(แอบแนะนำไว้ด้วยตัวหนังสือเล็กมากตอนท้าย) ก็เลยลองใช้ดู
แล้วมันใช้ได้ดี เลยปรับแต่งเอามาใช้เองอยู่ครับ
เพิ่มโมเดลเข้าไปอีก 3 ตัว
แล้วก็เพราะเสียงแจ้งเตือนดังเกินไป เลยใส่ตัวปรับระดับเสียงเข้าไป...
รวมถึงแก้บั๊กเล็ก ๆ น้อย ๆ ไปบ้าง..
ช่วงนี้ก็คงจะใช้ตัวนี้ต่อไปอีกสักพัก
พิมพ์โค้ดด้วยเสียงกันแบบมัน ๆ เลยครับ
พอเปิดโค้ดดูแล้วเหมือนเป็นโปรเจกต์ที่
คนที่ไม่ใช่นักพัฒนากำลังทำอยู่
เลยยิ่งอยากเอาใจช่วยมากขึ้นไปอีก~~
ดีกว่าคนบางคนที่
เอาแต่คิดแล้วก็ผัดวันประกันพรุ่ง
เป็นร้อยเท่าเลยครับ (ผมเอง..) 😂
พอเห็นร่องรอยของ
superpowersหลงเหลืออยู่ด้วยก็ทำให้นึกว่า "อ๋อ เขาทำกันแบบนี้นี่เอง.."
ขึ้นมาเหมือนกันครับ~
ว้าว ลองใช้แล้วเร็วและดีมากครับ จะใช้งานให้ดีเลยครับ
ขอบคุณ!
ฉันกำลังทำแอปคำสั่งเสียงสำหรับ Android อยู่ และต้องบอกว่า qwen ดีจริง ๆ ครับ แต่ตอนนี้ยังปรับแต่งให้เหมาะสมไม่ได้ เลยใช้งาน whisper base ที่นำไป fine-tune กับชุดข้อมูลภาษาเกาหลีอยู่
ดีกว่า Whisper large v3 turbo ไหมครับ? ตอนนี้ผมยังใช้อันนี้อยู่ เลยสงสัยว่าคุณเคยลองเปรียบเทียบดูบ้างหรือยัง Moonshine ก็เห็นจากที่นี่แล้วคิดว่าจะลองใช้เหมือนกัน แต่ผ่านไปตั้ง 3 สัปดาห์แล้วครับ 555
สำหรับภาษาเกาหลี ดีกว่า Whisper อย่างชัดเจนครับ!
Moonshine แทบไม่ต่างจาก parakeet มากนักครับ
แตกต่างจาก handy อย่างไร?
แอปแนวนี้ UX ก็น่าจะคล้ายๆ กันเกือบหมดครับ vvrite เองก็ไม่ได้ต่างกันมากนัก สุดท้ายก็อยู่ที่ประสิทธิภาพของโมเดล
ถ้าคุณใช้แค่อังกฤษ
parakeetที่ handy รองรับก็เพียงพอแล้วแต่จากประสบการณ์ของผม การรองรับภาษาเกาหลี
Qwen3-ASRเป็นตัวเลือกที่ดีที่สุดแต่เพราะไม่มีที่ไหนรองรับ ผมเลยทำขึ้นมาเองครับ
ว้าว เป็นเครื่องมือที่เจ๋งมากเลยครับ
ส่วนตัวคิดว่าถ้ามี UI ที่ให้กลับไปดูคู่มือการใช้งานได้อีกครั้งก็น่าจะดียิ่งขึ้น ตอนแรกตอนติดตั้งผมกดไปมั่ว ๆ เลยงงว่าต้องใช้อย่างไร 555
ชื่อเครื่องมือนี้อ่านว่าอะไรครับ? อ่านว่าไลต์ใช่ไหม?
ขอบคุณสำหรับความคิดเห็น! จะนำไปปรับใช้ในรีลีสถัดไปนะครับ
ตั้งใจให้อ่านเป็น “ไลต์” อยู่เหมือนกัน… แต่ผมเองก็ยังไม่ค่อยแน่ใจเหมือนกันว่าควรอ่านแบบไหนถึงจะดีที่สุด
ไบรต์เป็นอย่างไรบ้าง?
vvrite - vwrite - bright ที่สื่อความหมายทั้งสามอย่างไว้ด้วยกัน...