เครื่องแปลแบบเรียลไทม์ที่ทำขึ้นเองเพราะอยากสื่อสารกับชาวต่างชาติ Puripuly Heart
(github.com/kapitalismho)สรุปสั้น ๆ
Q: แล้วประสิทธิภาพดีพอที่จะคุยกับชาวต่างชาติได้อย่างเป็นธรรมชาติไหม?
A: ได้ครับ/ค่ะ ลองดูวิดีโอเดโมใน GitHub repo ได้เลย (หรือที่หน้า Faerie ด้านล่าง)
สวัสดีครับ/ค่ะ
โปรเจกต์นี้เริ่มต้นจากความคิดที่ว่า
อยากคุยกับเพื่อนชาวต่างชาติที่เจอกันในโลกเสมือนจริง
ให้ลึกซึ้งยิ่งขึ้น
แนวคิดหลักคือการแปลแบบเรียลไทม์ที่ทุกคนใช้งานได้โดยไม่รู้สึกเป็นภาระ
ด้วยเหตุนี้จึงพยายามคิดหาทางหลายแบบเพื่อให้ได้ประสิทธิภาพสูงสุด
พร้อมกับรักษาสมดุลใน 3 ด้านด้านล่าง
- คุณภาพการแปล => อัตราการแปลผิด 1/6 เมื่อเทียบกับ DeepL
- เวลาแฝง => ต่ำกว่า 2 วินาที
- การเข้าถึงและต้นทุน => โอเพนซอร์ส / 0.1 วอน ~ 0.5 วอนต่อหนึ่งข้อความพูด
(Gemma 4 26B A4B standard)
ข้อมูลจะไหลในรูปแบบ เสียง => ASR => LLM => ข้อความแปล
และสามารถแปลได้ทั้งสองทิศทาง โดยแปลทั้งคำพูดของตัวเองและของคู่สนทนา
วิดีโอใน GitHub repo เป็นวิดีโอการใช้งานจริง
แพลตฟอร์มที่อยู่ในวิดีโอคือ VRChat
ในช่วงเปลี่ยนผ่านระยะแรกที่ยังไม่จำเป็นต้องคอยสงสัยว่า
ใครบางคนอีกฝั่งจอเป็นมนุษย์จริงหรือไม่
หวังว่าโปรแกรมนี้จะช่วยให้การเชื่อมต่อกับใครสักคน
ก้าวข้ามอุปสรรคด้านภาษาได้
ยังไม่มีความคิดเห็น