2 คะแนน โดย kapitalismho 5 시간 전 | ยังไม่มีความคิดเห็น | แชร์ทาง WhatsApp

สรุปสั้น ๆ
Q: แล้วประสิทธิภาพดีพอที่จะคุยกับชาวต่างชาติได้อย่างเป็นธรรมชาติไหม?
A: ได้ครับ/ค่ะ ลองดูวิดีโอเดโมใน GitHub repo ได้เลย (หรือที่หน้า Faerie ด้านล่าง)

สวัสดีครับ/ค่ะ

โปรเจกต์นี้เริ่มต้นจากความคิดที่ว่า
อยากคุยกับเพื่อนชาวต่างชาติที่เจอกันในโลกเสมือนจริง
ให้ลึกซึ้งยิ่งขึ้น

แนวคิดหลักคือการแปลแบบเรียลไทม์ที่ทุกคนใช้งานได้โดยไม่รู้สึกเป็นภาระ
ด้วยเหตุนี้จึงพยายามคิดหาทางหลายแบบเพื่อให้ได้ประสิทธิภาพสูงสุด
พร้อมกับรักษาสมดุลใน 3 ด้านด้านล่าง


  • คุณภาพการแปล => อัตราการแปลผิด 1/6 เมื่อเทียบกับ DeepL
  • เวลาแฝง => ต่ำกว่า 2 วินาที
  • การเข้าถึงและต้นทุน => โอเพนซอร์ส / 0.1 วอน ~ 0.5 วอนต่อหนึ่งข้อความพูด
    (Gemma 4 26B A4B standard)

ข้อมูลจะไหลในรูปแบบ เสียง => ASR => LLM => ข้อความแปล
และสามารถแปลได้ทั้งสองทิศทาง โดยแปลทั้งคำพูดของตัวเองและของคู่สนทนา

วิดีโอใน GitHub repo เป็นวิดีโอการใช้งานจริง
แพลตฟอร์มที่อยู่ในวิดีโอคือ VRChat

ในช่วงเปลี่ยนผ่านระยะแรกที่ยังไม่จำเป็นต้องคอยสงสัยว่า
ใครบางคนอีกฝั่งจอเป็นมนุษย์จริงหรือไม่
หวังว่าโปรแกรมนี้จะช่วยให้การเชื่อมต่อกับใครสักคน
ก้าวข้ามอุปสรรคด้านภาษาได้

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น