-
บริบททางวัฒนธรรม
- StarCraft: Brood War (ต่อไปนี้จะเรียกว่า BW) เป็นเกมที่มีความสำคัญอย่างมากในเกาหลี โดยผู้เล่นอาชีพ ทีม และการแข่งขันส่วนใหญ่มีฐานอยู่ในเกาหลี
- BW เป็นเกมวางกลยุทธ์คล้ายหมากรุก ดังนั้นไม่ใช่แค่การเล่นเกมเท่านั้น แต่การศึกษาวิเคราะห์เกมก็สำคัญเช่นกัน
- เช่นเดียวกับโอเพนนิงในหมากรุก BW ก็มีทั้งกลยุทธ์และบิลด์เฉพาะ ซึ่งเป็นภาษาที่มีลักษณะเฉพาะทางโดเมนซึ่งพัฒนาขึ้นภายในชุมชน
-
ปัญหาด้านความรู้ของชาวต่างชาติ
- ชุมชนผู้เล่นต่างชาติส่วนใหญ่ไม่ได้เชี่ยวชาญภาษาเกาหลี
- ชาวต่างชาติที่พูดเกาหลีได้อย่างคล่องแคล่วนั้นมีน้อย ทำให้ชุมชนต่างชาติเข้าถึงข้อมูลได้จำกัดเมื่อเทียบกับชุมชนเกาหลี
- การแปลด้วยเครื่องยังมีข้อจำกัดในการแปลภาษาที่มีลักษณะเฉพาะทางโดเมน และนี่เป็นปัจจัยที่ทำให้ชุมชนต่างชาติตามหลังชุมชนเกาหลี
-
กระบวนการแปลแบบใหม่
- ด้วยกระบวนการแปลด้วยเครื่องแบบใหม่ จึงสามารถให้คำแปลที่แม่นยำยิ่งขึ้นได้
- สามารถแปลวิดีโอได้ประมาณวันละ 7 รายการ ซึ่งเร็วกว่าเดิมมาก
-
เทคโนโลยีที่ใช้
- แบ่งออกเป็นสองส่วนคือการสร้างคำบรรยายและการนำคำบรรยายไปใช้งาน
- ใช้ yt-dlp และ OpenAI Whisper เพื่อดาวน์โหลดแทร็กเสียงของวิดีโอ และใช้สิ่งนี้ในการสร้างคำบรรยาย
- ใช้ Google Colab เพื่อรัน Whisper โดยรับ URL ของวิดีโอแล้วสร้างไฟล์ SRT ภาษาเกาหลี
- ใช้ LLM และ พจนานุกรมสแลง เพื่อเพิ่มความแม่นยำของการแปล
-
การใช้งานคำบรรยาย
- ใช้ TamperMonkey เพื่อเพิ่มปุ่มบนวิดีโอ YouTube และทำให้สามารถดาวน์โหลดคำบรรยายที่แปลแล้วได้
- ใช้ Pastebin และ Google Sheets + Apps Script เพื่อแชร์และจัดการคำบรรยาย
-
จุดที่ปรับปรุงได้
- มีความเป็นไปได้ที่จะเพิ่มฟังก์ชันรองรับหลายภาษา
- ในด้านเทคนิค อาจเพิ่มความสามารถในการแสดงปุ่มเฉพาะกับวิดีโอบางรายการ
-
ความคิดส่งท้าย
- ประเด็นอย่างประสิทธิภาพ ความสามารถในการขยายระบบ และเวลาแฝงไม่ใช่สิ่งสำคัญ โดยโปรเจกต์นี้สำเร็จได้จากการนำโซลูชันที่มีอยู่แล้วมาประกอบเข้าด้วยกัน
- สคริปต์ผู้ใช้และโค้ด Python ใน Colab Notebook มีขนาดสั้นและดูแลรักษาง่าย
- โปรเจกต์นี้เป็นเพียงระบบ CRUD ที่ง่ายที่สุด และไม่มีเหตุผลใดที่ความซับซ้อนจะต้องเพิ่มขึ้นอย่างมาก
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
ในฐานะผู้เล่น BW ชาวเกาหลีและนักวิจัยด้านการรู้จำเสียง ฉันคิดว่าบทความนี้น่าสนใจ เดิมทีทรานสคริปชันภาษาเกาหลีมีข้อผิดพลาดอยู่มาก แต่ LLMs แก้ไขได้อย่างน่าประทับใจ ตัวอย่างเช่น "12 anmadang build" ที่จริงคือ "12 apmadang build" และบิลด์ two-e-cheori ควรถูกถอดความเป็น two-hae-cheori build
อย่าให้ชื่อเรื่องหลอกคุณ บทความนี้เป็นแนวทางที่ละเอียดและสร้างสรรค์มากในการแปลคำบรรยาย StarCraft และทำให้เข้าถึงได้มากขึ้น
ในฐานะผู้ใช้ที่ไม่ได้ใช้ภาษาอังกฤษเป็นหลัก ระหว่างอ่านบทความนี้ฉันนึกถึงความยากของการแปลบทความคอมพิวเตอร์และงานแปลด้านการพัฒนาซอฟต์แวร์
ฉันเข้าใจเวอร์ชัน Google Translate ได้ดี เพราะคุ้นเคยกับ BW และโอเพนเนอร์ zerg 12hatch
น่าขำที่บทความเกี่ยวกับการแปลกลับเข้าใจอัตราส่วนสัญญาณต่อสัญญาณรบกวนตรงกันข้ามทั้งหมด จริง ๆ แล้วอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่สูงเป็นเรื่องดี
สามารถใช้ yt-dlp ดาวน์โหลดวิดีโอคุณภาพต่ำเพื่อประหยัดแบนด์วิดท์ได้
yt-dlp -f "bv[height<=720]" <url>ในฐานะคนที่เคยเล่น donmaep ตอนเด็ก ฉันสงสัยว่าตัวเลขหน้าอาคารหมายถึงอะไร
แม้ Google Translate จะดีขึ้นแล้ว แต่ก็ยังแปลข้อความภาษาจีนหรือญี่ปุ่นเกี่ยวกับเกม Go ได้ไม่ค่อยมีประสิทธิภาพ
ฉันชอบบทความนี้มาก ตอนที่ลองเล่นรายการคัดเลือกระดับภูมิภาคของ World Cyber Games ในอเมริกา ฉันตกใจว่าคนอื่นเร็วกันขนาดไหน
การแปล "natural expansion" เป็น "courtyard" แม้จะ "ผิด" แต่ฉันกลับชอบมัน