4 คะแนน โดย GN⁺ 2025-01-19 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • บริบททางวัฒนธรรม

    • StarCraft: Brood War (ต่อไปนี้จะเรียกว่า BW) เป็นเกมที่มีความสำคัญอย่างมากในเกาหลี โดยผู้เล่นอาชีพ ทีม และการแข่งขันส่วนใหญ่มีฐานอยู่ในเกาหลี
    • BW เป็นเกมวางกลยุทธ์คล้ายหมากรุก ดังนั้นไม่ใช่แค่การเล่นเกมเท่านั้น แต่การศึกษาวิเคราะห์เกมก็สำคัญเช่นกัน
    • เช่นเดียวกับโอเพนนิงในหมากรุก BW ก็มีทั้งกลยุทธ์และบิลด์เฉพาะ ซึ่งเป็นภาษาที่มีลักษณะเฉพาะทางโดเมนซึ่งพัฒนาขึ้นภายในชุมชน
  • ปัญหาด้านความรู้ของชาวต่างชาติ

    • ชุมชนผู้เล่นต่างชาติส่วนใหญ่ไม่ได้เชี่ยวชาญภาษาเกาหลี
    • ชาวต่างชาติที่พูดเกาหลีได้อย่างคล่องแคล่วนั้นมีน้อย ทำให้ชุมชนต่างชาติเข้าถึงข้อมูลได้จำกัดเมื่อเทียบกับชุมชนเกาหลี
    • การแปลด้วยเครื่องยังมีข้อจำกัดในการแปลภาษาที่มีลักษณะเฉพาะทางโดเมน และนี่เป็นปัจจัยที่ทำให้ชุมชนต่างชาติตามหลังชุมชนเกาหลี
  • กระบวนการแปลแบบใหม่

    • ด้วยกระบวนการแปลด้วยเครื่องแบบใหม่ จึงสามารถให้คำแปลที่แม่นยำยิ่งขึ้นได้
    • สามารถแปลวิดีโอได้ประมาณวันละ 7 รายการ ซึ่งเร็วกว่าเดิมมาก
  • เทคโนโลยีที่ใช้

    • แบ่งออกเป็นสองส่วนคือการสร้างคำบรรยายและการนำคำบรรยายไปใช้งาน
    • ใช้ yt-dlp และ OpenAI Whisper เพื่อดาวน์โหลดแทร็กเสียงของวิดีโอ และใช้สิ่งนี้ในการสร้างคำบรรยาย
    • ใช้ Google Colab เพื่อรัน Whisper โดยรับ URL ของวิดีโอแล้วสร้างไฟล์ SRT ภาษาเกาหลี
    • ใช้ LLM และ พจนานุกรมสแลง เพื่อเพิ่มความแม่นยำของการแปล
  • การใช้งานคำบรรยาย

    • ใช้ TamperMonkey เพื่อเพิ่มปุ่มบนวิดีโอ YouTube และทำให้สามารถดาวน์โหลดคำบรรยายที่แปลแล้วได้
    • ใช้ Pastebin และ Google Sheets + Apps Script เพื่อแชร์และจัดการคำบรรยาย
  • จุดที่ปรับปรุงได้

    • มีความเป็นไปได้ที่จะเพิ่มฟังก์ชันรองรับหลายภาษา
    • ในด้านเทคนิค อาจเพิ่มความสามารถในการแสดงปุ่มเฉพาะกับวิดีโอบางรายการ
  • ความคิดส่งท้าย

    • ประเด็นอย่างประสิทธิภาพ ความสามารถในการขยายระบบ และเวลาแฝงไม่ใช่สิ่งสำคัญ โดยโปรเจกต์นี้สำเร็จได้จากการนำโซลูชันที่มีอยู่แล้วมาประกอบเข้าด้วยกัน
    • สคริปต์ผู้ใช้และโค้ด Python ใน Colab Notebook มีขนาดสั้นและดูแลรักษาง่าย
    • โปรเจกต์นี้เป็นเพียงระบบ CRUD ที่ง่ายที่สุด และไม่มีเหตุผลใดที่ความซับซ้อนจะต้องเพิ่มขึ้นอย่างมาก

1 ความคิดเห็น

 
GN⁺ 2025-01-19
ความคิดเห็นบน Hacker News
  • ในฐานะผู้เล่น BW ชาวเกาหลีและนักวิจัยด้านการรู้จำเสียง ฉันคิดว่าบทความนี้น่าสนใจ เดิมทีทรานสคริปชันภาษาเกาหลีมีข้อผิดพลาดอยู่มาก แต่ LLMs แก้ไขได้อย่างน่าประทับใจ ตัวอย่างเช่น "12 anmadang build" ที่จริงคือ "12 apmadang build" และบิลด์ two-e-cheori ควรถูกถอดความเป็น two-hae-cheori build

    • การป้อนพจนานุกรมคำสแลงเข้าไปในกระบวนการอนุมานของ Whisper โดยตรงอาจช่วยได้ วิธีที่ง่ายที่สุดคือเพิ่มความน่าจะเป็นของคำสแลงในพจนานุกรมด้วยอัตราคงที่ในเลเยอร์ทำนายสุดท้าย สามารถทำได้ง่ายโดยใช้ไลบรารีของ HuggingFace
  • อย่าให้ชื่อเรื่องหลอกคุณ บทความนี้เป็นแนวทางที่ละเอียดและสร้างสรรค์มากในการแปลคำบรรยาย StarCraft และทำให้เข้าถึงได้มากขึ้น

    • คำบรรยายเกมได้กลายเป็นภาษาที่เฉพาะโดเมนมาตลอด 27 ปี
    • แนวทางที่ใช้สคริปต์อัตโนมัติและ AI เพื่อทำความเข้าใจคร่าว ๆ และทำให้สม่ำเสมอนั้นเจ๋งมาก
  • ในฐานะผู้ใช้ที่ไม่ได้ใช้ภาษาอังกฤษเป็นหลัก ระหว่างอ่านบทความนี้ฉันนึกถึงความยากของการแปลบทความคอมพิวเตอร์และงานแปลด้านการพัฒนาซอฟต์แวร์

    • มีคำศัพท์มากมายที่แปลได้ยาก ทางออกเดียวคือรับเอาคำเหล่านั้นมาใช้ให้เข้ากับภาษา
    • เวลาพูดเรื่องการพัฒนาซอฟต์แวร์เป็นภาษาสเปน ก็มีคำที่ยืมมาจากภาษาอังกฤษจำนวนมาก
    • ฉันสงสัยว่าการแปลอัตโนมัติจะจัดการเรื่องนี้อย่างไร และในเชิงสังคมก็ดูเหมือนต้องมีการผสมสองภาษาเข้าด้วยกัน
  • ฉันเข้าใจเวอร์ชัน Google Translate ได้ดี เพราะคุ้นเคยกับ BW และโอเพนเนอร์ zerg 12hatch

    • ChatGPT และ Claude แปลข้อความภาษาเกาหลีได้ยอดเยี่ยมมาก
    • ตัวอย่างคำแปลของ Claude: อธิบายบิลด์ 12 hatchery และลำดับบิลด์สำหรับ Protoss กับ Terran
  • น่าขำที่บทความเกี่ยวกับการแปลกลับเข้าใจอัตราส่วนสัญญาณต่อสัญญาณรบกวนตรงกันข้ามทั้งหมด จริง ๆ แล้วอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่สูงเป็นเรื่องดี

  • สามารถใช้ yt-dlp ดาวน์โหลดวิดีโอคุณภาพต่ำเพื่อประหยัดแบนด์วิดท์ได้

    • ตัวอย่างคำสั่ง: yt-dlp -f "bv[height<=720]" <url>
  • ในฐานะคนที่เคยเล่น donmaep ตอนเด็ก ฉันสงสัยว่าตัวเลขหน้าอาคารหมายถึงอะไร

    • ดูเหมือนว่าตัวเลขอย่าง 12 hatchery จะบอกตำแหน่งในลำดับบิลด์
  • แม้ Google Translate จะดีขึ้นแล้ว แต่ก็ยังแปลข้อความภาษาจีนหรือญี่ปุ่นเกี่ยวกับเกม Go ได้ไม่ค่อยมีประสิทธิภาพ

    • สามารถใช้ LLMs สมัยใหม่โดยขอให้แปลพร้อมรวมคำศัพท์เฉพาะของ Go ได้
  • ฉันชอบบทความนี้มาก ตอนที่ลองเล่นรายการคัดเลือกระดับภูมิภาคของ World Cyber Games ในอเมริกา ฉันตกใจว่าคนอื่นเร็วกันขนาดไหน

    • จากนั้นได้ดูไลฟ์สตรีมจากเกาหลีและประทับใจกับความเร็วของพวกเขา
    • ทำให้ตระหนักว่าฉันพลาดเรื่องพื้นฐานจากมุมมองเชิงกลยุทธ์ไปมาก
  • การแปล "natural expansion" เป็น "courtyard" แม้จะ "ผิด" แต่ฉันกลับชอบมัน