13 คะแนน โดย skytin1004 2024-11-01 | 4 ความคิดเห็น | แชร์ทาง WhatsApp

👀 หลายคนน่าจะเคยเจอกันมาบ้างว่าการแปลและจัดการโปรเจกต์ให้รองรับหลายภาษานั้นยุ่งยากแค่ไหน โดยเฉพาะเมื่อมีเอกสาร Markdown ที่ต้องแปลจำนวนมาก หรือแม้แต่รูปภาพภายในโปรเจกต์ที่ต้องแปลด้วย ก็ยิ่งซับซ้อนมากขึ้น

✅เพื่อแก้ปัญหาความยุ่งยากนี้ จึงได้พัฒนาโอเพนซอร์สที่ใช้ Azure AI services และเทคโนโลยี LLM รุ่นล่าสุด เพื่อให้สามารถจัดการหลายภาษาของโปรเจกต์ได้ด้วยคำสั่งเพียงบรรทัดเดียว

✅ Co-op Translator เป็นแพ็กเกจ Python ที่ใช้ Azure OpenAI และ Azure Computer Vision ในการแปลไฟล์ Markdown และข้อความในรูปภาพเป็นหลายภาษาโดยอัตโนมัติ พร้อมจัดเก็บไว้ในโฟลเดอร์แปลที่กำหนดไว้ เป็นโปรแกรมที่ช่วยให้แปลไฟล์เอกสารทั้งหมดในโปรเจกต์ได้ด้วยคำสั่งเพียงบรรทัดเดียว จึงจัดการการรองรับหลายภาษาได้อย่างมีประสิทธิภาพ

✅ ฟีเจอร์และจุดเด่นหลัก:

การแปลอัตโนมัติ: ทำการแปลหลายภาษาได้อย่างง่ายดาย

คงรูปแบบ Markdown: รักษารูปแบบ Markdown ต้นฉบับไว้ระหว่างการแปล

แปลข้อความในรูปภาพ: แปลข้อความที่อยู่ในรูปภาพ บันทึกผล และแทนที่ลิงก์ที่แนบในฉบับแปล Markdown ด้วยลิงก์ที่แปลแล้ว

รองรับหลายภาษา: แปลได้ราว 40 ภาษา รวมถึงภาษาเกาหลี

ผสานรวมได้ง่าย: รวมเข้ากับโปรเจกต์ได้ง่ายเพื่อเพิ่มการรองรับหลายภาษาอย่างรวดเร็ว

✅ ใน README ของ Co-op Translator มีคำอธิบายและคู่มืออย่างละเอียดสำหรับการรองรับหลายภาษา ลองเข้าไปดูได้ที่!

: https://github.com/Azure/co-op-translator

✅ ขณะนี้โปรเจกต์โอเพนซอร์สอย่างเป็นทางการของ Microsoft คือ Phi-3 Cookbook ก็กำลังใช้ Co-op Translator ในการจัดการหลายภาษาอยู่เช่นกัน หากอยากดูตัวอย่างการจัดการงานแปลหลายภาษาด้วย Co-op Translator ก็ลองเข้าไปดูได้เช่นกัน!
: https://github.com/microsoft/Phi-3CookBook

หากได้ลองใช้งานแล้วมีฟีเจอร์ที่อยากให้เพิ่ม หรือมีข้อสงสัยใด ๆ ฝากไว้ได้ทาง GitHub issue หรือคอมเมนต์ ขอบคุณครับ!

4 ความคิดเห็น

 
jwseo 2024-11-01

นึกว่าเป็นรีโพส่วนตัว ที่แท้เป็นของทางการจาก Azure เหรอ??

 
skytin1004 2024-11-01

ใช่ครับ 😊 ถ้าจะเล่าเรื่องราวสักนิด...

ตอนแรกผมทำหน้าที่เป็นผู้มีส่วนร่วมในโปรเจกต์โอเพนซอร์ส Phi-3 CookBook ของ Microsoft และได้เสนอให้จัดทำฉบับแปลภาษาเกาหลีขึ้นมา ซึ่งพอดีกับที่ผมได้ยินจากพนักงานของ MS ท่านนั้นว่า ในโครงการสนับสนุนของ Microsoft University กำลังมีโปรเจกต์ระบบอัตโนมัติสำหรับการแปลหลายภาษาอยู่

โชคดีที่ผมได้เชื่อมต่อกับทีมนั้นและเข้าไปตรวจสอบดู จึงพบว่านักศึกษาจาก Imperial College ในสหราชอาณาจักรได้พัฒนาฟังก์ชันเริ่มต้นและ POC (การพิสูจน์แนวคิด) เอาไว้แล้ว แต่โครงสร้างยังค่อนข้างซับซ้อนเกินกว่าจะนำไปทำเป็นเชิงพาณิชย์ได้

ดังนั้น โดยอิงจาก POC (การพิสูจน์แนวคิด) นี้ ผมจึงออกแบบใหม่ให้เป็น Python โอเพนซอร์สที่พร้อมต่อยอดเชิงพาณิชย์ และได้พัฒนาฟีเจอร์ที่จำเป็นต่าง ๆ เพิ่มเติม หลังจากนั้นโปรเจกต์นี้ก็ถูกเปลี่ยนให้เป็น Azure โอเพนซอร์สอย่างเป็นทางการ และตอนนี้ผมก็ดูแลโปรเจกต์นี้ในฐานะเมนเทนเนอร์หลักอยู่ครับ!

ขอบคุณที่อ่านข้อความยาว ๆ นี้นะครับ ต่อจากนี้ไปผมจะค่อย ๆ ปรับปรุงฟีเจอร์ให้ดียิ่งขึ้น เพื่อให้ผู้คนจำนวนมากขึ้นใช้งานได้อย่างสะดวกครับ

 
cosine20 2024-11-01

เป็นโปรเจกต์ที่ดีมากเลยครับ! ขอบคุณที่แชร์ :)

แต่อีกหน่อยถ้าทำให้ฝั่งการแปลสามารถสลับไปใช้บริการแปลอื่นได้ง่าย ก็น่าจะยิ่งดีมากขึ้นครับ ไม่ได้เกลียด Azure นะครับ เพียงแต่โปรเจกต์นี้มีประโยชน์และนำไปใช้ได้กว้างมาก แต่เพราะบริการฝั่งแบ็กเอนด์ยังพึ่งพา Azure อยู่ เลยค่อนข้างน่าเสียดายที่นอกจากจะใช้กันภายใน MS หรือในบริษัทที่มีสัญญากับ Azure อยู่แล้ว คนที่อยากลองใช้จริง ๆ อาจมีไม่มากนัก

 
skytin1004 2024-11-01

สวัสดีครับ ขอบคุณมากสำหรับข้อเสนอแนะดี ๆ! 😊

ผมคิดว่าเป็นข้อเสนอที่ดีมากจริง ๆ ตอนนี้โปรเจกต์ถูกพัฒนาบนพื้นฐานของบริการ Azure แต่ตามที่คุณบอกไว้ หากนำโครงสร้างที่สามารถสลับไปใช้บริการแปลอื่นได้อย่างง่ายดายมาใช้ เพื่อให้ผู้คนใช้งานได้อย่างอิสระมากขึ้น ก็น่าจะช่วยเพิ่มคุณค่าของโปรเจกต์ได้อีกมาก

ผมจะนำข้อเสนอแนะนี้ไปคิดพิจารณาอย่างต่อเนื่อง ขอบคุณที่แจ้งให้ทราบครับ!