Dodari เครื่องมือแปล AI เกาหลี-อังกฤษ/อังกฤษ-เกาหลี
(github.com/vEduardovich)สามารถแปลภาษาเกาหลี-อังกฤษและอังกฤษ-เกาหลีด้วย AI ได้บนคอมพิวเตอร์ของคุณเองโดยไม่มีข้อจำกัด
- คุณภาพดีกว่าการแปลด้วยเครื่องแบบทั่วไป
- รองรับการแปลไฟล์ txt และ epub
- ส่งออกเป็น 2 ไฟล์ คือไฟล์ต้นฉบับ(ข้อความแปล)และไฟล์ข้อความแปล ทำให้สามารถเทียบกับต้นฉบับได้ทันทีหากผลแปลดูผิดปกติ
- ใช้งานง่ายมาก เพียงลากไฟล์ที่ต้องการแปลแล้วคลิกปุ่มเริ่มแปล ระบบจะจัดการแปลเกาหลี↔อังกฤษให้โดยอัตโนมัติ
- สามารถเปลี่ยนไปใช้โมเดล AI อื่นได้ ปัจจุบันใช้ NHNDQ ซึ่งคุ้มค่าด้านประสิทธิภาพต่อราคา
14 ความคิดเห็น
สวัสดีครับ/ค่ะ คือว่าระหว่างการติดตั้งฉัน/ผมปิด cmd ไป แต่หลังจากนั้นแม้จะลบโฟลเดอร์แล้วติดตั้งใหม่ การติดตั้งก็ไม่ดำเนินการเลยครับ/ค่ะ,,, มีวิธีแก้ไหมครับ/คะ T_T
แน่นอนครับ ต้องแก้ไขให้ได้
แต่ก่อนอื่นต้องทราบสถานะก่อนว่ามันใช้งานไม่ได้อย่างไร
https://github.com/vEduardovich/dodari/issues
ใน GitHub ของ Dodari ข้างต้น กรุณากดปุ่ม new issues เพื่อสร้าง issue ใหม่
ช่วยอธิบายเพิ่มเติมได้ไหมครับว่ามันใช้งานไม่ได้อย่างไร พร้อมแนบภาพหน้าจอหรือบอกรายละเอียดของสถานการณ์ให้ชัดเจนขึ้นอีกนิด
ผมจะแก้ไขให้ได้แน่นอน
ว้าว ยอดเยี่ยมมากครับ
ตอนนี้ผมใช้ DeepL อยู่เหมือนกัน แต่จะลองเทียบกันไปพร้อมกับค่อย ๆ ตรวจดูนะครับ
โดยเฉพาะอยากรีบลองเอาข้อความวรรณกรรมภาษาอังกฤษมาเทียบดูครับ
ประเด็นที่คุณพูดมาคือส่วนที่ตอนนี้ผมรู้สึกเสียดายมากที่สุดพอดีครับ
ตอนนี้โมเดลที่ใช้อยู่ใน Dodari คือโมเดล NHNDQ ซึ่งเป็นโมเดลแปลหลายภาษารองรับ 200 ภาษาชื่อ facebook-nllb ที่นำมาปรับจูนแบบ fine-tuning ให้เฉพาะทางกับภาษาเกาหลี แต่แม้ว่ามันจะดีกว่า Google Translate ก็ยังด้อยกว่า deepL มากครับ
เพื่อแก้ปัญหานี้ ผมเลยทดสอบหลายโมเดล แล้วก็ลองรันโมเดล yanolja-eeve ที่เรียกกันว่าเป็นระดับ 0-tier สำหรับภาษาเกาหลี ผลออกมาดีจนน่าตกใจครับ ในความรู้สึกของผม มันน่าจะได้ราว 80~90% ของ deepL เลย
แต่ถ้าจะใช้โมเดลนี้ เครื่องของผู้ใช้ต้องมี VRAM อย่างน้อย 23 ขึ้นไป อีกทั้งความเร็วในการแปลจะช้าลงหลายสิบเท่า จึงต้องใช้เทคโนโลยี vllm เพื่อเร่งความเร็ว ซึ่งถึงแม้จะช่วยให้เร็วขึ้นได้มากพอสมควร แต่ก็จำเป็นต้องใช้ Linux OS ด้วย สุดท้ายก็เลยมีแค่ 'นักพัฒนาที่ใช้ 4090 และ Linux OS' เท่านั้นที่พอจะลองรันโมเดลของ Yanolja ได้
นี่คือส่วนที่ผมกำลังกังวลอยู่ตอนนี้ครับ น่าเสียดายจริงๆ
ต้องอธิบายมากกว่านี้อีกจำเป็นไหม?
โมเดลแม่ของ NHNDQ คือ
facebook-nllbซึ่งเป็นโมเดลแปลหลายภาษาที่รองรับ 200 ภาษาเพราะแบบนั้น บางครั้งมันเลยแปลออกมาเป็นภาษาต่างดาว
ดูเหมือนว่าพวกเขาตั้งชื่อผลิตภัณฑ์ตามชื่อเล่น
โดดอรีของตัวเอกในเหตุการณ์ Freegate เพราะคุณภาพการแปลภาษาเกาหลียังมีส่วนที่ด้อยอยู่นิดหน่อย ดังนั้นจึงเลี่ยงไม่ได้ที่จะต้องพูดถึงความผิดพลาดในการใช้โปรแกรมแปลสุดฉาวโฉ่จากเหตุการณ์นั้นอย่าง “必要韓紙”จำเป็นไหม? มีประวัติอันน่าเศร้าแบบนี้ด้วย..
ดูเหมือนจะมีเหตุการณ์ที่ซับซ้อนอะไรบางอย่างเกิดขึ้นนะครับ อ่านแล้วยังไม่ค่อยเข้าใจเท่าไร T_T
ชื่อว่า Dodari ตั้งขึ้นจากการคุยกับโมเดล mixtral-7bx8
ตอนแรก AI แนะนำชื่อว่า "Eoneodari" แต่ผมรู้สึกว่าต้องการภาพที่ชัดเจนและวาดออกมาได้ง่าย เลยลองถามเล่น ๆ ว่า "Dodari" เป็นยังไงบ้าง เพราะตัวผมเองก็คิดว่ามันดูหลุด ๆ เหมือนกัน
แต่ AI ตอบว่าชื่อ Dodari ดีมาก เพราะมีความหมายว่า "สะพานที่คอยช่วยเหลือ" เป็นการตีความที่ผมไม่เคยนึกถึงมาก่อน เลยรู้สึกว่าแปลกใหม่ดี ชื่อนี้เลยกลายมาเป็น Dodari
เป็นเหตุการณ์ที่ค่อนข้างเก่าแล้ว แต่ในตอนนั้นก็ถือเป็นเหตุการณ์ที่ดังพอสมควรในคอมมูนิตี้อินเทอร์เน็ตของเกาหลี
สรุปคร่าว ๆ ได้ดังนี้
โดดอรีโพสต์ประกาศว่าจะเปิดสั่งซื้อรวม CD เพลงญี่ปุ่นลิมิเต็ดในราคา 70,000 วอนโดดอรีก็ไล่เขาออกจากคาเฟ่ ทำให้เรื่องยิ่งบานปลายโดดอรีเอามาเผยแพร่โดยอ้างว่าเป็นอีเมลที่คุยกับบริษัทญี่ปุ่น มีการพบข้อผิดพลาดจากการใช้เครื่องแปลแบบน่าอึ้ง เช่น “必要韓紙” ทำให้เรื่องนี้เริ่มโด่งดังไปถึงคนนอกด้วยโดดอรีเป็นคนที่มีอาการพูดเกินจริงอย่างหนัก และเรื่องราวเกี่ยวกับตัวเองส่วนใหญ่ที่เขาโพสต์บนอินเทอร์เน็ตก็เต็มไปด้วยการโอ้อวดและคำโกหกที่ไม่น่าเป็นไปได้ว่าแต่บางครั้งโมเดลภาษาขนาดใหญ่ก็ตีความอะไรออกมาแบบที่คาดไม่ถึงเหมือนกัน และในบางครั้งมันก็ดูสมเหตุสมผล ซึ่งผมเองก็เคยเจออยู่บ้าง
ดูเหมือนว่าปรากฏการณ์ที่เวลาเราคุยกับคนอื่นแล้วถูกชี้ให้เห็นมุมที่ตัวเองนึกไม่ถึง ตอนนี้เรากำลังได้สัมผัสมันผ่านการคุยกับเครื่องจักรด้วยเหมือนกัน
ให้ตายสิ แต่ดูเหมือนคงไม่ได้ถูกจับไปนะ
ส่วนตัวแล้วรู้สึกว่า chatGPT เนี้ยบเกินไปเลยไม่ค่อยสนุก แต่ Mixtral น่าจะเพราะไม่มีการเซ็นเซอร์ เลยทำให้บทสนทนาน่าสนใจมาก
ตามเนื้อหาในวิกิบอกว่าเคยถูกฟ้องร้องด้วย แต่เหมือนว่าจะอ้อนวอนขอความเมตตาจนได้รับการผ่อนปรนเลยปล่อยผ่านไป ตอนที่ถูกฟ้องนั้นเขามีสถานะเป็นเจ้าหน้าที่บริการสาธารณะทางเลือก
ส่วนผมด้วยข้อจำกัดด้านประสิทธิภาพของ PC ส่วนตัวยังไม่เคยลองใช้ local LLM ด้วยตัวเองเลย ตอนนี้ใช้แค่ประมาณ GPT-4 เท่านั้น แต่ก็กำลังคิดอยู่ว่าจะสมัคร Claude-3 เพิ่มดีไหมครับ
ตั้งแต่การรันโมเดล Huggingface การตั้งค่า venv ไปจนถึงการพัฒนาเว็บเซอร์วิส เป็นตัวอย่างที่สมบูรณ์มากจึงมีประโยชน์มากครับ ขอบคุณที่แบ่งปัน
ดีใจมากที่มันพอจะเป็นประโยชน์ได้ ขอบคุณเช่นกันครับ