40 คะแนน โดย tominam2 2024-04-13 | 14 ความคิดเห็น | แชร์ทาง WhatsApp

สามารถแปลภาษาเกาหลี-อังกฤษและอังกฤษ-เกาหลีด้วย AI ได้บนคอมพิวเตอร์ของคุณเองโดยไม่มีข้อจำกัด

  1. คุณภาพดีกว่าการแปลด้วยเครื่องแบบทั่วไป
  2. รองรับการแปลไฟล์ txt และ epub
  3. ส่งออกเป็น 2 ไฟล์ คือไฟล์ต้นฉบับ(ข้อความแปล)และไฟล์ข้อความแปล ทำให้สามารถเทียบกับต้นฉบับได้ทันทีหากผลแปลดูผิดปกติ
  4. ใช้งานง่ายมาก เพียงลากไฟล์ที่ต้องการแปลแล้วคลิกปุ่มเริ่มแปล ระบบจะจัดการแปลเกาหลี↔อังกฤษให้โดยอัตโนมัติ
  5. สามารถเปลี่ยนไปใช้โมเดล AI อื่นได้ ปัจจุบันใช้ NHNDQ ซึ่งคุ้มค่าด้านประสิทธิภาพต่อราคา

14 ความคิดเห็น

 
upkit2 2024-04-16

สวัสดีครับ/ค่ะ คือว่าระหว่างการติดตั้งฉัน/ผมปิด cmd ไป แต่หลังจากนั้นแม้จะลบโฟลเดอร์แล้วติดตั้งใหม่ การติดตั้งก็ไม่ดำเนินการเลยครับ/ค่ะ,,, มีวิธีแก้ไหมครับ/คะ T_T

 
tominam2 2024-04-17

แน่นอนครับ ต้องแก้ไขให้ได้
แต่ก่อนอื่นต้องทราบสถานะก่อนว่ามันใช้งานไม่ได้อย่างไร

https://github.com/vEduardovich/dodari/issues
ใน GitHub ของ Dodari ข้างต้น กรุณากดปุ่ม new issues เพื่อสร้าง issue ใหม่

ช่วยอธิบายเพิ่มเติมได้ไหมครับว่ามันใช้งานไม่ได้อย่างไร พร้อมแนบภาพหน้าจอหรือบอกรายละเอียดของสถานการณ์ให้ชัดเจนขึ้นอีกนิด
ผมจะแก้ไขให้ได้แน่นอน

 
illuza 2024-04-15

ว้าว ยอดเยี่ยมมากครับ
ตอนนี้ผมใช้ DeepL อยู่เหมือนกัน แต่จะลองเทียบกันไปพร้อมกับค่อย ๆ ตรวจดูนะครับ
โดยเฉพาะอยากรีบลองเอาข้อความวรรณกรรมภาษาอังกฤษมาเทียบดูครับ

 
tominam2 2024-04-15

ประเด็นที่คุณพูดมาคือส่วนที่ตอนนี้ผมรู้สึกเสียดายมากที่สุดพอดีครับ
ตอนนี้โมเดลที่ใช้อยู่ใน Dodari คือโมเดล NHNDQ ซึ่งเป็นโมเดลแปลหลายภาษารองรับ 200 ภาษาชื่อ facebook-nllb ที่นำมาปรับจูนแบบ fine-tuning ให้เฉพาะทางกับภาษาเกาหลี แต่แม้ว่ามันจะดีกว่า Google Translate ก็ยังด้อยกว่า deepL มากครับ

เพื่อแก้ปัญหานี้ ผมเลยทดสอบหลายโมเดล แล้วก็ลองรันโมเดล yanolja-eeve ที่เรียกกันว่าเป็นระดับ 0-tier สำหรับภาษาเกาหลี ผลออกมาดีจนน่าตกใจครับ ในความรู้สึกของผม มันน่าจะได้ราว 80~90% ของ deepL เลย

แต่ถ้าจะใช้โมเดลนี้ เครื่องของผู้ใช้ต้องมี VRAM อย่างน้อย 23 ขึ้นไป อีกทั้งความเร็วในการแปลจะช้าลงหลายสิบเท่า จึงต้องใช้เทคโนโลยี vllm เพื่อเร่งความเร็ว ซึ่งถึงแม้จะช่วยให้เร็วขึ้นได้มากพอสมควร แต่ก็จำเป็นต้องใช้ Linux OS ด้วย สุดท้ายก็เลยมีแค่ 'นักพัฒนาที่ใช้ 4090 และ Linux OS' เท่านั้นที่พอจะลองรันโมเดลของ Yanolja ได้

นี่คือส่วนที่ผมกำลังกังวลอยู่ตอนนี้ครับ น่าเสียดายจริงๆ

 
kunggom 2024-04-15

ต้องอธิบายมากกว่านี้อีกจำเป็นไหม?

 
tominam2 2024-04-15

โมเดลแม่ของ NHNDQ คือ facebook-nllb ซึ่งเป็นโมเดลแปลหลายภาษาที่รองรับ 200 ภาษา
เพราะแบบนั้น บางครั้งมันเลยแปลออกมาเป็นภาษาต่างดาว

 
kunggom 2024-04-15

ดูเหมือนว่าพวกเขาตั้งชื่อผลิตภัณฑ์ตามชื่อเล่น โดดอรี ของตัวเอกในเหตุการณ์ Freegate เพราะคุณภาพการแปลภาษาเกาหลียังมีส่วนที่ด้อยอยู่นิดหน่อย ดังนั้นจึงเลี่ยงไม่ได้ที่จะต้องพูดถึงความผิดพลาดในการใช้โปรแกรมแปลสุดฉาวโฉ่จากเหตุการณ์นั้นอย่าง “必要韓紙

 
roxie 2025-06-14

จำเป็นไหม? มีประวัติอันน่าเศร้าแบบนี้ด้วย..

 
tominam2 2024-04-15

ดูเหมือนจะมีเหตุการณ์ที่ซับซ้อนอะไรบางอย่างเกิดขึ้นนะครับ อ่านแล้วยังไม่ค่อยเข้าใจเท่าไร T_T

ชื่อว่า Dodari ตั้งขึ้นจากการคุยกับโมเดล mixtral-7bx8
ตอนแรก AI แนะนำชื่อว่า "Eoneodari" แต่ผมรู้สึกว่าต้องการภาพที่ชัดเจนและวาดออกมาได้ง่าย เลยลองถามเล่น ๆ ว่า "Dodari" เป็นยังไงบ้าง เพราะตัวผมเองก็คิดว่ามันดูหลุด ๆ เหมือนกัน

แต่ AI ตอบว่าชื่อ Dodari ดีมาก เพราะมีความหมายว่า "สะพานที่คอยช่วยเหลือ" เป็นการตีความที่ผมไม่เคยนึกถึงมาก่อน เลยรู้สึกว่าแปลกใหม่ดี ชื่อนี้เลยกลายมาเป็น Dodari

 
kunggom 2024-04-15

เป็นเหตุการณ์ที่ค่อนข้างเก่าแล้ว แต่ในตอนนั้นก็ถือเป็นเหตุการณ์ที่ดังพอสมควรในคอมมูนิตี้อินเทอร์เน็ตของเกาหลี
สรุปคร่าว ๆ ได้ดังนี้

  1. แอดมินของคาเฟ่ Naver แห่งหนึ่งชื่อ โดดอรี โพสต์ประกาศว่าจะเปิดสั่งซื้อรวม CD เพลงญี่ปุ่นลิมิเต็ดในราคา 70,000 วอน
  2. หลังจากนั้นมีการโพสต์รายชื่อผู้เข้าร่วมสั่งซื้อรอบแรก แต่ชื่อและที่อยู่ดูแปลก ๆ จนคนเริ่มสงสัย
  3. สมาชิกคาเฟ่คนหนึ่งเปิดเผยว่า CD แผ่นนั้นไม่ได้เป็นลิมิเต็ดเอดิชัน แถมราคาก็อยู่แค่ช่วง 30,000 วอนเท่านั้น พอเขาทักท้วง โดดอรี ก็ไล่เขาออกจากคาเฟ่ ทำให้เรื่องยิ่งบานปลาย
  4. ในอีเมลที่ โดดอรี เอามาเผยแพร่โดยอ้างว่าเป็นอีเมลที่คุยกับบริษัทญี่ปุ่น มีการพบข้อผิดพลาดจากการใช้เครื่องแปลแบบน่าอึ้ง เช่น “必要韓紙” ทำให้เรื่องนี้เริ่มโด่งดังไปถึงคนนอกด้วย
  5. หลังจากนั้นสิ่งที่ถูกเปิดเผยก็คือ โดดอรี เป็นคนที่มีอาการพูดเกินจริงอย่างหนัก และเรื่องราวเกี่ยวกับตัวเองส่วนใหญ่ที่เขาโพสต์บนอินเทอร์เน็ตก็เต็มไปด้วยการโอ้อวดและคำโกหกที่ไม่น่าเป็นไปได้

ว่าแต่บางครั้งโมเดลภาษาขนาดใหญ่ก็ตีความอะไรออกมาแบบที่คาดไม่ถึงเหมือนกัน และในบางครั้งมันก็ดูสมเหตุสมผล ซึ่งผมเองก็เคยเจออยู่บ้าง
ดูเหมือนว่าปรากฏการณ์ที่เวลาเราคุยกับคนอื่นแล้วถูกชี้ให้เห็นมุมที่ตัวเองนึกไม่ถึง ตอนนี้เรากำลังได้สัมผัสมันผ่านการคุยกับเครื่องจักรด้วยเหมือนกัน

 
tominam2 2024-04-15

ให้ตายสิ แต่ดูเหมือนคงไม่ได้ถูกจับไปนะ

ส่วนตัวแล้วรู้สึกว่า chatGPT เนี้ยบเกินไปเลยไม่ค่อยสนุก แต่ Mixtral น่าจะเพราะไม่มีการเซ็นเซอร์ เลยทำให้บทสนทนาน่าสนใจมาก

 
kunggom 2024-04-15

ตามเนื้อหาในวิกิบอกว่าเคยถูกฟ้องร้องด้วย แต่เหมือนว่าจะอ้อนวอนขอความเมตตาจนได้รับการผ่อนปรนเลยปล่อยผ่านไป ตอนที่ถูกฟ้องนั้นเขามีสถานะเป็นเจ้าหน้าที่บริการสาธารณะทางเลือก

ส่วนผมด้วยข้อจำกัดด้านประสิทธิภาพของ PC ส่วนตัวยังไม่เคยลองใช้ local LLM ด้วยตัวเองเลย ตอนนี้ใช้แค่ประมาณ GPT-4 เท่านั้น แต่ก็กำลังคิดอยู่ว่าจะสมัคร Claude-3 เพิ่มดีไหมครับ

 
savvykang 2024-04-14

ตั้งแต่การรันโมเดล Huggingface การตั้งค่า venv ไปจนถึงการพัฒนาเว็บเซอร์วิส เป็นตัวอย่างที่สมบูรณ์มากจึงมีประโยชน์มากครับ ขอบคุณที่แบ่งปัน

 
tominam2 2024-04-14

ดีใจมากที่มันพอจะเป็นประโยชน์ได้ ขอบคุณเช่นกันครับ