OpenAI เผยว่าพบหลักฐานว่า DeepSeek ใช้โมเดลของบริษัทไปฝึกสอนโมเดลของตน

(ft.com)

5 คะแนน โดย GN⁺ 2025-01-30 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

OpenAI เปิดเผยกับ Financial Times ว่าได้พบหลักฐานที่บ่งชี้ว่า DeepSeek สตาร์ทอัป AI จากจีน ใช้โมเดลกรรมสิทธิ์ของ OpenAI เพื่อฝึกสอนโมเดลคู่แข่งแบบโอเพนซอร์ส
มีข้อสงสัยว่า DeepSeek ใช้เทคนิค "การกลั่นความรู้ (distillation)" ซึ่งเป็นวิธีนำเอาผลลัพธ์จากโมเดลขนาดใหญ่มาใช้ฝึกโมเดลขนาดเล็กให้มีประสิทธิภาพได้อย่างมีประสิทธิผล
แม้ distillation จะเป็นแนวทางที่พบได้ทั่วไปในอุตสาหกรรม AI แต่ OpenAI อ้างว่าการที่ DeepSeek ใช้วิธีนี้เพื่อพัฒนาโมเดลของตนเองถือเป็นการละเมิดข้อกำหนดการให้บริการของบริษัท
ตามข้อกำหนดของ OpenAI ผู้ใช้ไม่สามารถคัดลอกผลลัพธ์ของ OpenAI หรือนำไปใช้พัฒนาโมเดลคู่แข่งได้

ประสิทธิภาพของโมเดล DeepSeek และปฏิกิริยาของตลาด

การเปิดตัวโมเดลใช้เหตุผล R1 ของ DeepSeek สร้างความประหลาดใจให้ทั้งวงการเทคโนโลยีและนักลงทุน
DeepSeek กำลังได้รับความสนใจจากอุตสาหกรรมจากการสร้างโมเดลประสิทธิภาพสูงด้วยต้นทุนที่ค่อนข้างต่ำ
หุ้นของ Nvidia ร่วงลง 17% ในวันจันทร์ ทำให้มูลค่าตลาดหายไปราว 589,000 ล้านดอลลาร์ แต่ดีดกลับ 9% ในวันอังคาร
สาเหตุของการปรับลงของ Nvidia มาจากความกังวลว่าอุปสงค์ต่อฮาร์ดแวร์ AI อาจลดลง

การตอบสนองของ OpenAI และ Microsoft

เมื่อปีที่แล้ว OpenAI และ Microsoft ได้ตรวจสอบและระงับบัญชีที่สงสัยว่า DeepSeek ใช้ API ของ OpenAI เพื่อพยายามทำ distillation
Bloomberg เป็นสื่อแรกที่รายงานเรื่องนี้
Microsoft ปฏิเสธที่จะแสดงความเห็นในประเด็นนี้ และ OpenAI ก็ปฏิเสธที่จะให้ความเห็นเพิ่มเติม

ความเห็นจากผู้เชี่ยวชาญ

David Sacks อดีตผู้รับผิดชอบด้าน AI และคริปโตในรัฐบาล Trump อ้างว่า "อาจมีการขโมยทรัพย์สินทางปัญญาเกิดขึ้น"
นักวิจัย AI บางส่วนวิเคราะห์ว่าโมเดลของ DeepSeek มีร่องรอยที่บ่งชี้ว่าเรียนรู้จากผลลัพธ์ของ GPT-4
Ritwik Gupta นักศึกษาปริญญาเอกด้าน AI แห่ง UC Berkeley อธิบายว่าการนำผลลัพธ์จาก LLM เชิงพาณิชย์มาใช้ฝึกโมเดลเป็นแนวปฏิบัติที่พบได้ทั่วไปในอุตสาหกรรม AI

การตอบสนองของ OpenAI และแนวโน้มในอนาคต

OpenAI เตือนว่าหลายบริษัท รวมถึงในจีน กำลังพยายามทำ distillation จากโมเดลของบริษัท AI สหรัฐฯ
บริษัทเน้นย้ำว่ากำลังตัดสินใจอย่างระมัดระวังเกี่ยวกับการเปิดเผยความสามารถล้ำสมัยของโมเดลเพื่อปกป้องทรัพย์สินทางปัญญา และการร่วมมือกับรัฐบาลสหรัฐฯ เพื่อป้องกันการรั่วไหลของเทคโนโลยีเป็นสิ่งสำคัญ
อย่างไรก็ตาม OpenAI เองก็เผชิญข้อถกเถียงด้านลิขสิทธิ์เช่นกัน โดยถูกฟ้องร้องจากสำนักข่าวและผู้ถือลิขสิทธิ์ รวมถึง The New York Times ในข้อหาใช้ข้อมูลโดยไม่ได้รับอนุญาต

2 ความคิดเห็น

botplaysdice 2025-02-01

OpenAI กำลังมีคดีความกับ The New York Times อยู่ แบบนี้ DeepSeek ก็จะไม่ต้องกังวลเรื่องคดีนั้นแล้วหรือครับ? :)

GN⁺ 2025-01-30

ความเห็นจาก Hacker News

มีข้อโต้แย้งว่าการที่ DeepSeek ใช้ข้อมูลของ OpenAI มาฝึกนั้นไม่ยุติธรรม แต่ข้อกล่าวหานี้ก็ไม่เหมาะสมนักเมื่อพิจารณาว่า OpenAI เองก็เก็บข้อมูลจากอินเทอร์เน็ตมาฝึกเช่นกัน
- การอ้างว่า DeepSeek สร้างประสิทธิภาพระดับ o1 ขึ้นมาใหม่ได้ตั้งแต่ต้นอาจไม่เป็นความจริง และทำให้เกิดข้อสงสัยเรื่องประสิทธิภาพของการฝึก
- งานวิจัย R1 ของ DeepSeek แสดงให้เห็นว่าการ distillation ทรงพลังมาก และหาก DeepSeek ใช้เอาต์พุตของ o1 มาฝึกโมเดล ก็อาจทำให้เกิดคำถามเรื่องประสิทธิภาพของการฝึกได้
มีความเห็นว่าการเปิดซอร์สและเผยแพร่ภายใต้ไลเซนส์ MIT ของ DeepSeek จะเป็นโอกาสดึงดูดบุคลากรชั้นยอดจำนวนมาก
- การทำเทคโนโลยีใหม่ให้เป็นโอเพนซอร์ส ในอดีตก็เป็นสิ่งที่ผลักดันความก้าวหน้ามาโดยตลอด
- OpenAI กำลังร่วมมือกับรัฐบาลสหรัฐฯ เพื่อปกป้องทรัพย์สินทางปัญญา และมีความเป็นไปได้ที่ DeepSeek อาจถูกแบนแบบเดียวกับ TikTok
r1 ถูกสร้างขึ้นในโลกหลัง o1 และอยู่ในสถานการณ์ที่โมเดลอื่นสามารถนำ r1 ไปทำ distillation ได้
- มีความเห็นว่าการทำ distillation จาก o1 ไม่ได้ทำให้ข้ออ้างเรื่องต้นทุนของ DeepSeek อ่อนลง
- มีคำถามว่า OpenAI มีความเหนือกว่าทางศีลธรรมหรือจริยธรรมจริงหรือไม่
หาก DeepSeek ได้รับการฝึกจาก OpenAI ก็แปลว่าไม่ได้ถูกฝึกจากศูนย์ด้วยต้นทุนแบบ "pennies on the dollar" และอาจไม่ใช่ความก้าวหน้าทางเทคนิค
- แต่ตอนนี้ยังไม่ได้รับการยืนยันว่าเป็นความจริงหรือไม่
ขณะนี้ OpenAI อยู่ในจุดที่เสียเปรียบ และไม่มีทรัพยากรทางกฎหมายแบบที่ Google หรือ Microsoft มี
- มีความเห็นว่ากลยุทธ์ของ OpenAI ที่ใช้ปัญหากฎหมายเพื่อกดคู่แข่งจะไม่ได้ผลนัก
เช่นเดียวกับอุตสาหกรรมรถไฟ AI ก็อาจมีการแข่งขันที่ช่วยลดต้นทุน และการลงทุนส่วนใหญ่อาจไม่สร้างความมั่งคั่งมหาศาล
- บริษัทใหญ่ด้าน AI อย่าง Nvidia, OpenAI, DeepSeek และรายอื่น ๆ อาจลงทุนใน AI แต่ก็อาจไม่สามารถสร้างกำไรที่แท้จริงได้
มีการวิจารณ์ว่า OpenAI ใช้คอนเทนต์โดยไม่ได้รับอนุญาต และใช้เงินจำนวนมากเพื่อหลบเลี่ยงสคริปต์ดักจับ AI
- หาก DeepSeek เพียงนำข้อมูลของ OpenAI มาใช้ซ้ำ ก็มีความเห็นว่านี่ไม่ใช่ความก้าวหน้าด้านวิศวกรรม
โมเดลของ OpenAI ถูกฝึกจากอีบุ๊กจำนวนมากที่รวบรวมมาจาก private ebook torrent tracker
- อีบุ๊กเหล่านั้นถูกแปลงและจัดระเบียบให้อยู่ในรูปแบบ epub แล้วโฮสต์ไว้ในคลังข้อมูลสาธารณะ