- OpenAI เปิดเผยกับ Financial Times ว่าได้พบหลักฐานที่บ่งชี้ว่า DeepSeek สตาร์ทอัป AI จากจีน ใช้โมเดลกรรมสิทธิ์ของ OpenAI เพื่อฝึกสอนโมเดลคู่แข่งแบบโอเพนซอร์ส
- มีข้อสงสัยว่า DeepSeek ใช้เทคนิค "การกลั่นความรู้ (distillation)" ซึ่งเป็นวิธีนำเอาผลลัพธ์จากโมเดลขนาดใหญ่มาใช้ฝึกโมเดลขนาดเล็กให้มีประสิทธิภาพได้อย่างมีประสิทธิผล
- แม้ distillation จะเป็นแนวทางที่พบได้ทั่วไปในอุตสาหกรรม AI แต่ OpenAI อ้างว่าการที่ DeepSeek ใช้วิธีนี้เพื่อพัฒนาโมเดลของตนเองถือเป็นการละเมิดข้อกำหนดการให้บริการของบริษัท
- ตามข้อกำหนดของ OpenAI ผู้ใช้ไม่สามารถคัดลอกผลลัพธ์ของ OpenAI หรือนำไปใช้พัฒนาโมเดลคู่แข่งได้
ประสิทธิภาพของโมเดล DeepSeek และปฏิกิริยาของตลาด
- การเปิดตัวโมเดลใช้เหตุผล R1 ของ DeepSeek สร้างความประหลาดใจให้ทั้งวงการเทคโนโลยีและนักลงทุน
- DeepSeek กำลังได้รับความสนใจจากอุตสาหกรรมจากการสร้างโมเดลประสิทธิภาพสูงด้วยต้นทุนที่ค่อนข้างต่ำ
- หุ้นของ Nvidia ร่วงลง 17% ในวันจันทร์ ทำให้มูลค่าตลาดหายไปราว 589,000 ล้านดอลลาร์ แต่ดีดกลับ 9% ในวันอังคาร
- สาเหตุของการปรับลงของ Nvidia มาจากความกังวลว่าอุปสงค์ต่อฮาร์ดแวร์ AI อาจลดลง
การตอบสนองของ OpenAI และ Microsoft
- เมื่อปีที่แล้ว OpenAI และ Microsoft ได้ตรวจสอบและระงับบัญชีที่สงสัยว่า DeepSeek ใช้ API ของ OpenAI เพื่อพยายามทำ distillation
- Bloomberg เป็นสื่อแรกที่รายงานเรื่องนี้
- Microsoft ปฏิเสธที่จะแสดงความเห็นในประเด็นนี้ และ OpenAI ก็ปฏิเสธที่จะให้ความเห็นเพิ่มเติม
ความเห็นจากผู้เชี่ยวชาญ
- David Sacks อดีตผู้รับผิดชอบด้าน AI และคริปโตในรัฐบาล Trump อ้างว่า "อาจมีการขโมยทรัพย์สินทางปัญญาเกิดขึ้น"
- นักวิจัย AI บางส่วนวิเคราะห์ว่าโมเดลของ DeepSeek มีร่องรอยที่บ่งชี้ว่าเรียนรู้จากผลลัพธ์ของ GPT-4
- Ritwik Gupta นักศึกษาปริญญาเอกด้าน AI แห่ง UC Berkeley อธิบายว่าการนำผลลัพธ์จาก LLM เชิงพาณิชย์มาใช้ฝึกโมเดลเป็นแนวปฏิบัติที่พบได้ทั่วไปในอุตสาหกรรม AI
การตอบสนองของ OpenAI และแนวโน้มในอนาคต
- OpenAI เตือนว่าหลายบริษัท รวมถึงในจีน กำลังพยายามทำ distillation จากโมเดลของบริษัท AI สหรัฐฯ
- บริษัทเน้นย้ำว่ากำลังตัดสินใจอย่างระมัดระวังเกี่ยวกับการเปิดเผยความสามารถล้ำสมัยของโมเดลเพื่อปกป้องทรัพย์สินทางปัญญา และการร่วมมือกับรัฐบาลสหรัฐฯ เพื่อป้องกันการรั่วไหลของเทคโนโลยีเป็นสิ่งสำคัญ
- อย่างไรก็ตาม OpenAI เองก็เผชิญข้อถกเถียงด้านลิขสิทธิ์เช่นกัน โดยถูกฟ้องร้องจากสำนักข่าวและผู้ถือลิขสิทธิ์ รวมถึง The New York Times ในข้อหาใช้ข้อมูลโดยไม่ได้รับอนุญาต
2 ความคิดเห็น
OpenAI กำลังมีคดีความกับ The New York Times อยู่ แบบนี้ DeepSeek ก็จะไม่ต้องกังวลเรื่องคดีนั้นแล้วหรือครับ? :)
ความเห็นจาก Hacker News
มีข้อโต้แย้งว่าการที่ DeepSeek ใช้ข้อมูลของ OpenAI มาฝึกนั้นไม่ยุติธรรม แต่ข้อกล่าวหานี้ก็ไม่เหมาะสมนักเมื่อพิจารณาว่า OpenAI เองก็เก็บข้อมูลจากอินเทอร์เน็ตมาฝึกเช่นกัน
มีความเห็นว่าการเปิดซอร์สและเผยแพร่ภายใต้ไลเซนส์ MIT ของ DeepSeek จะเป็นโอกาสดึงดูดบุคลากรชั้นยอดจำนวนมาก
r1 ถูกสร้างขึ้นในโลกหลัง o1 และอยู่ในสถานการณ์ที่โมเดลอื่นสามารถนำ r1 ไปทำ distillation ได้
หาก DeepSeek ได้รับการฝึกจาก OpenAI ก็แปลว่าไม่ได้ถูกฝึกจากศูนย์ด้วยต้นทุนแบบ "pennies on the dollar" และอาจไม่ใช่ความก้าวหน้าทางเทคนิค
ขณะนี้ OpenAI อยู่ในจุดที่เสียเปรียบ และไม่มีทรัพยากรทางกฎหมายแบบที่ Google หรือ Microsoft มี
เช่นเดียวกับอุตสาหกรรมรถไฟ AI ก็อาจมีการแข่งขันที่ช่วยลดต้นทุน และการลงทุนส่วนใหญ่อาจไม่สร้างความมั่งคั่งมหาศาล
มีการวิจารณ์ว่า OpenAI ใช้คอนเทนต์โดยไม่ได้รับอนุญาต และใช้เงินจำนวนมากเพื่อหลบเลี่ยงสคริปต์ดักจับ AI
โมเดลของ OpenAI ถูกฝึกจากอีบุ๊กจำนวนมากที่รวบรวมมาจาก private ebook torrent tracker