5 คะแนน โดย GN⁺ 2025-01-30 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • OpenAI เปิดเผยกับ Financial Times ว่าได้พบหลักฐานที่บ่งชี้ว่า DeepSeek สตาร์ทอัป AI จากจีน ใช้โมเดลกรรมสิทธิ์ของ OpenAI เพื่อฝึกสอนโมเดลคู่แข่งแบบโอเพนซอร์ส
  • มีข้อสงสัยว่า DeepSeek ใช้เทคนิค "การกลั่นความรู้ (distillation)" ซึ่งเป็นวิธีนำเอาผลลัพธ์จากโมเดลขนาดใหญ่มาใช้ฝึกโมเดลขนาดเล็กให้มีประสิทธิภาพได้อย่างมีประสิทธิผล
  • แม้ distillation จะเป็นแนวทางที่พบได้ทั่วไปในอุตสาหกรรม AI แต่ OpenAI อ้างว่าการที่ DeepSeek ใช้วิธีนี้เพื่อพัฒนาโมเดลของตนเองถือเป็นการละเมิดข้อกำหนดการให้บริการของบริษัท
  • ตามข้อกำหนดของ OpenAI ผู้ใช้ไม่สามารถคัดลอกผลลัพธ์ของ OpenAI หรือนำไปใช้พัฒนาโมเดลคู่แข่งได้

ประสิทธิภาพของโมเดล DeepSeek และปฏิกิริยาของตลาด

  • การเปิดตัวโมเดลใช้เหตุผล R1 ของ DeepSeek สร้างความประหลาดใจให้ทั้งวงการเทคโนโลยีและนักลงทุน
  • DeepSeek กำลังได้รับความสนใจจากอุตสาหกรรมจากการสร้างโมเดลประสิทธิภาพสูงด้วยต้นทุนที่ค่อนข้างต่ำ
  • หุ้นของ Nvidia ร่วงลง 17% ในวันจันทร์ ทำให้มูลค่าตลาดหายไปราว 589,000 ล้านดอลลาร์ แต่ดีดกลับ 9% ในวันอังคาร
  • สาเหตุของการปรับลงของ Nvidia มาจากความกังวลว่าอุปสงค์ต่อฮาร์ดแวร์ AI อาจลดลง

การตอบสนองของ OpenAI และ Microsoft

  • เมื่อปีที่แล้ว OpenAI และ Microsoft ได้ตรวจสอบและระงับบัญชีที่สงสัยว่า DeepSeek ใช้ API ของ OpenAI เพื่อพยายามทำ distillation
  • Bloomberg เป็นสื่อแรกที่รายงานเรื่องนี้
  • Microsoft ปฏิเสธที่จะแสดงความเห็นในประเด็นนี้ และ OpenAI ก็ปฏิเสธที่จะให้ความเห็นเพิ่มเติม

ความเห็นจากผู้เชี่ยวชาญ

  • David Sacks อดีตผู้รับผิดชอบด้าน AI และคริปโตในรัฐบาล Trump อ้างว่า "อาจมีการขโมยทรัพย์สินทางปัญญาเกิดขึ้น"
  • นักวิจัย AI บางส่วนวิเคราะห์ว่าโมเดลของ DeepSeek มีร่องรอยที่บ่งชี้ว่าเรียนรู้จากผลลัพธ์ของ GPT-4
  • Ritwik Gupta นักศึกษาปริญญาเอกด้าน AI แห่ง UC Berkeley อธิบายว่าการนำผลลัพธ์จาก LLM เชิงพาณิชย์มาใช้ฝึกโมเดลเป็นแนวปฏิบัติที่พบได้ทั่วไปในอุตสาหกรรม AI

การตอบสนองของ OpenAI และแนวโน้มในอนาคต

  • OpenAI เตือนว่าหลายบริษัท รวมถึงในจีน กำลังพยายามทำ distillation จากโมเดลของบริษัท AI สหรัฐฯ
  • บริษัทเน้นย้ำว่ากำลังตัดสินใจอย่างระมัดระวังเกี่ยวกับการเปิดเผยความสามารถล้ำสมัยของโมเดลเพื่อปกป้องทรัพย์สินทางปัญญา และการร่วมมือกับรัฐบาลสหรัฐฯ เพื่อป้องกันการรั่วไหลของเทคโนโลยีเป็นสิ่งสำคัญ
  • อย่างไรก็ตาม OpenAI เองก็เผชิญข้อถกเถียงด้านลิขสิทธิ์เช่นกัน โดยถูกฟ้องร้องจากสำนักข่าวและผู้ถือลิขสิทธิ์ รวมถึง The New York Times ในข้อหาใช้ข้อมูลโดยไม่ได้รับอนุญาต

2 ความคิดเห็น

 
botplaysdice 2025-02-01

OpenAI กำลังมีคดีความกับ The New York Times อยู่ แบบนี้ DeepSeek ก็จะไม่ต้องกังวลเรื่องคดีนั้นแล้วหรือครับ? :)

 
GN⁺ 2025-01-30
ความเห็นจาก Hacker News
  • มีข้อโต้แย้งว่าการที่ DeepSeek ใช้ข้อมูลของ OpenAI มาฝึกนั้นไม่ยุติธรรม แต่ข้อกล่าวหานี้ก็ไม่เหมาะสมนักเมื่อพิจารณาว่า OpenAI เองก็เก็บข้อมูลจากอินเทอร์เน็ตมาฝึกเช่นกัน

    • การอ้างว่า DeepSeek สร้างประสิทธิภาพระดับ o1 ขึ้นมาใหม่ได้ตั้งแต่ต้นอาจไม่เป็นความจริง และทำให้เกิดข้อสงสัยเรื่องประสิทธิภาพของการฝึก
    • งานวิจัย R1 ของ DeepSeek แสดงให้เห็นว่าการ distillation ทรงพลังมาก และหาก DeepSeek ใช้เอาต์พุตของ o1 มาฝึกโมเดล ก็อาจทำให้เกิดคำถามเรื่องประสิทธิภาพของการฝึกได้
  • มีความเห็นว่าการเปิดซอร์สและเผยแพร่ภายใต้ไลเซนส์ MIT ของ DeepSeek จะเป็นโอกาสดึงดูดบุคลากรชั้นยอดจำนวนมาก

    • การทำเทคโนโลยีใหม่ให้เป็นโอเพนซอร์ส ในอดีตก็เป็นสิ่งที่ผลักดันความก้าวหน้ามาโดยตลอด
    • OpenAI กำลังร่วมมือกับรัฐบาลสหรัฐฯ เพื่อปกป้องทรัพย์สินทางปัญญา และมีความเป็นไปได้ที่ DeepSeek อาจถูกแบนแบบเดียวกับ TikTok
  • r1 ถูกสร้างขึ้นในโลกหลัง o1 และอยู่ในสถานการณ์ที่โมเดลอื่นสามารถนำ r1 ไปทำ distillation ได้

    • มีความเห็นว่าการทำ distillation จาก o1 ไม่ได้ทำให้ข้ออ้างเรื่องต้นทุนของ DeepSeek อ่อนลง
    • มีคำถามว่า OpenAI มีความเหนือกว่าทางศีลธรรมหรือจริยธรรมจริงหรือไม่
  • หาก DeepSeek ได้รับการฝึกจาก OpenAI ก็แปลว่าไม่ได้ถูกฝึกจากศูนย์ด้วยต้นทุนแบบ "pennies on the dollar" และอาจไม่ใช่ความก้าวหน้าทางเทคนิค

    • แต่ตอนนี้ยังไม่ได้รับการยืนยันว่าเป็นความจริงหรือไม่
  • ขณะนี้ OpenAI อยู่ในจุดที่เสียเปรียบ และไม่มีทรัพยากรทางกฎหมายแบบที่ Google หรือ Microsoft มี

    • มีความเห็นว่ากลยุทธ์ของ OpenAI ที่ใช้ปัญหากฎหมายเพื่อกดคู่แข่งจะไม่ได้ผลนัก
  • เช่นเดียวกับอุตสาหกรรมรถไฟ AI ก็อาจมีการแข่งขันที่ช่วยลดต้นทุน และการลงทุนส่วนใหญ่อาจไม่สร้างความมั่งคั่งมหาศาล

    • บริษัทใหญ่ด้าน AI อย่าง Nvidia, OpenAI, DeepSeek และรายอื่น ๆ อาจลงทุนใน AI แต่ก็อาจไม่สามารถสร้างกำไรที่แท้จริงได้
  • มีการวิจารณ์ว่า OpenAI ใช้คอนเทนต์โดยไม่ได้รับอนุญาต และใช้เงินจำนวนมากเพื่อหลบเลี่ยงสคริปต์ดักจับ AI

    • หาก DeepSeek เพียงนำข้อมูลของ OpenAI มาใช้ซ้ำ ก็มีความเห็นว่านี่ไม่ใช่ความก้าวหน้าด้านวิศวกรรม
  • โมเดลของ OpenAI ถูกฝึกจากอีบุ๊กจำนวนมากที่รวบรวมมาจาก private ebook torrent tracker

    • อีบุ๊กเหล่านั้นถูกแปลงและจัดระเบียบให้อยู่ในรูปแบบ epub แล้วโฮสต์ไว้ในคลังข้อมูลสาธารณะ