1 คะแนน โดย GN⁺ 2023-12-29 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

New York Times ยื่นฟ้อง OpenAI ในคดีลิขสิทธิ์

  • New York Times ยื่นฟ้อง OpenAI และ Microsoft ซึ่งเป็นพาร์ตเนอร์ ในข้อหาละเมิดลิขสิทธิ์
  • มีการยกหลักฐานว่า ระบบที่พัฒนาบน GPT ของ OpenAI สามารถทำซ้ำบทความของ New York Times ได้
  • หลังการเจรจาไม่คืบหน้า New York Times จึงตัดสินใจฟ้อง OpenAI ในประเด็นเรื่องไลเซนส์

วารสารศาสตร์มีต้นทุนสูง

  • New York Times มีค่าใช้จ่ายสูงในการทำข่าวเชิงสืบสวนสำคัญผ่านผู้สื่อข่าวในหลากหลายสาขา
  • หนังสือพิมพ์สร้างรายได้ผ่านเพย์วอลล์ที่เข้มงวด และจำกัดการใช้ผลงานผ่านประกาศลิขสิทธิ์และเงื่อนไขการใช้งาน
  • คำฟ้องระบุว่าเครื่องมือที่ OpenAI พัฒนาขึ้นกำลังบั่นทอนวิธีสร้างรายได้เหล่านี้

ไม่ใช่แค่การฝึกโมเดล

  • มีการยื่นฟ้องหลายคดีเกี่ยวกับการใช้เนื้อหาที่มีลิขสิทธิ์เพื่อฝึกระบบ AI
  • คดีของ New York Times แสดงให้เห็นว่า เนื้อหาที่ถูกดูดซึมระหว่างการฝึกสามารถกลับมาปรากฏอีกครั้งระหว่างการใช้งานได้อย่างไร
  • คำฟ้องยกตัวอย่างกรณีที่ GPT-4 ทำซ้ำบทความของ New York Times ได้แทบจะเหมือนต้นฉบับ

ความเสียหายต่อชื่อเสียงและอื่น ๆ

  • คำฟ้องชี้ว่า 'ภาพหลอน' ของ AI อาจสร้างความเสียหายต่อชื่อเสียงของ New York Times และส่งผลลบต่อสุขภาพของผู้คน
  • แม้แต่บทความของ Wirecutter ซึ่ง New York Times เป็นเจ้าของ ก็มีการนำเนื้อหาที่มีลิขสิทธิ์ไปใช้โดยไม่ได้รับอนุญาต และลิงก์สร้างรายได้ถูกลบออก
  • คดีนี้กล่าวหา OpenAI และ Microsoft ในข้อหาละเมิดลิขสิทธิ์ ฝ่าฝืน DMCA และละเมิดเครื่องหมายการค้า เป็นต้น

ความเห็นของ GN⁺:

  • บทความนี้สะท้อนให้เห็นอย่างชัดเจนถึงปัญหาที่เกิดขึ้นเมื่อความก้าวหน้าของเทคโนโลยี AI ปะทะกับกรอบกฎหมายเดิม เช่น ลิขสิทธิ์
  • ความตึงเครียดระหว่างเจ้าของลิขสิทธิ์กับผู้พัฒนา AI อาจจุดชนวนให้เกิดการถกเถียงด้านกฎหมายและจริยธรรมที่สำคัญต่ออนาคตของ AI
  • การที่สื่อหลักอย่าง New York Times ดำเนินมาตรการทางกฎหมายกับเทคโนโลยี AI อาจกลายเป็นบรรทัดฐานสำคัญในการกำหนดกฎระเบียบและแนวทางต่อวิธีการสร้างและเผยแพร่คอนเทนต์ของ AI

1 ความคิดเห็น

 
GN⁺ 2023-12-29
ความคิดเห็นจาก Hacker News
  • คำถามว่าการนำบทความของ The New York Times (NYT) ไปสแครปเพื่อสร้างผลิตภัณฑ์เข้าข่าย fair use หรือไม่

    • มีการตั้งคำถามว่าการนำบทความ NYT ที่สแครปมาอย่างถูกกฎหมายไปสร้างผลิตภัณฑ์ จากนั้นสรุปและเรียบเรียงใหม่เพื่อนำไปให้บริการแบบเสียเงินนั้นเข้าข่าย fair use หรือไม่
    • มีการพูดถึงความแตกต่างจากเสิร์ชเอนจิน โดยชี้ว่าเสิร์ชเอนจินไม่ได้มาแทนที่ต้นฉบับ แต่ให้การอ้างอิง ในขณะที่ผลิตภัณฑ์สรุปข่าวอาจถูกใช้แทนการสมัครสมาชิก NYT ได้
  • มุมมองต่อคดีลิขสิทธิ์ของ NYT

    • มีความเห็นว่า LLM (โมเดลภาษาขนาดใหญ่) รุ่นถัดไปจะถูกฝึกด้วยข้อมูล "สังเคราะห์" ที่ไม่มีลิขสิทธิ์เท่านั้น และจะไม่มีปัญหาการละเมิดลิขสิทธิ์
    • มีความเห็นว่าสหรัฐฯ ไม่อาจหยุดความก้าวหน้าทางเทคโนโลยีลักษณะนี้ได้ และประเทศอื่นจะก้าวนำไปก่อน
    • มีการเสนอว่าด้วยวิวัฒนาการที่ซับซ้อนของโมเดล AI และความไม่ชัดเจนของแหล่งที่มาของข้อมูล ทำให้กฎหมายลิขสิทธิ์ตามเรื่องนี้ไม่ทันได้ยาก
  • การประเมินกรณีที่ ChatGPT/Bing Copilot คัดลอกงานของ NYT

    • มีความเห็นว่ากรณีที่ ChatGPT และ Bing Copilot คัดลอกบทความของ NYT แบบตรงตัวนั้นไม่น่าเข้าข่าย fair use
    • คดีนี้ไม่ได้กล่าวถึงแค่การคัดลอกโดยตรงเท่านั้น แต่ยังอ้างว่าการคัดลอกบทความโดยไม่ได้รับอนุญาตเพื่อนำไปฝึก LLM ก็เป็นการละเมิดลิขสิทธิ์ด้วย
    • มีความเห็นว่าควรโฟกัสที่ประเด็นทางกฎหมายว่าโมเดลสามารถถือเป็น "งานดัดแปลงเชิงแปรรูป" ได้หรือไม่
  • ความกังวลเรื่อง "fair use" ที่ถูกหยิบยกขึ้นมาในคดี

    • มีการแสดงความกังวลถึงความเสี่ยงที่บริษัทเพียงไม่กี่แห่งจะผูกขาดคุณค่าของอินเทอร์เน็ต
    • มีความเห็นว่าอยากให้ศาลช่วยกำหนดกติกาในด้านนี้
  • ลิงก์เอกสารคดีลิขสิทธิ์ของ NYT และสรุปเนื้อหา

    • มีการแนบลิงก์เอกสารที่แสดงให้เห็นอย่างชัดเจนถึงกรณีที่ ChatGPT อ้างข้อความจากเนื้อหาที่มีลิขสิทธิ์แบบตรงตัว
    • มีการตั้งคำถามว่าต้องดัดแปลงเนื้อหาที่มีลิขสิทธิ์มากแค่ไหนจึงจะไม่อยู่ภายใต้ลิขสิทธิ์อีกต่อไป
    • มีการถกเถียงว่า OpenAI จะสามารถบล็อกการรั่วไหลของเนื้อหาที่มีลิขสิทธิ์ผ่านเว็บอินเทอร์เฟซได้หรือไม่
  • คำวิจารณ์ต่อมุมมองของนักพัฒนาที่เห็นว่า LLM คล้ายมนุษย์

    • มีการวิจารณ์มุมมองของนักพัฒนาที่เห็นว่า LLM ใช้บทความ NYT เป็นสื่อการเรียนรู้เหมือนมนุษย์
    • มีการชี้ว่าการที่ LLM ซับซ้อน ไม่ได้เปลี่ยนข้อเท็จจริงที่ว่าเนื้อหามีลิขสิทธิ์ถูกผนวกรวมเข้าไปในซอร์สโค้ดแล้ว
  • ความคาดหวังของบริษัทคอนเทนต์ในการสร้างรายได้

    • บริษัทคอนเทนต์รวมถึง NYT คาดหวังค่าธรรมเนียมสำหรับการนำคอนเทนต์ของตนไปใช้ฝึก LLM
    • มีการกล่าวถึงว่า Reddit, Discord, Twitter กำลังพิจารณาหรือได้เริ่มขายคอนเทนต์เพื่อใช้ฝึก AI แล้ว
  • ข้ออ้างทางกฎหมายของ NYT ต่อการใช้ LLM

    • มีการวิเคราะห์ข้ออ้างของ NYT ที่ว่ารูปแบบการนำเนื้อหาไปใช้ในการฝึก LLM เข้าข่ายการละเมิดลิขสิทธิ์
    • มีการเปรียบเทียบระหว่างการวิจารณ์บริษัทใหญ่ที่ขายการเข้าถึง LLM กับท่าทีที่ผ่อนปรนกว่าสำหรับการใช้งานส่วนบุคคลหรือเพื่อการวิจัยทางวิชาการ
  • การคาดการณ์การใช้ LLM ในอนาคต

    • มีความเห็นว่าในอนาคตเมื่อ LLM ถูกผนวกรวมเข้ากับระบบเครื่องจักรที่โต้ตอบกับโลกกายภาพ การอ่านข้อความที่มีลิขสิทธิ์อาจกลายเป็นสิ่งผิดกฎหมาย
    • มีการเสนอว่าหุ่นยนต์อาจถูกทำให้ไม่สามารถจดจำคอนเทนต์ที่มีลิขสิทธิ์ได้ ไม่ว่าจะมาจากการดูทีวี อ่านหนังสือในห้องสมุด หรือค้นหาบนอินเทอร์เน็ต
  • ความเห็นว่า LLM ควรเข้าข่าย fair use ในฐานะ "งานดัดแปลงเชิงแปรรูป"

    • มีความเห็นส่วนตัวว่า LLM ควรเข้าข่าย fair use ในฐานะงานดัดแปลงเชิงแปรรูป
    • มีการแสดงความสนใจว่าระบบกฎหมายจะตัดสินประเด็นนี้อย่างไร