The New York Times ฟ้อง OpenAI และ Microsoft ในข้อหาละเมิดลิขสิทธิ์

(theverge.com)

3 คะแนน โดย GN⁺ 2023-12-28 | 2 ความคิดเห็น | แชร์ทาง WhatsApp

The New York Times ฟ้อง OpenAI และ Microsoft ในข้อหาละเมิดลิขสิทธิ์
อ้างว่าบริษัทเหล่านี้คัดลอกบทความหลายล้านชิ้นของ The New York Times เพื่อนำไปฝึกโมเดลภาษาที่ขับเคลื่อน ChatGPT และ Copilot
ส่งผลให้ความสัมพันธ์ของ The New York Times กับผู้อ่านเสียหาย และทำให้รายได้จากการสมัครสมาชิก การให้สิทธิ์ใช้งาน โฆษณา และพันธมิตรลดลง

ประเด็นที่ระบุในคำฟ้อง

ตามคำฟ้อง โมเดล AI เหล่านี้อ้างอิงเนื้อหาของ The New York Times แบบคำต่อคำ หรือสรุปและเลียนแบบรูปแบบการเขียน จนคุกคามงานวารสารศาสตร์คุณภาพสูง
The New York Times ระบุว่าพยายามเจรจามาหลายเดือนแล้ว แต่ไม่สามารถหาทางออกได้
โฆษกของ OpenAI ระบุว่ากำลังพยายามทำให้ผู้สร้างคอนเทนต์ได้รับประโยชน์จากเทคโนโลยี AI และโมเดลรายได้รูปแบบใหม่

ข่าวที่เกี่ยวข้อง

The New York Times บล็อกเว็บครอว์เลอร์ของ OpenAI เพื่อป้องกันไม่ให้เก็บข้อมูลจากเว็บไซต์ต่อไป
สื่อข่าวอื่น ๆ เช่น BBC, CNN และ Reuters ก็ได้บล็อกเว็บครอว์เลอร์ของ OpenAI เช่นกัน
ในทางกลับกัน Axel Springer ได้ทำข้อตกลงกับ OpenAI เพื่อให้ ChatGPT สามารถใช้ข้อมูลจาก Politico และ Business Insider ได้โดยตรง

ความเห็นของ GN⁺

กรณีนี้สะท้อนประเด็นร่วมสมัยที่การพัฒนาเทคโนโลยี AI ปะทะกับปัญหาลิขสิทธิ์
คดีละเมิดลิขสิทธิ์นี้อาจจุดประเด็นถกเถียงทางกฎหมายและจริยธรรมครั้งสำคัญว่า AI ควรใช้ผลงานสร้างสรรค์ของมนุษย์อย่างไร
การที่สำนักข่าวขนาดใหญ่อย่าง The New York Times ลุกขึ้นมาต่อกรกับบริษัท AI อาจเป็นจุดเปลี่ยนสำคัญต่ออนาคตของเทคโนโลยี AI และการคุ้มครองสิทธิของผู้สร้างคอนเทนต์

2 ความคิดเห็น

xguru 2023-12-29

บทความอื่น ระบุว่า เนื้อหาในคำฟ้องเรียกร้องให้ลบ GPT ทุกอินสแตนซ์ที่ฝึกด้วยข้อมูลของ The New York Times และทำลายชุดข้อมูลที่ใช้ในการฝึกดังกล่าว นอกจากนี้ยังขอให้มีคำสั่งห้ามถาวรเพื่อป้องกันไม่ให้เกิดการกระทำลักษณะเดียวกันในอนาคตด้วย
ยิ่งไปกว่านั้น ยังมีส่วนที่เรียกค่าเสียหายเป็นจำนวนมหาศาลด้วย: "ค่าเสียหายตามกฎหมาย ค่าเสียหายเชิงชดเชย การชดใช้ ค่าเสียหายเชิงลงโทษ และการเยียวยาอื่นใดทั้งหมดที่กฎหมายหรือหลักความเป็นธรรมอาจอนุญาต"

GN⁺ 2023-12-28

ความคิดเห็นจาก Hacker News

ฝั่งที่สนับสนุน The New York Times (NYT)
- ดูเหมือนว่าองค์กรสร้างสรรค์ต่าง ๆ กำลังตามหลังในการแข่งขันอีกครั้ง เช่นเดียวกับตอนที่เสิร์ชเอนจินสมัยใหม่ถือกำเนิดขึ้น
- ไม่ได้ตำหนิการตัดสินใจของ OpenAI ในช่วงแรกที่ฝึกโมเดลโดยไม่มีข้อตกลงลิขสิทธิ์ เพราะหากไม่ทำเช่นนั้น การปฏิวัติ AI อาจไม่เกิดขึ้นเลยก็ได้
- แต่ตอนนี้ OpenAI ควรยอมรับว่าตนติดค้างต่อผู้สร้างคอนเทนต์และแก้ไขให้ถูกต้อง มิฉะนั้นอาจสูญเสียมากขึ้นและเปิดโอกาสให้คู่แข่ง
ความรู้สึกที่ซับซ้อนต่อ LLM ที่นำคอนเทนต์มีลิขสิทธิ์ไปใช้และสร้างใหม่เป็นสิ่งใหม่
- ในฐานะนักพัฒนาซอฟต์แวร์และนักเขียน การพัฒนาของ LLM นั้นน่าตื่นเต้น แต่ก็ยังกังวลที่ผลงานเขียนถูก LLM นำไปใช้
- ปัจจุบัน LLM คล้ายกับเว็บไซต์คุณภาพต่ำที่นำคอนเทนต์มาเขียนใหม่โดยไม่มีงานค้นคว้าต้นฉบับ ซึ่งแม้ในเชิงเทคนิคอาจถูกกฎหมาย แต่เป็นพฤติกรรมแบบ寄生ที่ไม่ได้เพิ่มคุณค่า
- สำหรับผู้เชี่ยวชาญ ความผิดพลาดและการขาดการอ้างอิงของ LLM เป็นปัญหา ส่วนคนทั่วไปก็น่าจะใช้ LLM สร้างคอนเทนต์ใช้ความพยายามต่ำเพื่อ SEO ซึ่งอาจนำไปสู่คุณภาพของ LLM ที่ถดถอยลง
หวังให้มีการขยายขอบเขต fair use สำหรับการฝึก AI
- fair use สำหรับการฝึก AI สำคัญต่ออนาคตของมนุษยชาติมากกว่าสื่อรายเดียว
- ต่อให้ NYT หายไป ก็ยังมีสื่ออื่นทดแทนได้มากมาย แต่หาก AI เสียหายตั้งแต่ระยะแรกเพราะข้อพิพาทด้านทรัพย์สินทางปัญญา (IP) ก็อาจขัดขวางความก้าวหน้าที่สำคัญ
ข้อกล่าวหาเรื่องการเลียนแบบสไตล์ของ The New York Times ที่ค่อนข้างอ่อน และมุมมองเชิงลบต่อ OpenAI
- การปล่อยเนื้อหาของ The New York Times ออกมาตรง ๆ เป็นผลเสียต่อ OpenAI
- การลบคอนเทนต์บางประเภทออกจาก LLM เป็นเรื่องยาก ซึ่งบ่งชี้ว่าอายุการใช้งานของ LLM อาจสั้น
การสกัดกั้น LLM โดยอ้างอิงการละเมิดลิขสิทธิ์ไม่ได้ส่งเสริมความก้าวหน้าของวิทยาศาสตร์และศิลปะที่เป็นประโยชน์
- LLM จำเป็นต้องมีการกำกับดูแล แต่ควรเป็นการกำกับดูแลในรูปแบบอื่น ไม่ใช่ผ่านลิขสิทธิ์
- แนวคิดแบบเปิดของ OpenAI ในช่วงแรกนั้นดี แต่ตอนนี้จำเป็นต้องมีการแทรกแซงจากสาธารณะ
วิจารณ์การที่บริษัทหนึ่งผูกขาดผลผลิตทั้งหมดของมนุษย์
- การกระทำเช่นนี้ อย่างน้อยก็ถือว่าหน้าด้านและผิด และอาจถึงขั้นน่าอับอาย
- OpenAI มีผู้เสียหายมากเกินไปจนการฟ้องร้องแทบเป็นไปไม่ได้ จึงมีแนวโน้มว่าศาลจะตัดสินล่วงหน้าว่าจะไม่ชดเชยให้ผู้เสียหาย
การเข้าถึงคอนเทนต์ที่เผยแพร่สู่สาธารณะบนอินเทอร์เน็ตอย่างเสรี และความชอบธรรมของการที่เครื่องจักรนำข้อมูลไปใช้
- คอนเทนต์ที่มนุษย์เข้าถึงได้ เครื่องจักรก็ควรเข้าถึงได้เช่นกัน
- เครื่องจักรสามารถทำงานแทนสิ่งที่มนุษย์ทำได้ เพื่อให้มนุษย์มีเวลาไปทำสิ่งที่น่าสนใจกว่า
พฤติกรรมแบบ寄生ของ LLM และการเปรียบเทียบกับ patent troll
- LLM ใช้ประโยชน์จากรูปแบบภาษาของคลังข้อความที่ผู้สร้างไม่ได้ใช้งาน เพื่อนำมาใช้ฝึก
- สิ่งนี้ไม่ได้เป็นประโยชน์ต่อสังคม และมีแต่ให้ประโยชน์กับพวก troll เท่านั้น ศาลไม่มีเหตุผลที่จะต้องบังคับสิ่งนี้
การกล่าวถึงคดีที่ The New York Times ฟ้อง OpenAI และ Microsoft
- The New York Times อ้างว่าทั้งสองบริษัทคัดลอกและนำบทความของตนไปใช้หลายล้านชิ้นเพื่อสร้างโมเดล AI