3 คะแนน โดย GN⁺ 2023-12-28 | 2 ความคิดเห็น | แชร์ทาง WhatsApp
  • The New York Times ฟ้อง OpenAI และ Microsoft ในข้อหาละเมิดลิขสิทธิ์
  • อ้างว่าบริษัทเหล่านี้คัดลอกบทความหลายล้านชิ้นของ The New York Times เพื่อนำไปฝึกโมเดลภาษาที่ขับเคลื่อน ChatGPT และ Copilot
  • ส่งผลให้ความสัมพันธ์ของ The New York Times กับผู้อ่านเสียหาย และทำให้รายได้จากการสมัครสมาชิก การให้สิทธิ์ใช้งาน โฆษณา และพันธมิตรลดลง

ประเด็นที่ระบุในคำฟ้อง

  • ตามคำฟ้อง โมเดล AI เหล่านี้อ้างอิงเนื้อหาของ The New York Times แบบคำต่อคำ หรือสรุปและเลียนแบบรูปแบบการเขียน จนคุกคามงานวารสารศาสตร์คุณภาพสูง
  • The New York Times ระบุว่าพยายามเจรจามาหลายเดือนแล้ว แต่ไม่สามารถหาทางออกได้
  • โฆษกของ OpenAI ระบุว่ากำลังพยายามทำให้ผู้สร้างคอนเทนต์ได้รับประโยชน์จากเทคโนโลยี AI และโมเดลรายได้รูปแบบใหม่

ข่าวที่เกี่ยวข้อง

  • The New York Times บล็อกเว็บครอว์เลอร์ของ OpenAI เพื่อป้องกันไม่ให้เก็บข้อมูลจากเว็บไซต์ต่อไป
  • สื่อข่าวอื่น ๆ เช่น BBC, CNN และ Reuters ก็ได้บล็อกเว็บครอว์เลอร์ของ OpenAI เช่นกัน
  • ในทางกลับกัน Axel Springer ได้ทำข้อตกลงกับ OpenAI เพื่อให้ ChatGPT สามารถใช้ข้อมูลจาก Politico และ Business Insider ได้โดยตรง

ความเห็นของ GN⁺

  • กรณีนี้สะท้อนประเด็นร่วมสมัยที่การพัฒนาเทคโนโลยี AI ปะทะกับปัญหาลิขสิทธิ์
  • คดีละเมิดลิขสิทธิ์นี้อาจจุดประเด็นถกเถียงทางกฎหมายและจริยธรรมครั้งสำคัญว่า AI ควรใช้ผลงานสร้างสรรค์ของมนุษย์อย่างไร
  • การที่สำนักข่าวขนาดใหญ่อย่าง The New York Times ลุกขึ้นมาต่อกรกับบริษัท AI อาจเป็นจุดเปลี่ยนสำคัญต่ออนาคตของเทคโนโลยี AI และการคุ้มครองสิทธิของผู้สร้างคอนเทนต์

2 ความคิดเห็น

 
xguru 2023-12-29

บทความอื่น ระบุว่า เนื้อหาในคำฟ้องเรียกร้องให้ลบ GPT ทุกอินสแตนซ์ที่ฝึกด้วยข้อมูลของ The New York Times และทำลายชุดข้อมูลที่ใช้ในการฝึกดังกล่าว นอกจากนี้ยังขอให้มีคำสั่งห้ามถาวรเพื่อป้องกันไม่ให้เกิดการกระทำลักษณะเดียวกันในอนาคตด้วย
ยิ่งไปกว่านั้น ยังมีส่วนที่เรียกค่าเสียหายเป็นจำนวนมหาศาลด้วย: "ค่าเสียหายตามกฎหมาย ค่าเสียหายเชิงชดเชย การชดใช้ ค่าเสียหายเชิงลงโทษ และการเยียวยาอื่นใดทั้งหมดที่กฎหมายหรือหลักความเป็นธรรมอาจอนุญาต"

 
GN⁺ 2023-12-28
ความคิดเห็นจาก Hacker News
  • ฝั่งที่สนับสนุน The New York Times (NYT)

    • ดูเหมือนว่าองค์กรสร้างสรรค์ต่าง ๆ กำลังตามหลังในการแข่งขันอีกครั้ง เช่นเดียวกับตอนที่เสิร์ชเอนจินสมัยใหม่ถือกำเนิดขึ้น
    • ไม่ได้ตำหนิการตัดสินใจของ OpenAI ในช่วงแรกที่ฝึกโมเดลโดยไม่มีข้อตกลงลิขสิทธิ์ เพราะหากไม่ทำเช่นนั้น การปฏิวัติ AI อาจไม่เกิดขึ้นเลยก็ได้
    • แต่ตอนนี้ OpenAI ควรยอมรับว่าตนติดค้างต่อผู้สร้างคอนเทนต์และแก้ไขให้ถูกต้อง มิฉะนั้นอาจสูญเสียมากขึ้นและเปิดโอกาสให้คู่แข่ง
  • ความรู้สึกที่ซับซ้อนต่อ LLM ที่นำคอนเทนต์มีลิขสิทธิ์ไปใช้และสร้างใหม่เป็นสิ่งใหม่

    • ในฐานะนักพัฒนาซอฟต์แวร์และนักเขียน การพัฒนาของ LLM นั้นน่าตื่นเต้น แต่ก็ยังกังวลที่ผลงานเขียนถูก LLM นำไปใช้
    • ปัจจุบัน LLM คล้ายกับเว็บไซต์คุณภาพต่ำที่นำคอนเทนต์มาเขียนใหม่โดยไม่มีงานค้นคว้าต้นฉบับ ซึ่งแม้ในเชิงเทคนิคอาจถูกกฎหมาย แต่เป็นพฤติกรรมแบบ寄生ที่ไม่ได้เพิ่มคุณค่า
    • สำหรับผู้เชี่ยวชาญ ความผิดพลาดและการขาดการอ้างอิงของ LLM เป็นปัญหา ส่วนคนทั่วไปก็น่าจะใช้ LLM สร้างคอนเทนต์ใช้ความพยายามต่ำเพื่อ SEO ซึ่งอาจนำไปสู่คุณภาพของ LLM ที่ถดถอยลง
  • หวังให้มีการขยายขอบเขต fair use สำหรับการฝึก AI

    • fair use สำหรับการฝึก AI สำคัญต่ออนาคตของมนุษยชาติมากกว่าสื่อรายเดียว
    • ต่อให้ NYT หายไป ก็ยังมีสื่ออื่นทดแทนได้มากมาย แต่หาก AI เสียหายตั้งแต่ระยะแรกเพราะข้อพิพาทด้านทรัพย์สินทางปัญญา (IP) ก็อาจขัดขวางความก้าวหน้าที่สำคัญ
  • ข้อกล่าวหาเรื่องการเลียนแบบสไตล์ของ The New York Times ที่ค่อนข้างอ่อน และมุมมองเชิงลบต่อ OpenAI

    • การปล่อยเนื้อหาของ The New York Times ออกมาตรง ๆ เป็นผลเสียต่อ OpenAI
    • การลบคอนเทนต์บางประเภทออกจาก LLM เป็นเรื่องยาก ซึ่งบ่งชี้ว่าอายุการใช้งานของ LLM อาจสั้น
  • การสกัดกั้น LLM โดยอ้างอิงการละเมิดลิขสิทธิ์ไม่ได้ส่งเสริมความก้าวหน้าของวิทยาศาสตร์และศิลปะที่เป็นประโยชน์

    • LLM จำเป็นต้องมีการกำกับดูแล แต่ควรเป็นการกำกับดูแลในรูปแบบอื่น ไม่ใช่ผ่านลิขสิทธิ์
    • แนวคิดแบบเปิดของ OpenAI ในช่วงแรกนั้นดี แต่ตอนนี้จำเป็นต้องมีการแทรกแซงจากสาธารณะ
  • วิจารณ์การที่บริษัทหนึ่งผูกขาดผลผลิตทั้งหมดของมนุษย์

    • การกระทำเช่นนี้ อย่างน้อยก็ถือว่าหน้าด้านและผิด และอาจถึงขั้นน่าอับอาย
    • OpenAI มีผู้เสียหายมากเกินไปจนการฟ้องร้องแทบเป็นไปไม่ได้ จึงมีแนวโน้มว่าศาลจะตัดสินล่วงหน้าว่าจะไม่ชดเชยให้ผู้เสียหาย
  • การเข้าถึงคอนเทนต์ที่เผยแพร่สู่สาธารณะบนอินเทอร์เน็ตอย่างเสรี และความชอบธรรมของการที่เครื่องจักรนำข้อมูลไปใช้

    • คอนเทนต์ที่มนุษย์เข้าถึงได้ เครื่องจักรก็ควรเข้าถึงได้เช่นกัน
    • เครื่องจักรสามารถทำงานแทนสิ่งที่มนุษย์ทำได้ เพื่อให้มนุษย์มีเวลาไปทำสิ่งที่น่าสนใจกว่า
  • พฤติกรรมแบบ寄生ของ LLM และการเปรียบเทียบกับ patent troll

    • LLM ใช้ประโยชน์จากรูปแบบภาษาของคลังข้อความที่ผู้สร้างไม่ได้ใช้งาน เพื่อนำมาใช้ฝึก
    • สิ่งนี้ไม่ได้เป็นประโยชน์ต่อสังคม และมีแต่ให้ประโยชน์กับพวก troll เท่านั้น ศาลไม่มีเหตุผลที่จะต้องบังคับสิ่งนี้
  • การกล่าวถึงคดีที่ The New York Times ฟ้อง OpenAI และ Microsoft

    • The New York Times อ้างว่าทั้งสองบริษัทคัดลอกและนำบทความของตนไปใช้หลายล้านชิ้นเพื่อสร้างโมเดล AI