2 คะแนน โดย GN⁺ 2023-12-31 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

แนวโน้มที่มืดมนต่อ AI เชิงสร้างสรรค์

  • ระบบ AI เชิงสร้างสรรค์เรียนรู้จากข้อมูลที่มีลิขสิทธิ์ และอาจสร้างเนื้อหาที่มีความเป็นไปได้ว่าจะละเมิดลิขสิทธิ์
  • OpenAI ไม่ได้มีความโปร่งใสเกี่ยวกับข้อมูลที่ใช้ฝึกระบบของตน
  • ผู้ใช้อาจละเมิดลิขสิทธิ์ได้โดยไม่มีข้อมูลเกี่ยวกับที่มาของภาพที่สร้างขึ้น

ข้อจำกัดของระบบ

  • ระบบอย่าง DALL-E และ ChatGPT โดยเนื้อแท้แล้วเป็น "กล่องดำ" จึงยังขาดความสามารถในการติดตามหรือระบุแหล่งที่มาในปัจจุบัน
  • จนกว่าจะมีการพัฒนาสถาปัตยกรรมใหม่ที่สามารถติดตามแหล่งที่มาได้ การละเมิดลิขสิทธิ์ก็จะยังคงเกิดขึ้นต่อไปโดยไม่ขึ้นกับเจตนาของผู้ใช้

ความเสี่ยงทางกฎหมายและความเสี่ยงทางการเงิน

  • คดีฟ้องร้องของ The New York Times เป็นเพียงคดีแรกในบรรดาคดีจำนวนมากเกี่ยวกับ AI เชิงสร้างสรรค์ และแม้จะยุติลง มูลค่าความเสียหายก็คาดว่าจะสูงกว่าหลายล้านดอลลาร์
  • ไม่ใช่เพียง OpenAI เท่านั้น แต่ Microsoft ซึ่งให้ใช้ DALL-E ผ่าน Bing ก็เผชิญความเสี่ยงทางกฎหมายเช่นกัน

ความเห็นของ GN⁺

  • ความก้าวหน้าของเทคโนโลยี AI เชิงสร้างสรรค์กำลังเพิ่มความเสี่ยงของการละเมิดลิขสิทธิ์ ซึ่งเป็นประเด็นสำคัญที่ก่อให้เกิดความตึงเครียดระหว่างเทคโนโลยีกับกรอบกฎหมาย
  • การที่ผู้ใช้ไม่สามารถรู้ที่มาของคอนเทนต์ที่สร้างขึ้นได้ เป็นปัจจัยสำคัญที่จุดประกายการถกเถียงเรื่องจริยธรรมและความโปร่งใสของ AI
  • บทความนี้นำเสนอมุมมองที่น่าสนใจเกี่ยวกับผลข้างเคียงที่ไม่คาดคิดจากการพัฒนาเทคโนโลยี AI อย่างรวดเร็ว และผลกระทบที่จะมีต่ออุตสาหกรรมที่เกี่ยวข้อง

1 ความคิดเห็น

 
GN⁺ 2023-12-31
ความเห็นจาก Hacker News
  • สรุปความเห็นแรก:

    • เหตุผลหนึ่งที่ Disney ประสบความสำเร็จคือการดัดแปลงเรื่องเล่าที่มีอยู่เดิม เช่น นิทานพื้นบ้านที่ถ่ายทอดกันมาหลายชั่วอายุคน
    • วัฒนธรรมเป็นทรัพย์สินของชุมชน และพัฒนาเติบโตผ่านการเล่าเรื่องร่วมกันและการตีความใหม่
    • ข้อถกเถียงปัจจุบันเกี่ยวกับ AI และการละเมิดลิขสิทธิ์มักมองข้ามแง่มุมพื้นฐานของวิวัฒนาการทางวัฒนธรรมนี้
    • ไม่ควรมองข้ามนัยทางกฎหมายและบริบททางประวัติศาสตร์ของการเล่าเรื่องเชิงวัฒนธรรมในการทำความเข้าใจธรรมชาติของสังคมที่สร้างสรรค์
  • สรุปความเห็นที่สอง:

    • ในสหภาพยุโรป (EU) ประเด็นนี้ถูกกำกับไว้แล้วโดยมาตรา 3 และ 4 ของ "Copyright in the Digital Single Market Directive"
    • ทุกคนรวมถึงนักพัฒนา machine learning (ML) เชิงพาณิชย์ สามารถใช้ผลงานที่เข้าถึงได้โดยชอบด้วยกฎหมายได้ก็ต่อเมื่อเจ้าของลิขสิทธิ์ไม่ได้สงวนสิทธิ์การใช้งานเพื่อวัตถุประสงค์ด้าน text and data mining ไว้อย่างชัดแจ้ง
    • มีการหารือกันถึงการใช้สิ่งที่คล้ายกับ "robots.txt" เพื่อระบุว่าอะไรไม่ควรถูกใช้ฝึกโมเดล และผู้ใช้ปลายทางควรระมัดระวังในการใช้เนื้อหาที่ถูกสร้างขึ้น
  • สรุปความเห็นที่สาม:

    • เป็นที่ทราบกันอยู่แล้วว่า AI ที่ฝึกจากเนื้อหาซึ่งมีลิขสิทธิ์สามารถสร้างผลลัพธ์ที่คล้ายกันได้
    • บริษัทขนาดใหญ่ได้นำแนวทางนี้ไปใช้แล้ว และตอนนี้สถานการณ์ก็ยากจะย้อนกลับ
    • เนื่องจากประชาชนทั่วไปยังไม่ค่อยเข้าใจวิธีการสร้าง AI หรือประเด็นลิขสิทธิ์ คำถามสำคัญตอนนี้จึงคือ 'จากนี้จะทำอย่างไรต่อ'
  • สรุปความเห็นที่สี่:

    • ความรับผิดชอบในการทำให้มั่นใจว่าไม่มีการละเมิดลิขสิทธิ์เป็นของผู้ที่เผยแพร่ผลงาน
    • การสมมติว่า ChatGPT หรือเครื่องมืออื่นจะไม่สร้างเนื้อหาที่มีลิขสิทธิ์เป็นความคิดที่ไร้เดียงสา
  • สรุปความเห็นที่ห้า:

    • เป้าหมายหลักของศิลปะและการตีพิมพ์ควรเป็นการส่งอิทธิพลต่อวัฒนธรรมและสังคม ไม่ใช่เพียงเพื่อหารายได้
    • งานสร้างสรรค์ควรได้รับการคุ้มครอง แต่ก็ควรถูกถ่ายโอนไปเป็นสาธารณสมบัติให้เร็วขึ้นมาก เพื่อเติมเชื้อไฟให้ความคิดสร้างสรรค์และแรงบันดาลใจ
  • สรุปความเห็นที่หก:

    • การแก้ปัญหานี้ดูเหมือนไม่ได้ยากนัก
    • สำนวนอย่าง "video game plumber" เป็นคำย่อที่ใช้ชี้ไปยังเอนทิตีเฉพาะ และคนส่วนใหญ่ก็เชื่อมโยงมันกับ "Mario"
    • การใช้เครื่องมือ AI เพื่ออธิบายภาพที่คล้าย Mario และตัดผลลัพธ์ลักษณะนี้ออกจากคำขออย่าง "video game plumber" ไม่น่าจะเป็นเรื่องยาก
  • สรุปความเห็นที่เจ็ด:

    • บรรทัดฐานทางกฎหมายสำหรับ generative AI เทียบได้กับกรณีที่ Google ทำการสแครปเว็บไซต์และจัดทำดัชนีเพื่อการค้นหา
    • ไม่มีใครบอกว่าการที่ Google แสดงเนื้อหาต้นฉบับจากเว็บไซต์แบบตรงตัวเป็นการละเมิดลิขสิทธิ์
    • หาก generative AI ต้องลบทั้งการอ้างอิงทางวัฒนธรรมและทรัพย์สินทางปัญญา (IP) ยอดนิยมออกทั้งหมด มันก็จะไร้ประโยชน์
  • สรุปความเห็นที่แปด:

    • เป็นการพิจารณาประเด็นการละเมิดลิขสิทธิ์ในกรณีจ้าง session musician ให้เล่นบางส่วนของเพลงดัง แล้วนำไปใช้เป็น sample
    • ทำให้เกิดคำถามว่าใครควรเป็นผู้รับผิดชอบต่อการละเมิดลิขสิทธิ์
  • สรุปความเห็นที่เก้า:

    • กล่าวถึงเธรดที่กำลังดำเนินอยู่ซึ่งเกี่ยวข้องกับการที่ New York Times เรียกร้องให้ทำลาย large language models (LLMs) ทั้งหมดที่ฝึกจากข้อมูลของตน
  • สรุปความเห็นที่สิบ:

    • จากการทดลองดูว่าโมเดล Llama2 บีบอัดข้อความได้ดีเพียงใด พบว่าโมเดลดังกล่าวมีเนื้อหาจากบทแรกของหนังสือ Harry Potter อยู่เป็นจำนวนมาก