แรงกดดันด้านลิขสิทธิ์ที่มากขึ้นกำลังมาถึง AI เชิงสร้างสรรค์
(garymarcus.substack.com)- หลังจากคดีที่ New York Times ฟ้อง OpenAI ประเด็นว่า AI เชิงสร้างสรรค์ควรรับผิดชอบต่อการละเมิดลิขสิทธิ์ในขั้นตอนการฝึกและการสร้างผลลัพธ์มากน้อยเพียงใด ได้กลายเป็นประเด็นใหญ่ขึ้น
- แก่นของคดีคือแชตบอตสามารถทำซ้ำข้อความแทบจะเหมือนต้นฉบับได้ และการทดลองของ Marcus กับ Reid Southen แสดงให้เห็นว่า DALL-E ก็สามารถสร้างการทำซ้ำที่คล้ายกันในรูปภาพ ได้เช่นกัน
- แม้จะมีมาตรการป้องกันอย่างการบล็อกชื่อเฉพาะ แต่ผู้ใช้ยังอาจได้ผลลัพธ์ที่คล้ายกับ SpongeBob SquarePants, RoboCop หรือตัวละครวิดีโอเกมจากพรอมป์ที่ไม่ได้เขียนชื่อตัวละครหรือชื่อภาพยนตร์โดยตรง
- ระบบปัจจุบันไม่แจ้ง ข้อมูลแหล่งที่มาและความเป็นไปได้ในการละเมิด ของแหล่งข้อมูลฝึกและผลงานที่สร้างให้ผู้ใช้ทราบ ทำให้ผู้ใช้อาจสร้างผลงานที่ละเมิดโดยไม่รู้ตัว
- Marcus มองว่าข้อถกเถียงเรื่องการละเมิดจะดำเนินต่อไปจนกว่าจะมีสถาปัตยกรรมใหม่ที่ติดตามแหล่งที่มาได้ และคดีของ New York Times อาจเป็นจุดเริ่มต้นของคดีความอีกจำนวนมาก
คดี New York Times และการทดลองทำซ้ำรูปภาพ
- ในช่วงที่ New York Times ยื่นฟ้อง OpenAI, Gary Marcus ได้ทำการทดลองร่วมกับ Reid Southen ศิลปินคอนเซ็ปต์ในอุตสาหกรรมภาพยนตร์
- Southen ถูกแนะนำว่าเป็นผู้มีประสบการณ์เกี่ยวข้องกับ Marvel, DC, Matrix Resurrections, Hunger Games และอื่น ๆ
- รายงานฉบับเต็มมีกำหนดเผยแพร่สัปดาห์หน้า และจะมีการกล่าวถึงเพิ่มเติมใน IEEE Spectrum วันที่ 3 มกราคม
- แก่นของคดีคือแชตบอตของ OpenAI สามารถ ทำซ้ำข้อความได้แทบเหมือนต้นฉบับ
- ในการทดลองของ Marcus และ Southen มีการระบุว่าแม้เมื่อใช้ซอฟต์แวร์สร้างภาพของ OpenAI ผ่าน Bing ก็สามารถทำ การทำซ้ำรูปภาพแบบเหมือนต้นฉบับหรือใกล้เคียงมาก ได้
การสร้างผลลัพธ์ที่คล้ายกันซึ่งมาตรการป้องกันหยุดไม่ได้
- เป็นที่ทราบกันว่า DALL-E มีมาตรการป้องกันที่ช่วยกันชื่อเฉพาะและความพยายามละเมิดโดยเจตนาบางส่วน แต่มีการระบุว่ามาตรการเหล่านี้ไม่ได้ทำงานอย่างเสถียร
- ความเป็นไปได้ในการละเมิดอาจเกิดขึ้นได้แม้ผู้ใช้ไม่ได้ตั้งใจละเมิดโดยตรง หรือไม่ได้กล่าวถึงชื่อตัวละครหรือชื่อภาพยนตร์
- มีการระบุว่าพรอมป์สั้น ๆ ที่ไม่ได้กล่าวถึง SpongeBob SquarePants ก็อาจให้ผลลัพธ์ที่เกี่ยวข้องได้
- ยังยกตัวอย่างกรณีที่ไม่ได้กล่าวถึง RoboCop รวมถึงผลลัพธ์ที่คล้ายตัวละครวิดีโอเกมและอาจละเมิดเครื่องหมายการค้า
- ผู้ใช้ X ชื่อ Blanket_Man01 และ Justine Moore จาก A16Z ก็พบปรากฏการณ์คล้ายกันโดยอิสระเช่นกัน
ปัญหากล่องดำที่ไม่รู้แหล่งที่มา
- ในมุมมองของ Marcus ปัญหาหลักของ AI เชิงสร้างสรรค์อยู่ที่ โครงสร้างที่ไม่เปิดเผยแหล่งข้อมูลฝึกและแหล่งที่มาของผลงานที่สร้างให้ผู้ใช้เห็น
- ระบบอย่าง DALL-E และ ChatGPT ได้รับการฝึกด้วยเนื้อหาที่มีลิขสิทธิ์
- OpenAI ไม่เปิดเผยอย่างโปร่งใสว่าฝึกจากอะไร
- ระบบ AI เชิงสร้างสรรค์สามารถสร้างเนื้อหาที่อาจละเมิดลิขสิทธิ์ได้
- ระบบไม่แจ้งผู้ใช้เมื่อมีผลลัพธ์เช่นนั้นเกิดขึ้น
- และไม่ให้ข้อมูลแหล่งที่มาของรูปภาพที่สร้างขึ้นด้วย
- ผู้ใช้อาจไม่รู้ว่ารูปภาพที่ตนสร้างเป็นการละเมิดหรือไม่
- ระบบปัจจุบันอย่าง DALL-E และ ChatGPT ใกล้เคียงกับ กล่องดำ และมองว่าด้วยโครงสร้างตอนนี้ การแสดงการระบุแหล่งที่มาของข้อมูลต้นทางเป็นเรื่องยาก
- แม้บางบริษัทกำลังทำวิจัยที่เกี่ยวข้อง แต่ระบุว่ายังไม่รู้จักแนวทางแก้ที่น่าเชื่อถือ
- มองว่าการละเมิดอาจดำเนินต่อไปจนกว่าจะมีสถาปัตยกรรมใหม่ที่ติดตามแหล่งที่มาของข้อความหรือรูปภาพที่สร้างได้อย่างเสถียร
- ระบบที่ดีควรให้รายชื่อแหล่งที่มาแก่ผู้ใช้ แต่มีการระบุว่าระบบปัจจุบันยังไม่ทำเช่นนั้น
การลุกลามของคดีความและความเสี่ยงของ Microsoft
- คดีของ New York Times มีแนวโน้มสูงว่าจะเป็นคดีแรกในบรรดาหลายคดี
- ในแบบสำรวจที่ Marcus ทำบน X ผู้ตอบส่วนใหญ่คาดว่าจะมีการยอมความ
- สำหรับขนาดของการยอมความ ผู้ตอบจำนวนมากคาดว่าจะมากกว่า 100 ล้านดอลลาร์ และ 20% คาดว่าจะอยู่ที่ 1 พันล้านดอลลาร์
- หากขยายไปถึงสตูดิโอภาพยนตร์ บริษัทวิดีโอเกม และหนังสือพิมพ์รายอื่น ๆ ขนาดของจำนวนเงินอาจใหญ่ขึ้นได้
- เนื่องจากกรณีตัวอย่างเกิดขึ้นผ่าน DALL-E บน Bing จึงมองว่า Microsoft ก็มีความเสี่ยงด้านความรับผิด ด้วย
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ทุกคนยอมรับเรื่องเล่าแบบองค์กรธุรกิจง่ายเกินไป ว่าสิ่งแบบนี้มีใครสักคนสามารถ เป็นเจ้าของ ได้จริง ๆ
เรื่องสโนว์ไวท์กับซินเดอเรลล่า ใครกันเป็นเจ้าของจริง ๆ? เรื่องเหล่านี้ไม่ได้มาจาก Disney แต่เป็นส่วนหนึ่งของนิทานพื้นบ้านที่ส่งต่อกันมาหลายชั่วอายุคน และความสำเร็จของ Disney ก็มีฐานส่วนหนึ่งจากการดัดแปลงเรื่องเล่าที่มีอยู่เดิม ซึ่งชุมชนต่าง ๆ แบ่งปันและปรับเปลี่ยนกันมาหลายศตวรรษ
การถกเถียงนี้ไม่ควรเป็นแค่รายละเอียดทางเทคนิคของปัญญาประดิษฐ์หรือเหตุผลทางกฎหมายของลิขสิทธิ์ แต่ควรเป็นเรื่องของการเข้าใจรากลึกของวัฒนธรรมที่เราแบ่งปันกัน
โดยแก่นแท้แล้ว วัฒนธรรมคือ ทรัพย์สินร่วม และวิวัฒนาการกับเติบโตผ่านเรื่องเล่าและการตีความใหม่ของส่วนรวม
การถกเถียงเรื่อง Generative AI กับการละเมิดลิขสิทธิ์ดูเหมือนจะพลาดแก่นพื้นฐานของวิวัฒนาการทางวัฒนธรรมนี้ไป อัลกอริทึมอาจเป็นของใหม่ แต่การจินตนาการเรื่องราวขึ้นใหม่และนำกลับมาใช้ซ้ำนั้นเก่าแก่เท่ามนุษยชาติ
ผมคิดว่ามันไม่สมเหตุสมผลเลยที่ Disney สร้าง “บ้านของหนู” ไว้บนวัฒนธรรมและเรื่องราวที่มีอยู่เดิม แล้วตอนนี้จะมาเสนอให้จำกัดเครื่องมือแสดงออกทางวัฒนธรรมเพื่อให้เข้ากับลิขสิทธิ์ที่ล้าสมัยและประหลาด
ภาพในบทความใช้ของที่ค่อนข้างใหม่ และไม่มีแม้แต่ข้อสงสัยด้วยซ้ำว่านั่นเป็น Mario หรือ Coca Cola หรือไม่ ถ้า Nintendo กับ Coca Cola ทำโปรโมชันร่วมกัน ภาพที่ออกมาแบบนั้นก็น่าเชื่อได้ตรง ๆ
ถ้าอ้างแนวคิดทั้งหมดของช่างประปาตัวเตี้ยล่ำที่ใส่เสื้อผ้าคล้าย Mario นั่นก็อีกเรื่อง แต่สิ่งนั้นก็คือ Mario กับ Luigi ชัด ๆ เป็น Robocop และ C3PO ชัด ๆ ไม่ได้คลุมเครือเลยแม้แต่น้อย ถ้าสามารถลบเครื่องหมายการค้าแบบนี้ด้วยการ ฟอกผ่าน AI ได้ ก็ฟอกอะไรก็ได้ทั้งนั้น
ความใหม่อยู่ที่ LLM และเทคโนโลยีของมัน ไม่ใช่การคิดทบทวนลิขสิทธิ์ทั้งหมดภายใต้แนวคิดอันสูงส่งเรื่องการเปิดกว้างทางวัฒนธรรม
ดังนั้นนี่ไม่ใช่แค่เรื่องเล่าขององค์กรธุรกิจ แต่คือกฎหมายซึ่งเป็นรากฐานที่ทำให้เรื่องเล่านั้นเกิดขึ้น ไม่ว่าจะถูกหรือผิดก็ตาม บริษัทต่าง ๆ อาจมีบทบาทมากในการก่อรูปกฎหมาย แต่ลิขสิทธิ์ก็ให้ประโยชน์กับบุคคลด้วย มันไม่ใช่แค่การโฆษณาชวนเชื่อหรือเรื่องเล่าขององค์กรที่บิดเบือนความจริงร่วมกัน แต่เป็นสิ่งที่ผู้พิพากษาไกล่เกลี่ย และคนที่มีปืนกับคุกเป็นผู้บังคับใช้
ในเมื่อเป็นประเด็นทางกฎหมาย ก็จำเป็นต้องพูดถึง รายละเอียดทางเทคนิคของกฎหมาย ถ้าปัดไปว่าควรถกกันแค่เรื่องเล่าทางสังคม ก็เท่ากับแทนที่ผลลัพธ์เชิงวัตถุและความจริงด้วยภาพฝัน ต้องถกด้วยว่าลิขสิทธิ์และทรัพย์สินทางปัญญามีลักษณะที่กดทับการสร้างสรรค์อย่างไร แต่ในขณะเดียวกันก็ไม่อาจเพิกเฉยต่อสิ่งที่เกิดขึ้นจริงได้
อย่างไรก็ดี Georgism ยังไม่ได้รับการพิจารณาอย่างเพียงพอ
นัยทางกฎหมายก็คือนัยของมนุษย์ และเป็นส่วนหนึ่งของวัฒนธรรมไม่แพ้เรื่องอื่น ๆ มันเกี่ยวข้องกับว่าอะไรยุติธรรม และรางวัลตอบแทนความพยายามควรถูกยอมรับและกระจายอย่างไร
การทำให้เป็นรูปแบบเช่นนี้อาจสำคัญน้อยกว่าในวัฒนธรรมที่ไม่ได้มีเศรษฐกิจตลาดเป็นศูนย์กลาง และถ้อยคำอย่าง “ผืนทออันอุดมของนิทานพื้นบ้าน” ก็ให้ความรู้สึกเหมือนอยากกลับไปสู่โลกแบบนั้น แต่สังคมที่กำลังคิดว่าจะจัดการกับปัญญาประดิษฐ์อย่างไร ไม่ใช่สังคมแบบนั้น
ความคิดที่ว่าลิขสิทธิ์ใช้ไม่ได้หรือเก่าเกินไปเพราะความสามารถในการทำสำเนาแบบใหม่นั้น เป็นความคิดที่กลับหัวกลับหางอย่างแท้จริง ลิขสิทธิ์มีน้ำหนักขึ้นมาก็เพราะ ความสามารถในการทำสำเนาแบบใหม่
ความสามารถเฉพาะในตอนนั้นคือการพิมพ์เชิงอุตสาหกรรม และคนที่ดูฉลาดกว่าผู้เชี่ยวชาญซอฟต์แวร์ทั่วไปมากเข้าใจว่าความสามารถนั้นสร้างแรงจูงใจที่ไม่สอดคล้องกัน ระหว่างฝ่ายที่มีความสามารถในการทำสำเนาแบบใหม่กับฝ่ายที่สร้างผลงานอันเป็นฐานของมูลค่านั้น หัวใจของข้อตกลงด้านลิขสิทธิ์คือการจัดแรงจูงใจเหล่านี้ให้สอดคล้องกัน
เทคโนโลยีการทำสำเนาแบบใหม่อาจเปลี่ยนรายละเอียดว่าอะไรควรถูกห้าม จำกัด หรืออนุญาต ควรวางมาตรฐาน อำนาจบังคับใช้ และขอบเขตอย่างไร แต่ไม่ได้เปลี่ยนภูมิปัญญาของข้อตกลงนั้นเอง หากจะเปลี่ยนมัน ต้องมีวิธีที่ดีกว่าในการจัดระบบและให้รางวัลแก่ขีดความสามารถในการผลิตของสังคม
ถึงอย่างนั้น แนวคิดที่จะยกเลิกลิขสิทธิ์เพื่อให้บริษัท Generative AI ทำเงินได้มากขึ้นก็ฟังดูประหลาดสุด ๆ
สำหรับผม คำถามนั้นตั้งผิด
ทุกคนรู้กันอยู่แล้วว่ามันถูกฝึกด้วยข้อมูลที่มีลิขสิทธิ์ และสามารถให้ผลลัพธ์ที่คล้ายกันจนน่าขนลุกได้
แต่เรื่องนี้เกิดขึ้นไปแล้วในระดับมหาศาล และบริษัทยักษ์ใหญ่ก็กระโจนเข้ามาเต็มตัวแล้ว ไม่มีทางจะยัดยาสีฟันที่บีบออกมาแล้วกลับเข้าไปในหลอดได้
คล้ายกับช่วงที่บริษัทยักษ์ใหญ่ด้านเทคโนโลยีสร้างธุรกิจบนการ เก็บข้อมูลผู้ใช้ เชิงรุก ประเด็นว่ามันถูกต้อง มีจริยธรรม หรือแม้แต่ถูกกฎหมายหรือไม่ ในขั้นนี้ก็แทบเป็นการถกเถียงเชิงวิชาการไปแล้ว พวกเขาแค่ลงมือทำ และในทางปฏิบัติก็เดินหน้าไปโดยไม่มี informed consent ที่เหมาะสมจากสังคม
คำถามที่ถูกต้องตรงนี้คือ “แล้วตอนนี้จะทำอย่างไร” คำตอบก็คงใกล้เคียงกับตอนเทคโนโลยีติดตามผู้ใช้ คือ “แทบไม่มีอะไรเกิดขึ้น”
เทคโนโลยีอย่างการบันทึกเสียงและการผลิตเพลงราคาถูกก็เหมือนกัน คุณสามารถอัดเสียงศิลปินหนึ่งครั้งแล้วผลิตแผ่นเสียงจำนวนมากได้ แต่ก็ไม่ได้หมายความว่าเราจะคิดได้ว่าอัดเสียง Taylor Swift ครั้งเดียวแล้วก็ทำสำเนาได้ไม่จำกัดโดยไม่จ่ายเงิน
ลองอ่านเรื่อง การประท้วงของนักดนตรีปี 1942 ดู: https://jacobin.com/2022/03/1940s-musicians-strike-american-...
เรื่องนี้เคยเกิดขึ้นแล้วกับ Napster ต่อมากับ Apple Music และตอนนี้กับบริการสตรีมมิง
แทนที่จะยังมีการแชร์ไฟล์อย่างแพร่หลายในหมู่คนทั่วไป เรากลับมีอุปกรณ์ที่เราไม่ได้เป็นเจ้าของจริง ๆ และการสมัครสมาชิกสตรีมมิง
Apple ไม่ได้ขาย iPod โดยคัดลอกเพลงทั้งหมดใส่ลงไป แต่ใช้ การเจรจาสัญญา 10 ปี และเงินจำนวนมากเพื่อให้ได้สิทธิ์คอนเทนต์
ผมไม่ได้จะบอกว่าอะไรถูกหรือผิด แค่หมายความว่านี่เป็นคำพูดที่แทบไม่เข้าใจการต่อสู้เหล่านี้เลย
ทำให้นึกถึงตอนที่ Uber และ AirBnB ผิดกฎหมายในเมืองใหญ่ส่วนใหญ่ แต่สุดท้ายก็ได้อำนาจเหนือตลาด
ผมกลับมองว่าเป็นเรื่องดี ผมไม่เคยเชื่อในสิ่งอย่าง “ทรัพย์สินทางปัญญา” เลย ควรกำจัดสิทธิบัตร ลิขสิทธิ์ และชุด “สิทธิ” ในจินตนาการทั้งหมดนี้ทิ้งไป
มากกว่าครึ่งโลก หรือก็คือ Global South ไม่ยอมรับสิทธิพวกนี้ด้วยซ้ำ และตอนนี้มันก็ยิ่งบังคับใช้ได้ยากขึ้นเรื่อย ๆ หากไม่มีการบังคับใช้กฎหมายเกินขอบเขตอย่างรุนแรงและการรวมศูนย์แบบผูกขาด
บริษัทเหล่านี้เป็นบริษัทมูลค่าหลายพันล้านถึงหลายล้านล้านดอลลาร์ ต่อให้ผู้ถือหุ้นและผู้บริหารระดับสูงจะไม่ชอบแค่ไหน พวกเขาก็มีศักยภาพที่จะทำตัวเป็น สมาชิกของสังคมที่มีความรับผิดชอบ ในเรื่องนี้ได้
ใน EU เรื่องนี้ไม่ควรเป็นปัญหา มาตรา 3 และ 4 ของคำสั่ง “Copyright in the Digital Single Market” ได้กำกับเรื่องนี้ไว้แล้ว
ตามสรุปของ Wolters Kluwer หน่วยงานอื่นทั้งหมด รวมถึงผู้พัฒนาแมชชีนเลิร์นนิงเชิงพาณิชย์ สามารถใช้ผลงานที่เข้าถึงได้โดยชอบด้วยกฎหมายได้เฉพาะในกรณีที่เจ้าของสิทธิ์ไม่ได้สงวนการใช้งานเพื่อทำเหมืองข้อความและข้อมูลไว้อย่างชัดเจน
เท่าที่ผมทราบ กำลังมีการพูดคุยถึงสิ่งที่คล้ายกับ robot.txt สำหรับระบุว่า “ห้ามใช้ฝึก” อาจต้องมีการติดตั้งมาตรการคุ้มกันบางอย่าง และผู้ใช้ปลายทางก็ควรระมัดระวังเมื่อใช้ผลงานที่สร้างขึ้น
แหล่งที่มาของ Kluwer: https://copyrightblog.kluweriplaw.com/2023/02/20/protecting-...
ตัวบทกฎหมาย EU: https://eur-lex.europa.eu/eli/dir/2019/790/oj
https://eur-lex.europa.eu/eli/dir/2019/790/oj
ความรับผิดชอบในการรับประกันว่าไม่มีการละเมิดลิขสิทธิ์อยู่ที่คนที่เผยแพร่ผลงาน
ไม่ว่าจะวาดเอง ให้จิตรกรฝึกหัดที่ไม่มีความรู้ทางกฎหมายทำ ถ่ายรูป หรือสร้างภาพด้วยปัญญาประดิษฐ์ ก็ไม่ได้ต่างกัน
ทำไมถึงสันนิษฐานว่า ChatGPT หรือเครื่องมืออื่น ๆ จะไม่สร้างคอนเทนต์ที่มีลิขสิทธิ์อยู่แล้ว?
ผมเข้าใจข้อสันนิษฐานแบบไร้เดียงสาว่าเพราะมันถูก “สร้าง” ขึ้นมา จึงน่าจะเป็นต้นฉบับ แต่ทันทีที่เปลี่ยน “ChatGPT” เป็น “ศิลปินรุ่นน้อง” ข้อสันนิษฐานนั้นก็พังลง
สมมติว่าคุณสั่งให้วาดดรอยด์จากหนังไซไฟ และไม่ได้พูดอะไรเพิ่มเติม ไม่พูดถึงลิขสิทธิ์ ไม่บอกว่าต้องเป็นงานต้นฉบับ แล้วคุณคาดว่ามันจะวาดอะไรออกมา?
ศิลปินรุ่นน้องในสมมติฐานนั้นก็จะต้องรับ ความรับผิด อย่างน้อยเท่ากัน หรืออาจมากกว่าด้วยซ้ำ
มีคำตอบจำนวนมากจนน่าตกใจที่ดูเหมือนไม่เข้าใจแก่นของบทความนี้และคดีความของ NYT เลย ChatGPT สามารถเผยแพร่บทความของ NYT จำนวนไม่น้อยออกมาได้เป็นความยาวหลายร้อยถึงหลายพันคำ โดย เหมือนต้นฉบับทุกตัวอักษร
นี่ไม่ใช่งานดัดแปลง มันเลยจุดนั้นไปไกลแล้ว NYT มีคดีที่แข็งมาก และคนที่กำลังถกเถียงข้อดีข้อเสียของลิขสิทธิ์กำลังหลุดประเด็น
คดีเดียวนี้คงไม่พลิกกฎหมายลิขสิทธิ์ด้วยตัวมันเอง สิ่งที่ OpenAI จะยกขึ้นมาได้ก็มีแค่ประมาณว่า “นี่เป็นเรื่องใหม่ แล้วเราจะรู้ได้อย่างไรว่ามันจะเป็นแบบนี้” ถ้าอย่างนั้นโมเดลที่ถูกฝึกมาแล้วในปัจจุบันก็อยู่ในสถานการณ์ลำบากมาก
อีกอย่าง ไม่คิดว่า NYT จะยอมตกลงยอมความ ผลกระทบมันใหญ่เกินไป และถ้าตกลงกับ OpenAI ก็จะเกิดคดีคล้ายกันกับโมเดลอื่นทั้งหมด สื่ออื่นทุกแห่งที่เผยแพร่คอนเทนต์ดิจิทัลก็จะมีคดีที่มีน้ำหนักคล้ายกัน
นี่คือจุดเปลี่ยนของ generative AI และดูมีแนวโน้มสูงว่าจะมีราคาแพงขึ้นมาก หรือถูกจำกัดมากกว่าที่เราคิดไว้ตอนแรกมาก
ผลข้างเคียงคือคิดว่าจะมี โมเดลเถื่อน เพิ่มขึ้น อาจมีโมเดลที่ไม่สนความถูกต้องตามกฎหมายเลย ฝึกแบบกระจายศูนย์ และกระจายน้ำหนักโมเดลโดยกลุ่มคนแทนที่จะเป็นบริษัท เช่น โมเดลแบบทอร์เรนต์
โมเดลแบบนี้ก็มีโอกาสพอสมควรที่จะทำผลงานเหนือกว่าโมเดล “เรียบร้อย” อย่างเป็นทางการ น่าจะเป็นเรื่องน่าสนใจให้ติดตามในอีกไม่กี่ปีข้างหน้า
กล่าวคือ ChatGPT โดยพื้นฐานไม่ได้ทำซ้ำงานที่มีลิขสิทธิ์เอง แต่ทำซ้ำตามคำขอหรือการกระทำของผู้ใช้บุคคลที่สาม เหมือนกับที่ YouTube ให้บริการวิดีโอที่ผู้คนอัปโหลด
เจตนาของ OpenAI ไม่ใช่การละเมิดลิขสิทธิ์ และจริง ๆ แล้วนักวิจัยจำนวนมากหรือส่วนใหญ่ก็เชื่อว่าโมเดลไม่ได้ overfit ถึงขั้นทำซ้ำส่วนใหญ่ของงานมีลิขสิทธิ์แบบสุ่มได้
โดยพื้นฐานแล้ว ลิขสิทธิ์ที่ไม่มีบริษัทยักษ์ใหญ่อยู่เบื้องหลังแทบไม่มีความหมาย และถ้ามีบริษัทอยู่เบื้องหลังก็สามารถถูกล็อกไว้ตลอดกาลโดยไม่สนข้อจำกัดที่ควรมีในลิขสิทธิ์ดั้งเดิม
การที่ OpenAI สามารถทำซ้ำข่าวเก่าแบบต้นฉบับได้ ไม่ได้ทำให้ NYT เสียอะไรเลย
ถ้า NYT ชนะ เราจะเสียอะไรไปมาก ตอนนี้ถึงเวลาต้องมองลิขสิทธิ์ใหม่แล้ว จริง ๆ แล้วเราทำได้ และมันก็ล้าสมัยมากพอที่จะต้องอัปเดตแล้ว
Stable Diffusion ถ้าใช้สิ่งอย่าง Control Net และ LoRA ให้เต็มที่ จะเอาชนะ โมเดลปิดกรรมสิทธิ์ อื่น ๆ ได้
อาจจะฟังดูอุดมคตินิดหน่อย แต่ผมเชื่อมาตลอดว่าเป้าหมายหลักของศิลปะและการตีพิมพ์ไม่ควรเป็นแค่การหาเงินก้อนโต แต่ควรเป็น การส่งอิทธิพลต่อวัฒนธรรมและสังคม
ดังนั้นแม้งานต้นฉบับต้องได้รับการคุ้มครอง แต่ผมเห็นว่ามันควรเข้าสู่ public domain เร็วกว่านี้มาก เพื่อกระตุ้นความสร้างสรรค์และแรงบันดาลใจ ช่วงเปลี่ยนผ่านควรคิดเป็นระดับไม่กี่ปี ไม่ใช่หลายสิบปี
เป้าหมายหลักของศิลปะคือการก่อให้เกิด อารมณ์ ในปัจเจกบุคคล ความคิดที่ว่าศิลปะต้องสอนบทเรียน อาจเป็นเหตุผลที่ทุกวันนี้มีนิยายแนว “นักเคลื่อนไหว” แบบโจ่งแจ้งมากมาย
สิ่งเหล่านี้ดูไม่ได้แก้ยากขนาดนั้น ตัวอย่างส่วนใหญ่ไม่ใช่คำอธิบายทั่วไป แต่เป็น สำนวนย่อ ที่ชี้ไปยังสิ่งที่เป็นที่รู้จักดี
“ช่างประปาในวิดีโอเกม” แทบจะมีความหมายเดียวกับ “Mario” และใครก็ตามที่รู้จักตัวละครนั้นแม้เพียงเล็กน้อยก็รู้เรื่องนี้
ในทำนองเดียวกัน ถ้าให้เครื่องมืออธิบายภาพบรรยายรูปภาพแบบ Mario [1] แล้วจะยากแค่ไหนกันที่จะลบผลลัพธ์แบบนั้นออกจากคนที่ป้อนคำว่า “ช่างประปาในวิดีโอเกม”?
ทำให้นึกถึงช่วงแรก ๆ ของอินเทอร์เน็ตที่ผู้คนพยายามลบแฟนฟิกชันฟรี ๆ โดยอ้างว่าละเมิดกฎหมายลิขสิทธิ์ การเอากฎหมายลิขสิทธิ์มาใช้กับ การใช้งานส่วนตัว ที่ผู้สร้างไม่ได้ตั้งใจจะขายอะไรเลยนั้น ในมุมมองของผมค่อนข้างน่ากลัว
ลองจินตนาการอีก 50 ปีข้างหน้า “หุ่นยนต์ ช่วยตัดรูปที่ฉันวาดนี้สำหรับไดโอรามาโรงเรียนหน่อยได้ไหม?” “แน่นอนครับ” “ช่วยทำรูปนี้ด้วย” “ข้อผิดพลาด: รูปนี้อาจมีเนื้อหาที่มีลิขสิทธิ์ จึงไม่สามารถประมวลผลได้”
ระบบปัญญาประดิษฐ์เชิงสร้างสรรค์มีความสามารถเพียงพอที่จะสร้าง เนื้อหาที่ละเมิดลิขสิทธิ์ ได้
และเมื่อทำเช่นนั้น ก็ไม่ได้แจ้งให้ผู้ใช้ทราบ
ดังนั้นเอาต์พุตใด ๆ ก็อาจละเมิดเนื้อหาต้นทางบนเว็บที่ obscure แต่ยังได้รับการคุ้มครองอยู่ และใครก็ตามที่ใช้เอาต์พุตนั้นอาจเผชิญความเสี่ยงถูกฟ้องโดยไม่มีคำเตือนใด ๆ
เรื่องนี้แก้ยากมาก
ถ้าไม่ได้ตั้งใจจะสร้างคอนเทนต์ละเมิด ก็อาจลบหรือทิ้งผลลัพธ์แบบนั้นได้ แต่ปัญหาคือคนที่พยายามหลอกปัญญาประดิษฐ์ให้สร้างคอนเทนต์แบบนั้น ตราบใดที่ไม่ได้ตัดข้อมูลฝึกที่มีลิขสิทธิ์หรือเครื่องหมายการค้าทั้งหมดออก ก็แทบเป็นไปไม่ได้ที่จะหยุดพวกเขา
อีกปัญหาหนึ่งของปัญญาประดิษฐ์เชิงสร้างสรรค์ก็คือประเด็นที่บทความกล่าวไว้ว่า “ระบบอย่าง DALL-E และ ChatGPT โดยเนื้อแท้แล้วเป็น กล่องดำ”
จะเกิดอะไรขึ้นหากปัญญาประดิษฐ์ถูกใช้ในการตัดสินใจในสถานการณ์ที่ผู้ใช้หรือผู้เสียหายมีสิทธิ์รู้แน่ชัดว่าทำไมปัญญาประดิษฐ์จึงตัดสินใจเช่นนั้น? ในมุมมองทางธุรกิจและกฎหมาย ผมคิดว่าโซลูชันปัญญาประดิษฐ์ในปัจจุบันมีความเสี่ยงและควรถูกใช้อย่างจำกัดมาก เพราะแม้แต่คนที่สร้างมันก็ยังไม่สามารถชี้ไปยังชิ้นส่วนข้อมูลที่แน่ชัดซึ่งทำให้ปัญญาประดิษฐ์เลือกแบบนั้นได้
ถ้าป้อนว่า “columbian coffee logo” แล้วได้โลโก้แบรนด์ที่มีอยู่แล้วออกมา ต้องวิศวกรรมย้อนกลับอินเทอร์เน็ตทั้งใบเพื่อตรวจสอบว่าโลโก้เหล่านั้นมีอยู่ก่อนแล้วหรือไม่?
ปัญญาประดิษฐ์ควรแสดง แหล่งที่มาของแรงบันดาลใจ มนุษย์ที่สร้างสรรค์โดยได้รับแรงบันดาลใจจากบางสิ่งย่อมรู้แน่ชัดว่าตนใช้อะไร และข้ามเส้นไปสู่การลอกเลียนหรือไม่ แต่กลไกการทำงานของปัญญาประดิษฐ์นั้นทึบเกินไปสำหรับเรื่องนี้
ผมคิดว่าสิ่งที่ต้องทำมีแค่การเปิดเผยแหล่งที่มาเท่านั้น แต่เรื่องนี้หมายความว่าบริษัทปัญญาประดิษฐ์ต้องเปิดเผยชุดข้อมูลของตน และอาจเผยข้อมูลที่ไม่ควรมีไว้ตั้งแต่แรกหรือไม่ควรถูกเปิดเผยออกมาด้วย
เท่าที่ผมเข้าใจ บรรทัดฐานทางกฎหมายของ AI เชิงสร้างสรรค์ก็เหมือนกับกรณีที่ Google ได้รับอนุญาตให้สเครปเว็บไซต์เพื่อทำดัชนีค้นหาเพื่อประโยชน์สาธารณะ
Google ยังแสดงเวอร์ชันแคชของเว็บไซต์ได้ด้วย และนั่นก็คือเนื้อหาต้นฉบับของไซต์นั้นเอง คงไม่มีใครพูดว่า Google ละเมิดลิขสิทธิ์เพียงเพราะแสดงเนื้อหาจากเว็บไซต์อื่นแบบคำต่อคำ
ดังนั้นผมมองว่าข้อโต้แย้งนี้อ่อน ถ้าต้องลบการอ้างอิงทางวัฒนธรรมและ IP ยอดนิยมทั้งหมด รวมถึงสิ่งที่ดังน้อยกว่านั้นด้วย AI ก็จะไร้ประโยชน์
ส่วนตัวแล้วผมคิดว่า AI เชิงสร้างสรรค์ควรสามารถให้ลิงก์ไปยังแหล่งข้อมูลต้นฉบับที่คล้ายกันในข้อมูลฝึกได้ นี่เป็นวิธีขั้นต่ำในการตอบแทนผู้ที่มีส่วนช่วยในการฝึก AI
ถ้า AI เชิงสร้างสรรค์กำลังมุ่งไปในทางที่ฆ่าทั้งเว็บไซต์และศิลปินที่สร้างแหล่งข้อมูลต้นฉบับ ผมคิดว่าในระยะยาวมันไม่ยั่งยืน แหล่งที่มาช่วยเพิ่มความโปร่งใส และยังช่วยให้ผู้ใช้เข้าใจได้ด้วยว่านั่นเป็น hallucination หรือไม่
ผู้คนควรสามารถ opt out ไม่ให้คอนเทนต์ของตนถูกใช้ในการฝึกได้ และควรตรวจสอบได้ด้วยว่าถูกลบออกจากเวอร์ชันถัดไปแล้วหรือยัง
พูดตรง ๆ บริษัท AI แค่พยายามเก็บเป็นความลับเพื่อหลีกเลี่ยงคดีความเท่านั้น ผมคิดว่ากฎระเบียบในพื้นที่แบบนี้อาจช่วยได้มากกว่าสถานการณ์วันสิ้นโลกที่พูดกัน
[1]: https://yro.slashdot.org/story/03/07/14/025216/web-caching-g...
[2]: https://www.theguardian.com/technology/2016/apr/27/getty-ima...
คลื่นเทคโนโลยีทุกระลอกล้วนมีวิธีโน้มน้าวให้ผู้สร้างสรรค์ใช้เวลาและเงินสร้างแหล่งข้อมูลต้นฉบับ แล้วหลังจากนั้นกฎก็เปลี่ยนไป
Google สัญญาว่าจะให้การเข้าถึงและตลาดใหม่กับคอนเทนต์ และมันก็ได้ผลจริง จากนั้นก็เริ่มนำ snippet, โฆษณา และกลไกสารพัดอย่างที่กักผู้เข้าชมไว้บนทางด่วนของตัวเอง แทนที่จะส่งไปยังไซต์ต้นฉบับ
Reddit, Stack Overflow และอื่น ๆ ใช้ gamification อย่างคะแนนกับ badge และชุมชน เพื่อจูงใจให้ผู้ใช้ร่วมสร้างคอนเทนต์ต้นฉบับ
ตอนนี้ AI กำลังสั่นคลอนแนวทางเหล่านี้ ในแต่ละขั้น แรงจูงใจในการสร้างแหล่งข้อมูลต้นฉบับดูเหมือนจะลดลงเรื่อย ๆ เพราะผลตอบแทนที่ได้รับกลับมาน้อยลงเรื่อย ๆ
ถ้า AI เพียงทวนคอนเทนต์ต้นฉบับโดยไม่ให้อะไรตอบแทนเลย—ไม่มีการเข้าถึง, gamification, ชุมชน หรือโอกาสได้รับการยอมรับ—แล้วผู้เชี่ยวชาญยังเหลือแรงจูงใจอะไรอีก?
ก็เหมือนกับที่คุณให้ลิงก์ไปยังแหล่งข้อมูลต้นฉบับที่มีอิทธิพลต่อการเขียนคอมเมนต์ของคุณไม่ได้ มีการฝึกมากแค่ไหนที่เข้าไปอยู่ในค่าน้ำหนักของนิวรอนที่ทำให้เกิดคำตอบนั้น? คุณเรียนรู้วิธีใช้ตัวเอียงและผลของมันต่อการตีความคำจากที่ไหน? คุณเรียนรู้น้ำเสียงที่เหมาะกับฟอรัมนี้จากที่ไหน?
ถ้า “ผู้คนควรสามารถ opt out ไม่ให้คอนเทนต์ของตนถูกใช้ในการฝึกได้” งั้นตอนผมเขียนหนังสือ ผมควรสามารถ opt out ไม่ให้คุณอ่านหนังสือเล่มนั้นได้หรือไม่? ผมควรสามารถตั้งเงื่อนไขได้ไหมว่าใครอ่านงานของผมได้บ้าง? ศาสนา? สีผิว? คนที่จำไม่ค่อยเก่ง?
ผมหวังว่าแนวคิดเรื่องการจำกัดว่าใครสามารถรับความรู้ได้จะฟังดูไร้สาระ แล้วทำไมข้อจำกัดแบบเดียวกันจึงโอเคเมื่อมันไม่ได้จำกัดที่ “ใคร” แต่จำกัดที่ “อะไร”?
การที่บริษัท AI เก็บเป็นความลับเพื่อหลีกเลี่ยงคดีความทำให้เกิดกำแพงต่อการวิจัย แทนที่ผมกับ Joe จะร่วมทำวิจัยและเขียนบทความด้วยชุดข้อมูลเดียวกันได้ เรากลับต้องซ่อนข้อมูลฝึก เพราะกลัวพวกลัดไดต์จะมาทุบเครื่องจักร ราวกับว่าการเรียนรู้นั้นยอมรับได้ก็ต่อเมื่อมันไม่เก่งเกินไป
แต่การฝึก AI จะผ่านการทดสอบ 4 ปัจจัยของ fair use จริงหรือไม่ ยังต้องรอดูกันต่อไป
ผมเห็นด้วยว่าควรทำให้ AI เชิงสร้างสรรค์มีสิ่งนั้นได้ แต่การเก็บข้อมูลนั้นไว้คงทำให้ต้นทุนการฝึกแพงขึ้นมาก และบริษัท AI ก็แทบไม่สนใจจะทำ อาจเป็นไปได้มากกว่าที่พวกเขาจะพยายามประเมินปัญหาลิขสิทธิ์ที่อาจเกิดขึ้นด้วย heuristic ในขั้นตอนหลังประมวลผล
คำถามที่น่าสนใจกว่าคือ นอกเหนือจากกรณีที่สร้างซ้ำแทบจะเหมือนต้นฉบับ ผู้ถือสิทธิ์จะสามารถอ้างเรื่อง การใช้โดยไม่ได้รับอนุญาต ได้หรือไม่ เพียงเพราะผลงานของตนส่งอิทธิพลต่อ AI ในเชิงรวมในรูปแบบที่กว้างกว่า
เราต้องมีกฎหมายที่ชัดเจนกว่านี้ซึ่งใช้กับ AI เชิงสร้างสรรค์โดยเฉพาะ มีการเปรียบเทียบและอุปมากับคนจริงมากเกินไป
มีคำพูดทำนองว่า “แล้วถ้ามีคนเรียนวาดภาพจากการดูสื่อที่มีเครื่องหมายการค้า แล้วเผลอวาดออกมาคล้ายกันล่ะ” แต่โมเดลเหล่านี้ไม่ใช่มนุษย์ และอยู่ในหมวดหมู่แยกต่างหาก
ผมมองว่าโมเดลเหล่านี้ละเมิด เครื่องหมายการค้า ในระดับหนึ่ง แต่ขณะเดียวกันก็คิดว่าควรได้รับอนุญาต ความรับผิดชอบสุดท้ายควรตกอยู่กับคนที่นำภาพไปใช้เป็นสื่ออิสระให้สาธารณชนบริโภค
ในการถกเถียงแบบนี้ โมเดลดูเหมือนทำหน้าที่เป็น ม่านบังตา มากกว่าแก่นหลัก และทำให้การอภิปรายไปติดอยู่ตรงนั้น
โมเดลช่วยให้เกิดความเป็นไปได้ในการปฏิเสธความรับผิดชอบที่ดูสมเหตุสมผลใน “ห่วงโซ่ความรับผิด” ถ้าตัดคำว่า “LLM” ออกแล้วแทนด้วย “กล่องวิเศษในซุ้มโชว์ของสวนสนุก” ข้ออ้างที่ว่า LLM มีอะไรพิเศษจนสมควรได้รับข้อยกเว้นก็จะหายไปอย่างรวดเร็ว
คดี Betamax ระบุว่าเทคโนโลยีที่มีการใช้งานอย่างมีนัยสำคัญโดยไม่ละเมิดลิขสิทธิ์ ตัวมันเองไม่ถือเป็นการละเมิด
มีบรรทัดฐานอยู่แล้วว่าผลงานที่สร้างโดยปัญญาประดิษฐ์ไม่ได้รับความคุ้มครองลิขสิทธิ์ และด้วยตรรกะเดียวกัน การกระทำในการสร้างของปัญญาประดิษฐ์ก็ไม่ได้แสดงเจตนา ดังนั้น การตัดสินว่าเป็นการละเมิดหรือไม่ควรขึ้นอยู่กับมนุษย์ที่นำผลลัพธ์ไปใช้ เพราะตัวกล่องดำเองไม่มี ความเป็นผู้กระทำการ
ก่อนจะสรุปว่า LLM หรือโดยทั่วไปกว่านั้น เทคนิคเชิงกำเนิดเป็นคลื่นลูกใหญ่ถัดไป somehow หรือก่อนจะอ้างว่าเรามาถึงธรณีประตูของปัญญา “ทั่วไป” แล้ว ก็ต้องแสดงให้เห็นประตูนั้นก่อน
ประตูนั้นอาจเป็นภาพของการ นำไปใช้ในอุตสาหกรรม เพื่อแก้ปัญหาจริง ๆ ที่มากกว่าคุณค่าด้านความบันเทิงจากการพิมพ์อะไรบางอย่างลงในกล่องแล้วดูสิ่งที่ออกมาอีกฝั่ง แต่เท่าที่ผมเห็นมาจนถึงตอนนี้ ดูเหมือนยังไม่มีที่ไหนทำแบบนั้นจริง ๆ