1 คะแนน โดย GN⁺ 2023-09-08 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • หากลูกค้าเชิงพาณิชย์ถูกฟ้องคดีละเมิดลิขสิทธิ์จากการใช้ Copilot หรือผลลัพธ์ที่สร้างขึ้น Microsoft จะเป็นผู้ต่อสู้คดีและรับภาระค่าเสียหายจากคำพิพากษาหรือเงินยอมความที่เป็นผลเสีย
  • คำมั่นนี้เป็นการขยายการคุ้มครองการชดใช้ด้านทรัพย์สินทางปัญญาที่มีอยู่เดิมไปยังบริการ Copilot เชิงพาณิชย์ โดยครอบคลุม Microsoft 365 Copilot, GitHub Copilot และ Bing Chat Enterprise
  • ลูกค้าต้องใช้ ตัวกรองเนื้อหาและรั้วป้องกัน ที่มีอยู่ในผลิตภัณฑ์ และต้องไม่พยายามสร้างเนื้อหาละเมิดด้วยอินพุตที่ตนไม่มีสิทธิ์
  • ตามอัปเดตวันที่ 5 มกราคม 2024 ชื่อคำมั่นถูกเปลี่ยนเป็น Customer Copyright Commitment และขยายไปถึงลูกค้าเชิงพาณิชย์ของ Azure OpenAI Service
  • Microsoft ไม่อ้างสิทธิ์ทรัพย์สินทางปัญญาเหนือผลลัพธ์ของ Copilot และมองว่าควรจัดการประเด็นลิขสิทธิ์ ค่าตอบแทนผู้สร้างสรรค์ และการแข่งขันของ AI เชิงกำเนิดไปพร้อมกัน

คำมั่นรับผิดชอบลิขสิทธิ์ของ Copilot

  • Microsoft เปิดตัว Copilot Copyright Commitment เพื่อตอบสนองต่อความกังวลของลูกค้าว่าการใช้ผลลัพธ์จาก AI เชิงกำเนิดอาจนำไปสู่ ข้อกล่าวหาการละเมิดลิขสิทธิ์
  • หากลูกค้าเชิงพาณิชย์ถูกบุคคลที่สามฟ้องคดีละเมิดลิขสิทธิ์จากบริการ Microsoft Copilot หรือผลลัพธ์ของมัน Microsoft จะเป็นผู้ปกป้องลูกค้าและจ่ายค่าเสียหายจากคำพิพากษาหรือเงินยอมความที่เป็นผลเสีย
  • เพื่อให้ได้รับความคุ้มครอง ลูกค้าต้องใช้ รั้วป้องกัน และตัวกรองเนื้อหาที่ฝังอยู่ในผลิตภัณฑ์ของ Microsoft
  • Microsoft มองว่าเมื่อเรียกเก็บเงินลูกค้าเชิงพาณิชย์สำหรับ Copilot แล้ว ภาระปัญหาทางกฎหมายจากการใช้งานก็ควรเป็นของ Microsoft ไม่ใช่ของลูกค้า

ขอบเขตการคุ้มครองและเงื่อนไขสำหรับลูกค้า

  • Copilot Copyright Commitment เป็นการขยาย การชดใช้ด้าน IP เดิมของ Microsoft ไปสู่ข้อกล่าวหาด้านลิขสิทธิ์ที่เกี่ยวข้องกับการใช้งานและผลลัพธ์ของ Copilot ที่ขับเคลื่อนด้วย AI
  • ครอบคลุมบริการ Copilot เชิงพาณิชย์แบบชำระเงินของ Microsoft และ Bing Chat Enterprise
    • Microsoft 365 Copilot: ให้ความสามารถ AI เชิงกำเนิดใน Word, Excel, PowerPoint และอื่น ๆ โดยช่วยให้ผู้ใช้วิเคราะห์จากข้อมูลของตนเองหรือแปลงเอกสารเป็นงานนำเสนอได้
    • GitHub Copilot: เป็นบริการที่ช่วยให้นักพัฒนาลดเวลางานเขียนโค้ดแบบซ้ำ ๆ และใช้เวลากับผลลัพธ์ใหม่ ๆ ที่มีการดัดแปลงสร้างสรรค์มากขึ้น
  • ลูกค้าต้องใช้ตัวกรองเนื้อหาที่มีอยู่ในผลิตภัณฑ์และระบบความปลอดภัยอื่น ๆ
  • ห้ามพยายามสร้างเนื้อหาที่ละเมิด หรือป้อนอินพุตเข้า Copilot โดยไม่มีสิทธิ์ในการใช้งานที่เหมาะสม
  • สิทธิประโยชน์นี้ไม่ได้เปลี่ยนจุดยืนเดิมของ Microsoft ที่ว่า ไม่ได้อ้างสิทธิ์ทรัพย์สินทางปัญญา เหนือผลลัพธ์จากบริการ Copilot

ความกังวลด้านลิขสิทธิ์และดุลยภาพเชิงนโยบาย

  • AI เชิงกำเนิดช่วยเพิ่มประสิทธิภาพและความคิดสร้างสรรค์ของลูกค้า แต่ก็ทำให้เกิดคำถามว่าการใช้ผลลัพธ์จะนำไปสู่ ข้อกล่าวหาการละเมิด IP หรือไม่
  • นักเขียนและศิลปินได้ออกมาแสดงความกังวลต่อสาธารณะมาโดยตลอดเกี่ยวกับวิธีที่ผลงานของตนถูกนำไปใช้ในโมเดลและบริการ AI และ Microsoft มองว่าความกังวลของลูกค้าเหล่านี้เป็นเรื่องเข้าใจได้
  • แม้กฎหมายลิขสิทธิ์เดิมจะมีส่วนที่ชัดเจนอยู่แล้ว แต่ AI เชิงกำเนิดก็สร้างคำถามนโยบายสาธารณะใหม่ ๆ ขึ้นมา
  • Microsoft เสนอ 3 เป้าหมายควบคู่กัน
    • AI ควรมีส่วนช่วยให้ความรู้แพร่กระจายและช่วยแก้ปัญหาทางสังคม
    • ผู้สร้างสรรค์ควรควบคุมสิทธิของตนตามกฎหมายลิขสิทธิ์และได้รับรายได้ที่เหมาะสมจากผลงานสร้างสรรค์
    • เนื้อหาที่จำเป็นต่อการฝึกโมเดล AI และการอ้างอิงแหล่งที่มาไม่ควรถูกกักไว้โดยบริษัทเพียงไม่กี่รายจนขัดขวางการแข่งขันและนวัตกรรม

กลไกป้องกันที่ฝังอยู่ใน Copilot

  • Microsoft ผสาน ตัวกรอง และเทคโนโลยีอื่น ๆ เพื่อลดโอกาสที่ Copilot จะส่งกลับเนื้อหาที่ละเมิด
  • กลไกป้องกันเหล่านี้ทำงานร่วมกับงานเดิมด้านความปลอดภัยดิจิทัล ความมั่นคงปลอดภัย และความเป็นส่วนตัว
  • รั้วป้องกันที่ใช้ประกอบด้วยตัวจำแนก เมตาพรอมป์ต การกรองเนื้อหา การติดตามการทำงาน และการตรวจจับการใช้งานในทางที่ผิด
  • การตรวจจับการใช้งานในทางที่ผิดรวมถึงการใช้งานที่อาจละเมิดเนื้อหาของบุคคลที่สาม
  • Copilot Copyright Commitment กำหนดให้ลูกค้าใช้เทคโนโลยีเหล่านี้ เพื่อสร้างแรงจูงใจให้เคารพข้อกังวลด้านลิขสิทธิ์ได้ดียิ่งขึ้น

ขยายไปยัง Azure OpenAI Service

  • ตามอัปเดตเมื่อวันที่ 5 มกราคม 2024 Microsoft ได้ขยาย Copilot Copyright Commitment เมื่อวันที่ 15 พฤศจิกายน 2023 เป็น Customer Copyright Commitment
  • การขยายนี้รวมถึงลูกค้าเชิงพาณิชย์ที่ใช้ Azure OpenAI Service
  • หากลูกค้าถูกฟ้องคดีละเมิดลิขสิทธิ์จากการใช้ผลลัพธ์ของ Azure OpenAI Service Microsoft ก็จะเป็นผู้ปกป้องลูกค้าและจ่ายค่าเสียหายจากคำพิพากษาที่เป็นผลเสีย
  • การขยายครั้งนี้มีขึ้นเพื่อรับมือกับความกังวลของลูกค้าเพิ่มเติมเกี่ยวกับความรับผิดที่อาจเกิดขึ้นจากการละเมิด IP ในการใช้ผลลัพธ์จาก Microsoft Copilot และ Azure OpenAI Service
  • ลูกค้าต้องนำ รั้วป้องกันและมาตรการบรรเทาความเสี่ยง ที่ Microsoft จัดหาไว้ไปใช้งาน เพื่อให้ได้รับสิทธิประโยชน์ภายใต้ Customer Copyright Commitment
  • Microsoft จัดเตรียมเอกสารและเครื่องมือสำหรับ Azure OpenAI Service เพื่อสนับสนุนการใช้ AI อย่างมีความรับผิดชอบและลดความเสี่ยงจากการละเมิดเนื้อหาที่มีลิขสิทธิ์

การขยายตัวของ AI และการคุ้มครองงานสร้างสรรค์

  • Microsoft มองว่ามาตรการครั้งนี้เป็นเพียงก้าวแรก และเห็นว่าคำถามทางกฎหมายที่ AI ก่อขึ้นต้องได้รับการแก้ไขร่วมกันโดยทั้งอุตสาหกรรมและผู้มีส่วนได้ส่วนเสียหลายฝ่าย
  • สำหรับลูกค้า มาตรการนี้ทำหน้าที่เป็นคำมั่นว่า Microsoft จะรับภาระความรับผิดด้านลิขสิทธิ์ของผลิตภัณฑ์แทน
  • Microsoft มองประโยชน์ของ AI ในแง่บวก ขณะเดียวกันก็รับรู้ถึงความท้าทายและความเสี่ยง รวมถึงการคุ้มครองงานสร้างสรรค์
  • บริษัทมีจุดยืนว่าควรร่วมมือกับอุตสาหกรรมเทคโนโลยี นักเขียนและศิลปินรวมถึงตัวแทนของพวกเขา เจ้าหน้าที่รัฐ แวดวงวิชาการ และภาคประชาสังคม เพื่อจัดการความเสี่ยง
  • ในอนาคต บริษัทตั้งใจเดินหน้าสู่โครงการริเริ่มใหม่ ๆ เพื่อให้ AI ช่วยขยายการเข้าถึงความรู้ไปพร้อมกับคุ้มครองสิทธิและความต้องการของผู้สร้างสรรค์

1 ความคิดเห็น

 
GN⁺ 2023-09-08
ความคิดเห็นบน Hacker News
  • Microsoft ควรเปิดเผยโมเดล Copilot ที่ฝึกด้วย โค้ดเบสภายในของ Azure, Windows และ Office ก่อน
    แบบนั้นจึงจะเชื่อได้ว่า Microsoft เชื่อจริง ๆ ว่า Copilot เป็น เทคโนโลยีที่ไม่ละเมิดลิขสิทธิ์

    • Microsoft มีแนวโน้มจะทำเงินได้มากกว่าหากทำเช่นนั้น
      วิศวกรภายในจะคุ้นเคยกับโครงสร้างข้อมูล สไตล์โค้ด ฯลฯ ของ Copilot อยู่แล้ว ทำให้ผลิตภาพเพิ่มขึ้นและความแม่นยำก็ดีขึ้นมาก
      อีกทั้งโค้ดของ third-party ทั่วโลกก็จะค่อย ๆ เข้าใกล้ สไตล์ของ Microsoft มากขึ้น ทำให้การจ้างงานและการฝึกอบรมง่ายขึ้นด้วย
      ข้อเสียที่คนนอกอาจได้เบาะแสเล็กน้อยเกี่ยวกับซอร์สของ Microsoft ดูเหมือนจะไม่ค่อยมีนัยสำคัญนัก เมื่อพิจารณาว่าทุกวันนี้สามารถ decompile ไบนารีเพื่อได้ข้อมูลมากกว่านั้นมากอยู่แล้ว
    • Microsoft ไม่ได้อ้างว่า Copilot ไม่สามารถคายโค้ดออกมาตรง ๆ ได้
      เพียงแต่จะรับผิดชอบเมื่อเงื่อนไขต่อไปนี้เป็นจริงทั้งหมด: มี output แบบนั้นเกิดขึ้นจริง, ผู้ใช้ไม่ได้ปิดฟิลเตอร์ที่ป้องกันสิ่งนั้น, ไม่ได้จงใจทำให้เกิดขึ้นแบบนั้น, และการใช้งานนั้นถูกตัดสินว่าผิดกฎหมาย
      โค้ดที่ต้องรักษาไว้เป็นความลับจากผู้ไม่ประสงค์ดี กับโค้ดที่เปิดเผยต่อสาธารณะแล้วแต่มีข้อจำกัดการใช้งานติดอยู่และผู้รับควรรู้ถึงข้อจำกัดนั้น เป็นคนละเรื่องกัน
      คล้ายกับข้อโต้แย้งทำนองว่า “ถ้าเชื่อว่าสัญญาอนุญาตใช้สิทธิ์มีผลตามกฎหมาย ก็ลองเปิดเผยรหัสผ่านผู้ใช้พร้อมแนบไลเซนส์ที่บอกว่าอย่าให้ใครใช้ดูสิ”
    • การรั่วไหลของข้อมูลอ่อนไหว กับการละเมิดลิขสิทธิ์เป็นคนละเรื่องกัน แต่เป็นความกังวลที่เกี่ยวข้องกัน
      แม้จะไม่มีความเสี่ยงด้านการละเมิดเลย Microsoft ก็อาจไม่ต้องการเปิดเผยเช่นนั้นอยู่ดี
    • สิ่งสุดท้ายที่โลกต้องการเพิ่มคือโค้ดที่เขียนใน สไตล์ Win32 API
    • สิ่งที่พูดถึงตรงนี้ดูเหมือนจะหมายถึง GitHub Copilot ซึ่งเป็นผลิตภัณฑ์แยกต่างหากแม้อยู่ในพอร์ตโฟลิโอของ Microsoft
      GitHub Copilot เคยอิงกับ GPT-3 ที่ fine-tune ด้วยคลังโค้ดสาธารณะ และส่วนนั้นคือแกนหลักของข้อถกเถียง
      บล็อกโพสต์นี้พูดถึงระบบนิเวศ Microsoft Copilot ที่กว้างกว่า
      เครื่องมือส่วนใหญ่ใช้บริการ Azure OpenAI API อยู่เบื้องหลัง และไม่ได้ถูกออกแบบมาเฉพาะสำหรับการสร้างโค้ด
  • โดยทั่วไป AI เชิงสร้างสรรค์มี ลักษณะเป็นการดัดแปลงแปรรูป จึงมีโอกาสสูงที่จะถูกมองว่าเป็นการใช้งานโดยชอบธรรม
    ถ้าจงใจกระตุ้นจริง ๆ ก็อาจให้ผลลัพธ์ที่คล้ายกับโค้ดหรือรูปภาพเดิมได้ แต่โดยรวมศาลอาจมองว่าเป็นการสร้างเนื้อหาใหม่ที่ไม่เคยมีมาก่อน โดยเฉพาะกับรูปภาพยิ่งเป็นเช่นนั้น
    ในคดี Google Books แม้จะคัดลอกหนังสือตรง ๆ แล้วใส่ไว้ในฐานข้อมูลออนไลน์ ก็ยังถูกตัดสินว่าเป็นการใช้งานโดยชอบธรรม ดังนั้น AI เชิงสร้างสรรค์ที่มีความเป็นการดัดแปลงแปรรูปมากกว่านั้นมาก จึงมีแนวโน้มสูงที่จะอยู่ในขอบเขตการพิจารณาการใช้งานโดยชอบธรรมที่กว้างกว่า
    แม้ Google Books จะเป็นกรณีที่ไม่ใช่เชิงพาณิชย์ แต่โดยปกติศาลมักมองว่ายิ่งมีความเป็นการดัดแปลงแปรรูปมาก ก็ยิ่งสามารถใช้เกณฑ์ตัดสินการใช้งานโดยชอบธรรมได้อย่างไม่เข้มงวดนัก
    https://ogc.harvard.edu/pages/copyright-and-fair-use

    • หลายคนพูดกันว่า “AI เชิงสร้างสรรค์โดยรวมมีแนวโน้มสูงที่จะได้รับการยอมรับว่าเป็นการใช้งานโดยชอบธรรม” แต่ผมคิดว่าในความเป็นจริง ความน่าจะเป็นนั้น ไม่ถึง 50% ด้วยซ้ำ
      Google Books เป็นการใช้งานโดยชอบธรรมเพราะมีประโยชน์สาธารณะ ไม่ได้ทำร้ายสำนักพิมพ์หรือผู้เขียน และกลับช่วยให้ผู้คนค้นพบงานมีลิขสิทธิ์ได้ง่ายขึ้น
      ในทางกลับกัน AI เชิงสร้างสรรค์อาจดึงแก่นสำคัญจากผลงานของผู้คนมาสร้างผลลัพธ์ที่มีสไตล์ ฯลฯ คล้ายกัน และอาจตัดผู้เขียนต้นฉบับออกไปโดยสิ้นเชิง จนแย่งชิงผลแห่งแรงงานของพวกเขา
      โดยเฉพาะอย่างยิ่ง มันเป็นกระบวนการเชิงกลล้วน ๆ และไม่มีความคิดสร้างสรรค์ของมนุษย์นอกเหนือจากสิ่งที่สกัดมาจากผู้เขียนคนอื่น พรอมป์ตง่าย ๆ มองว่าเป็นความคิดสร้างสรรค์ได้ยาก
      สุดท้ายก็ใกล้เคียงกับตรรกะที่ว่า “ใช้ผลงานมีลิขสิทธิ์อยู่ก็จริง แต่เอามาผสมกันในระดับใหญ่ จึงไม่เป็นไร”
    • หากดูคำพิพากษาศาลฎีกาสหรัฐฯ ล่าสุดในคดี Warhol v. Goldsmith ก็จะเห็นว่าความหมายของการดัดแปลงแปรรูปในบริบทการใช้งานโดยชอบธรรมถูกนิยามใหม่ค่อนข้างมาก
      เป็นทิศทางที่ไม่เป็นผลดีต่อข้ออ้างว่า AI เชิงสร้างสรรค์เป็นการใช้งานโดยชอบธรรม
      โดยเฉพาะเพราะศาลเชื่อมโยงความเป็นการดัดแปลงแปรรูปกับผลกระทบต่อตลาด ทำให้ AI เชิงสร้างสรรค์ที่สร้างผลลัพธ์ซึ่งแข่งขันโดยตรงกับสิ่งที่ป้อนเข้าไป ถูกศาลมองว่าเป็นการดัดแปลงแปรรูปได้ยากขึ้นมาก
      กรณีการสร้างรูปภาพยิ่งเป็นเช่นนั้น เพราะแข่งขันกับภาพสต็อกอย่างชัดเจน
    • การใช้งานโดยชอบธรรมไม่ได้ทำงานแบบนั้น
      ไม่มีหลักประกันแบบครอบคลุมว่า “AI เชิงสร้างสรรค์โดยรวมเป็นการใช้งานโดยชอบธรรม” และการที่ผลลัพธ์มี ลักษณะดัดแปลงแปรรูป หรือไม่ ก็เป็นเพียงหนึ่งในหลายปัจจัยเท่านั้น
      ดูได้จากกรณีการแซมเปิลเสียงหรือรีมิกซ์
    • Google Books อาจมีลักษณะดัดแปลงแปรรูปในแง่วัตถุประสงค์และลักษณะการใช้งาน แต่การนำผลการค้นหาจาก Google Books ไปแปะไว้ในหนังสือของตัวเองไม่ได้ทำให้กลายเป็นการใช้งานโดยชอบธรรม
      อาจมีข้อยกเว้นอย่างกรณีอ้างอิงหนังสือในงานวิจัย แต่การยกกรณีพิเศษแบบนั้นมาก็ทำได้แค่ใช้จับผิดกันในวงถกเถียงบนอินเทอร์เน็ตเท่านั้น
      ข้อเท็จจริงที่ว่า Copilot เองอาจเป็นงานดัดแปลงแปรรูปที่สามารถมีอยู่ได้ ไม่ได้นำไปสู่ข้อสรุปว่านักพัฒนาเมื่อนำผลลัพธ์ของมันไปใส่ในผลงานของตนแล้วจะไม่ต้องรับ ความรับผิดจากการละเมิดลิขสิทธิ์
      เช่นเดียวกับที่เราไม่อาจถือได้ว่าผลลัพธ์ทั้งหมดที่คนอื่นสร้างขึ้นปลอดจากปัญหาลิขสิทธิ์ การที่คนคนหนึ่งเคยเห็นผลงานอื่นไม่ได้แปลว่าจะกล่าวหาว่าตัวบุคคลนั้นเองเป็นสิ่งละเมิดได้ แต่ผลลัพธ์เป็นอีกเรื่องหนึ่ง
    • มีข้อโต้แย้งมากมาย แต่ดูเหมือน EU จะเห็นด้วยกับมุมมองนี้อยู่พอสมควร: https://creativecommons.org/wp-content/uploads/2021/12/CC-St...
      https://www.notion.so/DSM-Directive-Implementation-Tracker-3...
      https://eur-lex.europa.eu/eli/dir/2019/790/oj
      ข้อยกเว้นลิขสิทธิ์ TDM4 อนุญาตให้สร้างชุดข้อมูลที่ประกอบด้วยผลงานมีลิขสิทธิ์ได้ ตราบใดที่มีระบบให้ผู้ถือสิทธิ์ปฏิเสธได้
      ชุดข้อมูลจะโปร่งใสขึ้น ผู้ถือสิทธิ์สามารถใช้สิทธิของตนได้ และบริษัท AI บางรายก็สามารถฝึกโมเดลด้วยวัสดุมีลิขสิทธิ์ได้ จึงดูเหมือนเป็นการประนีประนอมที่ดีที่สุด
      แน่นอนว่าไม่ได้ให้สิทธิ์เชิงพาณิชย์แก่โมเดลที่ฝึกแล้ว แต่ให้เฉพาะสิทธิ์ด้านการวิจัยทางวิทยาศาสตร์และวิชาการเท่านั้น ตัวอย่างเช่น การที่ Meta ฝึกและเผยแพร่โมเดล LLaMA ที่เรียนรู้จากหนังสือ หมายความว่าใช้ได้หากไม่ได้แสวงหาประโยชน์เชิงพาณิชย์และมีระบบให้ผู้เขียนปฏิเสธได้
      กำลังหารือกับ Jordan จาก https://spawning.ai ว่าสามารถสร้างระบบปฏิเสธที่เหมาะกับหนังสือได้หรือไม่ และสามารถจินตนาการแนวทางคล้ายกันสำหรับเพลงได้ด้วย
      นี่เป็นกฎหมายยุโรป แต่ต่างจากกฎระเบียบ EU ที่มากเกินไปบางอย่าง มันดูเป็นการประนีประนอมที่สมเหตุสมผลมาก
      แก้ไข: Jordan ส่งอีเมลมาแก้ความเข้าใจว่า การเข้าใจว่าสิทธิ์ปฏิเสธใช้กับงานวิจัยเชิงพาณิชย์เท่านั้นนั้นถูกต้องแล้ว หมายความว่าการสร้างชุดข้อมูลให้ที่อย่าง Eleuther อาจไม่จำเป็นต้องมีกระบวนการปฏิเสธ แต่จะจำเป็นในกรณีที่ OpenAI นำไปใช้กับ GPT-5 และคิดค่าใช้จ่าย
      ถ้าเช่นนั้น กฎหมายนี้ก็มีผลกับการใช้แมชชีนเลิร์นนิงในเชิงพาณิชย์จริง ๆ และการใช้งานแบบไม่ใช่เชิงพาณิชย์อย่าง LLaMA ก็ไม่จำเป็นต้องมีแม้กระทั่งสิทธิ์ปฏิเสธ
      เป็นเรื่องยอดเยี่ยม เพราะให้เกราะคุ้มครองทางกฎหมายแก่นักวิจัย และกำหนดให้การใช้งานเชิงพาณิชย์ต้องมีความโปร่งใสของชุดข้อมูล
  • สงสัยว่าประกาศนี้มีรายละเอียดจริง ๆ อยู่หรือไม่
    รู้ว่าเป็นบทความบล็อก แต่ลิงก์ทั้งหมดในหน้านั้นก็เป็นแค่บทความบล็อกอื่น ๆ เลยยังมีคำถามค้างอยู่มาก
    บทความบล็อกนี้เป็น สัญญาที่บังคับใช้ได้ตามกฎหมาย หรือไม่? Microsoft กำลังชดใช้/คุ้มครองผู้ใช้ทุกคนอย่างเฉพาะเจาะจงจากข้อเรียกร้องละเมิดลิขสิทธิ์ที่เกิดจากการใช้ Copilot หรือเปล่า?
    บทความบล็อกบอกว่า “โปรแกรมนี้มีเงื่อนไขสำคัญ” แล้วก็ยกมาหลายข้อ แต่ไม่ชัดเจนว่านั่นคือเงื่อนไขทั้งหมด หรือยังมีเงื่อนไขเพิ่มเติมที่ไม่ได้อยู่ในบทความหรือไม่
    เช่น ไม่รู้ว่าใช้ได้เฉพาะบางประเทศหรือไม่ หรือใช้ได้กับระบบกฎหมายทั้งหมดทั่วโลกหรือเปล่า
    อะไรคือหลักประกันว่า Microsoft จะไม่ยุติโปรแกรมนี้? ถ้าศาลตัดสินเป็นผลเสียซ้ำ ๆ และ Microsoft ตระหนักว่าไม่สามารถจ่ายค่าเสียหายได้ทุกครั้งที่ Copilot ฟอกไลเซนส์ให้โค้ดมีลิขสิทธิ์เป็นก้อนใหญ่ ผู้ใช้มีวิธีใดที่จะบังคับให้ Microsoft รักษาสัญญาได้หรือไม่?

    • ดังนั้นจนถึงตอนนี้ มันใกล้เคียงกับ การประชาสัมพันธ์ มากกว่าการคุ้มครองทางกฎหมายจริง
      Brad Smith ซึ่งเป็นทนายความก็น่าจะเข้าใจจุดนี้
      ถ้าไม่อย่างนั้น ทำไมเขาถึงจะเอา Microsoft บริษัทมูลค่า 2.5 ล้านล้านดอลลาร์ไปเสี่ยงกับ การรับประกันความรับผิดแบบไม่จำกัด?
    • สำหรับคำถามว่า “บทความบล็อกนี้เป็นสัญญาที่บังคับใช้ได้ตามกฎหมายหรือไม่?” อาจเป็นไปได้
      มีแนวคิดที่เรียกว่า promissory estoppel
      https://www.nolo.com/dictionary/promissory-estoppel-term.htm...
    • ในฐานะทนายความ ผมลองค้นหาถ้อยคำใหม่นี้แล้ว แต่เอกสารกฎหมายที่ตรวจดูไม่มีฉบับไหนดูเหมือนจะได้รับการอัปเดตให้สะท้อนเรื่องนี้
      เอกสารของ Microsoft มีหลายประเภทเลยชวนสับสนอยู่บ้าง แต่เอกสารที่เกี่ยวกับ Copilot ค่อนข้างชัดเจน และตั้งแต่ช่วงฤดูใบไม้ผลิ ข้อกำหนดการชดใช้/คุ้มครอง ก็ไม่ได้เปลี่ยนไป
  • เป็นการเดินเกมที่ฉลาดมากของ Microsoft
    โดยพื้นฐานคือการวาดเป้าขนาดมหึมาไว้บนหลังตัวเองเพื่อรับคดีความที่จะเกิดขึ้นในอนาคต และพวกเขาประเมินว่าตัวเองมีทรัพยากรพอจะต่อสู้ ซึ่งก็ไม่ใช่การประเมินที่ผิด
    ดูจากทิศทางของ AI แล้ว อีกไม่นานน่าจะมี บรรทัดฐานคำพิพากษาที่สำคัญ ออกมา
    จากมุมของ Microsoft การทำให้ตลาดนี้โตให้เร็วที่สุดและยืนอยู่ตรงศูนย์กลางของมันเป็นเรื่องสำคัญมาก
    มาตรการนี้ช่วยลดอุปสรรคหลักที่ทำให้องค์กรขนาดเล็กลังเลที่จะนำโค้ดที่สร้างโดย AI มาใช้ นั่นคือความกังวลว่า “ถ้าผลิตภัณฑ์นี้สร้างโค้ดที่มีลิขสิทธิ์ ฉันจะถูกฟ้องไหม?”

    • ใช่ ประเด็นหลักอยู่ตรงนี้
      Microsoft เหมือนโยนถุงมือท้าดวลแล้วพูดว่า “เครื่องจักรฝ่ายกฎหมายขนาดยักษ์ของ Microsoft จะสู้เอง”
      โดยพื้นฐานคือการ แสดงแสนยานุภาพ แบบ “ลองฟ้องดูสิ เอาเลย ไม่งั้นก็กลับบ้านไป”
    • Microsoft มีเงินด้วย จึงเป็น คู่กรณีที่คุ้มจะฟ้อง
    • Microsoft อาจแค่มองว่านี่เป็นทางเลือกที่แย่น้อยกว่า
      เป็นวิธีจ่ายเงินบางส่วนให้ฝ่ายไวท์คอลลาร์เหมือนเป็นภาษีที่รับได้ เพื่อไม่ให้แรงกดดันที่ให้รัฐบาลมาจำกัดพวกเขาอย่างหนักเพิ่มขึ้นเร็วเกินไป
    • ถ้าจะคาดการณ์ พวกเขาอาจใช้การ deploy บนคลาวด์เพื่อ fork ส่วนที่เป็น GPL สำคัญ ๆ แล้วจำกัดอัปเดตความปลอดภัยที่จำเป็นไว้เฉพาะใน fork และ implementation ของตัวเอง
      จากนั้นก็ถ่วงเวลาไปหลายปีด้วยการควบคุมสาธารณชนและออกข่าวประชาสัมพันธ์ ระหว่างนั้นก็ทำให้ฐานะของตัวเองมั่นคง
  • มีดอกจันตัวใหญ่ติดอยู่: “ลูกค้าต้องไม่พยายามสร้างเนื้อหาที่ละเมิดสิทธิ”
    สุดท้ายแล้วขึ้นอยู่กับว่า Microsoft จะนิยามคำว่า พยายามสร้างเนื้อหาที่ละเมิดสิทธิ อย่างไร
    เดิมทีหวังว่าจะหมายถึงการยกเว้นเฉพาะการใช้ที่รู้อยู่แล้วว่าเป็นการละเมิด เช่น “สร้างซอร์สโค้ดทั้งหมดของ Half-Life 2 ขึ้นมาใหม่” แต่ในความเป็นจริงก็ไม่มีทางรู้

    • พูดตรง ๆ เรื่องนี้ผมไว้ใจ Microsoft
      ผมไม่เชื่อว่าพวกเขาจะ แข่งขันอย่างเป็นธรรม และไม่เชื่อพวกเขาในฐานะนายจ้างด้วย
      ผมไม่เชื่อว่าพวกเขาจะไม่ทำเรื่องทุจริตเกี่ยวพันกับการเมืองระดับชาติ และก็ไม่อยากให้เป็นพาร์ตเนอร์ในโปรเจกต์ที่มีความหมาย
      แต่สิ่งหนึ่งที่ Microsoft ทำได้ดีจริง ๆ คือ ธุรกรรมระหว่างองค์กร ที่เชื่อถือได้และยั่งยืนในระยะยาว
      ในฐานะลูกค้าธุรกิจ ผมไว้ใจพวกเขา ถ้าพวกเขาใช้ช่องโหว่แบบนี้ในทางที่ผิด ชื่อเสียงจะพังทลาย
      ผมไม่ใช้ Google Cloud Platform เพราะมักทำให้ลูกค้าเดือดร้อน แต่ไว้ใจ AWS กับ Azure เพราะพวกเขาไม่ทำแบบนั้น
      ค่าใช้จ่ายในการจ่ายค่าละเมิดสิทธิน่าจะต่ำกว่าต้นทุนของการสูญเสียความไว้วางใจนั้นมาก
    • สุดท้ายความหมายของ “พยายามสร้างเนื้อหาที่ละเมิดสิทธิ” ไม่ได้ขึ้นอยู่กับ Microsoft แต่ขึ้นอยู่กับว่า ศาล ที่บังคับใช้คำมั่นนั้นจะมองอย่างไร
      อย่างไรก็ดี Microsoft ก็จะมีแรงจูงใจมากขึ้นในการล็อบบี้ให้กฎหมายก่อตัวไปในทางที่ทำให้การใช้เครื่องมือแบบนี้แทบไม่ก่อให้เกิดความรับผิด
    • นั่นเป็นเพียง ถ้อยคำทางกฎหมาย ที่หมายความว่า “ถ้ามีการละเมิดลิขสิทธิ์ ทั้งหมดเป็นความรับผิดชอบของคุณ”
      แต่คำถามว่า Microsoft ขโมยโค้ดของผู้คนไปขายต่อหรือไม่นั้นยังคงอยู่
    • นั่นเป็น ช่องโหว่ ที่ใหญ่พอให้รถบรรทุกขับผ่านได้
    • ผมไม่คิดว่านี่เป็นเงื่อนไขที่น่าตกใจหรือจำกัดอะไรนัก
      ถ้าใช้ LLM เพื่อตอบคำถามเกี่ยวกับเอกสารของบริษัท มันอาจสร้างเนื้อหามีลิขสิทธิ์จากการ pre-train ออกมาโดยไม่ตั้งใจได้
  • เรื่องอาจไม่ง่ายขนาดนั้น
    แม้ Microsoft จะรับผิดแทน ผู้ละเมิดก็ยังอาจถูกฟ้องแยกต่างหากได้ หลังจากนั้น Microsoft อาจต้องรับภาระค่าใช้จ่ายในการดำเนินคดี
    แต่ไม่สามารถปกป้องผู้ใช้ผลิตภัณฑ์แบบเหมารวมไม่ให้ถูกฟ้องได้
    ถ้อยคำสำคัญคือ “หากบุคคลที่สามยื่นฟ้องลูกค้าเชิงพาณิชย์ในข้อหาละเมิดลิขสิทธิ์จากการใช้ Microsoft Copilot หรือ output ที่สร้างขึ้น Microsoft จะต่อสู้คดีและจ่ายจำนวนเงินตามคำพิพากษาที่เป็นผลเสียหรือเงินยุติคดี ตราบใดที่ลูกค้าได้ใช้มาตรการป้องกันและตัวกรองเนื้อหาที่มีอยู่ในผลิตภัณฑ์”
    ตรงนี้คำว่า “ต่อสู้คดี” สำคัญ และน่าจะหมายความว่าผู้ใช้จะต้องใช้ทนายของ Microsoft ไม่ใช่ทนายของตัวเอง
    คนเหล่านี้อยู่ในบริษัท จึงอาจถูกกว่าทนายภายนอกที่คิดค่าบริการรายชั่วโมง
    อีกทั้งยังมีเงื่อนไขว่าต้องใช้ผลิตภัณฑ์อย่างไร และที่สำคัญ ผู้ใช้ต้อง บันทึกเป็นเอกสาร ว่าได้ใช้ตามวิธีนั้นจริง
    เป็นพัฒนาการที่น่าสนใจ ลูกค้าองค์กรระมัดระวังเพราะกลัวว่าจะละเมิดลิขสิทธิ์โดยบังเอิญจากการใช้เครื่องมือนี้ และนั่นน่าจะทำให้การนำไปใช้ช้าลง

    • คดีความนั้น แม้แต่บริษัทอย่าง Microsoft ก็แทบจะมอบให้ สำนักงานกฎหมายภายนอก เสมอ
      โดยเฉพาะคดีที่มูลค่าความเสียหายอาจสูง
      ประเด็นหลักคือการลดแรงต้านต่อการนำไปใช้ที่เกิดจากความเสี่ยงทางกฎหมาย
  • ใช้ได้เฉพาะเมื่อเปิดมาตรการป้องกันไว้เท่านั้น
    หนึ่งในมาตรการป้องกันเหล่านั้นคือการไม่ให้ Copilot ส่งออกโค้ดที่มีอยู่ใน GitHub repository ใด ๆ
    ผมลองทดสอบ Copilot โดยเปิดมาตรการป้องกันไว้แล้ว และมันถูกทำให้หมดฤทธิ์ไปแทบจะถึงขั้น เหมือนถูกตัดหัว
    อนึ่ง นี่ไม่ใช่การเปลี่ยนแปลงใหม่ ใน Copilot Product Specific Terms มีข้อกำหนดอยู่แล้วว่า “ถ้าถูกฟ้อง Microsoft จะรับผิดชอบ”: https://github.com/customer-terms/github-copilot-product-spe...

  • ผมถูกวิจารณ์เยอะจากคำตอบนี้ในชุมชนอื่น แต่ถ้าโมเดลเชิงสถิติสร้างผลงานดัดแปลงล้วน ๆ ในฐานะโมเดลคณิตศาสตร์ที่โดยแก่นแล้วใกล้เคียงกับ ตัวทำนายโทเค็นที่เหมาะสมที่สุดถัดไป จริง ๆ นั่นถือว่าเป็น “การขโมย” หรือไม่?
    การเข้าใจโทเค็นที่เหมาะสมที่สุดถัดไป หรือแม้แต่การรู้ว่าโทเค็นใดพบบ่อยที่สุดบน GitHub ถือว่าเป็น “การขโมย” หรือไม่?
    อาจโต้แย้งได้ว่าไอเดียที่มีคุณค่าทั้งหมดถูกคิดขึ้นมาแล้ว และข้อความที่ใช้งานได้ทั้งหมดก็ถูกเขียนไปแล้ว ดังนั้นควรทำให้ AI ทั้งหมดผิดกฎหมาย แต่ถ้าเป็นแบบนั้น เราจะเหลืออยู่ตรงไหน?
    เช่น ฟังก์ชันที่เปลี่ยนสตริงจากตัวพิมพ์ใหญ่เป็นตัวพิมพ์เล็กมีโอกาสสูงที่จะคล้ายกับฟังก์ชันที่คนอื่นสักแห่งบนโลกเขียนไว้ และโค้ดจัดการข้อผิดพลาดหรือเทคนิคสมัยใหม่ในการจัด div ให้อยู่กึ่งกลางก็เช่นกัน

    • ผมไม่ใช่ทนายด้านลิขสิทธิ์ แต่แม้จะตัด AI ออกไป งานดัดแปลงและการใช้งานโดยชอบธรรมก็เป็น พื้นที่สีเทา อยู่แล้ว
      เป็นประเด็นที่ถกเถียงกันในศาลอยู่เสมอ
      ถ้าฝึกและเผยแพร่โมเดลที่เมื่อป้อน “When Mr. Bilbo Baggins” แล้วตอบสนองด้วยการพิมพ์ไตรภาค The Lord of the Rings ออกมาทั้งหมด ก็น่าจะเป็นการละเมิดลิขสิทธิ์
      ในทางกลับกัน ถ้าสร้างย่อหน้าทั่วไปเกี่ยวกับ “ภูเขา” และ “มังกร” โดยไม่มีการอ้างคำพูดหรือสำนวนโดยตรงที่มีนัยสำคัญ ตัวมันเองก็มีแนวโน้มว่าจะไม่ละเมิด คำเหล่านั้นปรากฏในงานของ Tolkien แต่ตัวคำเองไม่ใช่สิ่งที่มีลิขสิทธิ์
      อย่างไรก็ตาม หากพิสูจน์ได้ว่ามีการทำสำเนางานของ Tolkien เพื่อฝึกโมเดลในลักษณะที่ใบอนุญาตลิขสิทธิ์ไม่อนุญาต แม้ผลลัพธ์ของโมเดลจะไม่ดูเป็นสำเนาของต้นฉบับอีกต่อไป ก็อาจมีการละเมิดลิขสิทธิ์ในขั้นตอนกลางแล้ว
      ผมมองว่าเรื่องนี้ไม่มีคำตอบแบบขาวดำ ผลงานที่มีลิขสิทธิ์เมื่อถูกย่อยเป็นชิ้นเล็ก ๆ แล้วทำให้เป็นสถิติ จะถึงจุดไหนที่มันไม่ใช่งานที่มีลิขสิทธิ์อีกต่อไป? เราสามารถฝึกโมเดลโดยไม่ต้องคัดลอกบางสิ่งก่อนในแบบที่ละเมิดกฎหมายลิขสิทธิ์ได้หรือไม่?
      นี่เป็นแนวคิดแบบมนุษย์ที่ยืดหยุ่น ซึ่งมนุษย์ในศาลและฝ่ายนิติบัญญัติเป็นผู้ตัดสิน และรายละเอียดทางคณิตศาสตร์ไม่น่าจะทำให้ผลลัพธ์สุดท้ายแตกต่างมากนัก
    • ผมไม่ใช่ทนาย แต่นี่ไม่ใช่การขโมย
      แต่สิ่งที่พูดถึงอยู่ตรงนี้ไม่ใช่การลักทรัพย์ หากเป็น การละเมิดลิขสิทธิ์ ซึ่งเป็นคนละแนวคิดกัน
      ความแตกต่างที่ละเอียดแต่เป็นรากฐานนี้ก็น่าจะเป็นส่วนหนึ่งที่ทำให้ปฏิกิริยาค่อนข้างเย็นชา
    • สำหรับส่วนที่ว่า “ไอเดียที่มีคุณค่าทั้งหมดถูกคิดขึ้นมาแล้ว ดังนั้น AI ทั้งหมดควรผิดกฎหมาย” ใน https://en.wikipedia.org/wiki/Copyright ระบุไว้ว่า
      ลิขสิทธิ์มีไว้เพื่อคุ้มครอง การแสดงออกดั้งเดิมของไอเดีย ที่อยู่ในรูปแบบของผลงานสร้างสรรค์ ไม่ใช่เพื่อคุ้มครองตัวไอเดียเอง
    • กลไกการทำงานภายในไม่สำคัญ
      เราสามารถสร้างตรรกะคล้าย ๆ กันกับอัลกอริทึมการเข้ารหัสหรือการบีบอัดได้เช่นกัน
  • สงสัยเหมือนกันว่า คำมั่นสาธารณะ แบบนี้มีผลผูกพันแค่ไหน
    คล้ายกับที่ Musk เคยประกาศต่อสาธารณะบนแพลตฟอร์มเมื่อเร็ว ๆ นี้ว่าจะรับผิดชอบค่าใช้จ่ายให้คนที่มีปัญหาเรื่องงานหรือปัญหาทางกฎหมายเพราะสิ่งที่พูดบนแพลตฟอร์ม แต่ตอนนี้กลับปฏิเสธที่จะทำตามคำมั่นนั้น

  • หาก codebase ละเมิด GPL วิธีเยียวยาคือเปิดเผยซอร์สโค้ดที่เป็นปัญหา หรือไม่ก็หยุดการแจกจ่าย
    เมื่อ Microsoft พูดถึงโค้ดของบุคคลที่สาม ผมไม่คิดว่าพวกเขาจะใส่ใจกับทางเลือกใดทางเลือกหนึ่งมากนัก
    ผมไม่รู้ว่าบรรทัดฐานคดีเกี่ยวกับค่าเสียหายในโครงการโอเพนซอร์สเป็นอย่างไร แต่ไม่น่าจะถึงขั้นเป็นความกังวลใหญ่สำหรับ Microsoft
    พูดอีกอย่างคือ ความเสี่ยงขาลงของ Microsoft คือการส่งทนายเข้ามาจัดการ ส่วนขาขึ้นคือการปรับปรุงเครื่องมือสร้างโค้ด
    ผมไม่ใช่ทนาย