5 คะแนน โดย GN⁺ 2024-05-10 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การต่อต้านของผู้ใช้ต่อการประกาศความร่วมมือระหว่าง Stack Overflow และ OpenAI

  • ผู้ใช้บางส่วนกำลังแสดงการต่อต้านต่อการที่ Stack Overflow และ OpenAI เพิ่งประกาศความร่วมมือกัน
  • ผู้ใช้บางรายพยายามลบคอนเทนต์ของตนเอง (คำถามและคำตอบ) ออกจาก Stack Overflow แต่ประสบปัญหาเนื่องจากเว็บไซต์ไม่ได้ทำให้ลบได้โดยง่าย
  • ด้วยเหตุนี้ ผู้ใช้ดังกล่าวจึงตัดสินใจแก้ไขคำถามหรือคำตอบของตนให้ "เสียหาย" เพื่อประท้วงความร่วมมือระหว่าง Stack Overflow และ OpenAI

ภาพรวมความร่วมมือระหว่าง Stack Overflow และ OpenAI

  • Stack Overflow และ OpenAI ตกลงร่วมมือกันผ่านพาร์ตเนอร์ชิป API ใหม่
  • ความร่วมมือนี้มีเป้าหมายเพื่อผสานแพลตฟอร์มองค์ความรู้ขนาดมหาศาลของ Stack Overflow เข้ากับโมเดล AI ขั้นสูงของ OpenAI เพื่อมอบให้แก่นักพัฒนา
  • ผู้ใช้ OpenAI จะสามารถใช้ข้อมูลที่แม่นยำและผ่านการตรวจสอบของ Stack Overflow ผ่านการเข้าถึง OverflowAPI เพื่อแก้ปัญหาได้รวดเร็วยิ่งขึ้น และโฟกัสกับงานที่มีลำดับความสำคัญสูงได้
  • นอกจากนี้ OpenAI ยังมีแผนจะผสานองค์ความรู้ทางเทคนิคที่ผ่านการตรวจสอบจาก Stack Overflow เข้ากับ ChatGPT เพื่อยกระดับการเข้าถึงข้อมูลและโค้ดที่ผู้ใช้ไว้วางใจได้

กระแสต้าน AI

  • เว็บไซต์ในเครือ Stack Exchange รวมถึง Stack Overflow เป็นเครื่องมือที่มีประโยชน์อย่างมากต่อชุมชน แต่ผู้ใช้บางส่วนไม่ค่อยยินดีนักที่คอนเทนต์ของตนจะถูกนำไปใช้ฝึก AI และนำไปใช้สร้างคำตอบโดยไม่มีการระบุแหล่งที่มา
  • นี่เป็นปฏิกิริยาที่พบได้บ่อยในหมู่ผู้สร้างคอนเทนต์ ไม่ใช่แค่บน Stack Overflow แต่ทั่วทั้งอินเทอร์เน็ตในปัจจุบัน
  • ขณะนี้อินเทอร์เน็ตกำลังอยู่ในช่วงเวลาแห่งความเปลี่ยนแปลง ทั้งทราฟฟิกบล็อกและยอดเพจวิวที่ลดลง การค้นหาคำตอบผ่าน AI ที่เพิ่มขึ้น และบางคนก็ใช้งานเสิร์ชเอนจินน้อยลง
  • เป็นช่วงเวลาแห่งความตึงเครียดที่ความไม่แน่นอนเกี่ยวกับการปรับตัวต่อความสามารถใหม่ของ ChatGPT และ LLM (โมเดลภาษาขนาดใหญ่) อื่นๆ อยู่ร่วมกับคำถามว่าสิ่งเหล่านี้หมายถึงอะไรต่ออินเทอร์เน็ตอย่างที่เรารู้จัก
  • กระแสต้านล่าสุดต่อความร่วมมือระหว่าง Stack Overflow และ OpenAI เป็นเพียงหนึ่งตัวอย่างของการที่ผู้คนตอบสนองในเชิงลบต่อการยอมรับ AI ในวงกว้างและความเปลี่ยนแปลงอย่างรวดเร็วที่ตามมา
โฆษณา

Stack Overflow กำลังระงับบัญชีเพราะลบคอนเทนต์หรือไม่?

  • ผู้ใช้หลายรายโพสต์บน Twitter และ Hacker News ว่า หลังจากพยายามลบคำถามและคำตอบหลายรายการที่ตนเคยโพสต์ไว้บนเว็บไซต์ Stack Overflow พวกเขาได้รับอีเมลจากผู้ดูแลของ Stack Overflow ว่าบัญชีถูกพักไว้ 7 วันหรือถูกบล็อกชั่วคราว
  • ตามอีเมลจากทีมผู้ดูแล Stack Overflow การลบหรือเอาคอนเทนต์ที่อาจเป็นประโยชน์ต่อผู้อื่นออกไป อาจสร้างความปั่นป่วนให้กับทั้งชุมชน แม้ว่าคอนเทนต์นั้นจะไม่มีประโยชน์กับผู้เขียนอีกต่อไปแล้วก็ตาม
  • ธุรกิจของ Stack Overflow และเครือข่าย Stack Exchange ทั้งหมดพึ่งพาคอนเทนต์ที่ผู้ใช้สร้างขึ้นเพื่อให้เว็บไซต์ยังคงมีประโยชน์ใช้งานได้ ดังนั้นจึงชัดเจนว่ามีเหตุผลทางธุรกิจที่ไม่ต้องการให้ผู้ใช้นำคอนเทนต์ออกครั้งละมากๆ
  • การที่ Stack Overflow ระงับบัญชีและส่งอีเมลเตือนอาจไม่ใช่เรื่องใหม่ และน่าจะเป็นนโยบายที่ใช้มานานเพื่อปกป้องแพลตฟอร์ม
  • หากผู้ใช้สามารถทำให้คอนเทนต์จำนวนมากเสียหายหรือลบได้โดยง่าย ก็อาจสร้างความปั่นป่วนอย่างมากต่อแพลตฟอร์ม ดังนั้นการปกป้องคอนเทนต์จึงเป็นผลประโยชน์สูงสุดของทั้ง Stack Overflow และชุมชน
  • นอกจากนี้ ยังมีความเป็นไปได้สูงว่าอีเมลนี้เป็นอีเมลอัตโนมัติที่ถูกทริกเกอร์จากพฤติกรรมของผู้ใช้ และการติดต่อ Stack Overflow โดยตรงเกี่ยวกับคอนเทนต์อาจเป็นแนวทางที่ดี
  • จนถึงตอนนี้ยังไม่เห็นคำตอบจาก Stack Overflow เกี่ยวกับการระงับบัญชีเหล่านี้ อีกทั้งก็ยังไม่ชัดเจนว่ามีผู้ใช้ที่พยายามทำแบบนี้จริงๆ มากน้อยเพียงใด จึงอาจไม่ได้มีกระแสต่อต้านความร่วมมือระหว่าง Stack Overflow และ OpenAI ขนาดใหญ่นัก
  • แรงส่งของการนำ AI มาใช้คงจะไม่ชะลอลงในเร็วๆ นี้ ดังนั้นจึงน่าสนใจที่จะจับตาดูว่าสิ่งเหล่านี้จะพัฒนาไปอย่างไรต่อจากนี้
  • ผู้ใช้ Stack Overflow ที่เหลือไม่แนะนำให้ลบคอนเทนต์ของตนเองเพื่อเป็นการประท้วง

ความเห็นของ GN⁺

  • ความร่วมมือระหว่าง Stack Overflow และ OpenAI ดูมีแนวโน้มจะส่งผลอย่างมากต่อพัฒนาการของเทคโนโลยี AI และชุมชนนักพัฒนา แต่การหาสมดุลระหว่างการคุ้มครองทรัพย์สินทางปัญญาของนักพัฒนาแต่ละคนกับการนำข้อมูลไปใช้เป็นข้อมูลฝึก AI ยังเป็นโจทย์ที่ต้องแก้
  • นักพัฒนาควรสามารถแบ่งปันความรู้ของตนได้ พร้อมกับได้รับผลตอบแทนที่เป็นธรรมสำหรับสิ่งนั้น Stack Overflow จึงดูจำเป็นต้องจัดให้มีกลไกการชดเชยที่เหมาะสม
  • ความเชื่อมั่นต่อชุมชนเป็นสิ่งสำคัญอย่างยิ่งในการส่งเสริมให้นักพัฒนาแบ่งปันความรู้ด้วยความสมัครใจ จากเหตุการณ์ครั้งนี้จึงจำเป็นต้องใช้แนวทางที่ระมัดระวังเพื่อไม่ให้ความเชื่อมั่นของนักพัฒนาต่อ Stack Overflow ถูกบั่นทอน
  • ในอีกด้านหนึ่ง การเพิ่มผลิตภาพการพัฒนาด้วยเทคโนโลยี AI อย่าง ChatGPT ก็เป็นข้อได้เปรียบอย่างมากสำหรับนักพัฒนาเช่นกัน จึงควรเดินหน้าหาวิธีลดผลข้างเคียงจากการใช้ AI เช่น ประเด็นความเป็นส่วนตัว ให้เหลือน้อยที่สุด พร้อมทั้งดึงข้อดีออกมาให้ได้มากที่สุด
  • ประเด็นคล้ายกันนี้เคยเกิดขึ้นกับข้อถกเถียงเรื่องลิขสิทธิ์รอบ GitHub Copilot จึงดูจำเป็นต้องมีความพยายามในการหาจุดร่วมที่ทุกฝ่ายยอมรับได้ผ่านการถกเถียงอย่างคึกคักภายในชุมชนนักพัฒนา

1 ความคิดเห็น

 
GN⁺ 2024-05-10
ความเห็นจาก Hacker News
  • ประเด็นเรื่องการเปลี่ยนไลเซนส์คอนเทนต์ของผู้ใช้ใน StackOverflow:
    • เมื่อราว 5 ปีก่อน StackOverflow เคยประกาศผิดพลาดว่าคอนเทนต์ทั้งหมดที่ผู้ใช้ส่งเข้ามาอยู่ภายใต้ CC-BY-SA 4.0 ทั้งที่ข้อตกลงเดิมกับผู้ใช้คือ CC-BY-SA 3.0
    • ช่วงกลางปี 2018 ถึงต้นปี 2019 มีความสับสนเกี่ยวกับไลเซนส์ที่ใช้กับทั้งโค้ดและเนื้อหาที่ไม่ใช่โค้ด
    • ในช่วงต้นปี 2019 ได้ขอให้ผู้ใช้ล็อกอินใหม่และยอมรับข้อตกลงไลเซนส์ฉบับใหม่
    • ปัจจุบัน คอนเทนต์ก่อนวันที่ 5 พฤษภาคม 2018 ใช้ CC-BY-SA 3.0 และหลังจากนั้นใช้ CC-BY-SA 4.0
  • ความเห็นของผู้ใช้ต่อประเด็น AI scraper และการให้ข้อมูลกับ OpenAI ของ StackOverflow:
    • ผู้ใช้บางคนไม่ได้ติดขัดที่คำตอบของตนจะถูกนำไปใช้ฝึก AI และมองว่ามอบคุณค่าอย่างมากให้กับเครื่องมืออย่าง ChatGPT
    • ความร่วมมือกับ OpenAI ไม่ใช่แก่นหลักของปัญหาการลบคอนเทนต์ของผู้ใช้ โดยในแง่ไลเซนส์ การลบคอนเทนต์ไม่ใช่สิ่งที่ได้รับการยอมรับและมักถูกย้อนกลับ
    • ด้วยไลเซนส์ CC-BY-SA ต่อให้ StackOverflow ไม่อนุญาต คนอื่นก็ยังคัดลอกได้ ทำให้การลบคอนเทนต์ทำได้ยาก
    • ผู้ใช้สามารถลบชื่อหรือแก้ไขข้อมูลส่วนตัวได้ แต่ไม่สามารถนำคอนเทนต์คุณภาพดีออกไปภายหลังได้
  • ปัญหาของการที่บริษัทแสวงหากำไรเป็นผู้ดูแลผลิตภัณฑ์ที่ "ฟรี":
    • เพราะต้องทำกำไร จึงไม่จำเป็นต้องยึดถือจริยธรรมแบบโอเพนซอร์ส ผู้ใช้อาจคิดว่าตนกำลังมีส่วนร่วมกับโอเพนซอร์ส แต่ความจริงไม่ใช่
    • การกระทำของ StackExchange น่าจะถูกกฎหมาย แต่ผู้มีส่วนร่วมไม่ใช่ผู้มีส่วนได้ส่วนเสีย และบริษัทเพียงแค่ต้องรักษาจำนวนผู้มีส่วนร่วมให้อยู่ในระดับที่ทำธุรกิจต่อได้
    • สำหรับผลิตภัณฑ์ที่ให้ใช้ฟรี สุดท้ายผู้ใช้เองก็คือสินค้า และถ้าไม่รู้ว่ามีการทำเงินอย่างไร สักวันก็มีแนวโน้มจะผิดหวัง
  • ความจำเป็นของไลเซนส์คอนเทนต์แบบใหม่ที่ออกแบบมาสำหรับการฝึก AI โดยเฉพาะ:
    • อาจมีไลเซนส์ในแนวคิดแบบ GPL เกิดขึ้น เช่น หากคอนเทนต์ถูกใช้ฝึก AI เชิงพาณิชย์ ก็ต้องเปิดเผย weights ของ AI ด้วย
  • โมเดลการขายชุดข้อมูลของ StackOverflow:
    • ตั้งแต่แรก StackOverflow ก็ไม่ได้เน้นผู้ใช้เป็นศูนย์กลาง แต่เน้นสร้างชุดข้อมูลเพื่อ SEO มากกว่า ดังนั้นดีลกับ OpenAI จึงไม่ได้เปลี่ยนอะไรไปมาก
    • เมื่อ LLM มาถึง วิกฤตของ StackOverflow ก็ดูหลีกเลี่ยงไม่ได้ จึงควรขายให้ OpenAI และเก็บเกี่ยวสิ่งที่ทำได้ก่อนจะล่มสลาย
  • ความสำคัญของเงื่อนไข ShareAlike ในไลเซนส์ CC BY-SA:
    • ข้อกำหนดที่ว่าหากสร้างงานดัดแปลงจะต้องเผยแพร่ภายใต้ไลเซนส์เดียวกันนั้นกว้างมากและกำกวม โดยนิยามของคำว่า "build upon" อาจไม่น่าดึงดูดสำหรับผู้ใช้จำนวนมาก
  • การเปรียบเทียบข้อดีข้อเสียของ LLM กับ StackOverflow:
    • LLM ทำให้สามารถหลีกเลี่ยง StackOverflow ได้มากที่สุดเท่าที่จะทำได้ เพราะ StackOverflow เต็มไปด้วยความเป็นชนชั้นนำและความเป็นพิษที่ให้ความสำคัญกับขั้นตอนมากกว่าการช่วยเหลือจริง
    • มีคนบ่นว่า LLM ตอบผิดในบางครั้ง แต่คำตอบใน StackOverflow ก็มีจำนวนไม่น้อยที่ผิดทั้งหมดหรือไม่เกี่ยวกับคำถามเลย และยังมีคำตอบเก่า ๆ อยู่มาก
    • ถ้านำความสามารถด้านการเขียนของ LLM มารวมกับการตรวจสอบจากผู้ใช้ StackOverflow ได้ นั่นน่าจะเป็นรูปแบบที่ดีที่สุด แม้อาจไม่ถูกใจคนที่สนใจแค่การเก็บแต้มบนอินเทอร์เน็ต แต่สำหรับผู้ใช้จะยอดเยี่ยมมาก
  • ข้อความเตือนอัตโนมัติของ StackOverflow เกี่ยวกับการลบคอนเทนต์จำนวนมาก:
    • ดูเหมือนว่าจะมีมาตั้งแต่อย่างน้อยปี 2017 และน่าจะถูกแสดงโดยอัตโนมัติเมื่อระบบตรวจพบการลบจำนวนมาก
    • StackOverflow มีลักษณะใกล้เคียงวิกิมากกว่าฟอรัมในหลายด้าน จึงพอเข้าใจเหตุผลของนโยบายนี้ได้ และไม่น่าใช่ว่าถูกนำมาใช้เพื่อกลบกระแสประท้วงต่อต้าน OpenAI
  • ยังมีความเห็นส่วนตัวด้วยว่า ในช่วง 2 ปีที่ผ่านมาแทบไม่ได้ใช้ StackOverflow เลย