1 คะแนน โดย GN⁺ 2023-08-26 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • บทความว่าด้วยความซับซ้อนทางกฎหมายและความหน้าไหว้หลังหลอกของเว็บสแครปปิง
  • วิธีที่บริษัทยักษ์ใหญ่อย่าง Meta และ Microsoft ห้ามเว็บสแครปปิงบนแพลตฟอร์มของตนเอง ขณะเดียวกันก็เก็บข้อมูลจากแพลตฟอร์มของบริษัทอื่น
  • ความซับซ้อนของประเด็นทางกฎหมายเกี่ยวกับการเข้าถึงและการใช้ข้อมูลบนอินเทอร์เน็ต รวมถึงวัตถุประสงค์ของการกระทำนั้น แม้ว่าจะมีรูปแบบข้อมูลที่ได้รับการคุ้มครองด้วยลิขสิทธิ์หรือทรัพย์สินทางปัญญาอื่น แต่ข้อมูลส่วนใหญ่บนอินเทอร์เน็ตกลับได้รับความคุ้มครองได้ไม่ง่ายนัก
  • บริษัทโซเชียลมีเดียอย่าง LinkedIn และ Facebook เป็นผู้ที่เดินหน้าฟ้องร้องคดีเว็บสแครปปิงอย่างแข็งกร้าวที่สุด แต่คอนเทนต์ที่พวกเขาพยายามปกป้องนั้นเป็นสิ่งที่ผู้ใช้สร้างขึ้น ไม่ใช่ทรัพย์สินของบริษัทเอง
  • ในยุคแรกของอินเทอร์เน็ต บริษัทต่าง ๆ ใช้ทฤษฎีกฎหมายเพื่อหยุดเว็บสแครปปิงในฐานะการบุกรุกต่อทรัพย์สิน โดยอ้างว่าการส่งคำขอข้อมูลจำนวนมากที่ไม่พึงประสงค์เป็นรูปแบบหนึ่งของการบุกรุกทรัพย์สินที่จับต้องได้ของเอกชน นั่นคือเซิร์ฟเวอร์คอมพิวเตอร์
  • ตั้งแต่ต้นทศวรรษ 2000 ถึงปี 2017 กฎหมาย Computer Fraud and Abuse Act (CFAA) เป็นทฤษฎีกฎหมายหลักที่ใช้ป้องกันเว็บสแครปปิง โดย CFAA ห้ามการเข้าถึง "คอมพิวเตอร์ที่ได้รับการคุ้มครอง" โดยไม่ได้รับอนุญาต
  • ในคดี hiQ Labs, Inc. v. LinkedIn Corp. ปี 2017 ศาลยืนยันสิทธิของเว็บสแครปเปอร์ในการเข้าถึงข้อมูล LinkedIn ที่เป็นสาธารณะภายใต้ CFAA ทำให้หลายคนตีความว่านี่คือการรับรองสิทธิเชิงบวกในการสแครปข้อมูลสาธารณะ
  • ปัจจุบัน วิธีหลักในการหยุดเว็บสแครปปิงคือการอ้างการละเมิดสัญญา ซึ่งเปิดทางให้บริษัทต่าง ๆ อ้างสิทธิในทรัพย์สินเหนือการใช้และการเข้าถึงข้อมูลผ่านกฎหมายสัญญา
  • การเปลี่ยนผ่านจากกฎหมายทรัพย์สินไปสู่กฎหมายสัญญา ทำให้เจ้าของเว็บไซต์สามารถกำหนดสิทธิในข้อมูลออนไลน์ได้ผ่านข้อกำหนดการใช้งานออนไลน์
  • บทความนี้ชี้ให้เห็นถึงความหน้าไหว้หลังหลอกของบริษัทอย่าง Microsoft ที่เพิ่งอัปเดตข้อกำหนดการใช้งานเพื่อห้ามการสแครปบริการ AI แต่ OpenAI ซึ่งเป็นบริษัทในเครือกลับเปิดตัวผลิตภัณฑ์ที่ออกแบบมาเพื่อสแครปทั้งอินเทอร์เน็ต
  • ผู้เขียนวิจารณ์การที่ศาลยอมให้บริษัทเอกชนสร้างสิทธิในทรัพย์สินทางปัญญาผ่านสัญญาสำเร็จรูป และโต้แย้งว่าคำตัดสินลักษณะนี้ควรเป็นประเด็นที่คำนึงถึงประโยชน์สาธารณะ
  • บทความเสนอว่าระบอบกฎหมายปัจจุบันเกี่ยวกับเว็บสแครปปิงจะถูกทดสอบจากกรณีของ generative AI พร้อมคาดการณ์ว่าความสอดคล้องของกฎหมายจะไม่อาจคงอยู่ได้ และจะมีพัฒนาการทางกฎหมายสำคัญเกิดขึ้นในอีกไม่กี่ปีข้างหน้า

1 ความคิดเห็น

 
GN⁺ 2023-08-26
ความคิดเห็นบน Hacker News
  • ช่วงหลังมานี้การแข่งขันด้าน AI และ LLM ทำให้ความกังวลเกี่ยวกับการทำ web scraping เพิ่มสูงขึ้น และบุคคลสำคัญกับบริษัทเทคโนโลยีรายใหญ่ต่างก็เสริมการป้องกันต่อภัยคุกคามที่รับรู้กันมากขึ้น
  • เพื่อลดความหวาดกลัวเกี่ยวกับการ scrape ข้อมูล จึงจำเป็นต้องมีการตีความลิขสิทธิ์แบบใหม่สำหรับแอปพลิเคชัน AI เชิงพาณิชย์
  • คดี HiQ v. LinkedIn มักถูกยกมาอ้างในการถกเถียงเรื่อง web scraping แต่รายละเอียดของคดีมีความซับซ้อนและมักถูกมองข้าม
  • สิ่งที่ถูกมองว่าเป็นความหน้าซื่อใจคดของบริษัทที่ scrape ข้อมูลไปพร้อมกับห้ามผู้อื่น scrape ข้อมูลของตนเอง อาจอธิบายได้ว่าเป็นกลยุทธ์การแข่งขัน ไม่ใช่ความขัดแย้งในตัวเอง
  • การเปลี่ยนจากกฎหมายทรัพย์สินไปสู่กฎหมายสัญญา ทำให้เจ้าของเว็บไซต์สามารถกำหนดสิทธิของตนเองได้ และส่งผลให้ "สัญญา" แบบฝ่ายเดียวจากบริษัทยักษ์ใหญ่แพร่หลายมากขึ้น
  • กรณีล่าสุดที่ Microsoft ออกผลิตภัณฑ์ที่ออกแบบมาเพื่อ scrape อินเทอร์เน็ต ทั้งที่ก่อนหน้านี้ห้ามการ scrape ถูกชี้ว่าเป็นตัวอย่างของความหน้าซื่อใจคดขององค์กร
  • web scraping ถูกมองว่าเป็นปัญหาต่อโมเดลธุรกิจ โดยเฉพาะเมื่อทำในระดับขนาดใหญ่ และผู้ให้บริการคอนเทนต์ฟรีที่พึ่งพารายได้จากโฆษณาก็กำลังถูกคุกคามจากการ scrape ที่หลบเลี่ยงโฆษณา
  • ความเป็นเจ้าของคอนเทนต์ที่ผู้ใช้สร้างขึ้นบนแพลตฟอร์มอย่าง Facebook มีความซับซ้อน โดยผู้ใช้ยังคงถือครองสิทธิ แต่ให้สิทธิการใช้งานอย่างกว้างขวางแก่แพลตฟอร์ม
  • อุปสรรคทางกฎหมายต่อ web scraping โดยทั่วไปถูกมองว่าเป็นสิ่งไม่พึงประสงค์ แต่ก็มีบุคคลที่เคยได้รับผลกระทบด้านลบจากการ scrape เช่น อีเมลสแปมด้วยเช่นกัน