22 คะแนน โดย xguru 2022-04-20 | 11 ความคิดเห็น | แชร์ทาง WhatsApp
  • "การสแครปข้อมูลที่เข้าถึงได้แบบสาธารณะเป็นเรื่องถูกกฎหมาย (ไม่ถือว่าละเมิด CFAA)"
  • ยืนยันคำตัดสินเดิมในคดีที่ LinkedIn ฟ้องบริษัทวิเคราะห์ข้อมูล Hiq เพื่อห้ามการสแครปข้อมูล (ซึ่งแพ้คดีไปแล้วตั้งแต่ปี 2019)
  • ถือเป็นข่าวดีสำหรับเว็บอาร์ไคฟ์ วงการวิชาการ นักวิจัย และนักข่าว
  • ศาลสหรัฐได้ทบทวน CFAA (Computer Fraud and Abuse Act, กฎหมายว่าด้วยการฉ้อโกงและการใช้งานคอมพิวเตอร์โดยมิชอบ) ซึ่งมีมานานหลายทศวรรษอีกครั้งในคดีนี้
    • จำกัดความการละเมิดไว้เฉพาะผู้ที่ "เข้าถึงระบบคอมพิวเตอร์โดยไม่ได้รับอนุญาต"
    • แนวคิดเรื่อง "ไม่ได้รับอนุญาต" ไม่สามารถนำมาใช้กับเว็บไซต์สาธารณะได้

11 ความคิดเห็น

 
devsejong 2022-04-20

ผมก็สงสัยเหมือนกันว่าในเกาหลี เว็บสแครปปิงจะไม่มีปัญหาทางกฎหมายหรือเปล่า
ถ้าใครมีประสบการณ์ รบกวนช่วยแชร์ได้ไหมครับ?

 
nullvana 2022-04-25

ในแง่กฎระเบียบของบ้านเรา

  1. ข้อมูลเครดิตส่วนบุคคล
    คำว่าเครดิตในที่นี้ไม่ใช่เครดิตของ "บัตรเครดิต" ครับ บริการที่ทำให้เจ้าตัวสามารถ "ตรวจสอบ" ข้อมูลที่ใช้ประเมินชื่อเสียงหรือความน่าเชื่อถือทางการเงินของบุคคล (เช่น ยอดคงเหลือ ประวัติธุรกรรม ฯลฯ) นั้นเป็นสิ่งต้องห้าม ต้องได้รับใบอนุญาตประกอบธุรกิจจัดการข้อมูลเครดิตส่วนบุคคลก่อน แต่ถ้าไม่ใช่การให้เจ้าตัวตรวจสอบได้ และแค่นำไปใช้เป็นข้อมูลเหมือนการยื่นภาษี ก็ไม่มีปัญหา อืม...?

  2. ต่อให้ได้ข้อมูลที่ต้องการจากการ crawl หรือ scraping บนหน้าเว็บมาแล้วก็ตาม ถ้าเป็นการข้ามหน้าชำระเงิน หรือได้ข้อมูลนอกเหนือจากที่หน้าเว็บตั้งใจ/ให้แสดงบนหน้าจอ ทั้งหมดถือว่าผิดกฎหมาย แม้จะไม่แสดงบนหน้าจอและวิ่งไปมาระหว่าง FE/BE ในรูปแบบ JSON ก็ตาม ถ้าเอาไปใช้นอกวัตถุประสงค์ก็ผิดกฎหมาย ผมเหมือนเคยเห็นข่าวว่ามีคนไปดึงเอกสารจดทะเบียนจากกระทรวงยุติธรรมฟรี ๆ แล้วโดนจับ

ข้อ 2 นี่บริษัทการเงินที่เงินไม่มากนัก (ประกัน/บัตร/หลักทรัพย์ ฯลฯ...นอกเหนือจากธนาคาร) หลายเจ้ามีช่องโหว่เยอะเพราะไม่มีทรัพยากรพอ... ถ้ามองในแง่การปกป้องก็ยังพอเข้าใจได้อยู่... แต่ข้อ 1 นี่ดูเหมือนทำอะไรไม่เข้าท่าเลยครับ เจตนาของข้อ 1 ในกรอบอธิปไตยข้อมูลส่วนบุคคลผมก็พอเข้าใจนะ แต่รูปแบบที่ทำอยู่ตอนนี้มันเหมือน ActiveX 3.0? มากกว่า

 
devsejong 2022-04-21

ขอบคุณทุกท่านที่แสดงความคิดเห็นครับ! ช่วยได้มากจริง ๆ ครับ

 
ninebow 2022-04-21

ขอแชร์ลิงก์ที่เคยพูดถึงหัวข้อคล้ายกันเมื่อไม่นานนี้ในจดหมายข่าวที่ผมติดตามอยู่ครับ

มีการสรุปกรณี JobKorea VS Saramin ที่คุณ rtyuiop กล่าวถึงด้านล่างไว้ด้วย รวมถึงกรณี Yeogi Eottae VS Yanolja และ Naver vs Darwin Brokerage ด้วย
https://stibee.com/api/v1.0/…==

 
xguru 2022-04-21

โอ้ จดหมายข่าวของ Packt ดีเลยนะครับ ขอบคุณสำหรับลิงก์ครับ~!

 
ninebow 2022-04-21

ติดตามอ่านอยู่เสมอ ขอบคุณมากครับ (_ _)

 
rtyuiop 2022-04-20

เท่าที่ผมทราบ กรณีที่ดังที่สุดน่าจะเป็นกรณีที่ Yeogi Eottae ครอว์ลิงข้อมูลของ Yanolja ตามความเข้าใจของผม แน่นอนว่ามันเป็นข้อมูลสาธารณะและตัวการครอว์ลิงเองก็ไม่มีปัญหา แต่ประเด็นหลักคือ (1) ความเสียหายที่ Yanolja ได้รับจากภาระบนเซิร์ฟเวอร์ที่เพิ่มขึ้น และ (2) ความเสียหายที่ Yanolja อาจได้รับจากการที่ทั้งสองแบรนด์อยู่ในธุรกิจประเภทเดียวกันจากเรื่องนี้ คดียังอยู่ระหว่างการพิจารณา และแต่ละบทความก็ตีความไปคนละทาง ดังนั้นผมคิดว่าลองหาอ่านหลาย ๆ แหล่งด้วยตัวเองจะดีกว่าครับ

 
tingo29 2022-04-20

ในแวดวงการเงิน หลังจากเริ่มใช้ MyData ก็มีการห้ามทำสแครปปิง

https://news.einfomax.co.kr/news/articleView.html?idxno=4192027

 
tribela 2022-04-20

ฉันเคยคุยเรื่องนี้กับทนายความคนหนึ่งที่ฉันรู้จัก และตามเกณฑ์ในตอนนั้นคือ "ตัวการรวบรวมข้อมูลที่เปิดเผยสู่สาธารณะนั้นไม่ใช่ปัญหาในตัวมันเอง แต่ถ้ามีมาตรการป้องกันการครอว์ลไม่ว่าจะในรูปแบบใดก็ตาม การพยายามหลบเลี่ยงมันเพื่อบันทึกข้อมูลเมื่อไร ก็อาจกลายเป็นปัญหาได้"
สุดท้ายแล้ว ในทางกฎหมายเขามองที่เจตนามากกว่าประเด็นทางเทคนิคจริง ๆ

 
xguru 2022-04-20

นี่เป็นข้อมูลโปรไฟล์ส่วนบุคคลที่อยู่ใน LinkedIn เลยรู้สึกแปลกๆ อยู่บ้าง..
แต่ก็ดูเหมือนว่าการจะห้ามแม้แต่การสแครปข้อมูลที่เปิดเผยสาธารณะก็คงเป็นเรื่องที่ฝืนเกินไปจริงๆ

สถานการณ์เว็บสแครปปิงในปี 2021

 
joone 2022-04-26

มีข้อมูลจำนวนมากบน LinkedIn ที่เปิดเป็นสาธารณะเช่นกัน แต่ LinkedIn ก็เป็นหนึ่งในเว็บไซต์ที่สแครปได้ยากที่สุดเช่นกัน ถึงอย่างนั้นก็ยังหาวิธีเก็บข้อมูลจากหน้าเว็บได้อยู่ดี เป็นการต่อสู้กันระหว่างหอกกับโล่