4 คะแนน โดย GN⁺ 2023-11-03 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • บทความของ Bear Blog ว่าด้วยการวิเคราะห์ข้อมูลด้วย CSS โดยเน้นที่ความเร็ว ประสิทธิภาพ และความเสถียร
  • Bear Blog หลีกเลี่ยงการใช้ JavaScript ฝั่งไคลเอนต์ เนื่องจากช่องโหว่ของตัวบล็อกโฆษณาและปัญหาที่ไม่สามารถแยกทราฟฟิกของบอตกับมนุษย์ออกจากกันได้
  • ผู้เขียนอธิบายข้อจำกัดของการวิเคราะห์โดยใช้ server logs ว่าปฏิบัติต่อทราฟฟิกทั้งหมดเท่า ๆ กัน และไม่สามารถระบุทราฟฟิกบอตได้อย่างแม่นยำ
  • วิธีแก้ของผู้เขียนคือใช้ CSS เพื่อทริกเกอร์การอ่านด้วยโค้ดต่อไปนี้: body:hover { border-image: url("/hit/{{ post.id }}/?ref={{ request.META.HTTP_REFERER }}");}.
  • วิธีนี้จะถูกทริกเกอร์เมื่อผู้ใช้เลื่อนเคอร์เซอร์เหนือหน้าเว็บ หรือเลื่อนหน้าจอบนอุปกรณ์มือถือ ซึ่งผู้เขียนเชื่อว่าเป็นตัวชี้วัดทราฟฟิกจากมนุษย์ที่เชื่อถือได้
  • ระบบจะตรวจสอบ user-agent เพื่อยืนยันว่าไม่ใช่บอต ดึงข้อมูลเบราว์เซอร์และแพลตฟอร์ม และแฮชที่อยู่ IP กับวันที่เพื่อสร้าง "การอ่าน" แบบไม่ซ้ำของหน้า
  • ระบบไม่ได้เก็บคุกกี้ของเบราว์เซอร์หรือข้อมูลระบุตัวตนของผู้อ่านไว้บนเซิร์ฟเวอร์
  • ผู้เขียนยอมรับข้อจำกัดของวิธีนี้: การอ่านหลายครั้งจากอุปกรณ์ต่างกันแต่ใช้ที่อยู่ IP เดียวกันจะถูกนับเป็นการอ่านเดียว
  • ถึงอย่างนั้น ผู้เขียนเชื่อว่าวิธีนี้ให้จำนวนการอ่านที่แม่นยำ และเรียบง่ายกว่ารูปแบบการเก็บข้อมูลวิเคราะห์อื่น ๆ จำนวนมาก

1 ความคิดเห็น

 
GN⁺ 2023-11-03
ความคิดเห็นบน Hacker News
  • ผู้เขียนบทความชี้แจงไว้อย่างชัดเจนว่าใช้แฮชของที่อยู่ IP เพื่อป้องกันการนับยอดเข้าชมซ้ำภายในวันเดียว และทำให้การเข้าชมแต่ละครั้งมีลักษณะเป็นเอกลักษณ์โดยพื้นฐาน เมื่อสิ้นสุดแต่ละวัน งานของ worker จะล้างข้อมูลเหล่านี้ออกโดยยังคงเก็บสารสนเทศการเข้าชมไว้
  • ผู้แสดงความคิดเห็นรายหนึ่งมองว่าแนวคิดการใช้ CSS เป็นตัวกระตุ้นสำหรับงานวิเคราะห์นั้นเจ๋งมาก และยกตัวอย่างการซ้อนกริดสี่เหลี่ยมที่มองไม่เห็นไว้บนหน้าเพื่อใช้ติดตามเมาส์ โดยแต่ละช่องมีภาพพื้นหลังเฉพาะตัวที่ถูกเรียกใช้งานเมื่อโฮเวอร์
  • ผู้แสดงความคิดเห็นอีกรายวิจารณ์ว่าการทำให้ที่อยู่ IP ไม่ระบุตัวตนด้วยการแฮชแค่วันที่กับ IP เป็นเพียงภาพลวงตาด้านความปลอดภัย พร้อมชี้ว่าแฮชเชิงเข้ารหัสถูกออกแบบมาให้คำนวณได้รวดเร็ว จึงอาจถูกโจมตีแบบ brute-force เพื่อค้นหาที่อยู่ IP ได้
  • ผู้ใช้คนหนึ่งชี้ว่าวิธี body:hover มีแนวโน้มสูงที่จะพลาดผู้ใช้ส่วนใหญ่ที่ใช้งานแบบ "คีย์บอร์ดล้วน" และ user agent ที่ไม่ใช้อุปกรณ์ชี้ตำแหน่ง (เทคโนโลยีช่วยการเข้าถึง) พร้อมเน้นว่าจำเป็นต้องมีแนวทางที่ครอบคลุมกว่านี้
  • ผู้ใช้อีกรายเชื่อว่าหากการวิเคราะห์ด้วย CSS ได้รับความนิยม ผู้ใช้ก็อาจเริ่มเอือมระอากับแนวคิดของการวิเคราะห์โดยรวมและพยายามหาทางเลี่ยงมัน
  • ผู้แสดงความคิดเห็นบางรายชื่นชมการใช้ CSS สำหรับงานวิเคราะห์อย่างชาญฉลาด และแชร์ความพยายามของตนกับวิธีคล้ายกัน เช่น การใช้แท็ก <img> เพื่อโหลดภาพปลอม
  • ผู้ใช้คนหนึ่งตั้งคำถามถึงเป้าหมายของการเก็บข้อมูลวิเคราะห์สำหรับบล็อกส่วนตัวในบริบทที่ไม่ใช่เชิงพาณิชย์
  • ผู้ใช้อีกรายเสนอว่าแทนที่จะใช้การวิเคราะห์ด้วย CSS ควรดึงข้อมูลนี้จาก HTTP server