หน้าเว็บที่แสดงข้อมูลทั้งหมดที่เบราว์เซอร์บอกได้
(sinceyouarrived.world)- หน้านี้แสดงตำแหน่ง อุปกรณ์ เบราว์เซอร์ ภาษา GPU แบตเตอรี่ ฟอนต์ และค่ากำหนดของผู้ใช้ โดยอาศัยเพียงข้อมูลที่เบราว์เซอร์ส่งมาในช่วงมิลลิวินาทีแรกหลังเข้าชม และใช้เฉพาะความสามารถมาตรฐานที่มีเอกสารสาธารณะรองรับ โดยไม่มีการใช้ exploit หรือการแฮ็ก
- ระบบส่ง IP address จาก request header ทั้งหมดไปยัง ip-api.com · Free tier · CC-BY-SA เพื่อแปลงเป็นชื่อเมืองและผู้ให้บริการอินเทอร์เน็ต โดยระบุว่าการค้นหาจะไม่ถูกเก็บไว้ และบนหน้าจอจะแสดงเพียงบาง octet เท่านั้น แม้จะสามารถทราบส่วนที่เหลือได้
- ลายนิ้วมือฟอนต์ ใช้การวัดความกว้างของข้อความที่เรนเดอร์แล้วเพื่อตรวจจับฟอนต์ที่ติดตั้งไว้ และ Electronic Frontier Foundation · Cover Your Tracks มีเครื่องมือสำหรับตรวจสอบความเป็นเอกลักษณ์ของเบราว์เซอร์ ขณะที่งานวิจัยของ Princeton ปี 2014 พบ ลายนิ้วมือแคนวาส บน 5% ของเว็บไซต์ 100,000 อันดับแรก
- แม้หน้าเว็บนี้จะไม่ได้เรียกใช้ แต่ก็มี Clipboard API ที่สามารถขออ่านสิ่งล่าสุดที่ผู้ใช้คัดลอกได้ด้วย gesture ของผู้ใช้เพียงครั้งเดียว รวมถึง “The Leaking Battery” ที่แสดงความเป็นไปได้ในการติดตามผู้ใช้ได้นานสูงสุด 30 นาทีจากระดับแบตเตอรี่และเวลาคายประจุ และยังมีเทคนิคตรวจจับเว็บไซต์ที่ล็อกอินอยู่ผ่าน favicon
- ระบุว่าสิ่งที่ส่งไปยังเซิร์ฟเวอร์มีเพียงอีเวนต์นิรนามสองรายการคือ arrival และ complete เท่านั้น และไม่เก็บอะไรไว้ใน
cookies,localStorage,sessionStorage,IndexedDBหรือ service worker cache พร้อมบอกว่าจะลืมผู้เข้าชมทันทีเมื่อปิดแท็บ
ข้อมูลที่เบราว์เซอร์ส่งมาทันทีเมื่อมาถึง
- การสังเกตทั้งหมดของ taken. มาจากข้อมูลที่ได้จากเบราว์เซอร์ของผู้เข้าชมในช่วงมิลลิวินาทีแรกหลังเข้าชม และใช้เพียงความสามารถมาตรฐานที่มีเอกสารสาธารณะรองรับ โดยไม่มี exploit, ช่องโหว่ หรือการแฮ็ก
-
ตำแหน่งที่ตั้ง
- ระบบส่ง IP address ที่อยู่ใน request header ทุกครั้งไปยัง ip-api.com · Free tier · CC-BY-SA เพื่อแปลงเป็นชื่อเมืองและผู้ให้บริการอินเทอร์เน็ต
- ระบุว่าการค้นหานี้เป็นเพียงชั่วคราวและไม่มีฝ่ายใดจัดเก็บไว้ และบนหน้าจอจะแสดงเพียง octet แรกกับ octet สุดท้ายของ IP แต่ก็ยังสามารถรู้ส่วนที่เหลือได้
- ภายใต้ GDPR นั้น IP address อาจถือเป็นข้อมูลส่วนบุคคลได้เมื่อถูกใช้เพื่อติดตาม และ taken. ไม่ได้ติดตาม จัดเก็บ หรือทำ log
-
Browser API
- ค่าที่สังเกตได้จากอุปกรณ์ เช่น หน้าจอ เบราว์เซอร์ ภาษา GPU จำนวนคอร์ แบตเตอรี่ ฟอนต์ และค่ากำหนดของผู้ใช้ ถูกดึงมาด้วย JavaScript API มาตรฐานที่มีเอกสารสาธารณะบน MDN Web Docs · Mozilla · CC-BY-SA 2.5
- สิ่งเหล่านี้เป็นพฤติกรรมที่เป็นไปได้ตามการออกแบบของเบราว์เซอร์ และนำไปสู่ข้อสรุปว่า “ปัญหาอยู่ที่การออกแบบ”
-
ลายนิ้วมือฟอนต์และแคนวาส
- เทคนิค ลายนิ้วมือฟอนต์ ที่ตรวจจับฟอนต์ที่ติดตั้งไว้ผ่านความกว้างของข้อความที่เรนเดอร์แล้ว มีเอกสารอธิบายมาตั้งแต่ปี 2010 และ Electronic Frontier Foundation · Cover Your Tracks ก็มีเครื่องมือให้ตรวจสอบว่าเบราว์เซอร์มีเอกลักษณ์มากเพียงใด
- เบราว์เซอร์ส่วนใหญ่มีความเป็นเอกลักษณ์มากพอที่จะถูกติดตามบนเว็บเปิดได้แม้ไม่มีคุกกี้ และชุดฟอนต์เป็นหนึ่งในสัญญาณที่ทรงพลังที่สุด
- งานวิจัยปี 2014 ของ Princeton University · Web Transparency & Accountability Project เป็นงานแรกที่บันทึก ลายนิ้วมือแคนวาส บนเว็บจริง และพบใน 5% ของเว็บไซต์ 100,000 อันดับแรก
- ลายนิ้วมือแคนวาสทำงานโดยให้เบราว์เซอร์ของผู้เข้าชมวาดภาพที่ซ่อนไว้ แล้วอ่านพิกเซลที่เรนเดอร์กลับมาเป็นตัวระบุเฉพาะ โดย taken. ไม่ได้รันเทคนิคนี้ แต่เบราว์เซอร์รองรับอยู่
-
คลิปบอร์ดและแบตเตอรี่
- ตาม MDN · Clipboard API specification หน้าเว็บสามารถขออ่านสิ่งล่าสุดที่ผู้ใช้คัดลอกได้จาก gesture ของผู้ใช้เพียงครั้งเดียว เช่น การคลิกหรือแตะ
- สิ่งที่คัดลอกล่าสุดอาจเป็นรหัสผ่าน ที่อยู่ หรือข้อความร่าง และแม้ taken. จะไม่ได้ขออ่าน แต่ความสามารถนี้มีอยู่ในเบราว์เซอร์สมัยใหม่
- งานวิจัยปี 2015 ของ Olejnik, Englehardt และ Narayanan ชื่อ “The Leaking Battery” แสดงให้เห็นว่าสามารถติดตามผู้เข้าชมข้ามหลายเว็บไซต์ได้นานสูงสุด 30 นาที โดยไม่ต้องใช้คุกกี้หรือบัญชี เพียงจากการรวมข้อมูลระดับแบตเตอรี่กับเวลาคายประจุ
- Firefox เอา API นี้ออกไปในปี 2016 แต่ Chrome และ Edge ยังเปิดเผยข้อมูลนี้อยู่
เทคนิคที่ไม่ได้รันและข้อมูลที่ไม่ได้ทิ้งไว้
-
การตรวจจับเว็บไซต์ที่ล็อกอินอยู่
- แม้ taken. จะไม่ได้รัน แต่มีเทคนิคที่มีเอกสารอธิบาย ชอบด้วยกฎหมาย และถูกเผยแพร่อย่างกว้างขวาง ซึ่งใช้ให้เบราว์เซอร์โหลด URL ของ favicon จากบริการเฉพาะ แล้วสังเกตความสำเร็จหรือความล้มเหลวเพื่อดูว่าผู้ใช้ล็อกอินอยู่กับเว็บไซต์ใด
- วิธีนี้อาศัยความแตกต่างที่ระบบส่งคืนภาพไม่เหมือนกันระหว่างสถานะล็อกอินกับล็อกเอาต์ และสามารถตรวจได้โดยไม่ต้องขออนุญาตว่าผู้ใช้ล็อกอิน Facebook, Google, X, GitHub, Reddit, LinkedIn และบริการอื่น ๆ อยู่หรือไม่
-
บาร์โค้ดที่คำนวณภายในเบราว์เซอร์
- เส้น 16 เส้น ที่แสดงใต้ตัวนับ ประกอบด้วยความสูงที่ได้มาจาก GPU ฟอนต์ ขนาดหน้าจอ ภาษา เขตเวลา ระบบปฏิบัติการ เบราว์เซอร์ และความลึกสี
- ข้อมูลชุดเดิมจะสร้างบาร์โค้ดเดิม และผู้เข้าชมแต่ละคนจะเห็นบาร์โค้ดต่างกัน โดยการคำนวณเกิดขึ้นภายในเบราว์เซอร์เท่านั้นและไม่ถูกส่งออกไป
- หากมีคนที่มีลายนิ้วมือเหมือนกันทุกประการก็จะเห็นแท่งเหมือนกัน แต่โอกาสนั้นต่ำ
-
วิธีสร้างประโยค
- ทุกประโยคเขียนโดย Matt เอง และไม่มี language model มาเขียนหรือแก้ไขประโยคในขณะรัน
- โค้ดจะเลือกหนึ่งใน template ประโยคที่เขียนไว้ล่วงหน้าตามค่าที่เบราว์เซอร์ส่งกลับมา และหากเป็นเงื่อนไขที่ไม่สามารถจัดการได้ด้วยประโยคที่มนุษย์เขียนไว้ ก็จะไม่พูดอะไรเลย
-
สิ่งที่ส่งไปยังเซิร์ฟเวอร์
- อีเวนต์ที่ส่งไปยังเซิร์ฟเวอร์มีเพียงอีเวนต์นิรนามสองรายการคือ arrival และ complete เท่านั้น โดยไม่มีคุกกี้ ตัวระบุ หรือ IP ที่เก็บรักษาไว้
- เซิร์ฟเวอร์จะทิ้ง body ของแต่ละ request และไม่ส่งอะไรกลับมา แม้บันทึกระดับ transport ที่ระบุว่าเคยมี request อาจยังอยู่ใน log ตามระยะเวลาเก็บรักษามาตรฐานของผู้ให้บริการโฮสติง ซึ่งมักเป็นไม่กี่วัน
- เว็บไซต์ส่วนใหญ่ส่ง beacon เพิ่มอีกหลายร้อยรายการไปยังผู้ลงโฆษณา ผู้เก็บลายนิ้วมือ เครื่องมือเล่นซ้ำ session และ tag manager แต่ taken. ส่งเพียงสองรายการไปยังเซิร์ฟเวอร์ของตัวเองและบอกเรื่องนี้อย่างชัดเจน
-
สิ่งที่จัดเก็บบนอุปกรณ์
- ไม่มีการเก็บอะไรไว้ใน
cookies,localStorage,sessionStorage,IndexedDBหรือ service worker cache - ข้อมูลที่แสดงบนหน้าจอถูกคำนวณภายในเบราว์เซอร์ และนอกจากการค้นหา IP geolocation กับอีเวนต์นิรนามสองรายการแล้ว ก็ไม่ออกจากอุปกรณ์เลย
- เมื่อปิดแท็บ taken. จะลืมผู้เข้าชม และปิดท้ายพร้อมเผยแพร่ซอร์สโค้ดว่า “หน้าส่วนใหญ่พูดแบบนั้นไม่ได้”
- ไม่มีการเก็บอะไรไว้ใน
-
บริบทของซีรีส์และการสร้าง
- Vol. I ว่าด้วยสิ่งที่เกิดขึ้นบนโลกขณะผู้เข้าชมอยู่บนหน้าเว็บ, Vol. II ว่าด้วยท้องฟ้าที่พลาดไป, Vol. III ว่าด้วยสิ่งที่อยู่ใต้เท้ามาตลอด และ Vol. IV ค่อย ๆ บีบวงเข้ามาที่ตัวผู้เข้าชมเอง
- หน้าเว็บนี้สร้างโดย Matt ที่ Rise Up Labs และฉบับถัดไปจะเผยแพร่บน X และ Bluesky
2 ความคิดเห็น
ความคิดเห็นบน Lobste.rs
อาจเป็นเพราะอายุมากขึ้นจนกลายเป็นคนมองโลกในแง่ร้ายก็ได้ แต่ในสิ่งที่ยกมาที่นี่ไม่มีอะไรใหม่อย่างมีนัยสำคัญเลย แม้แต่มีม “hot singles in your area” ก็น่าจะอายุเกือบ 20 ปีแล้ว
ข้อมูลบางอย่างอาจทำให้ตั้งคำถามได้ว่าทำไมเบราว์เซอร์ต้องเปิดเผย แต่บางส่วนก็จำเป็นต่อการใช้งานพื้นฐานไปพร้อมกับที่ถูกใช้ทำฟิงเกอร์พรินต์ด้วย เช่น เป็นเรื่องดีที่เว็บไซต์รู้ว่าฉันชอบโหมดมืด และการแสดงวันที่กับเวลาให้ตรงกับเขตเวลาก็มีประโยชน์
เว็บไซต์นี้ใกล้เคียงกับการนำเสนอฟิงเกอร์พรินต์แบบหวือหวา มากกว่าจะให้ข้อมูลที่ใช้ประโยชน์ได้จริง และถ้ากังวลเรื่องฟิงเกอร์พรินต์ https://coveryourtracks.eff.org ของ EFF เป็นแหล่งข้อมูลที่ดีกว่ามาก
ฉันให้ความสำคัญกับความเป็นส่วนตัวและก็มีมาตรการลดการติดตามอยู่บ้าง แต่ไม่ค่อยเชื่อว่า การจำกัดฟิงเกอร์พรินต์ จะช่วยได้จริงนัก ถ้าจะทำให้ไม่มีฟิงเกอร์พรินต์เลย ประสบการณ์ท่องเว็บก็จะอึดอัดมาก และวิธีแบบกึ่งกลางก็มีแนวโน้มจะยิ่งสร้างฟิงเกอร์พรินต์ที่แปลกเฉพาะตัวกว่าเดิม
อีกอย่าง สิ่งที่ตามดูอยู่ที่นี่หลายอย่างก็ธรรมดามาก ถ้าทุกคนใช้ฟอนต์เหมือนกัน ชอบธีมสว่างเหมือนกัน และอยู่ในภูมิภาคเดียวกัน จะสร้างโปรไฟล์ที่แยกแต่ละคนได้เฉพาะเจาะจงมากขนาดไหนกัน?
เป็นเดโมที่สวยมาก และฉันชอบวิธีใช้แอนิเมชันค่อย ๆ เผยข้อมูลตามเวลา แต่ตัวบทวิเคราะห์และเนื้อหาออกจะ เน้นอารมณ์ มากเกินไปสำหรับรสนิยมฉัน
อย่างเช่น ข้อมูลหลายอย่างที่หน้านี้บอกว่า “เข้าใจ” เกี่ยวกับเบราว์เซอร์ แท้จริงแล้วใน Firefox เป็นค่าที่ฮาร์ดโค้ดไว้โดยไม่เกี่ยวกับสถานะจริงของอุปกรณ์เลย ตัวติดตามฟิงเกอร์พรินต์อาจมองไม่ออกถึงความต่างนั้น แต่ Firefox เลือกความสม่ำเสมอสำหรับข้อมูลเฉพาะเครื่องอย่างจำนวน CPU หรือความละเอียดหน้าจอ
ใน Firefox หน้านี้บอกว่าข้อมูล GPU ของฉันถูกเบราว์เซอร์ “ซ่อนไว้” แต่ขณะเดียวกันก็พูดเหมือนว่าเบราว์เซอร์ส่งข้อมูล GPU ออกไปด้วย สรุปเอาแค่อารมณ์เหรอ?
อีกประเด็นหนึ่ง เวลาไปดูหน้าอื่นที่ตรวจว่าติดตามได้มากแค่ไหน มักจะวัด entropy หรือพยายามดูว่ามีความเฉพาะตัวแค่ไหน ซึ่งแนวทางนั้นก็บกพร่องแบบน่าเสียดายเช่นกัน เพราะบางเบราว์เซอร์ใส่ความสุ่มลงไปใน API ที่ควรละเอียดกว่าระดับ “มี CPU กี่คอร์”
ตัวอย่างเช่น Firefox อาจดูน่ากลัวกับตัวติดตามฟิงเกอร์พรินต์ผ่านแคนวาสเพราะเหมือนจะไม่ซ้ำใครเสมอ แต่จริง ๆ แล้วมันได้ฟิงเกอร์พรินต์ที่ไม่ซ้ำเดิมในทุกครั้ง ลองเปิดหน้าทดสอบฟิงเกอร์พรินต์ในโหมดปกติและโหมดส่วนตัว หรือในคอนเทนเนอร์ต่างกันก็จะเห็น
ฮ่า ๆ ใช่เลย
ในยุคแรก ๆ ของอินเทอร์เน็ต เคยมีแบนเนอร์โฆษณาที่พูดแนว ๆ ว่า “คอมพิวเตอร์ของคุณกำลังกระจาย IP address ออกไป!!!” เว็บไซต์นี้ทำให้นึกถึงยุคนั้นมาก และยังคล้ายกันในแง่ที่ชวนให้คิดว่า การที่เว็บไซต์ที่เราเข้าใช้งานรู้อะไรบางอย่างเกี่ยวกับอุปกรณ์หรือการเชื่อมต่อของเราเป็นเรื่องอันตรายในแบบที่คลุมเครือและอธิบายเป็นคำพูดยาก
เวลาออกไปข้างนอก คนอื่นก็เห็นหน้าฉันได้ เวลาเข้าร้าน ลูกค้าคนอื่นก็รู้ได้ว่าฉันกำลังดูชั้นวางไหน ถ้าซื้อไข่มาหนึ่งกล่อง ร้านก็จะบันทึกการขายพร้อม timestamp ไว้ และถ้ามีใครจดว่าใครเข้าออกร้านอยู่ข้างนอก เขาอาจไปคุ้ยถังขยะหาใบเสร็จแล้วรู้ได้ว่าฉันซื้อไข่
คุณจะเลือกหวาดกลัวการละเมิดความเป็นส่วนตัวอันเลวร้ายที่เกิดขึ้นตลอดเวลา ปิดม่าน ขังตัวเองอยู่บ้าน และโต้ตอบกับโลกภายนอกด้วย Monero ที่ซื้อผ่าน Tor เท่านั้นก็ได้ หรือจะยอมรับว่านี่เป็นส่วนหนึ่งของชีวิตมนุษย์มาตั้งแต่มีมนุษย์ และการที่เว็บไซต์รู้ เขตเวลาท้องถิ่น หรือ CPU ในคอมพิวเตอร์ของฉันไม่ได้ก่ออันตรายใหญ่โตอะไรนักก็ได้
และการพูดว่า “นั่นแหละชีวิต จะยอมรับหรือย้ายไปอยู่กลางป่าก็แล้วแต่” ไม่ใช่วิธีที่ดีในการแก้ปัญหาใด ๆ บนโลกนี้
แต่สมมติว่าแทนที่จะมองผ่าน ๆ ทุกคนกลับเดินเข้ามาวาดสเก็ตช์หน้าฉัน ดูนาฬิกาแล้วจดเวลา จดเสื้อผ้าที่ฉันใส่กับตำแหน่งที่อยู่ อาจถึงขั้นถามว่าจะไปไหน ในโลกที่เรากำลังมุ่งไป อาจถึงขั้นทำสำเนาบัตรประชาชนที่รัฐออกให้ด้วย
หลังฉันเดินผ่านไป คนหลายร้อยคนนั้นก็เอาสมุดบันทึกไปยังตึกใหญ่ที่มีพนักงานของบริษัทขนาดยักษ์และรัฐบาลอีกหลายล้านคน ซึ่งคอยจัดหมวดหมู่ภาพสเก็ตช์และบันทึกของทุกคนในเมืองอย่างละเอียด แปะมันลงบนบอร์ดยักษ์เหมือนนักสืบในหนังอาชญากรรม แล้วโยงเข้าหากันด้วยเส้นด้ายสีแดง
พวกเขาทำแบบนี้ทุกวันเพื่อ ทำความรู้จัก กับฉัน นี่มันยังเป็นเรื่องที่ คลุมเครือและอธิบายเป็นคำพูดยาก จริงหรือ?
“สิ่งแรกที่อุปกรณ์ของคุณส่งมาคือ IP address ของคุณ เราจึงรู้เรื่องนี้ และยังรู้อย่างอื่นด้วย เพียงแต่เราเลือกจะไม่แสดง ส่วนหน้าเว็บส่วนใหญ่คงไม่เลือกแบบนั้น”
ย่อหน้าแรกชวนขัดใจนิดหน่อย และให้ความรู้สึกเหมือน การตลาดด้วยความกลัว ที่เล็งคนมีความรู้ทางเทคนิคน้อย การที่เว็บเซิร์ฟเวอร์รู้ IP ของฉันเป็นเรื่องปกติอยู่แล้ว
ประโยค “เราเลือกจะไม่แสดง ส่วนหน้าเว็บส่วนใหญ่คงไม่เลือกแบบนั้น” ก็แปลกเหมือนกัน ฉันไม่เข้าใจว่าทำไมการแสดง IP address ของฉันให้ฉันเองดูถึงจะเป็นปัญหา และก็ไม่คิดว่า “หน้าเว็บส่วนใหญ่” จะตั้งใจเลือกทำแบบนั้นจริง ๆ อาจเป็นฉันที่พลาดประเด็นที่เขาต้องการจะสื่อ
“IP address ของคุณ — 88.xxx.xxx.231 — เป็นสิ่งแรกที่อุปกรณ์ของคุณส่งมา เรารู้อย่างอื่นด้วย เพียงแต่เราเลือกจะไม่แสดง ส่วนหน้าเว็บส่วนใหญ่คงไม่เลือกแบบนั้น”
การเปิดด้วยข้อความที่หยาบ ๆ และ เหมือน InfoWars แบบนี้ถือว่าใจกล้ามาก สำหรับฉันมันลดความน่าเชื่อถือของทั้งหน้าทันที หรือจริง ๆ ควรบอกว่ามัน “กำหนดโทน” ไปเลย เพราะส่วนที่เหลือก็แย่พอกัน
บทความนี้ดูเหมือนต้องการ ชื่อเรื่องที่อธิบายชัดเจนกว่านี้ มาก
“หน้าจอมีขนาด 375×812 พิกเซล และเรนเดอร์ด้วยความหนาแน่น 3 เท่า ซึ่งเกือบจะแน่นอนว่าหมายถึงจอระดับสูงรุ่นใหม่”
ก็ไม่แน่ใจนะ เพราะ iPhone 13 mini เครื่องนี้ออกมาตั้งแต่ปี 2021 เกือบ 5 ปีแล้ว ฉันเลยไม่ถือว่าใหม่ขนาดนั้น แต่ตัวหน้าเว็บก็น่าสนใจดี
“คุณชอบอินเทอร์เฟซแบบสว่าง — ระบบปฏิบัติการของคุณเป็นคนบอกเรา”
แต่ถึงอย่างนั้นเว็บไซต์นี้ก็ยังเมินความชอบของฉันอยู่ดี ซึ่งยิ่งแสดงให้เห็นว่าปกติแล้วเว็บไซต์ไม่ได้เอาข้อมูลพวกนี้ไปใช้เพื่อ ปรับปรุงประสบการณ์ผู้ใช้ เท่าไร
ถ้าใช้ Chrome ก็คงแย่หน่อย
ตอนนี้ฉันใช้ การเชื่อมต่อ 5G อยู่ที่ Munich แต่เว็บกลับคิดว่าฉันอยู่ London
ความเห็นจาก Hacker News
ฉันไม่ได้อยู่ในเมืองนั้นด้วยซ้ำ ถ้ามองกว้าง ๆ ก็แค่รัน อะไรทำนอง Linux กับ Chrome อยู่เท่านั้น และไม่มีใครอนุมานได้ว่าฉันทำงานตอนไหนหรือนอนตอนไหน เพราะฉันเองก็ยังไม่รู้เลย
ที่บอกว่าเป็นจอรุ่นใหม่ระดับไฮเอนด์ ก็จริง ๆ คือจอแท็บเล็ตราคาถูกที่ซื้อมาจากซูเปอร์มาร์เก็ตเมื่อ 5 ปีก่อน แต่ถึงอย่างนั้น การเก็บลายนิ้วมือเบราว์เซอร์ ก็ยังน่ารำคาญอยู่ดี ถ้าตรวจจับโหมดสว่างได้ ก็ช่วยเคารพการตั้งค่านั้นด้วยไม่ได้หรือ?
มันบอกว่า “English · Chinese” แล้วทำเหมือนว่าภาษาหลักของเบราว์เซอร์กับภาษาเพิ่มเติมสามารถบอกถิ่นกำเนิด ที่อยู่อาศัย หรือแม้แต่คนที่อยู่ด้วยกันได้ แต่การมีภาษาอังกฤษกับภาษาจีนเป็นภาษาป้อนข้อมูลไม่ได้บอกอะไรแบบนั้น มันคล้ายกับการพูดว่า “การที่คุณเล่นเน็ตผ่านมือถือ แปลว่าคุณเป็นคนที่สามารถต่ออินเทอร์เน็ตผ่านมือถือได้” เทคโนโลยีต่าง ๆ มีปฏิสัมพันธ์กัน และนั่นแหละคือวิธีที่เทคโนโลยีทำงาน มันก็มีความ Orwellian อยู่บ้าง แต่จะ Orwellian กว่ารัฐสอดส่องอย่างรัสเซีย/จีน/เกาหลีเหนือไหมก็อีกเรื่องหนึ่ง การแชร์ตำแหน่งช่วยตามหามือถือ รถ หรืออุปกรณ์ได้ กิจกรรมออนไลน์ช่วยตามหาคนร้ายได้ และยังบันทึกเหตุการณ์ที่เป็นอาชญากรรมหรือจำเป็นต้องตรวจสอบความรับผิดชอบของตำรวจได้ด้วย การมอง การล่วงล้ำเกินพอดี ของเทคโนโลยีเป็นหายนะก็เป็นทางเลือกทางการรับรู้แบบหนึ่ง แต่การตระหนักว่าเทคโนโลยีของเรารู้อะไรเกี่ยวกับเราบ้างก็เป็นเรื่องที่ดี
เห็นด้วยมากกับเรื่องโหมดสว่าง ฉันอายุสามสิบกลาง ๆ แต่เว็บโหมดมืดบางเว็บทำให้รู้สึกเหมือนตัวเองอายุแปดสิบปลาย ๆ เว็บนี้คือมองอะไรแทบไม่เห็นจริง ๆ
อยากให้พวกสายปกป้องความเป็นส่วนตัวพูดกันแบบปกติสักครั้ง การพยายามทำให้การที่เบราว์เซอร์เข้าถึง เขตเวลา ดูเป็นเรื่องชั่วร้ายคงไม่ทำให้ใครคล้อยตามหรอก
ประเด็นสำคัญไม่ใช่ว่าข้อมูลแม่นหรือไม่ แต่คือมันสามารถใช้ระบุตัวฉันได้โดยไม่ต้องใช้คุกกี้ ฉันไปเจอเว็บที่ดีกว่าแล้ว และของ EFF มีประโยชน์มาก
ลายนิ้วมือเบราว์เซอร์ของฉันถูกระบุว่าไม่ซ้ำกับผู้เยี่ยมชมในช่วง 45 วันที่ผ่านมา: https://coveryourtracks.eff.org/
ถ้าเข้าเว็บโดยไม่ใช้ JavaScript จะขึ้นว่า “เมื่อปิด JavaScript หน้าเว็บไม่สามารถบอกคุณได้ว่าเบราว์เซอร์ของคุณเปิดเผยอะไรไปบ้าง ข้อมูลยังคงอยู่ การเปิดเผยยังคงเกิดขึ้น สิ่งเดียวที่หยุดคือการบอกคุณเท่านั้น”
สำนวน LLM เว่อร์ ๆ แบบนี้น่ารำคาญมาก แต่ก็ต้องขอบคุณที่มันส่งสัญญาณชัดเจนว่าฉันควรเมินมันทิ้งได้เลย
ไม่รู้ว่าเพราะฉันแก่แล้ว หรือเพราะทำซอฟต์แวร์อินเทอร์เน็ตมาเกือบ 30 ปี แต่ไม่มีอะไรในนี้ที่ทำให้ฉันแปลกใจหรือกังวลเลย
มีคนตั้งเซิร์ฟเวอร์ที่รับการเชื่อมต่อ และมีคนส่งคำขอเชื่อมต่อไปยังเซิร์ฟเวอร์นั้น โดยไม่มีข้อตกลง ความคาดหวัง หรือกติกาอะไรที่ตกลงร่วมกันไว้เลย เซิร์ฟเวอร์ก็ไม่ได้มีหน้าที่ต้องรับทุกการเชื่อมต่อ และใครก็ไม่ได้มีหน้าที่ต้องส่งคำขอไปยังเซิร์ฟเวอร์นั้นด้วย เซิร์ฟเวอร์จะส่งอะไรกลับมา และไคลเอนต์จะจัดการสิ่งนั้นอย่างไร ก็เป็นเรื่องของแต่ละฝ่าย
ฉันรู้สึกว่าข้อตกลงนี้ หรือการไม่มีข้อตกลงนี้ ใช้ได้กับทั้งสองฝั่งเหมือนกัน ฉันไม่คิดว่าผู้ใช้ควรโกรธที่เว็บไซต์เอาข้อมูลคำขอเชื่อมต่อไปใช้ตามที่ต้องการ แต่เว็บไซต์ก็ไม่ควรโกรธถ้าฉันจัดการข้อมูลที่ได้รับมาตามใจฉันเหมือนกัน กล่าวคือ เว็บไซต์จะจำ IP address กับรายละเอียดคำขอของฉันไว้มากแค่ไหนก็ได้ และฉันก็มีสิทธิทำอะไรก็ได้กับสิ่งที่ได้รับตอบกลับมา จะบล็อกโฆษณา จะไม่ทำคำขอถัดไปที่เว็บสั่ง หรือจะแสดงผลตอบกลับในแบบที่ฉันต้องการก็ได้ ฉันเป็นคนขอข้อมูล และฝั่งนั้นเป็นคนส่งข้อมูลมา
ถ้ามีข้อมูลบางอย่างที่คุณไม่อยากให้รู้ ก็ไม่ควรแนบไปกับคำขอ ถ้าอยากให้ส่งข้อมูลเฉพาะตอนจะแสดงโฆษณา ก็ต้องทำให้ผู้ใช้ยินยอมแบบนั้นก่อนส่งข้อมูล แน่นอนว่าในโลกจริง คนส่วนใหญ่ไม่รู้ว่าเบราว์เซอร์ทำอะไรอยู่ แทบไม่มีทางเลือกจริงจังเกี่ยวกับสิ่งที่เบราว์เซอร์ส่งออกไป และอินเทอร์เน็ตก็ไม่ใช่สิ่งที่เลือกไม่ใช้ได้อีกต่อไป เรื่องอย่าง DDoS ก็ทำให้โครงสร้างแบบ “อะไรก็ได้ทั้งนั้น” ใช้งานจริงยากเหมือนกัน แต่ถึงอย่างนั้นฉันก็ยังมีสัญชาตญาณว่า เวลาส่งคำขอผ่านอินเทอร์เน็ต เราไม่ควรคาดหวังอะไรจากทั้งสองฝั่งมากเกินไป
แต่ในความเป็นจริง เบราว์เซอร์กลับเป็นตัวแทนของคนอื่น มันทำงานเพื่อเว็บดีเวลอปเปอร์และใส่ทุกอย่างที่ช่วยให้ชีวิตนักพัฒนาง่ายขึ้น มันทำงานเพื่อผู้ลงโฆษณาและมอบเบาะแสสำหรับการติดตามกับการเก็บลายนิ้วมือ มันทำงานเพื่อผู้พัฒนาเบราว์เซอร์เองและเก็บเมตริก เทเลเมทรี และข้อมูลอื่นอีกไม่รู้เท่าไร แต่มันไม่ได้ทำงานเพื่อฉันจริง ๆ อีกต่อไป ฉันเป็นแค่ผู้โดยสารที่นั่งอยู่ในรถเท่านั้น
ฉันเข้าใจว่า IP address ไม่ใช่สิ่งที่เบราว์เซอร์ควบคุมได้ และถ้าจะเชื่อมต่อกับเว็บไซต์ก็เลี่ยงไม่ได้ที่จะเปิดเผยมัน แต่การที่ IP address แบบปกติโดยไม่ใช้ VPN สามารถแมปไปถึงระดับประเทศ รัฐ/จังหวัด หรือบางครั้งถึงเมืองได้อย่างเสถียร นี่คือความผิดพลาดด้านการออกแบบที่เลวร้ายมาก เป็นปัญหาใหญ่ของวิธีจัดสรร IP ในโลกที่ดีกว่านี้ การรู้แค่ IP address ไม่ควรเปิดเผยตำแหน่งทางภูมิศาสตร์ของใครได้
ตอนที่ไคลเอนต์ส่ง language header หรือรายชื่อฟอนต์ที่รองรับ มันไม่ได้หมายความว่าเซิร์ฟเวอร์ได้รับสิทธิ์ให้ “ทำอะไรก็ได้ตามใจด้วยข้อมูลนี้” ตอนที่เราสร้างมาตรฐานพวกนี้ขึ้นมา มันมีเหตุผลจริง ๆ ผู้ให้บริการเว็บไซต์ หรือเจาะจงกว่านั้นคือเครือข่ายโฆษณา ที่เลือกเอาสิ่งเหล่านี้ไปใช้ในจุดประสงค์อื่น กำลังละเมิด ข้อตกลงโดยนัย นั้นอยู่ แน่นอนว่าอาจเป็นฉันเองที่คาดหวังมากเกินไป
มันรู้ระดับแบตเตอรี่ในมือถือฉัน และเดาอุปกรณ์ได้ถูกต้อง มันอ่าน gyroscope และการโต้ตอบกับหน้าจอสัมผัสได้อย่างแม่นยำ และแสดงให้เห็นว่าสิ่งเหล่านี้จะถูกใช้เพื่อการระบุตัวตนและการอนุมานได้อย่างไร แม้กระทั่งเดาว่าคุณกำลังนั่ง ยืน หรือนอนอยู่ได้ ช่วงแรกค่อนข้างเฉย ๆ แต่หลังจากนั้นเริ่มน่าสนใจขึ้น
แนวคิดที่ว่าเราไม่ติดค้างอะไรต่อกันเลย เคยใช้ได้ดีพอสมควรในยุคที่สมมติว่าคนส่วนใหญ่มีเจตนาดี แต่เมื่อเงินและอำนาจบนอินเทอร์เน็ตกลายเป็นความจริง ความสัมพันธ์ก็กลายเป็นปฏิปักษ์มากขึ้น สมมติฐานเรื่องความไว้วางใจและการไม่มีความรับผิดชอบ ทำให้อีกฝ่ายใช้ประโยชน์จากความหวังดีของอีกฝ่ายได้ง่าย และเพราะโครงสร้างเซิร์ฟเวอร์-ไคลเอนต์ของเว็บมีความไม่สมดุลทั้งทางเทคนิคและทางอำนาจอยู่ในตัว การใช้งานในทางที่ผิดจึงมักไหลไปทางเดียว
เว็บนี้สวย และข้อความเว่อร์ ๆ ก็พอขำดี แต่มี เดโมการเก็บลายนิ้วมือ ที่ดีกว่านี้เยอะ
จำนวนจุดข้อมูลที่แสดงที่นี่มีน้อย ยังมีสิ่งที่ตรวจได้อีกมาก และหลายอย่างก็ดูเหมือนจะผิด มันตรวจพบแบบชัดเจนว่า “withheld” แค่รายการเดียว แต่จริง ๆ น่าจะมีอีกหลายอย่างที่ถูกปิดไว้จนทำให้ผลลัพธ์เพี้ยน ต้องปรับปรุงเรื่องคุณภาพ
เหมือนเอา EFF Cover Your Tracks ไป vibe coding และการที่มันขึ้นหน้าแรกได้ น่ากลัวยิ่งกว่าตัวเนื้อหาอีก
ยังมีอะไรให้ดูได้มากกว่านี้อีกเยอะ มีงานก่อนหน้ามากมายเกี่ยวกับ super cookie และการเก็บลายนิ้วมือ
https://coveryourtracks.eff.org/
https://amiunique.org/
ว้าว ดูเหมือนมีคนใช้ ChatGPT แล้วเพิ่งค้นพบแนวคิดเรื่อง browser header ก่อนจะแปะประโยคแปลก ๆ อย่าง “เราเลือกที่จะไม่บอกคุณ” เข้าไป
ถ้าอยากรู้จริง ๆ ว่าเบราว์เซอร์ส่งอะไรออกไป ให้ดูที่นี่:
https://browserleaks.com/
https://coveryourtracks.eff.org/
“เราไม่ได้ขอตำแหน่งของคุณ ที่อยู่ของคุณมาถึงก่อนตัวคุณ” เป็นคำพูดไร้สาระ ฉันเอา IP address ของตัวเองไปให้ API/บริการระบุตำแหน่งค้นหา ดังนั้นมันก็คือการขอตำแหน่งของฉันอยู่ดี
และในการสื่อสารทางอินเทอร์เน็ต IP แทบเป็นสิ่งจำเป็นอยู่แล้ว แน่นอนว่ามีบริการช่วยซ่อนมันได้ แต่ถ้าใช้แบบนั้น บริการนั้นก็จะเป็นฝ่ายมีข้อมูลของฉันแทน
ถ้ามีพจนานุกรมอยู่ คุณก็ไม่จำเป็นต้องถามคู่สนทนาโดยตรงว่าคำนั้นหมายความว่าอะไร คุณเปิดพจนานุกรมดูก็ได้ แน่นอนว่าคำนั้นอาจมีหลายความหมายหรือเป็นภาษาพูด จึงอาจเดาผิดได้ ถ้าจะให้แก้ความไม่แม่นนั้น คุณก็อาจต้องใช้ข้อมูลอื่นอย่างบริบทของบทสนทนา หรือไม่ก็ถามเจ้าตัวเพื่อยืนยันโดยตรง
และแน่นอนว่า ที่อยู่ต้องมาถึงก่อนอยู่แล้ว ไม่งั้นก็ส่งข้อมูลที่ขอคืนกลับไปไม่ได้