- วิกิพีเดียภาษาอังกฤษได้ เพิ่ม Archive.today เข้าแบล็กลิสต์และเริ่มลบลิงก์
- มีการยืนยันแล้วว่าเว็บไซต์ดังกล่าว ถูกใช้เพื่อกระตุ้นการโจมตี DDoS ต่อบล็อกและบิดเบือนสแนปช็อตของเว็บ
- บรรณาธิการวิกิพีเดียเห็นพ้องให้หยุดใช้งาน โดยให้เหตุผลเรื่อง ความน่าเชื่อถือของเว็บไซต์ที่เสียหายและความเสี่ยงจากการนำอุปกรณ์ของผู้ใช้ไปใช้ในทางที่ผิด
- มีลิงก์ดังกล่าวอยู่ในบทความประมาณ 400,000 หน้า รวม 695,000 ลิงก์ และประเมินว่า ส่วนใหญ่สามารถแทนที่ด้วยบริการเก็บถาวรอื่นได้
- มีคำแนะนำให้บรรณาธิการ เปลี่ยนไปใช้ Internet Archive, Ghostarchive, Megalodon หรือทำการลบลิงก์
การตัดสินใจบล็อก Archive.today ของวิกิพีเดีย
- วิกิพีเดียภาษาอังกฤษตัดสินใจ เพิ่ม Archive.today เข้าแบล็กลิสต์
- เบื้องหลังการตัดสินใจคือเว็บไซต์นี้ เคยถูกใช้ในการโจมตี DDoS ต่อบล็อก
- ระหว่างการอภิปรายในวิกิพีเดีย มีการพบกรณีที่ เว็บไซต์แก้ไขสแนปช็อตของหน้าเว็บและแทรกชื่อของบล็อกเกอร์เป้าหมายของการโจมตี
- บรรณาธิการวิกิพีเดียประเมินว่า การบิดเบือนดังกล่าวเป็นการตอบโต้ต่อ โพสต์บล็อกที่ระบุว่าผู้ดูแลเว็บไซต์ใช้ชื่อปลอมหลายชื่อเพื่อปกปิดตัวตน
เนื้อหาฉันทามติของชุมชนวิกิพีเดีย
- ตามอัปเดตอย่างเป็นทางการของวิกิพีเดีย มีมติให้ เลิกใช้ Archive.today ทันที (deprecate) และ เพิ่มเข้า spam blacklist หรือบล็อกด้วย edit filter
- นอกจากนี้ยังตัดสินใจลบลิงก์เดิมทั้งหมดด้วย
- ชุมชนอ้างอิงนโยบาย (WP:ELNO#3) ที่ระบุว่า “ไม่ควรพาผู้อ่านไปยังเว็บไซต์ที่ยึดเครื่องคอมพิวเตอร์ของผู้ใช้ไปใช้โจมตี DDoS”
- มีการแสดง หลักฐานว่ามีการบิดเบือนเนื้อหาของหน้าที่ถูกเก็บถาวร ทำให้เว็บไซต์นี้ถูกประเมินว่าความน่าเชื่อถือเสียหายแล้ว
ขนาดของลิงก์และความเป็นไปได้ในการแทนที่
- ลิงก์ Archive.today มีอยู่มากกว่า 695,000 ลิงก์ในบทความราว 400,000 หน้า
- เว็บไซต์นี้มักถูกใช้เพื่อ หลบเลี่ยงเพย์วอลล์ของข่าว
- แม้จะมีความเห็นให้คงสภาพเดิมไว้ แต่ผลการวิเคราะห์ยืนยันว่า ลิงก์ส่วนใหญ่สามารถแทนที่ด้วยคลังเก็บถาวรอื่นได้
- บรรณาธิการบางส่วนได้เริ่ม จัดทำขั้นตอนอย่างเป็นรูปธรรมสำหรับการลบและแทนที่ลิงก์
แนวทางสำหรับบรรณาธิการ
- เอกสาร Wikipedia:Archive.today_guidance ที่เพิ่งเผยแพร่ อธิบายวิธีลบและแทนที่ลิงก์ให้กับบรรณาธิการ
- โดเมนที่เกี่ยวข้อง ได้แก่ archive.today, archive.is, archive.ph, archive.fo, archive.li, archive.md, archive.vn
- หากแหล่งต้นฉบับยังออนไลน์อยู่และมีเนื้อหาเหมือนเดิม สามารถ ลบลิงก์ Archive.today ได้
- หรือสามารถแทนที่ด้วยบริการเก็บถาวรอื่น เช่น Internet Archive, Ghostarchive, Megalodon
- หากต้นฉบับมีอยู่ในรูปแบบสิ่งพิมพ์ หรือเป็นลิงก์ที่มีไว้เพื่อความสะดวกเท่านั้น ก็สามารถ ลบลิงก์เก็บถาวรออกไปได้เลย
มาตรการเสริมความน่าเชื่อถือและความปลอดภัยในวิกิพีเดีย
- มาตรการครั้งนี้ถูกประเมินว่าเป็นการ เสริมความน่าเชื่อถือของวิกิพีเดียและเพิ่มการคุ้มครองผู้ใช้
- ชุมชนมองว่านี่เป็นโอกาสในการวาง เกณฑ์ตอบสนองที่ชัดเจนต่อการบิดเบือนเว็บไซต์และพฤติกรรมที่เป็นอันตราย
- ต่อไปจะมีการหารือเพิ่มเติมเกี่ยวกับ แนวทางทำให้งานลบลิงก์ดำเนินไปอย่างมีประสิทธิภาพ
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ไม่นานมานี้ผมเห็นบทความเกี่ยวกับความเป็นไปได้ของแคมเปญที่เป็นระบบซึ่งพุ่งเป้าไปที่ archive.today
เลยสงสัยว่ามีแหล่งข้อมูลที่อธิบาย โครงสร้างทางเทคนิค ของ archive.today อย่างลึกกว่านี้ไหม ต้องการข้อมูลที่มากกว่าผลค้นหาจาก AI แบบผิวเผินหรือเธรด HN ก่อนหน้า
เพราะ archive.org ทำตามคำขอลบเนื้อหา ผมเลยคิดว่า archive.today อาจถูกโจมตีเพราะมันเก็บรักษา คอนเทนต์ที่ปฏิเสธการลบ ไว้
ผมคิดว่าการ doxing ใครสักคนไม่มีประโยชน์ โดยเฉพาะถ้าเป็นคนที่ให้บริการซึ่งมีประโยชน์กับผู้ใช้ทั่วไป
แต่ถ้า archive.today เปลี่ยนผู้ใช้ให้กลายเป็น บอตเน็ตเพื่อโจมตี DDoS หรือเปลี่ยนเนื้อหาของหน้าที่เก็บถาวรไว้ อันนั้นเป็นปัญหา
พฤติกรรมแบบนี้ทำให้เว็บไซต์ ดูเหมือนติดมัลแวร์ และลดความน่าเชื่อถือของคอนเทนต์ที่เก็บถาวรไว้ ผมเข้าใจได้ว่าทำไมวิกิพีเดียถึงบล็อก
ถ้าเป็นการสืบค้นจากข้อมูลสาธารณะอย่างเดียว ก็ยากจะบอกว่าไม่จริยธรรม
ปัญหาคือในกรณีของ archive.today การเปลี่ยนเหล่านั้น ดูเหมือนการดัดแปลงโดยเจตนา
มีคนพบว่าภาพแคปเจอร์ X/Twitter บางส่วนของ archive.today ถูกบันทึกไว้ขณะล็อกอินด้วย บัญชี “advancedhosters”
บัญชีนี้เกี่ยวข้องกับบริษัทเว็บโฮสติ้งในไซปรัส และช่วงหลังยังลิงก์ไปยังโพสต์ที่เผยแพร่ อีเมลส่วนตัว ระหว่างผู้ดูแล archive.today (ใช้นามแฝงว่า “Volth”) กับเจ้าของเว็บไซต์
โพสต์ก่อนหน้านั้นเป็นลิงก์ไปยังบทความ ฝักใฝ่รัสเซียและต่อต้านยูเครน ที่ถูกเก็บผ่าน archive.today ดูเหมือนเป็นเบาะแสที่น่าสนใจ
แต่รูปแบบนี้ต่างจาก Internet Archive ซึ่งเป็นองค์กรไม่แสวงกำไรที่ถูกกฎหมาย และ แยกจากการกระทำผิดกฎหมายได้ยากกว่า
ปีที่แล้วผมเห็นว่า หน้าเว็บที่เก็บถาวรไว้ถูกแก้ไข บน archive.today
แต่ก่อนหน้าที่เก็บจาก Reddit จะมีชื่อผู้ใช้อยู่มุมขวาบน แต่จู่ ๆ ก็หายไป ปัญหาคือแม้แต่ภาพเก่า ๆ ก็ถูก แก้ย้อนหลัง ด้วย
ในแท็บสกรีนช็อตยังเห็นชื่ออยู่ เลยเกิดความต่างจากต้นฉบับ ตอนแรกผมคิดว่าเป็นเรื่องเล็กน้อย แต่พอดูเหตุการณ์ช่วงหลังแล้วเหมือนจะไม่ใช่
ถ้าพวกเขา แก้เนื้อหาของโพสต์ Reddit เอง นั่นคงเป็นอีกเรื่องหนึ่ง แต่ถ้าเป็นแค่ข้อมูลบัญชีก็พอเข้าใจได้
หลายคนไม่รู้ว่า Perma.cc เป็น เครื่องมือเก็บถาวรอย่างเป็นทางการ ที่เหมาะกับการใช้งานในที่อย่างวิกิพีเดีย
รายละเอียดเพิ่มเติมมีในบทความวิกิพีเดีย
สงสัยว่ามี เซิร์ฟเวอร์เก็บถาวรแบบ self-hosted สำหรับใช้งานส่วนตัวไหม
ดูเหมือน ArchiveBox จะดังที่สุดเลยตั้งใจจะลองใช้ แต่เหมือนจะไม่มี ฟังก์ชัน URL rewrite เลยน่าจะไม่สะดวก
ถ้ามีฟีเจอร์ที่ช่วยเชื่อมหลายหน้าของบทความแบบอัตโนมัติก็คงดี
ด้วยฟีเจอร์ Content Scripts คุณเขียน สคริปต์แปลง URL เองได้
ตามบทความของ Ars Technica ระบุว่า archive.today ถูกวิกิพีเดียบล็อกเพราะ โจมตี DDoS และดัดแปลงคอนเทนต์
ส่วนตัวผมแทบไม่ใช้ archive.today เพราะมันใช้งานไม่ค่อยสะดวก แต่ใน HN ดูเหมือนจะถูกใช้บ่อยเพื่อ ข้ามเพย์วอลล์
ปัญหาคือ พฤติกรรมในอดีตและความไม่เปิดเผยตัวตน ของผู้ดูแล มันอยู่ในตำแหน่งที่สามารถเก็บข้อมูลเกี่ยวกับ พฤติกรรมการอ่านของผู้ใช้ HN ได้มาก
ที่น่าสนใจคือ นี่ไม่ใช่ครั้งแรกที่ archive.today เข้าไปพัวพันกับ DDoS
ตามโพสต์ HN เมื่อ 3 ปีก่อน เคยมีกรณีที่ archive.ph ใช้ โค้ด XmlHttpRequest เพื่อทำ DDoS
เป้าหมายตอนนั้นคือ northcountrygazette.org และเว็บไซต์ช้าลงมากจนดูเหมือนการโจมตีได้ผลจริง
เว็บไซต์นั้นเคยขู่จะ ติดตามคนที่ข้ามเพย์วอลล์ และใช้ robots.txt เพื่อบล็อกการเก็บถาวร สุดท้ายดูเหมือนจะปิดตัวไปแล้ว
สงสัยว่าจะสร้าง เว็บอาร์ไคฟ์แบบย้อนกลับไม่ได้บนเครื่องตัวเอง โดยไม่พึ่งเว็บไซต์ภายนอกได้ไหม
น่าจะบันทึกทรานแซกชัน TLS ทั้งหมดไว้แล้ว ตรวจสอบซ้ำ ภายหลังได้หรือเปล่า แม้แน่นอนว่าถ้าใบรับรองหลุดก็มีความเสี่ยงต่อการปลอมแปลง
ในเชิงเทคนิค Wayback Machine ก็ไม่ได้ดีกว่า archive.today มากนัก
มี โซลูชันอาร์ไคฟ์แบบ self-hosted อยู่หลายตัว แต่ความสมบูรณ์แตกต่างกันมาก
ดูเหมือนน่าจะมี implementation มาตรฐาน สักตัวที่รองรับทั้งใช้ส่วนตัวและแบบสาธารณะได้แล้ว แต่ก็ยังไม่มี