ArchiveTeam ทำงานเก็บถาวรลิงก์ย่อ goo.gl ทั้งหมดเสร็จสิ้นแล้ว
(tracker.archiveteam.org)- ArchiveTeam เก็บถาวร ลิงก์ย่อ goo.gl ทั้งหมดได้สำเร็จ
- ทุกคนสามารถเข้าร่วมโครงการเก็บถาวรได้ผ่านโปรแกรมเก็บถาวรเสมือนชื่อ ArchiveTeam Warrior
- Warrior นี้สามารถ รันได้อย่างปลอดภัยโดยไม่ก่อความเสี่ยงเพิ่มเติม บน Windows, OS X และ Linux
- ผู้ใช้สามารถ ตั้งค่าอย่างง่าย เพื่อเลือกโครงการและเข้าร่วมกิจกรรมได้
- มอบวิธีการที่ ง่ายและเข้าใจได้ทันที สำหรับการช่วยงานเก็บถาวร แม้ไม่มีทักษะเฉพาะทาง
แนะนำ ArchiveTeam Warrior
- ArchiveTeam Warrior คือ อุปกรณ์เสมือนสำหรับงานเก็บถาวร ที่ใครก็ใช้งานได้อย่างง่ายดาย
- ผู้ใช้สามารถรัน Warrior เพื่อ ดาวน์โหลดเว็บไซต์และอื่น ๆ และมีส่วนร่วมในการอัปโหลดสิ่งเหล่านั้นไปยังคลังเก็บถาวรของ ArchiveTeam
- Warrior ไม่ก่อความเสี่ยงต่อสภาพแวดล้อมคอมพิวเตอร์จริง และ ใช้เพียงแบนด์วิดท์อินเทอร์เน็ตกับพื้นที่ดิสก์เล็กน้อย
- รองรับทั้ง Windows, OS X และ Linux และต้องใช้โปรแกรมเครื่องเสมือน เช่น VirtualBox, VMware
วิธีใช้งานด้วย VirtualBox
- ดาวน์โหลดอุปกรณ์ Warrior (357MB)
- ใน VirtualBox คลิกเมนู File > Import Appliance แล้วนำเข้าไฟล์ที่ดาวน์โหลดไว้
- เมื่อเริ่มเครื่องเสมือน ระบบจะรับการอัปเดตล่าสุดโดยอัตโนมัติ และจะขอให้ใช้งานเว็บเบราว์เซอร์
ขั้นตอนหลังจากรัน Warrior
- เข้าไปที่ เพื่อตรวจสอบหน้า Settings
- เลือกชื่อผู้ใช้เพื่อแสดงความคืบหน้าบน leaderboard
- ในแท็บ All projects สามารถเลือกโครงการที่ต้องการเข้าร่วมได้ และยังเลือก ArchiveTeam’s Choice เพื่อเข้าร่วมโครงการที่เร่งด่วนที่สุดได้เช่นกัน
ประโยชน์ของการเข้าร่วม
- ไม่ต้องมีทักษะเฉพาะทางหรือขั้นตอนซับซ้อน ใคร ๆ ก็สามารถมีส่วนร่วมกับโครงการเก็บถาวรได้อย่างง่ายดาย
- ผลงานการเก็บถาวร ของผู้ใช้จะแสดงบนกระดานผู้นำ ช่วยสร้างแรงจูงใจและส่งเสริมการทำงานร่วมกัน
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ทุกครั้งที่ ArchiveTeam ทำโปรเจ็กต์แบบนี้ ผมทึ่งมาก หลายปีก่อนตอนแพลตฟอร์มวิดีโอที่ผมทำงานอยู่ประกาศว่าจะปิดบริการในไม่ช้า ผมได้ติดต่อกับคนจาก ArchiveTeam และทราบว่าเขาสนใจงานเก็บรักษาข้อมูล ผมให้คำแนะนำเล็กน้อยกับเขา (ข้อมูลเกี่ยวกับ server endpoint ที่อาจทำให้การทำ archive ยากขึ้น) และให้ยืม EC2 instance ของผมสองสามตัวชั่วคราว เพราะเซิร์ฟเวอร์เป็นของผม ผมจึงเห็นได้ว่าเกิดอะไรขึ้น ภายใน 2 นาที instance ก็พร้อมใช้งานทั้งหมดและเริ่ม archive วิดีโออย่างรวดเร็ว โดยแต่ละ instance ดาวน์โหลดวิดีโอคนละชุดอย่างมีประสิทธิภาพโดยไม่ซ้ำกัน ArchiveTeam ไม่ได้มีแค่ภารกิจที่ดีเท่านั้น แต่วิธีการทำงานก็มีประสิทธิภาพจนน่าประทับใจมาก
หัวข้อไม่แม่นยำ จริง ๆ คือ Archiveteam.org ไม่ใช่ Archive.org The Internet Archive เป็นผู้ให้พื้นที่จัดเก็บ แต่การทำ archive จริง ๆ ดำเนินการโดยสมาชิกของ Archiveteam
อยากแชร์เนื้อหาที่เกี่ยวข้อง "เข้าร่วมสงครามกับ Link Rot" (ลิงก์), และกระทู้ HN หลายอันเกี่ยวกับการเปลี่ยนนโยบาย goo.gl ของ Google (รวมโพสต์ที่เกี่ยวข้องปี 2018~2025, ที่นี่, ที่นี่, ที่นี่, ที่นี่, ที่นี่, ที่นี่) มีการถกเถียงหลายแบบ หวังว่าจะเป็นประโยชน์
ขอแชร์อัปเดตล่าสุดจาก Google ลิงก์อัปเดตในบล็อก Google
มีใครกำลัง archive ทั้ง reddit หรือ twitter อยู่บ้างไหม? ถึงแม้ Terms ของพวกเขาจะเปลี่ยนไปจนไม่อนุญาตแล้วก็ตาม แค่อยากรู้
ผมไม่ค่อยเข้าใจหน้านี้ เห็นมีรายการ dataset (น่าจะใช่?) และขนาดดูใหญ่ถึง 91 TiB แต่ดูไม่น่าเป็นไปได้ว่าต้องใช้ถึง 91 TiB แค่สำหรับรายชื่อลิงก์ย่อของ Google กับ URL ปลายทาง มีใครรู้หลักการบ้างไหม?
ผมดีใจที่ได้มีส่วนช่วยงาน archive ครั้งนี้ไม่มากก็น้อย
ผมสงสัยว่ามีกี่ลิงก์ที่ชี้ไปยังวิดีโอ YouTube แบบ private หรือ Google Docs เป็นต้น
ผมสงสัยว่าคำว่า "all" หมายถึง URL ที่เปิดเผยต่อสาธารณะทั้งหมดจริง ๆ หรือหมายถึงการลองไล่ทุกค่าใน namespace ของ URL ทั้งหมด