- มีการค้นพบ เทป UNIX V4 ของ Bell Labs จากปี 1973 ในห้องเก็บของของมหาวิทยาลัยยูทาห์ ทำให้เกิดความเป็นไปได้ในการกู้คืนข้อมูลต้นฉบับของ Unix ยุคแรก
- เวอร์ชันนี้เป็น Unix ที่เคอร์เนลและยูทิลิตีหลักถูกเขียนด้วยภาษา C เป็นครั้งแรก และเป็นข้อมูลหายากที่ยังไม่เคยมีการยืนยันว่ามีสำเนาสมบูรณ์หลงเหลืออยู่
- บนเทปมีฉลากเขียนด้วยลายมือว่า “UNIX Original From Bell Labs V4” และยืนยันได้ว่าลายมือนั้นเป็นของศาสตราจารย์ผู้ล่วงลับ เจย์ เลอโปร
- เทปที่ค้นพบเป็นต้นฉบับที่ มาร์ติน นิวเวลล์ ผู้คิดค้น ‘Utah teapot’ ได้รับมาจาก AT&T และขณะนี้กำลังเตรียมส่งต่อไปยังพิพิธภัณฑ์ประวัติศาสตร์คอมพิวเตอร์ (CHM)
- Al Kossow แห่ง CHM จะรับผิดชอบงานกู้คืน โดยมีแผนจะอ่านข้อมูลด้วยอุปกรณ์แปลงสัญญาณแอนะล็อกเป็นดิจิทัล และถูกประเมินว่าเป็น หลักฐานสำคัญต่อการฟื้นฟูการวิจัย Unix ยุคแรก
การค้นพบเทป Unix V4
- ระหว่างการจัดเก็บห้องเก็บของของภาควิชาคอมพิวเตอร์ มหาวิทยาลัยยูทาห์ มีการพบม้วนเทป 9 แทร็กที่ติดฉลาก UNIX V4 (1973) ของ Bell Labs
- บนฉลากมีข้อความเขียนด้วยลายมือว่า “UNIX Original From Bell Labs V4 (See Manual for format)”
- มีการยืนยันโดยศาสตราจารย์โรเบิร์ต ริช ศิษย์ของศาสตราจารย์ Jay Lepreau ผู้เสียชีวิตในปี 2008 ว่าลายมือนี้เป็นของเขา
- ริชเปิดเผยการค้นพบนี้ผ่าน Mastodon และอธิบายว่านี่คือ เวอร์ชันที่เชื่อกันว่ายังไม่มีสำเนาสมบูรณ์หลงเหลืออยู่
- เทปนี้มีกำหนดจะถูกขนส่งโดยตรงไปยัง พิพิธภัณฑ์ประวัติศาสตร์คอมพิวเตอร์ (Computer History Museum, CHM)
ความสำคัญทางประวัติศาสตร์ของ Unix V4
- UNIX V4 เป็น เวอร์ชันแรกที่เคอร์เนลและยูทิลิตีหลักบางส่วนถูกเขียนใหม่ด้วยภาษา C ถือเป็นจุดเปลี่ยนสำคัญในประวัติการพัฒนา Unix
- สิ่งที่ยังหลงเหลือมาจนถึงตอนนี้มีเพียง ซอร์สโค้ดบางส่วนของเคอร์เนลเวอร์ชันก่อนหน้า, หน้า
man บางส่วน และ คู่มือโปรแกรมเมอร์ฉบับเดือนพฤศจิกายน 1973 เท่านั้น
- ดังนั้นการค้นพบครั้งนี้จึงถูกมองว่าเป็นหลักฐานที่เปิดทางสู่ ความเป็นไปได้ในการกู้คืน Unix ยุคแรกที่สร้างบนภาษา C ได้อย่างสมบูรณ์
ที่มาของเทปและบุคคลที่เกี่ยวข้อง
- จากการตรวจสอบเพิ่มเติม พบว่าเทปนี้เป็นสิ่งที่ Martin Newell ได้รับมาจาก AT&T
- นิวเวลล์เป็นผู้คิดค้น ‘Utah teapot’ อันโด่งดังในวงการคอมพิวเตอร์กราฟิกส์ ซึ่งเคยปรากฏในสกรีนเซฟเวอร์ OpenGL ของ Windows NT ด้วย
- ริชเปิดเผยข้อมูลนี้เพิ่มเติม พร้อมระบุว่าทำให้คุณค่าทางประวัติศาสตร์ของเทปสูงขึ้นอีก
แผนการกู้คืนและแนวทางทางเทคนิค
- Al Kossow ภัณฑารักษ์ซอฟต์แวร์ของ CHM จะเป็นผู้รับผิดชอบงานกู้คืน
- เขาวางแผนจะ ต่อหัวขยายสัญญาณอ่านเข้ากับเทป และใช้ตัวแปลงแอนะล็อกเป็นดิจิทัลความเร็วสูงแบบหลายช่องสัญญาณ เพื่อดัมพ์ข้อมูลลงใน RAM ราว 100GB จากนั้น
จะประมวลผลด้วยโปรแกรมวิเคราะห์ (readtape) ที่ Len Shustek เขียนไว้
- เทปนี้เป็น เทป 9 แทร็กของ 3M ความยาว 1200 ฟุตจากยุค 1970s และถูกประเมินว่ามีโอกาสกู้คืนได้สูง
- Kossow ระบุว่าเขากำลัง ยกระดับโครงการนี้ให้เป็นงานลำดับความสำคัญสูง เพื่อผลักดันการกู้คืน
ความหมายของการค้นพบครั้งนี้
- การค้นพบครั้งนี้ถูกมองว่าเป็นโอกาสหายากในการฟื้นฟู กระบวนการวิวัฒนาการทางเทคนิคของ Unix ยุคแรก
- CHM และทีม Bitsavers กำลังร่วมมือกันดำเนินงานกู้คืน และกำลังได้รับ ความสนใจจากชุมชนโอเพนซอร์สและผู้อนุรักษ์ประวัติศาสตร์คอมพิวเตอร์
- The Register แสดงความคาดหวังต่อความสำเร็จของการกู้คืน โดยระบุว่าสื่อชิ้นนี้มีค่ามากจน “ไม่น่าจะถูกฝากไว้ในมือที่ดีกว่านี้ได้อีกแล้ว”
2 ความคิดเห็น
เทปนี่เก็บรักษาได้ดีจริง ๆ นะ
ความคิดเห็นจาก Hacker News
เนื้อหาในเทปมี รายการสิ่งที่ต้องทำ แบบง่าย ๆ อยู่
เช่น ทำให้ออกจาก Emacs ได้ง่ายขึ้น เปลี่ยนชื่อไดเรกทอรีชั่วคราว อะไรทำนองนั้น โดยชื่อเดิมอย่าง bin หรือ dev ฟังดูชวนสับสนจนตลกนิด ๆ
ใน Unix มีมุกเล่นคำเยอะ เช่น cat, man, more/less แต่ etc นี่รู้สึกแปลกจริง
น่าเสียดายที่วงการคอมพิวเตอร์แทบจะ ลืมอดีต ไปหมด
เราฟื้นฟูและศึกษาทั้งอาวุธโบราณหรือการทดลองของกาลิเลโอ แต่ผลงานของแฮ็กเกอร์ยุค 60–70 กลับกำลังถูกลืม ทั้งที่เราน่าจะเรียนรู้อะไรได้มากจากข้อจำกัดของยุคนั้น
หนังเงียบระดับตำนานของอเมริกาบางเรื่องก็ถูกค้นพบโดยบังเอิญในห้องสมุดที่สเปนแล้วค่อยบูรณะกลับมา ดูเหมือนทั้งศิลปินและบริษัทจะสนใจแต่ปัจจุบัน โดยไม่ได้มองงานเก่าเป็นประวัติศาสตร์
มีโปรเจ็กต์ถอดรหัสเครื่องอาร์เคดยุค 90 หรือฟื้นฟูเกมคลาสสิกในระดับบิตกันอย่างคึกคัก
แม้แต่พีระมิดหรือโบราณวัตถุ หากไม่มีข้อจำกัดเรื่องต้นทุนหรือพื้นที่ ก็คงหายไปหมดเหมือนกัน
สิ่งที่นักโบราณคดีทำงานด้วยคือของที่มีอายุหลายร้อยหรือหลายพันปี อีกไม่กี่ศตวรรษ สิ่งประดิษฐ์อย่าง Unix ก็คงได้รับการยอมรับว่ามีคุณค่าทางประวัติศาสตร์
ฉันมี เครื่องอ่าน/เขียน CCT แบบ 9 แทร็ก ที่อ่านเทปตั้งแต่ปี 1982 ได้
แปลกใจเหมือนกันที่เทปปี 1973 เป็น 9 แทร็ก แต่พอทำความสะอาดหัวอ่านด้วยน้ำยาที่ตอนนี้กลายเป็นของผิดกฎหมายแล้ว ข้อมูลทั้งหมดก็ถูกกู้กลับมาได้อย่างสมบูรณ์ เป็นเทปจากหลายระบบรวมถึงมินิคอมพิวเตอร์ของ DEC
เป็นการค้นพบที่น่าทึ่งมาก ถ้าสามารถ อีมูเลต Unix v4 จากซอร์สนี้ แล้วคอมไพล์และรันได้ก็คงยอดเยี่ยมมาก
ในเมลลิงลิสต์ TUHS ก็เคยมีการกู้และรันซอร์ส Unix เวอร์ชันปี 1972 มาแล้ว
ดู GitHub repository ที่เกี่ยวข้อง
เธรดสนทนาต้นฉบับอยู่ที่ โพสต์บน discuss.systems
ตอนเรียนปริญญาตรี ฉันเคยเก็บโปรเจ็กต์คอมไพเลอร์ไว้ใน เทปเหล็ก UNIVAC UNISERVO II
มันเป็นแบบ 8 แทร็ก (ข้อมูล 6 บิต, parity 1 บิต, clock 1 บิต) และตอนนี้น่าจะไม่มีไดรฟ์ที่อ่านได้แล้ว แต่ในเชิงกายภาพมันก็น่าจะยังสภาพดีอยู่
เป็นการค้นพบที่เจ๋งมาก เรื่องนี้คล้ายกับช่วงที่เทปโครงการสำรวจดวงจันทร์หายไป ถ้าค้นต่ออีกหน่อยอาจเจออะไรเพิ่มก็ได้
IBM Tucson Tape Lab เคยกู้ข้อมูลจากเทปของกระสวย Challenger มาแล้ว
ดังนั้นเทปอายุ 52 ปี ก็น่าจะกู้คืนได้สบาย
“โอ้ นี่เป็นบทความของฉันเอง ขอบคุณนะ Ricardo!”
ถ้าเป็นเวอร์ชัน SIMH-classic ก็น่าจะรันได้แน่นอน
ลืม v4 เวอร์ชันเชิงพาณิชย์ไปได้เลย ใช้เวอร์ชันเปิดจะดีกว่า