1 คะแนน โดย GN⁺ 2024-02-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การลองเปิดไฟล์ข้อเสนอ WWW ต้นฉบับ

  • บนเว็บไซต์ W3C มีข้อเสนอ WWW ต้นฉบับที่เขียนโดย Tim Berners-Lee
  • ไฟล์ต้นฉบับของข้อเสนอนี้เป็นไฟล์ Word สำหรับ Macintosh 4.0 และคาดว่าสร้างขึ้นในปี 1990
  • เอกสารต้นฉบับมีขนาด 68,608 ไบต์ และเมื่อตรวจสอบประเภทไฟล์บน Mac พบว่าเป็นไฟล์ Microsoft Word for Macintosh 4.0

การลองเปิดด้วยซอฟต์แวร์หลายตัว

  • Microsoft Word: อัปโหลดไฟล์ต้นฉบับไปยัง OneDrive แล้วเปิดด้วย Microsoft Word โดยใส่นามสกุล .doc
  • Apple Pages: ไม่สามารถเข้าใจไฟล์ Microsoft Word for Macintosh รุ่นเก่าได้
  • Apache OpenOffice: เปิดไฟล์ได้ แต่รูปแบบหายไปและไดอะแกรมขาดหาย
  • LibreOffice: เปิดไฟล์ได้และไดอะแกรมก็แสดงได้ชัดเจน แต่มีปัญหาเรื่องระยะขอบและรูปแบบอื่น ๆ

การเปรียบเทียบ PDF ของ CERN กับ PDF ที่สร้างโดย LibreOffice

  • PDF ที่ CERN ให้มาถูกสร้างขึ้นในปี 1998 และมีความยาว 20 หน้า
  • เวอร์ชันที่นำเข้าใน LibreOffice มี 24 หน้า
  • เมื่อนำ PDF ทั้งสองมาเทียบกัน พบความต่างในเรื่องระยะขอบ ขนาดฟอนต์ ส่วนหัวและส่วนท้าย รวมถึงการแบ่งหน้า

การตรวจดูเอกสารต้นฉบับผ่านการจำลองระบบ

  • มีการจำลอง Macintosh ในยุค 1990 เพื่อรัน Word for Macintosh 4.0 จริง ๆ และดูว่าเอกสารต้นฉบับมีหน้าตาอย่างไร
  • เอกสารต้นฉบับกับ PDF ของ CERN แตกต่างกันพอสมควร และเอกสารต้นฉบับแสดงเป็น 22 หน้าบนกระดาษ A4

บทสรุป

  • การแปลงเอกสารต้นฉบับด้วยซอฟต์แวร์สมัยใหม่ถือเป็นชัยชนะของซอฟต์แวร์โอเพนซอร์ส และสะท้อนความยากของการเก็บรักษาเอกสาร
  • เพื่อการเก็บรักษาเอกสาร จึงอัปโหลดเวอร์ชัน .odt ไว้บน GitHub
  • ค่อนข้างน่าผิดหวังที่เอกสารอายุ 34 ปียังเปิดได้ยาก และแม้เปิดได้ก็ยังไม่เหมือนต้นฉบับอย่างแม่นยำ

ความเห็นของ GN⁺

  • โพสต์บล็อกนี้เน้นย้ำถึงความสำคัญของการเก็บรักษาดิจิทัลและการเข้าถึงเอกสารข้อเสนอ WWW ต้นฉบับ
  • แสดงให้เห็นว่าซอฟต์แวร์โอเพนซอร์สมีบทบาทสำคัญเพียงใดในการจัดการกับรูปแบบเอกสารเก่า
  • ช่วยให้เข้าใจความยากของการเก็บรักษาเอกสาร และตระหนักถึงความสำคัญของการคำนึงถึงความเข้ากันได้และการเข้าถึงระยะยาวตามพัฒนาการของเทคโนโลยี

1 ความคิดเห็น

 
GN⁺ 2024-02-14
ความคิดเห็นจาก Hacker News
  • มีการแชร์เอกสารที่แปลงเป็นรูปแบบ Word สมัยใหม่

    • มีการแชร์เอกสารในรูปแบบ Word สมัยใหม่ โดยคงงานเวกเตอร์ทั้งหมดและฟอนต์ไว้ครบถ้วน
    • ในการแปลงเอกสาร ได้เปิดไฟล์ครั้งแรกแล้วบันทึกใหม่ด้วย Word 98 ที่รันบน Power Mac ซึ่งจำลองด้วย QEMU
    • อย่างไรก็ตาม รูปภาพหายไป และ Word อ้างว่ามีหน่วยความจำหรือพื้นที่ดิสก์ไม่พอสำหรับการแสดงผลหรือพิมพ์รูปภาพ
    • เพื่อกู้คืนรูปภาพ จึงพิมพ์เป็น PDF จาก Word 98 ด้วย Acrobat แล้วใช้ Adobe Illustrator แยกรูปแต่ละรูปออกมาเป็น PDF แยกไฟล์
    • จากนั้นเพียงลบรูปต้นฉบับออก แล้วลากและวางไฟล์ PDF ที่ใช้แทนจาก Finder เพื่อกู้คืนรูปภาพ
    • มีการแชร์ PDF ที่สร้างจาก Word 98 บน Power Mac และ PDF ที่สร้างจาก Word รุ่นใหม่บน macOS Sonoma เพื่อใช้เปรียบเทียบ
  • การตรวจสอบฟอนต์และเลย์เอาต์

    • ต้องมีฟอนต์ต้นฉบับจึงจะตรวจสอบได้ว่าเอกสารควรแสดงผลอย่างไร
    • Word 4.0 มีไฟล์ฟอนต์สำหรับหน้าจอและเครื่องพิมพ์แยกกัน เพื่อรองรับความละเอียดการแสดงผลที่ต่างกัน
    • หากไม่มีฟอนต์เครื่องพิมพ์ ระบบจะพิมพ์โดยเรนเดอร์ฟอนต์หน้าจอแบบขยายสเกล และหากไม่มีฟอนต์หน้าจอ จะถูกแทนที่ด้วยฟอนต์ระบบ
    • ในกรณีนี้ต้องใช้ฟอนต์ที่รู้จักกันดีอย่าง Palatino และ Courier แต่ LibreOffice กลับแทนที่ด้วย Times New Roman ทั้งที่ติดตั้ง Palatino Linotype อยู่แล้ว
  • ความมีประโยชน์ของคำสั่ง file

    • คำสั่ง file มีประโยชน์มากในการไขข้อสงสัยเกี่ยวกับไฟล์และให้ข้อมูลที่เป็นประโยชน์
  • การรองรับรูปแบบไฟล์เอกสารเก่าที่ยอดเยี่ยมของ LibreOffice

    • LibreOffice รองรับรูปแบบไฟล์เอกสารเก่าได้ดีมาก จึงถูกนำมาใช้สำหรับงานนี้
    • การใช้เอมูเลเตอร์ BasiliskII และ InfiniteMac ก็เป็นเรื่องที่สนุกเช่นกัน
  • ความเข้ากันได้ย้อนหลังของ Microsoft Word

    • ไฟล์เปิดได้ค่อนข้างดีใน Word เวอร์ชัน Windows และเลย์เอาต์ก็เหมือนกับ PDF ในบทความ
    • แม้จะเปิดรูปภาพไม่ได้เพราะไม่มีกราฟิกฟิลเตอร์ แต่คาดว่าน่าจะเปิดได้ใน Word 2003
  • ความสามารถอันน่าทึ่งของ LibreOffice

    • LibreOffice ไม่เพียงเปิดรูปแบบเอกสารได้หลากหลาย แต่ยังทำงานอัตโนมัติผ่านตัวเลือกบรรทัดคำสั่งได้ด้วย
  • การพิมพ์เอกสารจากเอมูเลเตอร์

    • ในเอมูเลเตอร์ที่รัน Mac 4.0 สามารถติดตั้งคิวพิมพ์ที่สร้างไฟล์ .ps (Postscript) ได้ และสามารถแปลงต่อเป็น PDF ได้
  • ความผิดหวังต่อความเข้ากันได้ของเอกสารใน Microsoft Word

    • มีความเห็นว่า Microsoft ควรมีความรับผิดชอบที่จะทำให้ Word สามารถเปิดเอกสารที่สร้างจาก Word เวอร์ชันใดก็ได้
    • หากกังวลเรื่องช่องโหว่ ก็ควรมีความสามารถในการรันใน sandbox ที่แยกออกมาใน process ภายนอก แล้วแปลงเป็นเวอร์ชันใหม่
  • ปัญหาที่อาจเกิดขึ้นจากการสำรองข้อมูลแบบเก็บถาวรไม่สิ้นสุด

    • บางบริษัทมีการสำรองข้อมูลแบบเก็บถาวรไม่สิ้นสุด ซึ่งก่อให้เกิดปัญหาจากการไม่เข้าใจความต่างระหว่าง “อ่านได้” กับ “ใช้งานได้”
  • การใช้ Mac รุ่นเก่าและ Word

    • มีเครื่อง System 7.1 Mac SE/30 ที่ติดตั้ง Word 5 ไว้ หากส่งเอกสารมา ก็อาจช่วยอัปเกรดไปเป็น Office 2001 ได้