ArXiv เปิดให้บริการบทความวิจัยในรูปแบบ HTML แล้ว

(blog.arxiv.org)

14 คะแนน โดย GN⁺ 2023-12-22 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

การเข้าถึงงานวิจัยทางวิทยาศาสตร์อย่างเท่าเทียม

arXiv กำลังพยายามทำให้ผู้ใช้ทุกคน รวมถึงผู้พิการ สามารถเข้าถึงงานวิจัยทางวิทยาศาสตร์ได้อย่างเท่าเทียม
ตั้งแต่วันที่ 18 ธันวาคม 2023 เป็นต้นมา ระบบได้สร้างเวอร์ชัน HTML สำหรับบทความทั้งหมดที่ส่งด้วย TeX/LaTeX (เฉพาะบทความที่ส่งหลังวันที่ 1 ธันวาคม และกรณีที่การแปลงเป็น HTML สำเร็จ)

การเพิ่มรูปแบบ HTML

HTML ไม่ได้มาแทนที่ PDF แต่เป็นรูปแบบเพิ่มเติมที่ arXiv จัดให้ผู้ใช้
ผู้ส่งบทความมีโอกาสพรีวิวเวอร์ชัน HTML ตอนส่งได้เช่นเดียวกับ PDF
เมื่อเข้าไปที่หน้าบทคัดย่อของบทความ จะเห็นลิงก์สำหรับดูบทความแบบ HTML อยู่ใต้ลิงก์ PDF โดยตรง

การปรับปรุงการเข้าถึงสำหรับนักวิทยาศาสตร์ผู้พิการ

มีคำขอให้提供บทความในรูปแบบ HTML เพราะนักวิทยาศาสตร์ผู้พิการเผชิญอุปสรรคในการเข้าถึงงานวิจัย
บทความในรูปแบบ HTML สามารถถูกอ่านได้ง่ายและแม่นยำกว่าผ่านเทคโนโลยีอย่างโปรแกรมอ่านหน้าจอ จึงช่วยนักวิจัยที่มีภาวะตาบอด สายตาเลือนราง หรือดิสเล็กเซีย

ขั้นทดลองของการแปลงเป็น HTML

ขณะนี้การแปลงเป็น HTML ยังอยู่ในขั้นทดลอง และกำลังมีการปรับปรุงเพื่อให้การแปลงแม่นยำยิ่งขึ้น
ไม่ใช่ทุกบทความที่จะถูกแปลงเป็น HTML ได้อย่างสมบูรณ์ แต่ต้องการเปิดใช้ฟีเจอร์นี้ให้เร็วที่สุดเท่าที่เป็นไปได้สำหรับนักวิจัยที่ต้องการการเข้าถึง
สำหรับงานส่งที่แปลงเป็น HTML ไม่สำเร็จ ระบบจะไม่บล็อกหรือพักการส่งไว้ แต่ขอให้ผู้เขียนตรวจสอบเวอร์ชัน HTML อย่างรอบคอบ

ขอบคุณสำหรับโครงการ HTML

ได้กล่าวขอบคุณสำหรับ HTML แบบทดลอง ซึ่งเป็นก้าวสำคัญในการทำให้วิทยาศาสตร์เข้าถึงได้สำหรับทุกคน
ขอบคุณทุกฝ่ายที่ร่วมมือในโครงการนำร่องบทความ HTML ของ arXiv เช่น LaTeX Project และทีม LaTeXML ของ NIST
หากผู้ใช้คุ้นเคยกับ ar5iv ซึ่งเป็นโครงการความร่วมมือของ arXivLabs การให้บริการ HTML ครั้งนี้คือการนำโครงการที่ทรงอิทธิพลนั้นมาไว้ภายในอย่างสมบูรณ์
เป้าหมายสุดท้ายคือการทำ backfill ให้กับคอร์ปัสทั้งหมดของ arXiv เพื่อให้ทุกบทความมีเวอร์ชัน HTML แต่ตอนนี้ฟีเจอร์นี้ยังให้บริการเฉพาะบทความใหม่
ยังได้ขอบคุณผู้ใช้ arXiv ทุกคนที่ส่งรายงานบั๊กเกี่ยวกับโครงการบทความ HTML โดยทีมกำลังวิเคราะห์รายงานเหล่านั้นและมีแผนทำการปรับปรุงรอบแรกในช่วงปีใหม่

ความเห็นของ GN⁺

การที่ arXiv รองรับรูปแบบ HTML เป็นความก้าวหน้าสำคัญในการยกระดับการเข้าถึงงานวิจัย โดยเฉพาะสำหรับนักวิทยาศาสตร์ผู้พิการ
การเปลี่ยนแปลงนี้จะช่วยลดอุปสรรคทางเทคนิคในชุมชนวิทยาศาสตร์ และส่งเสริมความครอบคลุมของงานวิจัย
แม้ยังอยู่ในขั้นทดลอง แต่การที่ arXiv ตัดสินใจเปิดใช้ฟีเจอร์นี้อย่างรวดเร็ว แสดงให้เห็นถึงท่าทีเชิงบวกที่ให้ความสำคัญกับความต้องการของนักวิจัยเป็นอันดับแรก

1 ความคิดเห็น

GN⁺ 2023-12-22

ความคิดเห็นบน Hacker News

ในบทความไม่มีลิงก์ตัวอย่าง HTML แต่มีลิงก์สุ่มอยู่นี่: ลิงก์ตัวอย่าง HTML ของ arXiv. รองรับโหมดมืดด้วยซึ่งเจ๋งดี ไม่เห็นปุ่มสลับแต่เรนเดอร์ตามโหมดของระบบ ดูเหมือนว่าการเข้าถึง arXiv บนมือถือจะดีขึ้นมาก
- หลังจากที่ HTML ถูกคิดค้นขึ้นมาเพื่อสนับสนุนการเข้าถึงและการทำงานร่วมกันสำหรับงานวิจัยและวิชาการผ่านมาแล้ว 30 ปี ทำเนียบขาวก็ได้ประกาศแนวทางการเข้าถึงฉบับใหม่ ซึ่งเป็นนโยบายใหม่อย่างเป็นทางการฉบับแรกที่ประกาศในรูปแบบ HTML แทน PDF ลิงก์แนวทางการเข้าถึงของทำเนียบขาว
- ถ้าอยากติดตามข้อมูลเกี่ยวกับงานวิจัย AI/ML ใหม่ที่สำคัญบน arXiv ลองดู Emergent Mind เว็บไซต์นี้ตรวจสอบการถูกพูดถึงของงานบน arXiv ในโซเชียลมีเดีย (Hacker News, Reddit, X, YouTube, GitHub ฯลฯ) และจัดอันดับงานตามปริมาณกิจกรรมบนโซเชียลและเวลาที่งานถูกเผยแพร่ สำหรับแต่ละงานจะมีสรุปที่ใช้ GPT-4 พร้อมลิงก์ไปยังการสนทนาในโซเชียล การอ้างอิงงาน และงานที่เกี่ยวข้อง ตอนนี้ยังเป็นเว็บไซต์ใหม่และยังไม่ได้ถูกแชร์มากนัก ยินดีรับฟังฟีดแบ็กหรือคำขอเพื่อการปรับปรุง
- ถ้ามีบทความที่ไม่มีลิงก์ HTML ในแถบด้านข้าง ก็สงสัยว่าจะรู้ได้อย่างไรว่าเพราะอะไรจึงไม่ถูกเรนเดอร์เป็น HTML และจะแก้ไขได้อย่างไร
- น่าจะดีถ้าเปิดโอกาสให้ผู้ส่งบทความอัปโหลดเวอร์ชัน HTML ของตัวเองควบคู่กับเวอร์ชัน PDF แทนที่จะพึ่งพากระบวนการแปลงอัตโนมัติอย่างเดียว
  - ถ้ามีคนติดต่อมาว่าเวอร์ชัน HTML ของบทความมีปัญหา ผู้เขียนอาจหงุดหงิดเพราะไม่มีวิธีแก้ นอกจากหวังว่าการเปลี่ยนแปลงใน PDF จะส่งผลต่อการสร้าง HTML การแก้ปัญหารูปแบบโดยตรงใน PDF นั้นง่ายกว่า
  - การเปิดให้ทดลองรูปแบบทางเลือกของบทความก็น่าสนใจ เช่น บทความที่มี sandbox ให้ลองใช้ภาษาโปรแกรมที่กำลังพูดถึง หรือบทความเกี่ยวกับแคลคูลัสหลายตัวแปรที่ให้โต้ตอบกับกราฟ 3 มิติของฟังก์ชันบางตัวได้
- การเดิมพันกับเว็บเสมอเป็นการตัดสินใจที่ดีมาก
- เครื่องมือที่ใช้สำหรับบริการนี้คือ arXiv-readability ใส่ลิงก์ไว้ให้เพื่อประหยัดการคลิกไม่กี่ครั้ง
- PDF เหนือกว่า HTML มากในการเรนเดอร์เอกสารข้อความ และความแตกต่างนั้นชัดเจนมาก เรื่องนี้ทำได้ตั้งแต่เมื่อ 10 ปี หรือแม้แต่ 15-20 ปีก่อนแล้ว ที่มันไม่เกิดขึ้นไม่ใช่แค่เพราะความเฉื่อย LaTeX และ PDF ให้การเรนเดอร์ข้อความที่ดีกว่ามาก และรูปแบบคงที่ก็มีประโยชน์ต่อคนที่มาทีหลังเพราะมันตรึงสภาพไว้ตามกาลเวลา ต่างจากธรรมชาติที่ลื่นไหลของ HTML และย้ำอีกครั้งว่า การเรนเดอร์นั้นเทียบกันไม่ติด และมันส่งสัญญาณด้านคุณภาพทั้งโดยรู้ตัวหรือไม่รู้ตัว
- หวังว่า arXiv จะไม่หยุดให้บริการบทความในรูปแบบ PDF ฉันก็ยังชอบอ่าน PDF แม้บนคอมพิวเตอร์
- เวลาเปิด PDF ขนาดใหญ่ (มากกว่า 100MB ซึ่งพบได้บ่อยในงาน ML ที่เน้นสร้างภาพความละเอียดสูง) บน arXiv มักจะไม่มีอะไรเรนเดอร์เลยนอกจากแถบโหลด และใช้เวลานานกว่า 10 วินาทีพอสมควร เลยสงสัยว่าสาเหตุของความล่าช้านี้คืออะไร เป็นปัญหาเครือข่าย หรือ Chrome ช้าในการเรนเดอร์ PDF ขนาดใหญ่จริง ๆ? PDF จำเป็นต้องดาวน์โหลดเสร็จก่อนถึงจะเริ่มเรนเดอร์ได้หรือไม่? อย่างไรก็ตาม ความล่าช้านี้เป็นข้อบ่นอย่างเดียวที่มีต่อ arXiv และเอกสาร HTML ที่เรนเดอร์แบบค่อยเป็นค่อยไปโดยที่ข้อความโหลดขึ้นมาทันทีจะเป็นการปรับปรุงครั้งใหญ่

ArXiv เปิดให้บริการบทความวิจัยในรูปแบบ HTML แล้ว

การเข้าถึงงานวิจัยทางวิทยาศาสตร์อย่างเท่าเทียม

การเพิ่มรูปแบบ HTML

การปรับปรุงการเข้าถึงสำหรับนักวิทยาศาสตร์ผู้พิการ

ขั้นทดลองของการแปลงเป็น HTML

ขอบคุณสำหรับโครงการ HTML

ความเห็นของ GN⁺

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นบน Hacker News