10 คะแนน โดย GN⁺ 2025-04-23 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • arXiv คือ คลังเก็บบทความวิทยาศาสตร์แบบเปิดให้เข้าถึงได้ ที่ Paul Ginsparg สร้างขึ้นในปี 1991 และจนถึงทุกวันนี้ก็ยังถูกใช้งานในฐานะ หนึ่งในแพลตฟอร์มที่สำคัญที่สุด สำหรับนักวิทยาศาสตร์ทั่วโลก
  • ด้วยการ เลี่ยงโครงสร้างการตีพิมพ์วิชาการแบบเดิมที่ช้าและมีต้นทุนสูง ทำให้นักวิจัยสามารถ แชร์บทความก่อนการพิจารณา (preprint) ได้ ทันที จึงมีส่วนช่วยต่อความร่วมมือและนวัตกรรมทางวิทยาศาสตร์
  • arXiv เริ่มต้นจากเพียงสคริปต์อัตโนมัติอย่างง่าย แต่ปัจจุบันเติบโตเป็นแพลตฟอร์มขนาดใหญ่ที่มี การส่งบทความมากกว่า 20,000 ฉบับต่อเดือน และ ผู้ใช้งาน 5 ล้านคน
  • ในช่วงแรกมีการดำเนินงานแบบไม่เป็นทางการและค่อนข้างสบาย ๆ แต่ต่อมาก็เผชิญวิกฤตหลายครั้งจากปัญหาอย่าง ความซับซ้อนของโค้ดระบบ, ความขัดแย้งภายใน, ความล้าสมัยของเทคโนโลยี
  • ปัจจุบัน ภายใต้การสนับสนุนของ Simons Foundation และผู้นำชุดใหม่ กำลังมีการ ย้ายขึ้นคลาวด์และรีแฟกเตอร์โค้ด Python ขณะที่ Ginsparg ก็ยังคงหมกมุ่นกับปัญหาเรื่องการกรองคุณภาพอยู่

จุดกำเนิดของ arXiv และความท้าทายต่อโครงสร้างการตีพิมพ์ทางวิทยาศาสตร์

  • นักฟิสิกส์ Paul Ginsparg ยกคำพูดจาก The Godfather มาใช้อธิบายความรู้สึกที่ว่าเขาไม่อาจถอนตัวจากแพลตฟอร์มที่ตัวเองสร้างได้อย่างสิ้นเชิง
    > “Just when I thought I was out, they pull me back in!
    > “ตอนที่ผมนึกว่าออกมาได้แล้ว พวกเขาก็ดึงผมกลับเข้าไปอีก!”
  • เขาเป็นศาสตราจารย์แห่ง Cornell University และผู้ได้รับ MacArthur Genius Grant ซึ่งเมื่อ 35 ปีก่อนได้พัฒนาคลังเก็บดิจิทัล arXiv สำหรับแชร์บทความ ก่อนการประเมินโดยเพื่อนนักวิชาการ (preprint)
  • จนถึงตอนนี้ arXiv.org ยังรักษาดีไซน์แบบ เว็บ 1.0 คลาสสิก และ สัญลักษณ์ของ Cornell เอาไว้ แต่ต่างจากรูปลักษณ์ที่เรียบง่ายนั้น arXiv คือแพลตฟอร์มที่ก่อให้เกิด การเปลี่ยนแปลงเชิงรากฐานต่อโครงสร้างการเผยแพร่ความรู้ทางวิทยาศาสตร์
  • หาก arXiv หยุดให้บริการ ก็อาจเกิด ผลกระทบอย่างรุนแรงต่อการทำงานของนักวิทยาศาสตร์ทั่วโลก และในความเป็นจริง นักคณิตศาสตร์และนักฟิสิกส์จำนวนมากก็ เข้าใช้งาน arXiv ทุกวัน
    > “Everybody in math and physics uses it. I scan it every night.” — Scott Aaronson
    > “ทุกคนในวงการคณิตศาสตร์และฟิสิกส์ใช้มัน ผมไล่อ่านมันทุกคืน”

บทบาทของ arXiv และการตั้งคำถามต่อโครงสร้างการตีพิมพ์วิชาการ

  • ในแต่ละภาคส่วนของสังคมต่างมีปัญหาเชิงโครงสร้างเรื้อรัง และในแวดวงวิชาการ ความไม่สมเหตุสมผลของระบบการตีพิมพ์ ก็ถูกชี้ว่าเป็นปัญหาตัวอย่างที่เด่นชัด

  • โมเดลแสวงกำไรของสำนักพิมพ์รายใหญ่อย่าง Elsevier, Springer ถูกวิจารณ์ในลักษณะต่อไปนี้:

    • ให้ผู้เขียนต้องเขียนบทความโดยไม่ได้รับค่าตอบแทน
    • อาศัยนักวิจัยคนอื่นมาช่วยบรรณาธิการโดยไม่คิดค่าใช้จ่าย
    • เมื่องานเสร็จแล้วก็นำบทความไปขายในราคาสูง ขณะที่สถาบันต้องแบกรับค่าสมาชิกจำนวนมาก
      > “Calling their practice a form of thuggery isn’t so much an insult as an economic observation.
      > “การเรียกวิธีการของพวกเขาว่าเป็นการกรรโชกนั้น ไม่ใช่คำด่าเสียทีเดียว แต่เป็นข้อสังเกตทางเศรษฐศาสตร์”
  • กระบวนการ peer review แบบดั้งเดิมอาจใช้เวลา หลายเดือนถึง 1 ปี และความล่าช้านี้ก็กลายเป็นคอขวดของการไหลเวียนข้อมูล

  • ตรงกันข้าม arXiv เปิดให้ใครก็ตามสามารถ เผยแพร่และเข้าถึงได้ทันที ตั้งแต่ในขั้น ก่อนการพิจารณาบทความ (preprint) จึงช่วยแก้ปัญหาเชิงโครงสร้างของการตีพิมพ์

  • นวัตกรรมหลักของ arXiv สรุปได้ดังนี้:
    > “Showing that you could divorce the actual transmission of your results from the process of refereeing.” — Paul Fendley
    > “มันแสดงให้เห็นว่าเราสามารถแยกการส่งต่อผลลัพธ์การวิจัยออกจากกระบวนการ peer review ได้”

  • โครงสร้างเช่นนี้มีส่วนสำคัญอย่างยิ่งในการ เผยแพร่การค้นพบทางวิทยาศาสตร์ที่มีความหมายอย่างรวดเร็ว ใน สถานการณ์วิกฤตอย่างการระบาดใหญ่ของ COVID-19

    • และยังเป็นแรงบันดาลใจให้เกิด bioRxiv, medRxiv ที่ขยายแนวคิดไปสู่สายวิทยาศาสตร์ชีวภาพ ซึ่งก็มีการตั้งข้อสังเกตว่าอาจ ช่วยชีวิตผู้คนนับล้าน ได้

โครงสร้างการควบคุมคุณภาพของ arXiv

  • แม้บทความที่ส่งเข้า arXiv จะไม่ผ่าน peer review อย่างเป็นทางการ แต่ก็ยังคงรักษามาตรฐานทางวิชาการพื้นฐานและระเบียบต่าง ๆ ผ่าน การตรวจสอบโดยสมัครใจของผู้เชี่ยวชาญในแต่ละสาขา
  • องค์ประกอบหลักของการควบคุมคุณภาพ:
    • อนุญาตเฉพาะงานวิจัยต้นฉบับ
    • ห้ามใช้ข้อมูลที่ถูกบิดเบือน
    • ต้องใช้ถ้อยคำที่เป็นกลาง
  • นอกจากนี้ บทความที่ส่งเข้ามายังต้องผ่าน การตรวจเบื้องต้นด้วยระบบอัตโนมัติ ด้วย
  • หากไม่มีขั้นตอนตรวจสอบเหล่านี้ arXiv ก็เสี่ยงที่จะ เต็มไปด้วยงานวิทยาศาสตร์เทียมหรือผลงานจากผู้ที่ไม่ใช่มืออาชีพ

อิทธิพลของ arXiv และภาพปัจจุบันของ Ginsparg

  • ในปี 2021 วารสาร Nature เลือก arXiv ให้เป็นหนึ่งใน “10 computer codes that transformed science
    > “10 computer codes that transformed science
    > “10 โค้ดคอมพิวเตอร์ที่เปลี่ยนโฉมวิทยาศาสตร์”
  • arXiv ได้รับการยกย่องอย่างสูงในบทบาท การส่งเสริมความร่วมมือทางวิทยาศาสตร์ และปัจจุบันมี
    • บทความมากกว่า 2.6 ล้านฉบับ
    • บทความส่งเข้าใหม่ 20,000 ฉบับต่อเดือน
    • ผู้ใช้รายเดือน 5 ล้านคน
  • การค้นพบทางวิทยาศาสตร์สำคัญจำนวนมากในศตวรรษที่ 21 ถูก เผยแพร่ครั้งแรกผ่าน arXiv ตัวอย่างเช่น
    • บทความ “transformers” ที่จุดกระแส AI ยุคใหม่
    • วิธีพิสูจน์สมมติฐานปวงกาเร หนึ่งในปัญหารางวัลมิลเลนเนียม
  • บทความที่โพสต์บน arXiv หลายฉบับ ภายหลังก็ได้รับการตีพิมพ์ในวารสารชั้นนำ แต่ข้อได้เปรียบสำคัญคือ ทันทีที่เผยแพร่บน arXiv ทุกคนก็เข้าถึงได้
    > “Just because a paper is posted on arXiv doesn’t mean it won’t appear in a prestigious journal someday.
    > “แค่บทความถูกโพสต์บน arXiv ไม่ได้แปลว่าวันหนึ่งมันจะไม่ไปปรากฏในวารสารชั้นนำ”

ความเป็นจริงภายในของ arXiv และปัญหาความยั่งยืน

  • สำหรับนักวิทยาศาสตร์ arXiv ถูกมองว่าเป็น สิ่งจำเป็นพอ ๆ กับห้องสมุดสาธารณะหรือ GPS แต่ในความเป็นจริง การดำเนินงานของ arXiv นั้น ห่างไกลจากภาพแพลตฟอร์มอุดมคติที่ไร้แรงเสียดทาน
  • ตลอดเวลาที่ผ่านมา arXiv ต้องเผชิญกับปัญหาต่าง ๆ เช่น
    • ความขัดแย้งเชิงระบบราชการ
    • โค้ดที่ล้าสมัย
    • จนถึงขั้นมี คดีสอดแนม เกิดขึ้น
  • Ginsparg อธิบายความเป็นจริงนี้ไว้ดังนี้
    > “A child I sent off to college but who keeps coming back to camp out in my living room, behaving badly.
    > “เหมือนลูกที่ผมส่งไปเรียนมหาวิทยาลัยแล้ว แต่เอาแต่กลับมาปักหลักในห้องนั่งเล่นที่บ้านและก่อเรื่องไม่หยุด”
  • แม้จะพยายามเว้นระยะห่างจาก arXiv อยู่เรื่อย ๆ เช่น ส่งคำขอสัมภาษณ์ไปให้ดู FAQ หรือพยายามกันไม่ให้มีการมาเยี่ยมโดยตรง แต่ Ginsparg ก็ยังคง พยายามตีตัวออกห่างจาก arXiv อยู่เสมอ

บุคลิก รสนิยม และชีวิตประจำวันของ Ginsparg

  • จากการสัมภาษณ์ที่ Ithaca (ที่ตั้งของ Cornell) เผยให้เห็นว่า Ginsparg เป็นคน
    • อารมณ์ดีและขี้เล่น
    • แต่ในขณะเดียวกันก็มี ความดื้อดึงที่จะยืนหยัดในปรัชญาของตนอย่างไม่ประนีประนอม
  • ตามคำบอกเล่าของ Geoffrey West อดีตหัวหน้าของเขา
    > “Quite a character, infamous in the community, extremely funny, a great guy.
    > “เป็นคนที่มีคาแรกเตอร์มาก เป็นที่รู้จักไปทั่วในชุมชน ตลกมาก และเป็นคนที่ยอดเยี่ยม”
  • ตัว Ginsparg เองก็พูดลดทอนคุณค่าของบทความเกี่ยวกับ arXiv ว่า
    > “So many articles, so few insights.
    > “บทความมีเยอะ แต่มีข้อคิดลึกซึ้งอยู่น้อย”
  • ปัจจุบันในวัย 69 ปี เขายังคงใช้ชีวิตอย่างกระฉับกระเฉง ชอบปั่นจักรยานและเดินเขา และแต่งตัวในสไตล์ นักเดินทางสบาย ๆ อยู่เสมอ

สำนักงานของ Ginsparg และความสนใจล่าสุด

  • สำนักงานในภาควิชาฟิสิกส์ของ Cornell ไม่ได้ถึงกับ “รก” แต่ให้บรรยากาศเหมือน ข้าวของเก่าๆ ถูกวางค้างอยู่ในกาลเวลาที่หยุดนิ่ง
    • มีทั้งกล่องพัสดุจากยุค 90 นิตยสารเก่า จอ CRT และบัตรเชิญจากทำเนียบขาว
    • หนังสือที่ Stephen Wolfram ส่งมามีโน้ตขำๆ แนบไว้
      > “Since you can’t find it on arXiv :)
      > “คงหาไม่ได้บน arXiv น่ะสิ :)”
  • สิ่งเดียวที่ยังถูกใช้งานอย่างคึกคักคือ กระดานดำที่เต็มไปด้วยสมการเกี่ยวกับทฤษฎีการวัดเชิงควอนตัม
  • แม้อยู่นอกห้องทำงาน เขาก็ยังแสดงให้เห็นถึง ความช่างสังเกตที่ไม่พลาดแม้รายละเอียดเล็กๆ ไม่ว่าจะเป็นโครงสร้างอาคาร เส้นทางการเดินของพนักงาน หรือแม้แต่ชนิดของนกที่บินเข้ามาทุกปี
  • เขากังวลต่อ ปัญหางานวิจัยคุณภาพต่ำ ที่เพิ่มขึ้นพร้อมกับกระแสบทความ AI ที่พุ่งสูง และกำลังพัฒนา “holy grail crackpot filter” เพื่อคัดกรองสิ่งเหล่านี้
    > “The holy grail crackpot filter.
    > “ตัวกรองงานวิจัยเพี้ยนขั้นสุดยอด”
  • เพื่อรักษาคุณภาพของ arXiv เขายังลงมือ กู้คืนฮาร์ดไดรฟ์ ด้วยตัวเองเพื่อ ทดลองใช้ language model อยู่จนถึงตอนนี้
    • พฤติกรรมเช่นนี้ตีความได้ว่าเป็น ท่าทีที่รู้สึกรับผิดชอบต่อการรักษาคุณภาพของ arXiv ด้วยตัวเอง

การถือกำเนิดของ arXiv และประวัติศาสตร์ยุคแรก

  • เดิมที arXiv ไม่ใช่โครงสร้างพื้นฐานทางวิทยาศาสตร์ แต่เป็นเพียง ชุด shell script ง่ายๆ ที่รันอยู่บนเครื่อง NeXT ของ Ginsparg และถือกำเนิดขึ้นในเดือนมิถุนายน 1991 จาก จุดเปลี่ยนที่การประชุมวิชาการในโคโลราโด
  • ตอนนั้น Joanne Cohn ซึ่งเป็น postdoc ที่สถาบัน Institute for Advanced Study แห่ง Princeton และดูแลเมลลิงลิสต์พรีพรินต์ฟิสิกส์ ได้พูดถึงปัญหาว่า “ยังไม่มีระบบศูนย์กลางสำหรับแชร์งานวิจัยฟิสิกส์
    • การเข้าถึงเมลลิงลิสต์ขึ้นอยู่กับ สังกัดและคอนเน็กชันส่วนตัว และยังมี ความไม่มีประสิทธิภาพที่ต้องใช้เวลาหลายเดือนกว่างานวิจัยจะเผยแพร่
  • เมื่อมีนักฟิสิกส์คนหนึ่งพูดติดตลกว่า “ระหว่างเดินทาง อีเมลที่ส่งบทความเข้ามามีมากจนพื้นที่เก็บข้อมูลเต็ม” Ginsparg จึงตระหนักถึงความจำเป็นของ ระบบกระจายบทความแบบอัตโนมัติ
    • เมื่อเขาถาม Cohn ว่า “เคยคิดจะทำให้มันอัตโนมัติไหม” คำตอบที่ได้คือ
      > “Go ahead and do it yourself.
      > “งั้นคุณก็ลองทำเองสิ”
  • วันถัดมา Ginsparg ก็เขียนสคริปต์จนเสร็จจริงๆ และ
    > “My recollection is that the next day he’d come up with the scripts and seemed pretty happy about having done it so quickly.
    > “เท่าที่ฉันจำได้ วันรุ่งขึ้นเขาก็ทำสคริปต์เสร็จแล้ว และดูพอใจมากที่ทำได้เร็วขนาดนั้น” — Joanne Cohn

ตำแหน่งแห่งยุคสมัยของ Ginsparg และวิวัฒนาการทางเทคโนโลยีของ arXiv

  • Ginsparg มักถูกเปรียบว่าเป็น Forrest Gump แห่งยุคอินเทอร์เน็ต โดย
    • ตอนเรียนที่ Harvard เขาเป็นเพื่อนร่วมรุ่นกับ Bill Gates และ Steve Ballmer
    • พี่ชายของเขาเรียนที่ Stanford ร่วมกับ Terry Winograd ผู้บุกเบิก AI
    • ทั้งสองคนต่างก็มี บัญชีอีเมลบน Arpanet ซึ่งในเวลานั้นถือว่าหายากมาก
  • หลังจบปริญญาเอกฟิสิกส์ทฤษฎีจาก Cornell เขาเริ่มงานอาจารย์ที่ Harvard แต่เมื่อ ไม่ได้รับ tenure จึงย้ายไป Los Alamos
    • ที่นั่นมีทั้ง สภาพแวดล้อมที่เอื้อให้ทุ่มเทกับงานวิจัยฟิสิกส์ทฤษฎีพลังงานสูงได้เต็มที่ และ เงื่อนไขด้านพื้นที่ที่เหมาะกับไลฟ์สไตล์เน้นการออกกำลังกาย

ระบบ arXiv ก่อนยุคเว็บและการพัฒนาสู่เว็บ

  • ในช่วงแรก arXiv ไม่ใช่เว็บไซต์ แต่เป็น เซิร์ฟเวอร์ตอบกลับอัตโนมัติทางอีเมล และไม่กี่เดือนต่อมาก็มี FTP server เพิ่มเข้ามาด้วย
    • ต่อมา Ginsparg ได้ยินเกี่ยวกับเทคโนโลยีใหม่ชื่อ “World Wide Web” และในตอนแรกตอบสนองอย่างไม่ค่อยเชื่อมั่นว่า
      > “I can’t really pay attention to every single fad.
      > “คงเป็นไปไม่ได้ที่จะตามทุกกระแสฮิตหรอก”
      แต่หลังจากการมาถึงของเบราว์เซอร์ Mosaic ในปี 1993 เขาก็เริ่มสนใจและลงมือสร้างเว็บอินเทอร์เฟซด้วยตัวเอง
  • เขายังมีปฏิสัมพันธ์กับ Tim Berners-Lee แห่ง CERN ด้วย และจดจำเขาในฐานะ “โปรแกรมเมอร์ที่ย่างปลากระโทงดาบได้ยอดเยี่ยม”
    > “Tim grilled excellent swordfish at his home in the French countryside.
    > “Tim ย่างปลากระโทงดาบได้สุดยอดที่บ้านของเขาในชนบทฝรั่งเศส”

ที่มาของชื่อและการจัดระเบียบ codebase

  • ในปี 1994 ด้วยเงินสนับสนุนจาก National Science Foundation เขาจ้างนักพัฒนาสองคนเพื่อ รีแฟกเตอร์ shell script ชุดแรกให้เป็นโค้ด Perl ที่เสถียรกว่าเดิม
    • Mark Doyle: ต่อมากลายเป็น CIO ของ American Physical Society
    • Rob Hartill: ตอนนั้นทำโปรเจกต์ IMDb ควบคู่กัน และต่อมาก็มีบทบาทใน Apache Software Foundation
  • ที่อยู่แรกเริ่มของ arXiv คือ xxx.lanl.gov โดยคำว่า “xxx” ยังไม่มีความหมายแบบที่ใช้กันในปัจจุบัน จากนั้นเขากับภรรยาจึงช่วยกันคิด “ชื่อที่ดีกว่า” และสุดท้ายเลือกใช้ตัวอักษรกรีก chi (χ) จนกลายเป็นชื่อ ‘arXiv’
    > “She wrote it down and crossed out the e to make it more symmetric around the X.
    > “เธอเขียนมันลงมา แล้วขีด e ทิ้งเพื่อให้สมมาตรรอบตัว X มากขึ้น”
  • ในช่วงแรกยังไม่มีองค์กรแยกชัดเจน โดยมีเพียง นักพัฒนา 1-2 คน และผู้ดูแลส่วนใหญ่เป็นคนรู้จักกับเพื่อนร่วมงาน ขณะที่เดิมคาดว่าจะมีบทความปีละ ราว 100 ฉบับ แต่ในความเป็นจริงกลับเริ่มต้นที่ เดือนละ 100 ฉบับ และเติบโตอย่างรวดเร็ว

การขยายตัวอย่างรวดเร็วของชุมชนและการปักหลักของ arXiv

  • ตามคำบอกของ Ginsparg
    > “Day one, something happened, day two something happened, day three, Ed Witten posted a paper. That was when the entire community joined.
    > “วันแรกก็มีบางอย่างเกิดขึ้น วันที่สองก็มีอีกอย่างเกิดขึ้น แล้ววันที่สาม Ed Witten ก็โพสต์บทความ ตอนนั้นเองที่ทั้งชุมชนเข้าร่วม”
  • Edward Witten เป็นทั้งนักฟิสิกส์ทฤษฎีระดับแนวหน้าของยุคปัจจุบัน และถูกเรียกว่า “คนที่ฉลาดที่สุดที่ยังมีชีวิตอยู่” โดยเขาเองก็กล่าวว่า
    > “The arXiv enabled much more rapid worldwide communication among physicists.
    > “arXiv ทำให้การสื่อสารระหว่างนักฟิสิกส์ทั่วโลกเร็วขึ้นมาก”
  • หลังจากนั้นก็ขยายไปยัง สาขาอื่นๆ อีกหลากหลาย เช่น คณิตศาสตร์และวิทยาการคอมพิวเตอร์ โดย Ginsparg เองก็ย้อนนึกถึงช่วงพัฒนา arXiv แรกเริ่มว่า
    > “It was fun.
    > “มันสนุกมาก”

การขยายตัวของ arXiv และจุดเริ่มต้นของความขัดแย้ง

  • เมื่อการใช้งาน arXiv เพิ่มสูงขึ้นอย่างรวดเร็ว ระบบก็เริ่มเผชิญ ปัญหาด้านการขยายระบบและการปฏิบัติการแบบที่ซอฟต์แวร์ขนาดใหญ่ต้องเจอ โดยเฉพาะปัญหาเซิร์ฟเวอร์ช้าลงและภาระด้านการกลั่นกรอง
    • ตัวอย่างเช่น เคยเกิดเหตุเซิร์ฟเวอร์ทำงานหนักเกินไปจากทราฟฟิกจำนวนมากที่มาจาก “stanford.edu” ซึ่งภายหลังพบว่าเป็นช่วงที่ Sergey Brin และ Larry Page ผู้สร้าง Google ในเวลาต่อมา กำลังใช้เว็บครอว์ลเลอร์เก็บข้อมูลจาก arXiv
      > “Years later, when Ginsparg visited Google HQ, both Brin and Page personally apologized to him for the incident.
      > “หลายปีต่อมา เมื่อ Ginsparg ไปเยือนสำนักงานใหญ่ของ Google ทั้ง Brin และ Page ได้ขอโทษเขาด้วยตัวเองสำหรับเหตุการณ์นั้น”

กลยุทธ์การอยู่รอดของ arXiv และการสร้างความเป็นอิสระจากอุตสาหกรรมสำนักพิมพ์

  • เหตุผลสำคัญที่สุดที่ arXiv อยู่รอดมาได้ คือ การหลีกเลี่ยงการถูกโจมตีจากโครงสร้างอำนาจเดิมของสำนักพิมพ์วิชาการแบบดั้งเดิม ซึ่งเป็นผลจากกลยุทธ์ตั้งแต่ช่วงแรกที่ให้ผู้ใช้ยอมรับเงื่อนไขว่า “arXiv สามารถเผยแพร่บทความนั้นได้แบบไม่ผูกขาดและถาวร” ในตอนส่งบทความ
    • ด้วยเงื่อนไขนี้ แม้งานวิจัยจะถูกตีพิมพ์ในวารสารอื่นภายหลัง ก็ยังคงอยู่บน arXiv ได้ต่อไป ทำให้สำนักพิมพ์รายใหญ่ไม่มีแรงจูงใจจะพยายามปิดมันลง

การจากไปจาก Los Alamos และการกลับสู่ Cornell

  • แม้ว่า arXiv จะค่อย ๆ กลายเป็นโครงสร้างพื้นฐานที่สำคัญมากขึ้นในวงการวิทยาศาสตร์ แต่ ภายในห้องปฏิบัติการ Los Alamos เองกลับไม่ได้สนับสนุนโครงการ arXiv อย่างจริงจัง และยิ่งไปกว่านั้น การที่มันมีอิทธิพลมากกว่าตัวสถาบันเองก็กลายเป็นภาระด้วย
    • Ginsparg อธิบายช่วงเวลานั้นว่า
      > “dreamlike and heavenly” “เหมือนความฝันและราวกับสวรรค์”
    • แต่หลังจาก คดีจารกรรม Wen Ho Lee ในปี 1999 บรรยากาศภายในสถาบันก็เปลี่ยนไปอย่างรวดเร็ว ทำให้เขาตัดสินใจย้ายงานเพราะ มาตรการรักษาความปลอดภัยที่เข้มงวดขึ้นและความเหนื่อยล้าทางจิตใจที่สะสม
      • ในการประเมินผลงานตอนนั้น เขายังถูกวิจารณ์อย่างหนักว่าเป็น “a strictly average performer with no particular computer skills
        → “เป็นคนที่มีผลงานอยู่ในระดับปานกลางอย่างเคร่งครัด และไม่มีทักษะคอมพิวเตอร์ที่โดดเด่นเป็นพิเศษ” และลูกสาวที่เพิ่งเกิดรวมถึงประเด็นเรื่องสภาพแวดล้อมทางการศึกษาก็เป็นหนึ่งในเหตุผลของการย้ายงานด้วย
  • ในที่สุด Ginsparg ก็ กลับไปยัง Cornell ซึ่งเป็นมหาวิทยาลัยเดิมของเขา และย้าย arXiv ไปด้วยกัน พร้อมประกาศว่า “จะถอนตัวจาก arXiv ภายในไม่เกิน 5 ปี”
    > “They disseminate material to academics, so that seemed like a natural fit.
    > “ห้องสมุดมีหน้าที่เผยแพร่เอกสารวิชาการ จึงดูเป็นทางเลือกที่เหมาะสมโดยธรรมชาติ”

ความขัดแย้งด้านการดำเนินงานภายในห้องสมุด

  • อย่างไรก็ตาม ห้องสมุด Cornell ไม่ได้เข้าใจความซับซ้อนทางเทคนิคของ arXiv อย่างแท้จริง และแม้แต่ตรรกะของระบบส่งผลงานเพียงอย่างเดียวก็ต้องรองรับกรณียกเว้นจำนวนมาก ดังนั้นการปฏิบัติต่อมันเหมือนเป็นเพียงระบบเก็บข้อมูลธรรมดาจึงกลายเป็นปัญหา
  • Ginsparg และสมาชิกยุคแรก ๆ รู้สึกว่า ฝั่งห้องสมุดมอง arXiv เป็นเหมือนของแถมที่มาทีหลัง ขณะที่ฝั่งห้องสมุดเองก็รู้สึกว่า Ginsparg เข้าไปแทรกแซงมากเกินไป
    > “Good lower-level manager … but his sense of management didn’t scale.
    > “เป็นผู้จัดการภาคปฏิบัติที่ดี แต่ความสามารถด้านการบริหารของเขาไม่เหมาะกับการดำเนินงานในขนาดใหญ่”
  • ตลอดช่วงเวลาส่วนใหญ่ของทศวรรษ 2000 arXiv ดำเนินงานโดยไม่สามารถรักษาบุคลากรด้านพัฒนาให้มั่นคงได้

คำวิจารณ์ต่อปรัชญาและวิธีการดำเนินงานของ Ginsparg

  • Ginsparg ยังคงมีลักษณะเป็น นักพัฒนาสายลงมือทำที่ยังรีวิวโค้ดและหาข้อผิดพลาดด้วยตัวเอง และมีท่าทีเชิงเสียดสีต่อการบรรยายภายนอกหรือบทบาทที่ปรึกษาระดับสูง
    > “Larry Summers spending one day a week consulting for some hedge fund—it’s just unseemly.
    > “Larry Summers ไปเป็นที่ปรึกษาให้เฮดจ์ฟันด์สัปดาห์ละหนึ่งวัน มันดูไม่เหมาะสมเอาเสียเลย”
  • แต่ในอีกด้านหนึ่ง การที่เขายังคงมีส่วนร่วมอยู่นานเกินไปก็กลายเป็นปัญหาเช่นกัน และ arXiv ก็ขยายตัวใหญ่ขึ้นเรื่อย ๆ
    > “bigger than all of us” — Stephanie Orphan (ผู้อำนวยการโครงการ arXiv)
    > “มันกลายเป็นสิ่งที่ใหญ่กว่าพวกเราทุกคน”
    ซึ่งเริ่มกลายเป็นความเข้าใจร่วมกัน
  • มีข้อถกเถียงหลากหลายเกิดขึ้น ทั้ง คดีฟ้องร้องจากนักฟิสิกส์สายการออกแบบอัจฉริยะ, ข้อกล่าวหาเรื่องการลอกผลงาน, และ เสียงวิจารณ์เรื่องการใช้อำนาจของผู้ดูแลระบบเกินขอบเขต
    • โดยเฉพาะในปี 2009 นักฟิสิกส์อิสระ Philip Gibbs ได้ก่อตั้ง viXra ซึ่งเป็นแพลตฟอร์มฝั่งตรงข้ามของ arXiv
      • มันคือ “แพลตฟอร์มที่แทบไม่มีการกำกับดูแลและทำงานในทิศทางตรงกันข้ามกับ arXiv” ซึ่งมักมีทฤษฎีประหลาดหรือบทความจากมือสมัครเล่นถูกอัปโหลดอยู่เป็นหลัก
      • ตัวอย่างเด่นคือบทความที่อ้างว่า “π เป็นเรื่องโกหก” (ลิงก์)

ปัญหาการดูแลโค้ดเบสและความขัดแย้งด้านแนวปฏิบัติการพัฒนา

  • arXiv ค่อย ๆ เติบโตเป็น โค้ดเบสขนาดใหญ่ และโครงสร้างในยุคแรกก็ถูกสร้างขึ้น โดยไม่ได้คำนึงถึงการบำรุงรักษาและการทดสอบ
    • ทำให้เกิดปัญหาเชิงโครงสร้างคล้ายกับ “การก่อสร้างอาคารโดยไม่มีการตรวจความปลอดภัย
    • สิ่งนี้ช่วยให้พัฒนาได้รวดเร็วในช่วงแรก แต่ก่อให้เกิด หนี้ทางเทคนิคระยะยาวและความซับซ้อนที่เพิ่มขึ้น
  • Ginsparg ยังคงเข้าไป ตรวจและแก้ไขโค้ดด้วยตัวเองโดยไม่ผ่านการอนุมัติจากฝั่งห้องสมุด และด้วยเหตุนี้จึงถูกวิจารณ์ว่า
    > “micromanaging and sowing distrust
    > “จู้จี้ควบคุมรายละเอียดมากเกินไปและสร้างความไม่ไว้วางใจ”

ความพยายามเกษียณ การอยู่ต่อ และความขัดแย้งภายในที่ทวีความรุนแรง

  • ในวาระครบรอบ 20 ปีของ arXiv ในปี 2011 Ginsparg ตัดสินใจแน่วแน่ที่จะเกษียณ และเผยแพร่คำอำลาภายใต้ชื่อ “ArXiv at 20” บน Nature
    > “For me, the repository was supposed to be a three-hour tour, not a life sentence.
    > “สำหรับผม repository นี้ควรจะเป็นแค่ทริปสามชั่วโมง ไม่ใช่โทษจำคุกตลอดชีวิต”
    > “ArXiv was originally conceived to be fully automated, so as not to scuttle my research career.
    > “เดิมที arXiv ถูกออกแบบให้เป็นระบบอัตโนมัติเต็มรูปแบบ เพื่อไม่ให้มันทำลายเส้นทางอาชีพนักวิจัยของผม”
    > “But daily administrative activities associated with running it can consume hours of every weekday, year-round without holiday.
    > “แต่กิจกรรมงานบริหารที่เกี่ยวข้องกับการดูแลมันกลับกินเวลาหลายชั่วโมงในทุกวันทำงาน ตลอดทั้งปีไม่มีวันหยุด”
  • หลังจากนั้น งานปฏิบัติการประจำวันถูกโอนให้ห้องสมุด Cornell ดูแล และ Ginsparg ตั้งใจจะถอยไปอยู่ในบทบาทที่ปรึกษา แต่ความเป็นจริงไม่ได้เป็นเช่นนั้น
    • พนักงานบางส่วนวิจารณ์ว่า Ginsparg “จับโค้ดไว้เป็นตัวประกัน” และปฏิเสธที่จะใช้ GitHub หรือแชร์ภายใน
    • ขณะที่เขาเองก็แสดงความหงุดหงิดต่อความจริงที่ว่า ฟีเจอร์ที่เมื่อก่อนเขาทำได้ภายในวันเดียว ตอนนี้กลับใช้เวลาหลายสัปดาห์
      > “I learned Fortran in the 1960s, and real programmers didn’t document.
      > “ผมเรียน Fortran มาตั้งแต่ทศวรรษ 1960 และโปรแกรมเมอร์ตัวจริงไม่เขียนเอกสาร”
      (→ ถูกบรรยายว่าเป็นคำตอบที่ทำให้ผู้ถามช็อกระดับหัวใจวาย)

ความสับสนด้านการบริหารและการปรับโครงสร้าง

  • นอกจากปัญหาทางเทคนิคแล้ว arXiv ยังเผชิญกับ ความสับสนด้านการบริหาร ด้วย
    • ในปี 2019 หน่วยงานต้นสังกัดของ arXiv ภายใน Cornell ถูก ย้ายไปอยู่ภาควิชาคอมพิวเตอร์และสารสนเทศศาสตร์ แต่ไม่กี่เดือนต่อมาก็มีการเปลี่ยนแปลงอีกครั้ง
    • หลังจากนั้น มีผู้มีประสบการณ์ด้านสำนักพิมพ์วิชาการเชิงพาณิชย์เข้ามารับผิดชอบงานปฏิบัติการ แต่ก็ลาออกภายในเวลาเพียงหนึ่งปีครึ่ง
      > “There was disruption … it was not a good period.
      > “มีความปั่นป่วนเกิดขึ้น … มันไม่ใช่ช่วงเวลาที่ดี” — คนวงในของ arXiv
  • จุดเปลี่ยนเกิดขึ้นในปี 2022 เมื่อ ได้รับการสนับสนุนจากมูลนิธิ Simons จนสามารถเพิ่มกำลังคนด้านพัฒนาได้จำนวนมาก
    • และ ศาสตราจารย์ Ramin Zabih แห่ง Cornell ได้รับแต่งตั้งให้เป็นผู้รับผิดชอบการดำเนินงาน
    • พร้อมกับที่ การย้ายขึ้นคลาวด์และการรีแฟกเตอร์โค้ดบนพื้นฐานของ Python เริ่มเดินหน้าอย่างจริงจัง

แง่มุมส่วนตัวและการทบทวนตนเอง

  • ระหว่างให้สัมภาษณ์กับนักข่าว Ginsparg ก็ยังคงมีท่าทีขี้เล่น เช่น ช่วยซ่อมจักรยานให้ลูกชาย และแหย่เรื่องกำลังขาของอีกฝ่ายระหว่างทริปปั่นจักรยาน
    • ตอนขึ้นเนินช่วงสุดท้าย เขาพูดว่า
      > “I might’ve oversold this to you.
      > “ผมอาจจะโฆษณาเส้นทางนี้กับคุณเกินจริงไปหน่อย”
      พร้อมยอมรับถึงความเหนื่อยล้า
  • หลังจากสัมภาษณ์กันหลายวัน ผู้สื่อข่าวบอกว่าความ มุ่งมั่นและความดื้อรั้นของเขาคือเหตุผลที่ arXiv อยู่รอดมาได้ และ Ginsparg ก็ตอบกลับอย่างคาดไม่ถึง
    > “One person’s tenacity is another person’s terrorism.
    > “สิ่งที่สำหรับคนหนึ่งคือความมุ่งมั่น สำหรับอีกคนอาจเป็นการก่อการร้ายก็ได้”
  • จากนั้นเขายังยอมรับอีกว่า
    > “I’ve heard that the staff occasionally felt terrorized.
    > “ผมได้ยินมาว่าบางครั้งพนักงานก็รู้สึกหวาดกลัว”

arXiv ในปัจจุบันและอนาคต

  • ปัจจุบัน arXiv ยังคง ดำเนินงานต่อไปอย่างมีดราม่า,
  • ในปี 2023 บทความที่อ้างว่าค้นพบตัวนำยิ่งยวดที่อุณหภูมิห้องถูกโต้แย้งอย่างรวดเร็ว และกลายเป็นกรณีตัวอย่างที่แสดงให้เห็นกลไกฟีดแบ็กที่รวดเร็วของ arXiv
    • ในทางกลับกัน ก็มีกรณีที่ บทความปกติถูกถอนเพราะเหตุผลว่า “ใช้ถ้อยคำปลุกปั่น” หรือ “ภาษาไม่เป็นมืออาชีพ” ทำให้เกิดข้อถกเถียงเรื่อง “การเซ็นเซอร์” เช่นกัน
      • กรณีตัวอย่าง: เหตุการณ์ถอนบทความของ Jorge Hirsch ผู้คิดค้น h-index

ท่าทีและความผูกพันของ Ginsparg ในปัจจุบัน

  • เขา ไม่ได้ต้องการสร้างภาพว่าตัวเองเป็น “ผู้บุกเบิกโอเพนไซเอนซ์” และมากกว่าภารกิจอันยิ่งใหญ่ เขา ยังคงสนุกกับ arXiv ในฐานะพื้นที่ทดลองไอเดีย
    > “There are various aspects of this that remain incredibly entertaining.
    > “ยังมีหลายแง่มุมของโครงการนี้ที่สนุกอย่างเหลือเชื่ออยู่เสมอ”
    > “I have the perfect platform for testing ideas and playing with them.
    > “ผมมีแพลตฟอร์มที่สมบูรณ์แบบสำหรับทดลองไอเดียและเล่นกับมัน”
  • แม้ว่าเขา จะไม่ได้แตะโค้ดที่ใช้ดูแล arXiv แล้ว, แต่ก็ยัง หมกมุ่นกับโปรเจ็กต์ส่วนตัวในการพัฒนา ‘ตัวกรองบทความปลอม’
    > “It’s like that Al Pacino quote: They keep bringing me back.
    > “มันก็เหมือนคำพูดของ Al Pacino นั่นแหละ: พวกเขาดึงฉันกลับไปอยู่เรื่อย”
    > “But Al Pacino also developed a real taste for killing people.
    > “แต่ Al Pacino ลงท้ายด้วยการเริ่มชอบการฆ่าคนจริง ๆ”
    (→ เป็นการพูดเชิงขำ ๆ ถึงทั้งความรักความชังที่มีต่อ arXiv และความหมกมุ่นของตัวเอง)

1 ความคิดเห็น

 
GN⁺ 2025-04-23
ความคิดเห็นจาก Hacker News
  • ข้ออ้างที่ว่าในยุค 90 คำว่า "xxx" ยังไม่ได้มีความหมายแบบที่ใช้กันในปัจจุบันนั้นไม่เป็นความจริง
  • บทความนี้เป็นกรณีศึกษาระดับจุลภาคที่แสดงให้เห็นถึงความยากลำบากในการคงไว้ซึ่งสาธารณประโยชน์ จึงให้บรรยากาศที่ค่อนข้างหม่นเล็กน้อย
    • บริการขนาดเล็กมักไม่ค่อยเป็นที่สังเกต แต่มีบทบาทสำคัญ และยากที่จะได้รับความช่วยเหลือเพื่อดูแลให้คงอยู่ต่อไป
    • เมื่อบริการเติบโตขึ้นก็จะเริ่มได้รับความสนใจ และจะมีความพยายามบิดเบือนมันไปเพื่อจุดประสงค์อื่น ทำให้การได้รับความช่วยเหลือยิ่งยากขึ้น
  • สำหรับนักวิทยาศาสตร์ โลกที่ไม่มี arXiv ก็เหมือนโลกที่ไม่มีห้องสมุดสาธารณะ
  • บางคนชอบ Zenodo มากกว่า โดยให้เหตุผลว่าโฮสต์โดย CERN และมีฟีเจอร์มากกว่า
  • ในปี 2021 วารสาร Nature ได้เลือก arXiv ให้เป็นหนึ่งใน 10 โค้ดคอมพิวเตอร์ที่เปลี่ยนแปลงวงการวิทยาศาสตร์
    • บทความนี้อยู่หลังเพย์วอลล์ และอ่านได้ด้วยค่าสมัครรายปี $199
  • ใบอนุญาตบางส่วนของ arXiv อนุญาตให้ใช้งานได้เฉพาะเพื่อวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์
    • กำลังหาวิธีตรวจสอบข้อมูลใบอนุญาตได้จากหน้าหลักของบทความแต่ละฉบับ
  • arXiv อนุญาตให้อัปโหลดบทความวิชาการในรูปแบบ .ps, .tex, .pdf
  • อินเทอร์เน็ตและเว็บคือแพลตฟอร์มที่เปลี่ยนแปลงวงการวิทยาศาสตร์มากที่สุด
  • arXiv กำลังระงับบทความ เพราะไม่เชื่อว่าคนที่ไม่มีวุฒิด้านวิทยาการคอมพิวเตอร์จะพัฒนาภาษาโปรแกรมขึ้นมาได้ด้วยตนเอง