- arXiv คือ คลังเก็บบทความวิทยาศาสตร์แบบเปิดให้เข้าถึงได้ ที่ Paul Ginsparg สร้างขึ้นในปี 1991 และจนถึงทุกวันนี้ก็ยังถูกใช้งานในฐานะ หนึ่งในแพลตฟอร์มที่สำคัญที่สุด สำหรับนักวิทยาศาสตร์ทั่วโลก
- ด้วยการ เลี่ยงโครงสร้างการตีพิมพ์วิชาการแบบเดิมที่ช้าและมีต้นทุนสูง ทำให้นักวิจัยสามารถ แชร์บทความก่อนการพิจารณา (preprint) ได้ ทันที จึงมีส่วนช่วยต่อความร่วมมือและนวัตกรรมทางวิทยาศาสตร์
- arXiv เริ่มต้นจากเพียงสคริปต์อัตโนมัติอย่างง่าย แต่ปัจจุบันเติบโตเป็นแพลตฟอร์มขนาดใหญ่ที่มี การส่งบทความมากกว่า 20,000 ฉบับต่อเดือน และ ผู้ใช้งาน 5 ล้านคน
- ในช่วงแรกมีการดำเนินงานแบบไม่เป็นทางการและค่อนข้างสบาย ๆ แต่ต่อมาก็เผชิญวิกฤตหลายครั้งจากปัญหาอย่าง ความซับซ้อนของโค้ดระบบ, ความขัดแย้งภายใน, ความล้าสมัยของเทคโนโลยี
- ปัจจุบัน ภายใต้การสนับสนุนของ Simons Foundation และผู้นำชุดใหม่ กำลังมีการ ย้ายขึ้นคลาวด์และรีแฟกเตอร์โค้ด Python ขณะที่ Ginsparg ก็ยังคงหมกมุ่นกับปัญหาเรื่องการกรองคุณภาพอยู่
จุดกำเนิดของ arXiv และความท้าทายต่อโครงสร้างการตีพิมพ์ทางวิทยาศาสตร์
- นักฟิสิกส์ Paul Ginsparg ยกคำพูดจาก The Godfather มาใช้อธิบายความรู้สึกที่ว่าเขาไม่อาจถอนตัวจากแพลตฟอร์มที่ตัวเองสร้างได้อย่างสิ้นเชิง
> “Just when I thought I was out, they pull me back in!”
> “ตอนที่ผมนึกว่าออกมาได้แล้ว พวกเขาก็ดึงผมกลับเข้าไปอีก!” - เขาเป็นศาสตราจารย์แห่ง Cornell University และผู้ได้รับ MacArthur Genius Grant ซึ่งเมื่อ 35 ปีก่อนได้พัฒนาคลังเก็บดิจิทัล arXiv สำหรับแชร์บทความ ก่อนการประเมินโดยเพื่อนนักวิชาการ (preprint)
- จนถึงตอนนี้ arXiv.org ยังรักษาดีไซน์แบบ เว็บ 1.0 คลาสสิก และ สัญลักษณ์ของ Cornell เอาไว้ แต่ต่างจากรูปลักษณ์ที่เรียบง่ายนั้น arXiv คือแพลตฟอร์มที่ก่อให้เกิด การเปลี่ยนแปลงเชิงรากฐานต่อโครงสร้างการเผยแพร่ความรู้ทางวิทยาศาสตร์
- หาก arXiv หยุดให้บริการ ก็อาจเกิด ผลกระทบอย่างรุนแรงต่อการทำงานของนักวิทยาศาสตร์ทั่วโลก และในความเป็นจริง นักคณิตศาสตร์และนักฟิสิกส์จำนวนมากก็ เข้าใช้งาน arXiv ทุกวัน
> “Everybody in math and physics uses it. I scan it every night.” — Scott Aaronson
> “ทุกคนในวงการคณิตศาสตร์และฟิสิกส์ใช้มัน ผมไล่อ่านมันทุกคืน”
บทบาทของ arXiv และการตั้งคำถามต่อโครงสร้างการตีพิมพ์วิชาการ
-
ในแต่ละภาคส่วนของสังคมต่างมีปัญหาเชิงโครงสร้างเรื้อรัง และในแวดวงวิชาการ ความไม่สมเหตุสมผลของระบบการตีพิมพ์ ก็ถูกชี้ว่าเป็นปัญหาตัวอย่างที่เด่นชัด
-
โมเดลแสวงกำไรของสำนักพิมพ์รายใหญ่อย่าง Elsevier, Springer ถูกวิจารณ์ในลักษณะต่อไปนี้:
- ให้ผู้เขียนต้องเขียนบทความโดยไม่ได้รับค่าตอบแทน
- อาศัยนักวิจัยคนอื่นมาช่วยบรรณาธิการโดยไม่คิดค่าใช้จ่าย
- เมื่องานเสร็จแล้วก็นำบทความไปขายในราคาสูง ขณะที่สถาบันต้องแบกรับค่าสมาชิกจำนวนมาก
> “Calling their practice a form of thuggery isn’t so much an insult as an economic observation.”
> “การเรียกวิธีการของพวกเขาว่าเป็นการกรรโชกนั้น ไม่ใช่คำด่าเสียทีเดียว แต่เป็นข้อสังเกตทางเศรษฐศาสตร์”
-
กระบวนการ peer review แบบดั้งเดิมอาจใช้เวลา หลายเดือนถึง 1 ปี และความล่าช้านี้ก็กลายเป็นคอขวดของการไหลเวียนข้อมูล
-
ตรงกันข้าม arXiv เปิดให้ใครก็ตามสามารถ เผยแพร่และเข้าถึงได้ทันที ตั้งแต่ในขั้น ก่อนการพิจารณาบทความ (preprint) จึงช่วยแก้ปัญหาเชิงโครงสร้างของการตีพิมพ์
-
นวัตกรรมหลักของ arXiv สรุปได้ดังนี้:
> “Showing that you could divorce the actual transmission of your results from the process of refereeing.” — Paul Fendley
> “มันแสดงให้เห็นว่าเราสามารถแยกการส่งต่อผลลัพธ์การวิจัยออกจากกระบวนการ peer review ได้” -
โครงสร้างเช่นนี้มีส่วนสำคัญอย่างยิ่งในการ เผยแพร่การค้นพบทางวิทยาศาสตร์ที่มีความหมายอย่างรวดเร็ว ใน สถานการณ์วิกฤตอย่างการระบาดใหญ่ของ COVID-19
- และยังเป็นแรงบันดาลใจให้เกิด bioRxiv, medRxiv ที่ขยายแนวคิดไปสู่สายวิทยาศาสตร์ชีวภาพ ซึ่งก็มีการตั้งข้อสังเกตว่าอาจ ช่วยชีวิตผู้คนนับล้าน ได้
โครงสร้างการควบคุมคุณภาพของ arXiv
- แม้บทความที่ส่งเข้า arXiv จะไม่ผ่าน peer review อย่างเป็นทางการ แต่ก็ยังคงรักษามาตรฐานทางวิชาการพื้นฐานและระเบียบต่าง ๆ ผ่าน การตรวจสอบโดยสมัครใจของผู้เชี่ยวชาญในแต่ละสาขา
- องค์ประกอบหลักของการควบคุมคุณภาพ:
- อนุญาตเฉพาะงานวิจัยต้นฉบับ
- ห้ามใช้ข้อมูลที่ถูกบิดเบือน
- ต้องใช้ถ้อยคำที่เป็นกลาง
- นอกจากนี้ บทความที่ส่งเข้ามายังต้องผ่าน การตรวจเบื้องต้นด้วยระบบอัตโนมัติ ด้วย
- หากไม่มีขั้นตอนตรวจสอบเหล่านี้ arXiv ก็เสี่ยงที่จะ เต็มไปด้วยงานวิทยาศาสตร์เทียมหรือผลงานจากผู้ที่ไม่ใช่มืออาชีพ
อิทธิพลของ arXiv และภาพปัจจุบันของ Ginsparg
- ในปี 2021 วารสาร Nature เลือก arXiv ให้เป็นหนึ่งใน “10 computer codes that transformed science”
> “10 computer codes that transformed science”
> “10 โค้ดคอมพิวเตอร์ที่เปลี่ยนโฉมวิทยาศาสตร์” - arXiv ได้รับการยกย่องอย่างสูงในบทบาท การส่งเสริมความร่วมมือทางวิทยาศาสตร์ และปัจจุบันมี
- บทความมากกว่า 2.6 ล้านฉบับ
- บทความส่งเข้าใหม่ 20,000 ฉบับต่อเดือน
- ผู้ใช้รายเดือน 5 ล้านคน
- การค้นพบทางวิทยาศาสตร์สำคัญจำนวนมากในศตวรรษที่ 21 ถูก เผยแพร่ครั้งแรกผ่าน arXiv ตัวอย่างเช่น
- บทความ “transformers” ที่จุดกระแส AI ยุคใหม่
- วิธีพิสูจน์สมมติฐานปวงกาเร หนึ่งในปัญหารางวัลมิลเลนเนียม
- บทความที่โพสต์บน arXiv หลายฉบับ ภายหลังก็ได้รับการตีพิมพ์ในวารสารชั้นนำ แต่ข้อได้เปรียบสำคัญคือ ทันทีที่เผยแพร่บน arXiv ทุกคนก็เข้าถึงได้
> “Just because a paper is posted on arXiv doesn’t mean it won’t appear in a prestigious journal someday.”
> “แค่บทความถูกโพสต์บน arXiv ไม่ได้แปลว่าวันหนึ่งมันจะไม่ไปปรากฏในวารสารชั้นนำ”
ความเป็นจริงภายในของ arXiv และปัญหาความยั่งยืน
- สำหรับนักวิทยาศาสตร์ arXiv ถูกมองว่าเป็น สิ่งจำเป็นพอ ๆ กับห้องสมุดสาธารณะหรือ GPS แต่ในความเป็นจริง การดำเนินงานของ arXiv นั้น ห่างไกลจากภาพแพลตฟอร์มอุดมคติที่ไร้แรงเสียดทาน
- ตลอดเวลาที่ผ่านมา arXiv ต้องเผชิญกับปัญหาต่าง ๆ เช่น
- ความขัดแย้งเชิงระบบราชการ
- โค้ดที่ล้าสมัย
- จนถึงขั้นมี คดีสอดแนม เกิดขึ้น
- Ginsparg อธิบายความเป็นจริงนี้ไว้ดังนี้
> “A child I sent off to college but who keeps coming back to camp out in my living room, behaving badly.”
> “เหมือนลูกที่ผมส่งไปเรียนมหาวิทยาลัยแล้ว แต่เอาแต่กลับมาปักหลักในห้องนั่งเล่นที่บ้านและก่อเรื่องไม่หยุด” - แม้จะพยายามเว้นระยะห่างจาก arXiv อยู่เรื่อย ๆ เช่น ส่งคำขอสัมภาษณ์ไปให้ดู FAQ หรือพยายามกันไม่ให้มีการมาเยี่ยมโดยตรง แต่ Ginsparg ก็ยังคง พยายามตีตัวออกห่างจาก arXiv อยู่เสมอ
บุคลิก รสนิยม และชีวิตประจำวันของ Ginsparg
- จากการสัมภาษณ์ที่ Ithaca (ที่ตั้งของ Cornell) เผยให้เห็นว่า Ginsparg เป็นคน
- อารมณ์ดีและขี้เล่น
- แต่ในขณะเดียวกันก็มี ความดื้อดึงที่จะยืนหยัดในปรัชญาของตนอย่างไม่ประนีประนอม
- ตามคำบอกเล่าของ Geoffrey West อดีตหัวหน้าของเขา
> “Quite a character, infamous in the community, extremely funny, a great guy.”
> “เป็นคนที่มีคาแรกเตอร์มาก เป็นที่รู้จักไปทั่วในชุมชน ตลกมาก และเป็นคนที่ยอดเยี่ยม” - ตัว Ginsparg เองก็พูดลดทอนคุณค่าของบทความเกี่ยวกับ arXiv ว่า
> “So many articles, so few insights.”
> “บทความมีเยอะ แต่มีข้อคิดลึกซึ้งอยู่น้อย” - ปัจจุบันในวัย 69 ปี เขายังคงใช้ชีวิตอย่างกระฉับกระเฉง ชอบปั่นจักรยานและเดินเขา และแต่งตัวในสไตล์ นักเดินทางสบาย ๆ อยู่เสมอ
สำนักงานของ Ginsparg และความสนใจล่าสุด
- สำนักงานในภาควิชาฟิสิกส์ของ Cornell ไม่ได้ถึงกับ “รก” แต่ให้บรรยากาศเหมือน ข้าวของเก่าๆ ถูกวางค้างอยู่ในกาลเวลาที่หยุดนิ่ง
- มีทั้งกล่องพัสดุจากยุค 90 นิตยสารเก่า จอ CRT และบัตรเชิญจากทำเนียบขาว
- หนังสือที่ Stephen Wolfram ส่งมามีโน้ตขำๆ แนบไว้
> “Since you can’t find it on arXiv :)”
> “คงหาไม่ได้บน arXiv น่ะสิ :)”
- สิ่งเดียวที่ยังถูกใช้งานอย่างคึกคักคือ กระดานดำที่เต็มไปด้วยสมการเกี่ยวกับทฤษฎีการวัดเชิงควอนตัม
- แม้อยู่นอกห้องทำงาน เขาก็ยังแสดงให้เห็นถึง ความช่างสังเกตที่ไม่พลาดแม้รายละเอียดเล็กๆ ไม่ว่าจะเป็นโครงสร้างอาคาร เส้นทางการเดินของพนักงาน หรือแม้แต่ชนิดของนกที่บินเข้ามาทุกปี
- เขากังวลต่อ ปัญหางานวิจัยคุณภาพต่ำ ที่เพิ่มขึ้นพร้อมกับกระแสบทความ AI ที่พุ่งสูง และกำลังพัฒนา “holy grail crackpot filter” เพื่อคัดกรองสิ่งเหล่านี้
> “The holy grail crackpot filter.”
> “ตัวกรองงานวิจัยเพี้ยนขั้นสุดยอด” - เพื่อรักษาคุณภาพของ arXiv เขายังลงมือ กู้คืนฮาร์ดไดรฟ์ ด้วยตัวเองเพื่อ ทดลองใช้ language model อยู่จนถึงตอนนี้
- พฤติกรรมเช่นนี้ตีความได้ว่าเป็น ท่าทีที่รู้สึกรับผิดชอบต่อการรักษาคุณภาพของ arXiv ด้วยตัวเอง
การถือกำเนิดของ arXiv และประวัติศาสตร์ยุคแรก
- เดิมที arXiv ไม่ใช่โครงสร้างพื้นฐานทางวิทยาศาสตร์ แต่เป็นเพียง ชุด shell script ง่ายๆ ที่รันอยู่บนเครื่อง NeXT ของ Ginsparg และถือกำเนิดขึ้นในเดือนมิถุนายน 1991 จาก จุดเปลี่ยนที่การประชุมวิชาการในโคโลราโด
- ตอนนั้น Joanne Cohn ซึ่งเป็น postdoc ที่สถาบัน Institute for Advanced Study แห่ง Princeton และดูแลเมลลิงลิสต์พรีพรินต์ฟิสิกส์ ได้พูดถึงปัญหาว่า “ยังไม่มีระบบศูนย์กลางสำหรับแชร์งานวิจัยฟิสิกส์”
- การเข้าถึงเมลลิงลิสต์ขึ้นอยู่กับ สังกัดและคอนเน็กชันส่วนตัว และยังมี ความไม่มีประสิทธิภาพที่ต้องใช้เวลาหลายเดือนกว่างานวิจัยจะเผยแพร่
- เมื่อมีนักฟิสิกส์คนหนึ่งพูดติดตลกว่า “ระหว่างเดินทาง อีเมลที่ส่งบทความเข้ามามีมากจนพื้นที่เก็บข้อมูลเต็ม” Ginsparg จึงตระหนักถึงความจำเป็นของ ระบบกระจายบทความแบบอัตโนมัติ
- เมื่อเขาถาม Cohn ว่า “เคยคิดจะทำให้มันอัตโนมัติไหม” คำตอบที่ได้คือ
> “Go ahead and do it yourself.”
> “งั้นคุณก็ลองทำเองสิ”
- เมื่อเขาถาม Cohn ว่า “เคยคิดจะทำให้มันอัตโนมัติไหม” คำตอบที่ได้คือ
- วันถัดมา Ginsparg ก็เขียนสคริปต์จนเสร็จจริงๆ และ
> “My recollection is that the next day he’d come up with the scripts and seemed pretty happy about having done it so quickly.”
> “เท่าที่ฉันจำได้ วันรุ่งขึ้นเขาก็ทำสคริปต์เสร็จแล้ว และดูพอใจมากที่ทำได้เร็วขนาดนั้น” — Joanne Cohn
ตำแหน่งแห่งยุคสมัยของ Ginsparg และวิวัฒนาการทางเทคโนโลยีของ arXiv
- Ginsparg มักถูกเปรียบว่าเป็น Forrest Gump แห่งยุคอินเทอร์เน็ต โดย
- ตอนเรียนที่ Harvard เขาเป็นเพื่อนร่วมรุ่นกับ Bill Gates และ Steve Ballmer
- พี่ชายของเขาเรียนที่ Stanford ร่วมกับ Terry Winograd ผู้บุกเบิก AI
- ทั้งสองคนต่างก็มี บัญชีอีเมลบน Arpanet ซึ่งในเวลานั้นถือว่าหายากมาก
- หลังจบปริญญาเอกฟิสิกส์ทฤษฎีจาก Cornell เขาเริ่มงานอาจารย์ที่ Harvard แต่เมื่อ ไม่ได้รับ tenure จึงย้ายไป Los Alamos
- ที่นั่นมีทั้ง สภาพแวดล้อมที่เอื้อให้ทุ่มเทกับงานวิจัยฟิสิกส์ทฤษฎีพลังงานสูงได้เต็มที่ และ เงื่อนไขด้านพื้นที่ที่เหมาะกับไลฟ์สไตล์เน้นการออกกำลังกาย
ระบบ arXiv ก่อนยุคเว็บและการพัฒนาสู่เว็บ
- ในช่วงแรก arXiv ไม่ใช่เว็บไซต์ แต่เป็น เซิร์ฟเวอร์ตอบกลับอัตโนมัติทางอีเมล และไม่กี่เดือนต่อมาก็มี FTP server เพิ่มเข้ามาด้วย
- ต่อมา Ginsparg ได้ยินเกี่ยวกับเทคโนโลยีใหม่ชื่อ “World Wide Web” และในตอนแรกตอบสนองอย่างไม่ค่อยเชื่อมั่นว่า
> “I can’t really pay attention to every single fad.”
> “คงเป็นไปไม่ได้ที่จะตามทุกกระแสฮิตหรอก”
แต่หลังจากการมาถึงของเบราว์เซอร์ Mosaic ในปี 1993 เขาก็เริ่มสนใจและลงมือสร้างเว็บอินเทอร์เฟซด้วยตัวเอง
- ต่อมา Ginsparg ได้ยินเกี่ยวกับเทคโนโลยีใหม่ชื่อ “World Wide Web” และในตอนแรกตอบสนองอย่างไม่ค่อยเชื่อมั่นว่า
- เขายังมีปฏิสัมพันธ์กับ Tim Berners-Lee แห่ง CERN ด้วย และจดจำเขาในฐานะ “โปรแกรมเมอร์ที่ย่างปลากระโทงดาบได้ยอดเยี่ยม”
> “Tim grilled excellent swordfish at his home in the French countryside.”
> “Tim ย่างปลากระโทงดาบได้สุดยอดที่บ้านของเขาในชนบทฝรั่งเศส”
ที่มาของชื่อและการจัดระเบียบ codebase
- ในปี 1994 ด้วยเงินสนับสนุนจาก National Science Foundation เขาจ้างนักพัฒนาสองคนเพื่อ รีแฟกเตอร์ shell script ชุดแรกให้เป็นโค้ด Perl ที่เสถียรกว่าเดิม
- Mark Doyle: ต่อมากลายเป็น CIO ของ American Physical Society
- Rob Hartill: ตอนนั้นทำโปรเจกต์ IMDb ควบคู่กัน และต่อมาก็มีบทบาทใน Apache Software Foundation
- ที่อยู่แรกเริ่มของ arXiv คือ
xxx.lanl.govโดยคำว่า “xxx” ยังไม่มีความหมายแบบที่ใช้กันในปัจจุบัน จากนั้นเขากับภรรยาจึงช่วยกันคิด “ชื่อที่ดีกว่า” และสุดท้ายเลือกใช้ตัวอักษรกรีก chi (χ) จนกลายเป็นชื่อ ‘arXiv’
> “She wrote it down and crossed out the e to make it more symmetric around the X.”
> “เธอเขียนมันลงมา แล้วขีด e ทิ้งเพื่อให้สมมาตรรอบตัว X มากขึ้น” - ในช่วงแรกยังไม่มีองค์กรแยกชัดเจน โดยมีเพียง นักพัฒนา 1-2 คน และผู้ดูแลส่วนใหญ่เป็นคนรู้จักกับเพื่อนร่วมงาน ขณะที่เดิมคาดว่าจะมีบทความปีละ ราว 100 ฉบับ แต่ในความเป็นจริงกลับเริ่มต้นที่ เดือนละ 100 ฉบับ และเติบโตอย่างรวดเร็ว
การขยายตัวอย่างรวดเร็วของชุมชนและการปักหลักของ arXiv
- ตามคำบอกของ Ginsparg
> “Day one, something happened, day two something happened, day three, Ed Witten posted a paper. That was when the entire community joined.”
> “วันแรกก็มีบางอย่างเกิดขึ้น วันที่สองก็มีอีกอย่างเกิดขึ้น แล้ววันที่สาม Ed Witten ก็โพสต์บทความ ตอนนั้นเองที่ทั้งชุมชนเข้าร่วม” - Edward Witten เป็นทั้งนักฟิสิกส์ทฤษฎีระดับแนวหน้าของยุคปัจจุบัน และถูกเรียกว่า “คนที่ฉลาดที่สุดที่ยังมีชีวิตอยู่” โดยเขาเองก็กล่าวว่า
> “The arXiv enabled much more rapid worldwide communication among physicists.”
> “arXiv ทำให้การสื่อสารระหว่างนักฟิสิกส์ทั่วโลกเร็วขึ้นมาก” - หลังจากนั้นก็ขยายไปยัง สาขาอื่นๆ อีกหลากหลาย เช่น คณิตศาสตร์และวิทยาการคอมพิวเตอร์ โดย Ginsparg เองก็ย้อนนึกถึงช่วงพัฒนา arXiv แรกเริ่มว่า
> “It was fun.”
> “มันสนุกมาก”
การขยายตัวของ arXiv และจุดเริ่มต้นของความขัดแย้ง
- เมื่อการใช้งาน arXiv เพิ่มสูงขึ้นอย่างรวดเร็ว ระบบก็เริ่มเผชิญ ปัญหาด้านการขยายระบบและการปฏิบัติการแบบที่ซอฟต์แวร์ขนาดใหญ่ต้องเจอ โดยเฉพาะปัญหาเซิร์ฟเวอร์ช้าลงและภาระด้านการกลั่นกรอง
- ตัวอย่างเช่น เคยเกิดเหตุเซิร์ฟเวอร์ทำงานหนักเกินไปจากทราฟฟิกจำนวนมากที่มาจาก “stanford.edu” ซึ่งภายหลังพบว่าเป็นช่วงที่ Sergey Brin และ Larry Page ผู้สร้าง Google ในเวลาต่อมา กำลังใช้เว็บครอว์ลเลอร์เก็บข้อมูลจาก arXiv
> “Years later, when Ginsparg visited Google HQ, both Brin and Page personally apologized to him for the incident.”
> “หลายปีต่อมา เมื่อ Ginsparg ไปเยือนสำนักงานใหญ่ของ Google ทั้ง Brin และ Page ได้ขอโทษเขาด้วยตัวเองสำหรับเหตุการณ์นั้น”
- ตัวอย่างเช่น เคยเกิดเหตุเซิร์ฟเวอร์ทำงานหนักเกินไปจากทราฟฟิกจำนวนมากที่มาจาก “stanford.edu” ซึ่งภายหลังพบว่าเป็นช่วงที่ Sergey Brin และ Larry Page ผู้สร้าง Google ในเวลาต่อมา กำลังใช้เว็บครอว์ลเลอร์เก็บข้อมูลจาก arXiv
กลยุทธ์การอยู่รอดของ arXiv และการสร้างความเป็นอิสระจากอุตสาหกรรมสำนักพิมพ์
- เหตุผลสำคัญที่สุดที่ arXiv อยู่รอดมาได้ คือ การหลีกเลี่ยงการถูกโจมตีจากโครงสร้างอำนาจเดิมของสำนักพิมพ์วิชาการแบบดั้งเดิม ซึ่งเป็นผลจากกลยุทธ์ตั้งแต่ช่วงแรกที่ให้ผู้ใช้ยอมรับเงื่อนไขว่า “arXiv สามารถเผยแพร่บทความนั้นได้แบบไม่ผูกขาดและถาวร” ในตอนส่งบทความ
- ด้วยเงื่อนไขนี้ แม้งานวิจัยจะถูกตีพิมพ์ในวารสารอื่นภายหลัง ก็ยังคงอยู่บน arXiv ได้ต่อไป ทำให้สำนักพิมพ์รายใหญ่ไม่มีแรงจูงใจจะพยายามปิดมันลง
การจากไปจาก Los Alamos และการกลับสู่ Cornell
- แม้ว่า arXiv จะค่อย ๆ กลายเป็นโครงสร้างพื้นฐานที่สำคัญมากขึ้นในวงการวิทยาศาสตร์ แต่ ภายในห้องปฏิบัติการ Los Alamos เองกลับไม่ได้สนับสนุนโครงการ arXiv อย่างจริงจัง และยิ่งไปกว่านั้น การที่มันมีอิทธิพลมากกว่าตัวสถาบันเองก็กลายเป็นภาระด้วย
- Ginsparg อธิบายช่วงเวลานั้นว่า
> “dreamlike and heavenly” “เหมือนความฝันและราวกับสวรรค์” - แต่หลังจาก คดีจารกรรม Wen Ho Lee ในปี 1999 บรรยากาศภายในสถาบันก็เปลี่ยนไปอย่างรวดเร็ว ทำให้เขาตัดสินใจย้ายงานเพราะ มาตรการรักษาความปลอดภัยที่เข้มงวดขึ้นและความเหนื่อยล้าทางจิตใจที่สะสม
- ในการประเมินผลงานตอนนั้น เขายังถูกวิจารณ์อย่างหนักว่าเป็น “a strictly average performer with no particular computer skills”
→ “เป็นคนที่มีผลงานอยู่ในระดับปานกลางอย่างเคร่งครัด และไม่มีทักษะคอมพิวเตอร์ที่โดดเด่นเป็นพิเศษ” และลูกสาวที่เพิ่งเกิดรวมถึงประเด็นเรื่องสภาพแวดล้อมทางการศึกษาก็เป็นหนึ่งในเหตุผลของการย้ายงานด้วย
- ในการประเมินผลงานตอนนั้น เขายังถูกวิจารณ์อย่างหนักว่าเป็น “a strictly average performer with no particular computer skills”
- Ginsparg อธิบายช่วงเวลานั้นว่า
- ในที่สุด Ginsparg ก็ กลับไปยัง Cornell ซึ่งเป็นมหาวิทยาลัยเดิมของเขา และย้าย arXiv ไปด้วยกัน พร้อมประกาศว่า “จะถอนตัวจาก arXiv ภายในไม่เกิน 5 ปี”
> “They disseminate material to academics, so that seemed like a natural fit.”
> “ห้องสมุดมีหน้าที่เผยแพร่เอกสารวิชาการ จึงดูเป็นทางเลือกที่เหมาะสมโดยธรรมชาติ”
ความขัดแย้งด้านการดำเนินงานภายในห้องสมุด
- อย่างไรก็ตาม ห้องสมุด Cornell ไม่ได้เข้าใจความซับซ้อนทางเทคนิคของ arXiv อย่างแท้จริง และแม้แต่ตรรกะของระบบส่งผลงานเพียงอย่างเดียวก็ต้องรองรับกรณียกเว้นจำนวนมาก ดังนั้นการปฏิบัติต่อมันเหมือนเป็นเพียงระบบเก็บข้อมูลธรรมดาจึงกลายเป็นปัญหา
- Ginsparg และสมาชิกยุคแรก ๆ รู้สึกว่า ฝั่งห้องสมุดมอง arXiv เป็นเหมือนของแถมที่มาทีหลัง ขณะที่ฝั่งห้องสมุดเองก็รู้สึกว่า Ginsparg เข้าไปแทรกแซงมากเกินไป
> “Good lower-level manager … but his sense of management didn’t scale.”
> “เป็นผู้จัดการภาคปฏิบัติที่ดี แต่ความสามารถด้านการบริหารของเขาไม่เหมาะกับการดำเนินงานในขนาดใหญ่” - ตลอดช่วงเวลาส่วนใหญ่ของทศวรรษ 2000 arXiv ดำเนินงานโดยไม่สามารถรักษาบุคลากรด้านพัฒนาให้มั่นคงได้
คำวิจารณ์ต่อปรัชญาและวิธีการดำเนินงานของ Ginsparg
- Ginsparg ยังคงมีลักษณะเป็น นักพัฒนาสายลงมือทำที่ยังรีวิวโค้ดและหาข้อผิดพลาดด้วยตัวเอง และมีท่าทีเชิงเสียดสีต่อการบรรยายภายนอกหรือบทบาทที่ปรึกษาระดับสูง
> “Larry Summers spending one day a week consulting for some hedge fund—it’s just unseemly.”
> “Larry Summers ไปเป็นที่ปรึกษาให้เฮดจ์ฟันด์สัปดาห์ละหนึ่งวัน มันดูไม่เหมาะสมเอาเสียเลย” - แต่ในอีกด้านหนึ่ง การที่เขายังคงมีส่วนร่วมอยู่นานเกินไปก็กลายเป็นปัญหาเช่นกัน และ arXiv ก็ขยายตัวใหญ่ขึ้นเรื่อย ๆ
> “bigger than all of us” — Stephanie Orphan (ผู้อำนวยการโครงการ arXiv)
> “มันกลายเป็นสิ่งที่ใหญ่กว่าพวกเราทุกคน”
ซึ่งเริ่มกลายเป็นความเข้าใจร่วมกัน - มีข้อถกเถียงหลากหลายเกิดขึ้น ทั้ง คดีฟ้องร้องจากนักฟิสิกส์สายการออกแบบอัจฉริยะ, ข้อกล่าวหาเรื่องการลอกผลงาน, และ เสียงวิจารณ์เรื่องการใช้อำนาจของผู้ดูแลระบบเกินขอบเขต
- โดยเฉพาะในปี 2009 นักฟิสิกส์อิสระ Philip Gibbs ได้ก่อตั้ง viXra ซึ่งเป็นแพลตฟอร์มฝั่งตรงข้ามของ arXiv
- มันคือ “แพลตฟอร์มที่แทบไม่มีการกำกับดูแลและทำงานในทิศทางตรงกันข้ามกับ arXiv” ซึ่งมักมีทฤษฎีประหลาดหรือบทความจากมือสมัครเล่นถูกอัปโหลดอยู่เป็นหลัก
- ตัวอย่างเด่นคือบทความที่อ้างว่า “π เป็นเรื่องโกหก” (ลิงก์)
- โดยเฉพาะในปี 2009 นักฟิสิกส์อิสระ Philip Gibbs ได้ก่อตั้ง viXra ซึ่งเป็นแพลตฟอร์มฝั่งตรงข้ามของ arXiv
ปัญหาการดูแลโค้ดเบสและความขัดแย้งด้านแนวปฏิบัติการพัฒนา
- arXiv ค่อย ๆ เติบโตเป็น โค้ดเบสขนาดใหญ่ และโครงสร้างในยุคแรกก็ถูกสร้างขึ้น โดยไม่ได้คำนึงถึงการบำรุงรักษาและการทดสอบ
- ทำให้เกิดปัญหาเชิงโครงสร้างคล้ายกับ “การก่อสร้างอาคารโดยไม่มีการตรวจความปลอดภัย”
- สิ่งนี้ช่วยให้พัฒนาได้รวดเร็วในช่วงแรก แต่ก่อให้เกิด หนี้ทางเทคนิคระยะยาวและความซับซ้อนที่เพิ่มขึ้น
- Ginsparg ยังคงเข้าไป ตรวจและแก้ไขโค้ดด้วยตัวเองโดยไม่ผ่านการอนุมัติจากฝั่งห้องสมุด และด้วยเหตุนี้จึงถูกวิจารณ์ว่า
> “micromanaging and sowing distrust”
> “จู้จี้ควบคุมรายละเอียดมากเกินไปและสร้างความไม่ไว้วางใจ”
ความพยายามเกษียณ การอยู่ต่อ และความขัดแย้งภายในที่ทวีความรุนแรง
- ในวาระครบรอบ 20 ปีของ arXiv ในปี 2011 Ginsparg ตัดสินใจแน่วแน่ที่จะเกษียณ และเผยแพร่คำอำลาภายใต้ชื่อ “ArXiv at 20” บน Nature
> “For me, the repository was supposed to be a three-hour tour, not a life sentence.”
> “สำหรับผม repository นี้ควรจะเป็นแค่ทริปสามชั่วโมง ไม่ใช่โทษจำคุกตลอดชีวิต”
> “ArXiv was originally conceived to be fully automated, so as not to scuttle my research career.”
> “เดิมที arXiv ถูกออกแบบให้เป็นระบบอัตโนมัติเต็มรูปแบบ เพื่อไม่ให้มันทำลายเส้นทางอาชีพนักวิจัยของผม”
> “But daily administrative activities associated with running it can consume hours of every weekday, year-round without holiday.”
> “แต่กิจกรรมงานบริหารที่เกี่ยวข้องกับการดูแลมันกลับกินเวลาหลายชั่วโมงในทุกวันทำงาน ตลอดทั้งปีไม่มีวันหยุด” - หลังจากนั้น งานปฏิบัติการประจำวันถูกโอนให้ห้องสมุด Cornell ดูแล และ Ginsparg ตั้งใจจะถอยไปอยู่ในบทบาทที่ปรึกษา แต่ความเป็นจริงไม่ได้เป็นเช่นนั้น
- พนักงานบางส่วนวิจารณ์ว่า Ginsparg “จับโค้ดไว้เป็นตัวประกัน” และปฏิเสธที่จะใช้ GitHub หรือแชร์ภายใน
- ขณะที่เขาเองก็แสดงความหงุดหงิดต่อความจริงที่ว่า ฟีเจอร์ที่เมื่อก่อนเขาทำได้ภายในวันเดียว ตอนนี้กลับใช้เวลาหลายสัปดาห์
> “I learned Fortran in the 1960s, and real programmers didn’t document.”
> “ผมเรียน Fortran มาตั้งแต่ทศวรรษ 1960 และโปรแกรมเมอร์ตัวจริงไม่เขียนเอกสาร”
(→ ถูกบรรยายว่าเป็นคำตอบที่ทำให้ผู้ถามช็อกระดับหัวใจวาย)
ความสับสนด้านการบริหารและการปรับโครงสร้าง
- นอกจากปัญหาทางเทคนิคแล้ว arXiv ยังเผชิญกับ ความสับสนด้านการบริหาร ด้วย
- ในปี 2019 หน่วยงานต้นสังกัดของ arXiv ภายใน Cornell ถูก ย้ายไปอยู่ภาควิชาคอมพิวเตอร์และสารสนเทศศาสตร์ แต่ไม่กี่เดือนต่อมาก็มีการเปลี่ยนแปลงอีกครั้ง
- หลังจากนั้น มีผู้มีประสบการณ์ด้านสำนักพิมพ์วิชาการเชิงพาณิชย์เข้ามารับผิดชอบงานปฏิบัติการ แต่ก็ลาออกภายในเวลาเพียงหนึ่งปีครึ่ง
> “There was disruption … it was not a good period.”
> “มีความปั่นป่วนเกิดขึ้น … มันไม่ใช่ช่วงเวลาที่ดี” — คนวงในของ arXiv
- จุดเปลี่ยนเกิดขึ้นในปี 2022 เมื่อ ได้รับการสนับสนุนจากมูลนิธิ Simons จนสามารถเพิ่มกำลังคนด้านพัฒนาได้จำนวนมาก
- และ ศาสตราจารย์ Ramin Zabih แห่ง Cornell ได้รับแต่งตั้งให้เป็นผู้รับผิดชอบการดำเนินงาน
- พร้อมกับที่ การย้ายขึ้นคลาวด์และการรีแฟกเตอร์โค้ดบนพื้นฐานของ Python เริ่มเดินหน้าอย่างจริงจัง
แง่มุมส่วนตัวและการทบทวนตนเอง
- ระหว่างให้สัมภาษณ์กับนักข่าว Ginsparg ก็ยังคงมีท่าทีขี้เล่น เช่น ช่วยซ่อมจักรยานให้ลูกชาย และแหย่เรื่องกำลังขาของอีกฝ่ายระหว่างทริปปั่นจักรยาน
- ตอนขึ้นเนินช่วงสุดท้าย เขาพูดว่า
> “I might’ve oversold this to you.”
> “ผมอาจจะโฆษณาเส้นทางนี้กับคุณเกินจริงไปหน่อย”
พร้อมยอมรับถึงความเหนื่อยล้า
- ตอนขึ้นเนินช่วงสุดท้าย เขาพูดว่า
- หลังจากสัมภาษณ์กันหลายวัน ผู้สื่อข่าวบอกว่าความ มุ่งมั่นและความดื้อรั้นของเขาคือเหตุผลที่ arXiv อยู่รอดมาได้ และ Ginsparg ก็ตอบกลับอย่างคาดไม่ถึง
> “One person’s tenacity is another person’s terrorism.”
> “สิ่งที่สำหรับคนหนึ่งคือความมุ่งมั่น สำหรับอีกคนอาจเป็นการก่อการร้ายก็ได้” - จากนั้นเขายังยอมรับอีกว่า
> “I’ve heard that the staff occasionally felt terrorized.”
> “ผมได้ยินมาว่าบางครั้งพนักงานก็รู้สึกหวาดกลัว”
arXiv ในปัจจุบันและอนาคต
- ปัจจุบัน arXiv ยังคง ดำเนินงานต่อไปอย่างมีดราม่า,
- นักภาษาศาสตร์ Emily Bender เคยวิจารณ์ arXiv ว่าเป็น “มะเร็ง” ที่ส่งเสริม “junk science” และ “fast scholarship”
(ทวีตที่เกี่ยวข้อง, บทความที่เกี่ยวข้อง)
- นักภาษาศาสตร์ Emily Bender เคยวิจารณ์ arXiv ว่าเป็น “มะเร็ง” ที่ส่งเสริม “junk science” และ “fast scholarship”
- ในปี 2023 บทความที่อ้างว่าค้นพบตัวนำยิ่งยวดที่อุณหภูมิห้องถูกโต้แย้งอย่างรวดเร็ว และกลายเป็นกรณีตัวอย่างที่แสดงให้เห็นกลไกฟีดแบ็กที่รวดเร็วของ arXiv
- ในทางกลับกัน ก็มีกรณีที่ บทความปกติถูกถอนเพราะเหตุผลว่า “ใช้ถ้อยคำปลุกปั่น” หรือ “ภาษาไม่เป็นมืออาชีพ” ทำให้เกิดข้อถกเถียงเรื่อง “การเซ็นเซอร์” เช่นกัน
- กรณีตัวอย่าง: เหตุการณ์ถอนบทความของ Jorge Hirsch ผู้คิดค้น h-index
- ในทางกลับกัน ก็มีกรณีที่ บทความปกติถูกถอนเพราะเหตุผลว่า “ใช้ถ้อยคำปลุกปั่น” หรือ “ภาษาไม่เป็นมืออาชีพ” ทำให้เกิดข้อถกเถียงเรื่อง “การเซ็นเซอร์” เช่นกัน
ท่าทีและความผูกพันของ Ginsparg ในปัจจุบัน
- เขา ไม่ได้ต้องการสร้างภาพว่าตัวเองเป็น “ผู้บุกเบิกโอเพนไซเอนซ์” และมากกว่าภารกิจอันยิ่งใหญ่ เขา ยังคงสนุกกับ arXiv ในฐานะพื้นที่ทดลองไอเดีย
> “There are various aspects of this that remain incredibly entertaining.”
> “ยังมีหลายแง่มุมของโครงการนี้ที่สนุกอย่างเหลือเชื่ออยู่เสมอ”
> “I have the perfect platform for testing ideas and playing with them.”
> “ผมมีแพลตฟอร์มที่สมบูรณ์แบบสำหรับทดลองไอเดียและเล่นกับมัน” - แม้ว่าเขา จะไม่ได้แตะโค้ดที่ใช้ดูแล arXiv แล้ว, แต่ก็ยัง หมกมุ่นกับโปรเจ็กต์ส่วนตัวในการพัฒนา ‘ตัวกรองบทความปลอม’
> “It’s like that Al Pacino quote: They keep bringing me back.”
> “มันก็เหมือนคำพูดของ Al Pacino นั่นแหละ: พวกเขาดึงฉันกลับไปอยู่เรื่อย”
> “But Al Pacino also developed a real taste for killing people.”
> “แต่ Al Pacino ลงท้ายด้วยการเริ่มชอบการฆ่าคนจริง ๆ”
(→ เป็นการพูดเชิงขำ ๆ ถึงทั้งความรักความชังที่มีต่อ arXiv และความหมกมุ่นของตัวเอง)
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News