- arXiv คือ คลังเก็บบทความวิทยาศาสตร์แบบเปิดให้เข้าถึงได้ ที่ Paul Ginsparg สร้างขึ้นในปี 1991 และจนถึงทุกวันนี้ก็ยังถูกใช้งานในฐานะ หนึ่งในแพลตฟอร์มที่สำคัญที่สุด สำหรับนักวิทยาศาสตร์ทั่วโลก
- ด้วยการ เลี่ยงโครงสร้างการตีพิมพ์วิชาการแบบเดิมที่ช้าและมีต้นทุนสูง ทำให้นักวิจัยสามารถ แชร์บทความก่อนการพิจารณา (preprint) ได้ ทันที จึงมีส่วนช่วยต่อความร่วมมือและนวัตกรรมทางวิทยาศาสตร์
- arXiv เริ่มต้นจากเพียงสคริปต์อัตโนมัติอย่างง่าย แต่ปัจจุบันเติบโตเป็นแพลตฟอร์มขนาดใหญ่ที่มี การส่งบทความมากกว่า 20,000 ฉบับต่อเดือน และ ผู้ใช้งาน 5 ล้านคน
- ในช่วงแรกมีการดำเนินงานแบบไม่เป็นทางการและค่อนข้างสบาย ๆ แต่ต่อมาก็เผชิญวิกฤตหลายครั้งจากปัญหาอย่าง ความซับซ้อนของโค้ดระบบ, ความขัดแย้งภายใน, ความล้าสมัยของเทคโนโลยี
- ปัจจุบัน ภายใต้การสนับสนุนของ Simons Foundation และผู้นำชุดใหม่ กำลังมีการ ย้ายขึ้นคลาวด์และรีแฟกเตอร์โค้ด Python ขณะที่ Ginsparg ก็ยังคงหมกมุ่นกับปัญหาเรื่องการกรองคุณภาพอยู่
จุดกำเนิดของ arXiv และความท้าทายต่อโครงสร้างการตีพิมพ์ทางวิทยาศาสตร์
- นักฟิสิกส์ Paul Ginsparg ยกคำพูดจาก The Godfather มาใช้อธิบายความรู้สึกที่ว่าเขาไม่อาจถอนตัวจากแพลตฟอร์มที่ตัวเองสร้างได้อย่างสิ้นเชิง
“Just when I thought I was out, they pull me back in!”
“ตอนที่ผมนึกว่าออกมาได้แล้ว พวกเขาก็ดึงผมกลับเข้าไปอีก!” - เขาเป็นศาสตราจารย์แห่ง Cornell University และผู้ได้รับ MacArthur Genius Grant ซึ่งเมื่อ 35 ปีก่อนได้พัฒนาคลังเก็บดิจิทัล arXiv สำหรับแชร์บทความ ก่อนการประเมินโดยเพื่อนนักวิชาการ (preprint)
- จนถึงตอนนี้ arXiv.org ยังรักษาดีไซน์แบบ เว็บ 1.0 คลาสสิก และ สัญลักษณ์ของ Cornell เอาไว้ แต่ต่างจากรูปลักษณ์ที่เรียบง่ายนั้น arXiv คือแพลตฟอร์มที่ก่อให้เกิด การเปลี่ยนแปลงเชิงรากฐานต่อโครงสร้างการเผยแพร่ความรู้ทางวิทยาศาสตร์
- หาก arXiv หยุดให้บริการ ก็อาจเกิด ผลกระทบอย่างรุนแรงต่อการทำงานของนักวิทยาศาสตร์ทั่วโลก และในความเป็นจริง นักคณิตศาสตร์และนักฟิสิกส์จำนวนมากก็ เข้าใช้งาน arXiv ทุกวัน
“Everybody in math and physics uses it. I scan it every night.” — Scott Aaronson
“ทุกคนในวงการคณิตศาสตร์และฟิสิกส์ใช้มัน ผมไล่อ่านมันทุกคืน”
บทบาทของ arXiv และการตั้งคำถามต่อโครงสร้างการตีพิมพ์วิชาการ
-
ในแต่ละภาคส่วนของสังคมต่างมีปัญหาเชิงโครงสร้างเรื้อรัง และในแวดวงวิชาการ ความไม่สมเหตุสมผลของระบบการตีพิมพ์ ก็ถูกชี้ว่าเป็นปัญหาตัวอย่างที่เด่นชัด
-
โมเดลแสวงกำไรของสำนักพิมพ์รายใหญ่อย่าง Elsevier, Springer ถูกวิจารณ์ในลักษณะต่อไปนี้:
- ให้ผู้เขียนต้องเขียนบทความโดยไม่ได้รับค่าตอบแทน
- อาศัยนักวิจัยคนอื่นมาช่วยบรรณาธิการโดยไม่คิดค่าใช้จ่าย
- เมื่องานเสร็จแล้วก็นำบทความไปขายในราคาสูง ขณะที่สถาบันต้องแบกรับค่าสมาชิกจำนวนมาก
“Calling their practice a form of thuggery isn’t so much an insult as an economic observation.”
“การเรียกวิธีการของพวกเขาว่าเป็นการกรรโชกนั้น ไม่ใช่คำด่าเสียทีเดียว แต่เป็นข้อสังเกตทางเศรษฐศาสตร์” -
กระบวนการ peer review แบบดั้งเดิมอาจใช้เวลา หลายเดือนถึง 1 ปี และความล่าช้านี้ก็กลายเป็นคอขวดของการไหลเวียนข้อมูล
-
ตรงกันข้าม arXiv เปิดให้ใครก็ตามสามารถ เผยแพร่และเข้าถึงได้ทันที ตั้งแต่ในขั้น ก่อนการพิจารณาบทความ (preprint) จึงช่วยแก้ปัญหาเชิงโครงสร้างของการตีพิมพ์
-
นวัตกรรมหลักของ arXiv สรุปได้ดังนี้:
“Showing that you could divorce the actual transmission of your results from the process of refereeing.” — Paul Fendley
“มันแสดงให้เห็นว่าเราสามารถแยกการส่งต่อผลลัพธ์การวิจัยออกจากกระบวนการ peer review ได้” -
โครงสร้างเช่นนี้มีส่วนสำคัญอย่างยิ่งในการ เผยแพร่การค้นพบทางวิทยาศาสตร์ที่มีความหมายอย่างรวดเร็ว ใน สถานการณ์วิกฤตอย่างการระบาดใหญ่ของ COVID-19
- และยังเป็นแรงบันดาลใจให้เกิด bioRxiv, medRxiv ที่ขยายแนวคิดไปสู่สายวิทยาศาสตร์ชีวภาพ ซึ่งก็มีการตั้งข้อสังเกตว่าอาจ ช่วยชีวิตผู้คนนับล้าน ได้
โครงสร้างการควบคุมคุณภาพของ arXiv
- แม้บทความที่ส่งเข้า arXiv จะไม่ผ่าน peer review อย่างเป็นทางการ แต่ก็ยังคงรักษามาตรฐานทางวิชาการพื้นฐานและระเบียบต่าง ๆ ผ่าน การตรวจสอบโดยสมัครใจของผู้เชี่ยวชาญในแต่ละสาขา
- องค์ประกอบหลักของการควบคุมคุณภาพ:
- อนุญาตเฉพาะงานวิจัยต้นฉบับ
- ห้ามใช้ข้อมูลที่ถูกบิดเบือน
- ต้องใช้ถ้อยคำที่เป็นกลาง
- นอกจากนี้ บทความที่ส่งเข้ามายังต้องผ่าน การตรวจเบื้องต้นด้วยระบบอัตโนมัติ ด้วย
- หากไม่มีขั้นตอนตรวจสอบเหล่านี้ arXiv ก็เสี่ยงที่จะ เต็มไปด้วยงานวิทยาศาสตร์เทียมหรือผลงานจากผู้ที่ไม่ใช่มืออาชีพ
อิทธิพลของ arXiv และภาพปัจจุบันของ Ginsparg
- ในปี 2021 วารสาร Nature เลือก arXiv ให้เป็นหนึ่งใน “10 computer codes that transformed science”
“10 computer codes that transformed science”
“10 โค้ดคอมพิวเตอร์ที่เปลี่ยนโฉมวิทยาศาสตร์” - arXiv ได้รับการยกย่องอย่างสูงในบทบาท การส่งเสริมความร่วมมือทางวิทยาศาสตร์ และปัจจุบันมี
- บทความมากกว่า 2.6 ล้านฉบับ
- บทความส่งเข้าใหม่ 20,000 ฉบับต่อเดือน
- ผู้ใช้รายเดือน 5 ล้านคน
- การค้นพบทางวิทยาศาสตร์สำคัญจำนวนมากในศตวรรษที่ 21 ถูก เผยแพร่ครั้งแรกผ่าน arXiv ตัวอย่างเช่น
- บทความ “transformers” ที่จุดกระแส AI ยุคใหม่
- วิธีพิสูจน์สมมติฐานปวงกาเร หนึ่งในปัญหารางวัลมิลเลนเนียม
- บทความที่โพสต์บน arXiv หลายฉบับ ภายหลังก็ได้รับการตีพิมพ์ในวารสารชั้นนำ แต่ข้อได้เปรียบสำคัญคือ ทันทีที่เผยแพร่บน arXiv ทุกคนก็เข้าถึงได้
“Just because a paper is posted on arXiv doesn’t mean it won’t appear in a prestigious journal someday.”
“แค่บทความถูกโพสต์บน arXiv ไม่ได้แปลว่าวันหนึ่งมันจะไม่ไปปรากฏในวารสารชั้นนำ”
ความเป็นจริงภายในของ arXiv และปัญหาความยั่งยืน
- สำหรับนักวิทยาศาสตร์ arXiv ถูกมองว่าเป็น สิ่งจำเป็นพอ ๆ กับห้องสมุดสาธารณะหรือ GPS แต่ในความเป็นจริง การดำเนินงานของ arXiv นั้น ห่างไกลจากภาพแพลตฟอร์มอุดมคติที่ไร้แรงเสียดทาน
- ตลอดเวลาที่ผ่านมา arXiv ต้องเผชิญกับปัญหาต่าง ๆ เช่น
- ความขัดแย้งเชิงระบบราชการ
- โค้ดที่ล้าสมัย
- จนถึงขั้นมี คดีสอดแนม เกิดขึ้น
- Ginsparg อธิบายความเป็นจริงนี้ไว้ดังนี้
“A child I sent off to college but who keeps coming back to camp out in my living room, behaving badly.”
“เหมือนลูกที่ผมส่งไปเรียนมหาวิทยาลัยแล้ว แต่เอาแต่กลับมาปักหลักในห้องนั่งเล่นที่บ้านและก่อเรื่องไม่หยุด” - แม้จะพยายามเว้นระยะห่างจาก arXiv อยู่เรื่อย ๆ เช่น ส่งคำขอสัมภาษณ์ไปให้ดู FAQ หรือพยายามกันไม่ให้มีการมาเยี่ยมโดยตรง แต่ Ginsparg ก็ยังคง พยายามตีตัวออกห่างจาก arXiv อยู่เสมอ
บุคลิก รสนิยม และชีวิตประจำวันของ Ginsparg
- จากการสัมภาษณ์ที่ Ithaca (ที่ตั้งของ Cornell) เผยให้เห็นว่า Ginsparg เป็นคน
- อารมณ์ดีและขี้เล่น
- แต่ในขณะเดียวกันก็มี ความดื้อดึงที่จะยืนหยัดในปรัชญาของตนอย่างไม่ประนีประนอม
- ตามคำบอกเล่าของ Geoffrey West อดีตหัวหน้าของเขา
“Quite a character, infamous in the community, extremely funny, a great guy.”
“เป็นคนที่มีคาแรกเตอร์มาก เป็นที่รู้จักไปทั่วในชุมชน ตลกมาก และเป็นคนที่ยอดเยี่ยม” - ตัว Ginsparg เองก็พูดลดทอนคุณค่าของบทความเกี่ยวกับ arXiv ว่า
“So many articles, so few insights.”
“บทความมีเยอะ แต่มีข้อคิดลึกซึ้งอยู่น้อย” - ปัจจุบันในวัย 69 ปี เขายังคงใช้ชีวิตอย่างกระฉับกระเฉง ชอบปั่นจักรยานและเดินเขา และแต่งตัวในสไตล์ นักเดินทางสบาย ๆ อยู่เสมอ
สำนักงานของ Ginsparg และความสนใจล่าสุด
- สำนักงานในภาควิชาฟิสิกส์ของ Cornell ไม่ได้ถึงกับ “รก” แต่ให้บรรยากาศเหมือน ข้าวของเก่าๆ ถูกวางค้างอยู่ในกาลเวลาที่หยุดนิ่ง
- มีทั้งกล่องพัสดุจากยุค 90 นิตยสารเก่า จอ CRT และบัตรเชิญจากทำเนียบขาว
- หนังสือที่ Stephen Wolfram ส่งมามีโน้ตขำๆ แนบไว้
“Since you can’t find it on arXiv :)”
“คงหาไม่ได้บน arXiv น่ะสิ :)”
- สิ่งเดียวที่ยังถูกใช้งานอย่างคึกคักคือ กระดานดำที่เต็มไปด้วยสมการเกี่ยวกับทฤษฎีการวัดเชิงควอนตัม
- แม้อยู่นอกห้องทำงาน เขาก็ยังแสดงให้เห็นถึง ความช่างสังเกตที่ไม่พลาดแม้รายละเอียดเล็กๆ ไม่ว่าจะเป็นโครงสร้างอาคาร เส้นทางการเดินของพนักงาน หรือแม้แต่ชนิดของนกที่บินเข้ามาทุกปี
- เขากังวลต่อ ปัญหางานวิจัยคุณภาพต่ำ ที่เพิ่มขึ้นพร้อมกับกระแสบทความ AI ที่พุ่งสูง และกำลังพัฒนา “holy grail crackpot filter” เพื่อคัดกรองสิ่งเหล่านี้
“The holy grail crackpot filter.”
“ตัวกรองงานวิจัยเพี้ยนขั้นสุดยอด” - เพื่อรักษาคุณภาพของ arXiv เขายังลงมือ กู้คืนฮาร์ดไดรฟ์ ด้วยตัวเองเพื่อ ทดลองใช้ language model อยู่จนถึงตอนนี้
- พฤติกรรมเช่นนี้ตีความได้ว่าเป็น ท่าทีที่รู้สึกรับผิดชอบต่อการรักษาคุณภาพของ arXiv ด้วยตัวเอง
การถือกำเนิดของ arXiv และประวัติศาสตร์ยุคแรก
- เดิมที arXiv ไม่ใช่โครงสร้างพื้นฐานทางวิทยาศาสตร์ แต่เป็นเพียง ชุด shell script ง่ายๆ ที่รันอยู่บนเครื่อง NeXT ของ Ginsparg และถือกำเนิดขึ้นในเดือนมิถุนายน 1991 จาก จุดเปลี่ยนที่การประชุมวิชาการในโคโลราโด
- ตอนนั้น Joanne Cohn ซึ่งเป็น postdoc ที่สถาบัน Institute for Advanced Study แห่ง Princeton และดูแลเมลลิงลิสต์พรีพรินต์ฟิสิกส์ ได้พูดถึงปัญหาว่า “ยังไม่มีระบบศูนย์กลางสำหรับแชร์งานวิจัยฟิสิกส์”
- การเข้าถึงเมลลิงลิสต์ขึ้นอยู่กับ สังกัดและคอนเน็กชันส่วนตัว และยังมี ความไม่มีประสิทธิภาพที่ต้องใช้เวลาหลายเดือนกว่างานวิจัยจะเผยแพร่
- เมื่อมีนักฟิสิกส์คนหนึ่งพูดติดตลกว่า “ระหว่างเดินทาง อีเมลที่ส่งบทความเข้ามามีมากจนพื้นที่เก็บข้อมูลเต็ม” Ginsparg จึงตระหนักถึงความจำเป็นของ ระบบกระจายบทความแบบอัตโนมัติ
- เมื่อเขาถาม Cohn ว่า “เคยคิดจะทำให้มันอัตโนมัติไหม” คำตอบที่ได้คือ
“Go ahead and do it yourself.”
“งั้นคุณก็ลองทำเองสิ”
- เมื่อเขาถาม Cohn ว่า “เคยคิดจะทำให้มันอัตโนมัติไหม” คำตอบที่ได้คือ
- วันถัดมา Ginsparg ก็เขียนสคริปต์จนเสร็จจริงๆ และ
“My recollection is that the next day he’d come up with the scripts and seemed pretty happy about having done it so quickly.”
“เท่าที่ฉันจำได้ วันรุ่งขึ้นเขาก็ทำสคริปต์เสร็จแล้ว และดูพอใจมากที่ทำได้เร็วขนาดนั้น” — Joanne Cohn
ตำแหน่งแห่งยุคสมัยของ Ginsparg และวิวัฒนาการทางเทคโนโลยีของ arXiv
- Ginsparg มักถูกเปรียบว่าเป็น Forrest Gump แห่งยุคอินเทอร์เน็ต โดย
- ตอนเรียนที่ Harvard เขาเป็นเพื่อนร่วมรุ่นกับ Bill Gates และ Steve Ballmer
- พี่ชายของเขาเรียนที่ Stanford ร่วมกับ Terry Winograd ผู้บุกเบิก AI
- ทั้งสองคนต่างก็มี บัญชีอีเมลบน Arpanet ซึ่งในเวลานั้นถือว่าหายากมาก
- หลังจบปริญญาเอกฟิสิกส์ทฤษฎีจาก Cornell เขาเริ่มงานอาจารย์ที่ Harvard แต่เมื่อ ไม่ได้รับ tenure จึงย้ายไป Los Alamos
- ที่นั่นมีทั้ง สภาพแวดล้อมที่เอื้อให้ทุ่มเทกับงานวิจัยฟิสิกส์ทฤษฎีพลังงานสูงได้เต็มที่ และ เงื่อนไขด้านพื้นที่ที่เหมาะกับไลฟ์สไตล์เน้นการออกกำลังกาย
ระบบ arXiv ก่อนยุคเว็บและการพัฒนาสู่เว็บ
- ในช่วงแรก arXiv ไม่ใช่เว็บไซต์ แต่เป็น เซิร์ฟเวอร์ตอบกลับอัตโนมัติทางอีเมล และไม่กี่เดือนต่อมาก็มี FTP server เพิ่มเข้ามาด้วย
- ต่อมา Ginsparg ได้ยินเกี่ยวกับเทคโนโลยีใหม่ชื่อ “World Wide Web” และในตอนแรกตอบสนองอย่างไม่ค่อยเชื่อมั่นว่า
“I can’t really pay attention to every single fad.”
“คงเป็นไปไม่ได้ที่จะตามทุกกระแสฮิตหรอก”
แต่หลังจากการมาถึงของเบราว์เซอร์ Mosaic ในปี 1993 เขาก็เริ่มสนใจและลงมือสร้างเว็บอินเทอร์เฟซด้วยตัวเอง
- ต่อมา Ginsparg ได้ยินเกี่ยวกับเทคโนโลยีใหม่ชื่อ “World Wide Web” และในตอนแรกตอบสนองอย่างไม่ค่อยเชื่อมั่นว่า
- เขายังมีปฏิสัมพันธ์กับ Tim Berners-Lee แห่ง CERN ด้วย และจดจำเขาในฐานะ “โปรแกรมเมอร์ที่ย่างปลากระโทงดาบได้ยอดเยี่ยม”
“Tim grilled excellent swordfish at his home in the French countryside.”
“Tim ย่างปลากระโทงดาบได้สุดยอดที่บ้านของเขาในชนบทฝรั่งเศส”
ที่มาของชื่อและการจัดระเบียบ codebase
- ในปี 1994 ด้วยเงินสนับสนุนจาก National Science Foundation เขาจ้างนักพัฒนาสองคนเพื่อ รีแฟกเตอร์ shell script ชุดแรกให้เป็นโค้ด Perl ที่เสถียรกว่าเดิม
- Mark Doyle: ต่อมากลายเป็น CIO ของ American Physical Society
- Rob Hartill: ตอนนั้นทำโปรเจกต์ IMDb ควบคู่กัน และต่อมาก็มีบทบาทใน Apache Software Foundation
- ที่อยู่แรกเริ่มของ arXiv คือ
xxx.lanl.govโดยคำว่า “xxx” ยังไม่มีความหมายแบบที่ใช้กันในปัจจุบัน จากนั้นเขากับภรรยาจึงช่วยกันคิด “ชื่อที่ดีกว่า” และสุดท้ายเลือกใช้ตัวอักษรกรีก chi (χ) จนกลายเป็นชื่อ ‘arXiv’“She wrote it down and crossed out the e to make it more symmetric around the X.”
“เธอเขียนมันลงมา แล้วขีด e ทิ้งเพื่อให้สมมาตรรอบตัว X มากขึ้น” - ในช่วงแรกยังไม่มีองค์กรแยกชัดเจน โดยมีเพียง นักพัฒนา 1-2 คน และผู้ดูแลส่วนใหญ่เป็นคนรู้จักกับเพื่อนร่วมงาน ขณะที่เดิมคาดว่าจะมีบทความปีละ ราว 100 ฉบับ แต่ในความเป็นจริงกลับเริ่มต้นที่ เดือนละ 100 ฉบับ และเติบโตอย่างรวดเร็ว
การขยายตัวอย่างรวดเร็วของชุมชนและการปักหลักของ arXiv
- ตามคำบอกของ Ginsparg
“Day one, something happened, day two something happened, day three, Ed Witten posted a paper. That was when the entire community joined.”
“วันแรกก็มีบางอย่างเกิดขึ้น วันที่สองก็มีอีกอย่างเกิดขึ้น แล้ววันที่สาม Ed Witten ก็โพสต์บทความ ตอนนั้นเองที่ทั้งชุมชนเข้าร่วม” - Edward Witten เป็นทั้งนักฟิสิกส์ทฤษฎีระดับแนวหน้าของยุคปัจจุบัน และถูกเรียกว่า “คนที่ฉลาดที่สุดที่ยังมีชีวิตอยู่” โดยเขาเองก็กล่าวว่า
“The arXiv enabled much more rapid worldwide communication among physicists.”
“arXiv ทำให้การสื่อสารระหว่างนักฟิสิกส์ทั่วโลกเร็วขึ้นมาก” - หลังจากนั้นก็ขยายไปยัง สาขาอื่นๆ อีกหลากหลาย เช่น คณิตศาสตร์และวิทยาการคอมพิวเตอร์ โดย Ginsparg เองก็ย้อนนึกถึงช่วงพัฒนา arXiv แรกเริ่มว่า
“It was fun.”
“มันสนุกมาก”
การขยายตัวของ arXiv และจุดเริ่มต้นของความขัดแย้ง
- เมื่อการใช้งาน arXiv เพิ่มสูงขึ้นอย่างรวดเร็ว ระบบก็เริ่มเผชิญ ปัญหาด้านการขยายระบบและการปฏิบัติการแบบที่ซอฟต์แวร์ขนาดใหญ่ต้องเจอ โดยเฉพาะปัญหาเซิร์ฟเวอร์ช้าลงและภาระด้านการกลั่นกรอง
- ตัวอย่างเช่น เคยเกิดเหตุเซิร์ฟเวอร์ทำงานหนักเกินไปจากทราฟฟิกจำนวนมากที่มาจาก “stanford.edu” ซึ่งภายหลังพบว่าเป็นช่วงที่ Sergey Brin และ Larry Page ผู้สร้าง Google ในเวลาต่อมา กำลังใช้เว็บครอว์ลเลอร์เก็บข้อมูลจาก arXiv
“Years later, when Ginsparg visited Google HQ, both Brin and Page personally apologized to him for the incident.”
“หลายปีต่อมา เมื่อ Ginsparg ไปเยือนสำนักงานใหญ่ของ Google ทั้ง Brin และ Page ได้ขอโทษเขาด้วยตัวเองสำหรับเหตุการณ์นั้น”
- ตัวอย่างเช่น เคยเกิดเหตุเซิร์ฟเวอร์ทำงานหนักเกินไปจากทราฟฟิกจำนวนมากที่มาจาก “stanford.edu” ซึ่งภายหลังพบว่าเป็นช่วงที่ Sergey Brin และ Larry Page ผู้สร้าง Google ในเวลาต่อมา กำลังใช้เว็บครอว์ลเลอร์เก็บข้อมูลจาก arXiv
กลยุทธ์การอยู่รอดของ arXiv และการสร้างความเป็นอิสระจากอุตสาหกรรมสำนักพิมพ์
- เหตุผลสำคัญที่สุดที่ arXiv อยู่รอดมาได้ คือ การหลีกเลี่ยงการถูกโจมตีจากโครงสร้างอำนาจเดิมของสำนักพิมพ์วิชาการแบบดั้งเดิม ซึ่งเป็นผลจากกลยุทธ์ตั้งแต่ช่วงแรกที่ให้ผู้ใช้ยอมรับเงื่อนไขว่า “arXiv สามารถเผยแพร่บทความนั้นได้แบบไม่ผูกขาดและถาวร” ในตอนส่งบทความ
- ด้วยเงื่อนไขนี้ แม้งานวิจัยจะถูกตีพิมพ์ในวารสารอื่นภายหลัง ก็ยังคงอยู่บน arXiv ได้ต่อไป ทำให้สำนักพิมพ์รายใหญ่ไม่มีแรงจูงใจจะพยายามปิดมันลง
การจากไปจาก Los Alamos และการกลับสู่ Cornell
- แม้ว่า arXiv จะค่อย ๆ กลายเป็นโครงสร้างพื้นฐานที่สำคัญมากขึ้นในวงการวิทยาศาสตร์ แต่ ภายในห้องปฏิบัติการ Los Alamos เองกลับไม่ได้สนับสนุนโครงการ arXiv อย่างจริงจัง และยิ่งไปกว่านั้น การที่มันมีอิทธิพลมากกว่าตัวสถาบันเองก็กลายเป็นภาระด้วย
- Ginsparg อธิบายช่วงเวลานั้นว่า
“dreamlike and heavenly” “เหมือนความฝันและราวกับสวรรค์”
- แต่หลังจาก คดีจารกรรม Wen Ho Lee ในปี 1999 บรรยากาศภายในสถาบันก็เปลี่ยนไปอย่างรวดเร็ว ทำให้เขาตัดสินใจย้ายงานเพราะ มาตรการรักษาความปลอดภัยที่เข้มงวดขึ้นและความเหนื่อยล้าทางจิตใจที่สะสม
- ในการประเมินผลงานตอนนั้น เขายังถูกวิจารณ์อย่างหนักว่าเป็น “a strictly average performer with no particular computer skills”
→ “เป็นคนที่มีผลงานอยู่ในระดับปานกลางอย่างเคร่งครัด และไม่มีทักษะคอมพิวเตอร์ที่โดดเด่นเป็นพิเศษ” และลูกสาวที่เพิ่งเกิดรวมถึงประเด็นเรื่องสภาพแวดล้อมทางการศึกษาก็เป็นหนึ่งในเหตุผลของการย้ายงานด้วย
- ในการประเมินผลงานตอนนั้น เขายังถูกวิจารณ์อย่างหนักว่าเป็น “a strictly average performer with no particular computer skills”
- Ginsparg อธิบายช่วงเวลานั้นว่า
- ในที่สุด Ginsparg ก็ กลับไปยัง Cornell ซึ่งเป็นมหาวิทยาลัยเดิมของเขา และย้าย arXiv ไปด้วยกัน พร้อมประกาศว่า “จะถอนตัวจาก arXiv ภายในไม่เกิน 5 ปี”
“They disseminate material to academics, so that seemed like a natural fit.”
“ห้องสมุดมีหน้าที่เผยแพร่เอกสารวิชาการ จึงดูเป็นทางเลือกที่เหมาะสมโดยธรรมชาติ”
ความขัดแย้งด้านการดำเนินงานภายในห้องสมุด
- อย่างไรก็ตาม ห้องสมุด Cornell ไม่ได้เข้าใจความซับซ้อนทางเทคนิคของ arXiv อย่างแท้จริง และแม้แต่ตรรกะของระบบส่งผลงานเพียงอย่างเดียวก็ต้องรองรับกรณียกเว้นจำนวนมาก ดังนั้นการปฏิบัติต่อมันเหมือนเป็นเพียงระบบเก็บข้อมูลธรรมดาจึงกลายเป็นปัญหา
- Ginsparg และสมาชิกยุคแรก ๆ รู้สึกว่า ฝั่งห้องสมุดมอง arXiv เป็นเหมือนของแถมที่มาทีหลัง ขณะที่ฝั่งห้องสมุดเองก็รู้สึกว่า Ginsparg เข้าไปแทรกแซงมากเกินไป
“Good lower-level manager … but his sense of management didn’t scale.”
“เป็นผู้จัดการภาคปฏิบัติที่ดี แต่ความสามารถด้านการบริหารของเขาไม่เหมาะกับการดำเนินงานในขนาดใหญ่” - ตลอดช่วงเวลาส่วนใหญ่ของทศวรรษ 2000 arXiv ดำเนินงานโดยไม่สามารถรักษาบุคลากรด้านพัฒนาให้มั่นคงได้
คำวิจารณ์ต่อปรัชญาและวิธีการดำเนินงานของ Ginsparg
- Ginsparg ยังคงมีลักษณะเป็น นักพัฒนาสายลงมือทำที่ยังรีวิวโค้ดและหาข้อผิดพลาดด้วยตัวเอง และมีท่าทีเชิงเสียดสีต่อการบรรยายภายนอกหรือบทบาทที่ปรึกษาระดับสูง
“Larry Summers spending one day a week consulting for some hedge fund—it’s just unseemly.”
“Larry Summers ไปเป็นที่ปรึกษาให้เฮดจ์ฟันด์สัปดาห์ละหนึ่งวัน มันดูไม่เหมาะสมเอาเสียเลย” - แต่ในอีกด้านหนึ่ง การที่เขายังคงมีส่วนร่วมอยู่นานเกินไปก็กลายเป็นปัญหาเช่นกัน และ arXiv ก็ขยายตัวใหญ่ขึ้นเรื่อย ๆ
“bigger than all of us” — Stephanie Orphan (ผู้อำนวยการโครงการ arXiv)
“มันกลายเป็นสิ่งที่ใหญ่กว่าพวกเราทุกคน”
ซึ่งเริ่มกลายเป็นความเข้าใจร่วมกัน - มีข้อถกเถียงหลากหลายเกิดขึ้น ทั้ง คดีฟ้องร้องจากนักฟิสิกส์สายการออกแบบอัจฉริยะ, ข้อกล่าวหาเรื่องการลอกผลงาน, และ เสียงวิจารณ์เรื่องการใช้อำนาจของผู้ดูแลระบบเกินขอบเขต
- โดยเฉพาะในปี 2009 นักฟิสิกส์อิสระ Philip Gibbs ได้ก่อตั้ง viXra ซึ่งเป็นแพลตฟอร์มฝั่งตรงข้ามของ arXiv
- มันคือ “แพลตฟอร์มที่แทบไม่มีการกำกับดูแลและทำงานในทิศทางตรงกันข้ามกับ arXiv” ซึ่งมักมีทฤษฎีประหลาดหรือบทความจากมือสมัครเล่นถูกอัปโหลดอยู่เป็นหลัก
- ตัวอย่างเด่นคือบทความที่อ้างว่า “π เป็นเรื่องโกหก” (ลิงก์)
- โดยเฉพาะในปี 2009 นักฟิสิกส์อิสระ Philip Gibbs ได้ก่อตั้ง viXra ซึ่งเป็นแพลตฟอร์มฝั่งตรงข้ามของ arXiv
ปัญหาการดูแลโค้ดเบสและความขัดแย้งด้านแนวปฏิบัติการพัฒนา
- arXiv ค่อย ๆ เติบโตเป็น โค้ดเบสขนาดใหญ่ และโครงสร้างในยุคแรกก็ถูกสร้างขึ้น โดยไม่ได้คำนึงถึงการบำรุงรักษาและการทดสอบ
- ทำให้เกิดปัญหาเชิงโครงสร้างคล้ายกับ “การก่อสร้างอาคารโดยไม่มีการตรวจความปลอดภัย”
- สิ่งนี้ช่วยให้พัฒนาได้รวดเร็วในช่วงแรก แต่ก่อให้เกิด หนี้ทางเทคนิคระยะยาวและความซับซ้อนที่เพิ่มขึ้น
- Ginsparg ยังคงเข้าไป ตรวจและแก้ไขโค้ดด้วยตัวเองโดยไม่ผ่านการอนุมัติจากฝั่งห้องสมุด และด้วยเหตุนี้จึงถูกวิจารณ์ว่า
“micromanaging and sowing distrust”
“จู้จี้ควบคุมรายละเอียดมากเกินไปและสร้างความไม่ไว้วางใจ”
ความพยายามเกษียณ การอยู่ต่อ และความขัดแย้งภายในที่ทวีความรุนแรง
- ในวาระครบรอบ 20 ปีของ arXiv ในปี 2011 Ginsparg ตัดสินใจแน่วแน่ที่จะเกษียณ และเผยแพร่คำอำลาภายใต้ชื่อ “ArXiv at 20” บน Nature
“For me, the repository was supposed to be a three-hour tour, not a life sentence.”
“สำหรับผม repository นี้ควรจะเป็นแค่ทริปสามชั่วโมง ไม่ใช่โทษจำคุกตลอดชีวิต”
“ArXiv was originally conceived to be fully automated, so as not to scuttle my research career.”
“เดิมที arXiv ถูกออกแบบให้เป็นระบบอัตโนมัติเต็มรูปแบบ เพื่อไม่ให้มันทำลายเส้นทางอาชีพนักวิจัยของผม”
“But daily administrative activities associated with running it can consume hours of every weekday, year-round without holiday.”
“แต่กิจกรรมงานบริหารที่เกี่ยวข้องกับการดูแลมันกลับกินเวลาหลายชั่วโมงในทุกวันทำงาน ตลอดทั้งปีไม่มีวันหยุด” - หลังจากนั้น งานปฏิบัติการประจำวันถูกโอนให้ห้องสมุด Cornell ดูแล และ Ginsparg ตั้งใจจะถอยไปอยู่ในบทบาทที่ปรึกษา แต่ความเป็นจริงไม่ได้เป็นเช่นนั้น
- พนักงานบางส่วนวิจารณ์ว่า Ginsparg “จับโค้ดไว้เป็นตัวประกัน” และปฏิเสธที่จะใช้ GitHub หรือแชร์ภายใน
- ขณะที่เขาเองก็แสดงความหงุดหงิดต่อความจริงที่ว่า ฟีเจอร์ที่เมื่อก่อนเขาทำได้ภายในวันเดียว ตอนนี้กลับใช้เวลาหลายสัปดาห์
“I learned Fortran in the 1960s, and real programmers didn’t document.”
“ผมเรียน Fortran มาตั้งแต่ทศวรรษ 1960 และโปรแกรมเมอร์ตัวจริงไม่เขียนเอกสาร”
(→ ถูกบรรยายว่าเป็นคำตอบที่ทำให้ผู้ถามช็อกระดับหัวใจวาย)
ความสับสนด้านการบริหารและการปรับโครงสร้าง
- นอกจากปัญหาทางเทคนิคแล้ว arXiv ยังเผชิญกับ ความสับสนด้านการบริหาร ด้วย
- ในปี 2019 หน่วยงานต้นสังกัดของ arXiv ภายใน Cornell ถูก ย้ายไปอยู่ภาควิชาคอมพิวเตอร์และสารสนเทศศาสตร์ แต่ไม่กี่เดือนต่อมาก็มีการเปลี่ยนแปลงอีกครั้ง
- หลังจากนั้น มีผู้มีประสบการณ์ด้านสำนักพิมพ์วิชาการเชิงพาณิชย์เข้ามารับผิดชอบงานปฏิบัติการ แต่ก็ลาออกภายในเวลาเพียงหนึ่งปีครึ่ง
“There was disruption … it was not a good period.”
“มีความปั่นป่วนเกิดขึ้น … มันไม่ใช่ช่วงเวลาที่ดี” — คนวงในของ arXiv
- จุดเปลี่ยนเกิดขึ้นในปี 2022 เมื่อ ได้รับการสนับสนุนจากมูลนิธิ Simons จนสามารถเพิ่มกำลังคนด้านพัฒนาได้จำนวนมาก
- และ ศาสตราจารย์ Ramin Zabih แห่ง Cornell ได้รับแต่งตั้งให้เป็นผู้รับผิดชอบการดำเนินงาน
- พร้อมกับที่ การย้ายขึ้นคลาวด์และการรีแฟกเตอร์โค้ดบนพื้นฐานของ Python เริ่มเดินหน้าอย่างจริงจัง
แง่มุมส่วนตัวและการทบทวนตนเอง
- ระหว่างให้สัมภาษณ์กับนักข่าว Ginsparg ก็ยังคงมีท่าทีขี้เล่น เช่น ช่วยซ่อมจักรยานให้ลูกชาย และแหย่เรื่องกำลังขาของอีกฝ่ายระหว่างทริปปั่นจักรยาน
- ตอนขึ้นเนินช่วงสุดท้าย เขาพูดว่า
“I might’ve oversold this to you.”
“ผมอาจจะโฆษณาเส้นทางนี้กับคุณเกินจริงไปหน่อย”
พร้อมยอมรับถึงความเหนื่อยล้า
- ตอนขึ้นเนินช่วงสุดท้าย เขาพูดว่า
- หลังจากสัมภาษณ์กันหลายวัน ผู้สื่อข่าวบอกว่าความ มุ่งมั่นและความดื้อรั้นของเขาคือเหตุผลที่ arXiv อยู่รอดมาได้ และ Ginsparg ก็ตอบกลับอย่างคาดไม่ถึง
“One person’s tenacity is another person’s terrorism.”
“สิ่งที่สำหรับคนหนึ่งคือความมุ่งมั่น สำหรับอีกคนอาจเป็นการก่อการร้ายก็ได้” - จากนั้นเขายังยอมรับอีกว่า
“I’ve heard that the staff occasionally felt terrorized.”
“ผมได้ยินมาว่าบางครั้งพนักงานก็รู้สึกหวาดกลัว”
arXiv ในปัจจุบันและอนาคต
- ปัจจุบัน arXiv ยังคง ดำเนินงานต่อไปอย่างมีดราม่า,
- นักภาษาศาสตร์ Emily Bender เคยวิจารณ์ arXiv ว่าเป็น “มะเร็ง” ที่ส่งเสริม “junk science” และ “fast scholarship”
(ทวีตที่เกี่ยวข้อง, บทความที่เกี่ยวข้อง)
- นักภาษาศาสตร์ Emily Bender เคยวิจารณ์ arXiv ว่าเป็น “มะเร็ง” ที่ส่งเสริม “junk science” และ “fast scholarship”
- ในปี 2023 บทความที่อ้างว่าค้นพบตัวนำยิ่งยวดที่อุณหภูมิห้องถูกโต้แย้งอย่างรวดเร็ว และกลายเป็นกรณีตัวอย่างที่แสดงให้เห็นกลไกฟีดแบ็กที่รวดเร็วของ arXiv
- ในทางกลับกัน ก็มีกรณีที่ บทความปกติถูกถอนเพราะเหตุผลว่า “ใช้ถ้อยคำปลุกปั่น” หรือ “ภาษาไม่เป็นมืออาชีพ” ทำให้เกิดข้อถกเถียงเรื่อง “การเซ็นเซอร์” เช่นกัน
- กรณีตัวอย่าง: เหตุการณ์ถอนบทความของ Jorge Hirsch ผู้คิดค้น h-index
- ในทางกลับกัน ก็มีกรณีที่ บทความปกติถูกถอนเพราะเหตุผลว่า “ใช้ถ้อยคำปลุกปั่น” หรือ “ภาษาไม่เป็นมืออาชีพ” ทำให้เกิดข้อถกเถียงเรื่อง “การเซ็นเซอร์” เช่นกัน
ท่าทีและความผูกพันของ Ginsparg ในปัจจุบัน
- เขา ไม่ได้ต้องการสร้างภาพว่าตัวเองเป็น “ผู้บุกเบิกโอเพนไซเอนซ์” และมากกว่าภารกิจอันยิ่งใหญ่ เขา ยังคงสนุกกับ arXiv ในฐานะพื้นที่ทดลองไอเดีย
“There are various aspects of this that remain incredibly entertaining.”
“ยังมีหลายแง่มุมของโครงการนี้ที่สนุกอย่างเหลือเชื่ออยู่เสมอ”
“I have the perfect platform for testing ideas and playing with them.”
“ผมมีแพลตฟอร์มที่สมบูรณ์แบบสำหรับทดลองไอเดียและเล่นกับมัน” - แม้ว่าเขา จะไม่ได้แตะโค้ดที่ใช้ดูแล arXiv แล้ว, แต่ก็ยัง หมกมุ่นกับโปรเจ็กต์ส่วนตัวในการพัฒนา ‘ตัวกรองบทความปลอม’
“It’s like that Al Pacino quote: They keep bringing me back.”
“มันก็เหมือนคำพูดของ Al Pacino นั่นแหละ: พวกเขาดึงฉันกลับไปอยู่เรื่อย”
“But Al Pacino also developed a real taste for killing people.”
“แต่ Al Pacino ลงท้ายด้วยการเริ่มชอบการฆ่าคนจริง ๆ”
(→ เป็นการพูดเชิงขำ ๆ ถึงทั้งความรักความชังที่มีต่อ arXiv และความหมกมุ่นของตัวเอง)
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News