ถอดความม้วนกระดาษ Herculaneum ทั้งม้วนได้เป็นครั้งแรก
(scrollprize.org)- PHerc. 1667 ที่ไม่สามารถเปิดได้หลังการปะทุของ Vesuvius ในปี ค.ศ. 79 ได้รับการกู้คืนแบบเสมือนโดยไม่ต้องคลี่ออกทางกายภาพ ทำให้อ่านข้อความที่ยังคงอยู่ได้ตั้งแต่ต้นจนจบเป็นครั้งแรก
- การสแกนเอกซเรย์ความละเอียดสูง การสร้างพื้นผิวใหม่ การทำให้แบนราบ และการตรวจจับหมึกด้วยแมชชีนเลิร์นนิง ถูกผสานเข้าด้วยกันเพื่อเปลี่ยนม้วนกระดาษที่ถูกเผาจนเป็นคาร์บอนให้กลายเป็นหน้าที่อ่านได้
- มีการกู้คืน ปาปิรุสราว 1.4 เมตร และส่วนล่างของข้อความภาษากรีกราว 22 คอลัมน์ และยืนยันได้ว่าเนื้อหาเป็นบทความจริยศาสตร์แบบสโตอิกว่าด้วยธรรมชาติมนุษย์ แรงกระตุ้น และความก้าวหน้าทางศีลธรรม
- ใน PHerc. Paris 4 สามารถเห็นหมึกได้โดยตรงภายในข้อมูลเอกซเรย์ 3 มิติ และใน PHerc. 139 มีการกู้คืนชื่อเรื่องและชื่อผู้แต่งว่า Philodemus, On Gods, Book 8
- มีการเผยแพร่ข้อมูลเอกซเรย์พื้นตัด ผิวที่สร้างใหม่ ข้อความถอด และโค้ด เพื่อให้ตรวจสอบและทำซ้ำได้ และสามารถนำแนวทางเดียวกันไปใช้กับม้วน Herculaneum ที่ยังปิดผนึกอยู่อีกหลายร้อยม้วน
อ่านม้วนที่ปิดผนึกโดยไม่ต้องเปิด
- PHerc. 1667 คือปาปิรุส Herculaneum ที่ในชุมชน Vesuvius Challenge เรียกว่า Scroll 4
- มันถูกปิดผนึกมาราว 2,000 ปีหลังการปะทุของ Vesuvius ในปี ค.ศ. 79 และการคลี่ออกทางกายภาพอาจทำลายมันได้เพราะการกลายเป็นคาร์บอน
- งานครั้งนี้บรรลุทั้งการคลี่ออกแบบเสมือนเต็มรูปแบบและการถอดความอย่างต่อเนื่อง โดยไม่ต้องแตะต้องหน้าของม้วนโดยตรง
- ผลลัพธ์ที่เผยแพร่ประกอบด้วยพื้นผิวปาปิรุสยาวราว 1.4 เมตร และข้อความภาษากรีกราว 22 คอลัมน์
- มีการเผยแพร่ preprint PDF, ข้อมูล และ โค้ดบน GitHub ร่วมกัน
ข้อความที่กู้คืนจาก PHerc. 1667
- เดิม PHerc. 1667 เป็นส่วนหนึ่งของม้วนที่ใหญ่กว่า แต่ชั้นนอกถูกทำลายจากความพยายามเปิดด้วยมือในศตวรรษที่ 19 และอีกครั้งในปี 1969 กับช่วงทศวรรษ 1980
- ส่วนที่เหลือเป็นแกนด้านในที่แน่นมาก คิดเป็นความสูงเพียงประมาณ 8 ซม. จากความสูงเดิม 19–24 ซม.
- ทีมวิจัยกู้คืนส่วนล่างของราว 22 คอลัมน์จากส่วนที่ยังคงอยู่ และให้นักปาปิรุสวิทยาถอดและตรวจทาน
- ผลลัพธ์ครั้งนี้เป็นกรณีแรกที่อ่านข้อความที่ยังคงอยู่ได้อย่างต่อเนื่องตั้งแต่ต้นจนจบ ไม่ใช่เพียงคำหรือชิ้นส่วน
เนื้อหาและการระบุเชิงวิชาการ
- ข้อความที่กู้คืนได้เป็นบทความปรัชญาด้านจริยศาสตร์
- การระบุอาศัยทั้งหัวข้อเกี่ยวกับธรรมชาติมนุษย์ แรงกระตุ้น และความก้าวหน้าทางศีลธรรมของมนุษย์ รวมถึงลักษณะทางภาษาและชื่อ Aristocreon ที่ปรากฏในคอลัมน์สุดท้ายที่ยังคงอยู่
- Aristocreon ถูกเสนอว่าเป็นหลานและศิษย์ของนักปรัชญาสโตอิก Chrysippus ซึ่งเชื่อมโยงข้อความนี้เข้ากับบริบทสโตอิกและศตวรรษที่ 2 ก่อนคริสตกาล
- ตำแหน่งที่พื้นผิวปาปิรุสสูญหายไปเพราะความเสียหายยังคงเว้นว่างไว้ ทำให้ข้อความถอดยังคงเป็นชิ้นส่วนในบางส่วน
- ถึงอย่างนั้น หลายข้อความก็ถูกอ่านได้อย่างชัดเจนเป็นครั้งแรกในรอบ 2,000 ปี
- “เราจะสืบค้นบางสิ่ง แต่ถ้าเราหลุดออกจากตัวเราเองและจากธรรมชาติของเราไม่ว่าด้วยวิธีใด เราก็จะไม่อาจเข้าใจมันได้…”
- “หลังจากที่เราทำให้ตัวเองตึงเครียดถึงขีดสุดผ่านการวิจัยและการเรียนรู้… และมีปัญญาเชิงปฏิบัติแบบเดียวกัน…”
- “ถ้าสิ่งเหล่านั้นเป็นความดีสำหรับเรา ก็ย่อมไม่มีสิ่งดีใดในความชั่วที่ตรงข้ามกัน—และยิ่งไม่มีความงามอย่างแน่นอน—และจะไม่มีสิ่งเลวร้ายใด—และยิ่งไม่มีความอัปลักษณ์อย่างแน่นอน—และจะไม่มีความสุข…”
การยืนยันและการระบุจากม้วนอื่น
- PHerc. Paris 4 คือม้วนที่ในชุมชน Vesuvius Challenge เรียกว่า Scroll 1
- ด้วยเทคนิคภาพความละเอียดสูงยิ่งขึ้น จึงปรากฏผลลัพธ์ครั้งแรกที่หมึกมองเห็นได้โดยตรงภายในข้อมูลเอกซเรย์ 3 มิติ
- เมื่อนำหมึกที่แยกออกใน 3 มิติกลับไปฉายลงบนหน้าที่คลี่แล้ว ข้อความก็ตรงกันแบบหนึ่งต่อหนึ่งกับข้อความที่อ่านได้ในรางวัล Grand Prize ปี 2023
- นี่เป็นกรณียืนยันอย่างอิสระว่าการถอดความก่อนหน้านี้เป็นของจริง โดยใช้ข้อมูลที่ดีกว่าเดิม
- ใน PHerc. 139 มีการเสริมสัญญาณหมึกบริเวณชื่อเรื่องเพื่อกู้คืนชื่อเรื่องและชื่อผู้แต่ง
- ผลงานที่ระบุได้คือ Philodemus, On Gods, Book 8
- การอ่านชื่อเรื่องของม้วนที่ยังปิดอยู่ทำให้รู้ได้ว่าเป็นงานใด แม้ก่อนจะศึกษาคอลัมน์ข้อความหลัก
เทคโนโลยีที่ใช้และวิธีการเผยแพร่
- การสแกนได้มาจาก เอกซเรย์ไมโครโทโมกราฟีแบบ phase-contrast ความละเอียดสูง ที่บีมไลน์ BM18 ของ European Synchrotron Radiation Facility ใน Grenoble
- อุปกรณ์นี้สามารถแยกให้เห็นชั้นบาง ๆ ที่ซ้อนกันอย่างหนาแน่นของม้วน Herculaneum ได้
- งานนี้ดำเนินการร่วมกับ National Library of Naples “Vittorio Emanuele III” ซึ่งเป็นผู้เก็บรักษาปาปิรุส Herculaneum
- กระบวนการประมวลผลประกอบด้วย 4 ขั้นตอน
- สร้างใหม่ซึ่งโครงสร้างเรขาคณิตภายในของม้วน
- ติดตามพื้นผิวและทำให้แบนราบเป็นแผ่นที่อ่านได้
- ฝึกโมเดลแมชชีนเลิร์นนิงให้ตรวจจับหมึกที่แทบแยกไม่ออกจากปาปิรุสที่ถูกเผาจนเป็นคาร์บอน
- ให้นักปาปิรุสวิทยาตรวจทานและถอดความผลการอ่านแต่ละส่วน
- ข้อมูลเอกซเรย์พื้นตัด พื้นผิวที่สร้างใหม่ และข้อความถอด ถูกเผยแพร่ภายใต้สัญญาอนุญาต Creative Commons ที่ scrollprize.org/data และเก็บรักษาไว้ที่ ESRF
- โค้ดถูกเผยแพร่บน GitHub เพื่อให้ตรวจสอบและนำไปใช้กับม้วนอื่นได้
วิทยาศาสตร์แบบเปิดและขั้นตอนถัดไป
- การคลี่ม้วน Herculaneum แบบเสมือนถูกบุกเบิกโดยศาสตราจารย์ Brent Seales แห่ง EduceLab
- ในปี 2023 Seales ได้เผยแพร่เทคโนโลยีภาพและซอฟต์แวร์จากห้องปฏิบัติการของเขาให้กับ Vesuvius Challenge
- Vesuvius Challenge เป็นโครงการเปิดและอาศัยเงินบริจาค ซึ่งร่วมก่อตั้งโดย Brent Seales, Nat Friedman และ Daniel Gross
- รางวัล first letters และ 2023 Grand Prize ตกเป็นของผู้เข้าร่วมจากทั่วโลก
- ปัจจุบันสมาชิกจำนวนมากของทีมวิจัย Vesuvius Challenge เข้าร่วมครั้งแรกในฐานะผู้เข้าแข่งขัน ก่อนจะสร้างจุดเปลี่ยนในการแข่งขันแบบเปิด คว้ารางวัล และเข้ามาร่วมทีมวิจัย
- ยังมีม้วน Herculaneum ที่ปิดผนึกอยู่อีกหลายร้อยม้วน และห้องสมุดทั้งชุดที่ประกอบด้วยงานปรัชญา บทกวี และร้อยแก้ว กำลังรอคอยการถูกอ่านเป็นครั้งแรกนับตั้งแต่ยุคโบราณ
- ช่องทางการมีส่วนร่วมยังเปิดอยู่
- ตรวจสอบเนื้อหาทางวิทยาศาสตร์ได้จาก preprint PDF
- รับข้อมูลและโค้ดได้ที่ scrollprize.org/data และ GitHub
- เริ่มเข้าร่วมชุมชนได้ที่ get started
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ทำให้นึกภาพ Aristocreon กำลังจดความคิดลงบนม้วนกระดาษราวปี 200 ก่อนคริสตกาล
เขาอาจรู้เพียงว่าม้วนกระดาษนั้นน่าจะถูกเก็บไว้ในหอสมุดได้ช่วงหนึ่ง แต่คงจินตนาการไม่ออกว่าอีก 300 ปีต่อมา ภูเขาไฟจะทำลายม้วนกระดาษนั้นพร้อมกับเก็บรักษามันไว้ในอีกแบบหนึ่ง และเกือบ 2,000 ปีให้หลัง มนุษย์อนาคตที่มีเครื่องจักรซึ่งสร้างจากวัสดุที่อาจนับเป็นญาติห่าง ๆ ของทรายและสายฟ้าจะกลับมาอ่านมันได้อีกครั้งและส่งต่อไปทั่วโลกได้ในทันที
ในเวลานั้น การที่โลกเป็นทรงกลมเพิ่งได้รับการพิสูจน์ได้ไม่นานนัก แต่พื้นที่ส่วนใหญ่ของโลกยังคงเป็นสิ่งไม่รู้จัก แล้วพวกเราทุกวันนี้มีจินตนาการที่ดีกว่าหรือไม่? นักเขียน SF จะสามารถจินตนาการถึงบางสิ่งที่ไกลเกินจากสิ่งที่เรารู้ในตอนนี้ได้ขนาดนั้นหรือเปล่า?
สายตาของคนสมัยใหม่ไม่ได้ต่างจากคนยุคนั้นมาก แต่ตอนนี้แทบทุกคนอ่านออกเขียนได้ ขณะที่ในเวลานั้นคนที่อ่านม้วนกระดาษแบบนี้ได้มีน้อยมาก SF สร้างอนาคตที่แปลกจนเวียนหัวได้มากพออยู่แล้ว มีทั้ง hard SF อย่างซีรีส์ Orthogonal ของ Greg Egan ที่ว่าด้วยจักรวาลซึ่งจัดวาง 3 มิติของอวกาศและ 1 มิติของเวลาแตกต่างออกไป หรือถ้าเป็นอนาคตที่ยังต่อเนื่องจากสังคมมนุษย์แบบคุ้นเคย ก็มีตั้งแต่ Rainbows End ของ Vinge ไปจนถึงงานอนาคตอันไกลของ Stross
ถ้าเป็นช่วงทศวรรษ 1800 อย่างน้อยก็น่าจะพอเข้าใจส่วนที่เป็น “ไฟฟ้า” ได้
หรือบางทีอาจเป็นตั้งแต่ตอนที่แท่นพิมพ์ทำการพิมพ์ครั้งแรกด้วยซ้ำ
ผมอยู่ในทีม Vesuvius Challenge ที่ดูแลส่วนการแบ่งส่วน การคลี่ออก และการตรวจจับหมึก ถ้ามีคำถามก็พอตอบได้
การสร้างเครื่องที่อ่านม้วนกระดาษอายุเกิน 2,000 ปีซึ่งเปราะบางมากได้โดยไม่ต้องคลี่มันออกจริง ๆ และคุณยังมีส่วนร่วมโดยตรงกับสิ่งนั้น น่าทึ่งมาก
สงสัยด้วยว่ามีข้อมูลติดป้ายกำกับ เช่น ภาพที่ผู้เชี่ยวชาญมนุษย์ทำเครื่องหมายว่าตรงไหนเป็นหมึก หรือสแกนม้วนกระดาษคาร์บอไนซ์ที่รู้เนื้อหาอยู่แล้วหรือไม่ สำหรับผม แค่ดูด้วยตาเปล่าก็ไม่มั่นใจว่าจะทำได้ดีกว่าการเดาสุ่มในงานแบบนี้ และข้อจำกัดที่เห็นได้แค่ภาพตัดขวาง 2 มิติจากข้อมูล 3 มิติก็ใหญ่ไม่น้อย
จะทำระบบให้เป็นอัตโนมัติได้ถึงระดับที่การสแกนแบบปิดอยู่ทั้งม้วนเร็วกว่าการคลี่หนังสือออกมาสแกนหรือไม่?
ซากโบราณสถาน Herculaneum ยังขุดค้นไปเพียงประมาณ**20%**เท่านั้น จึงมีโอกาสสูงว่าจะยังมีม้วนกระดาษอีกมาก
ม้วนกระดาษที่มีอยู่ตอนนี้ดูเหมือนจะเป็นของสะสมส่วนตัวมากกว่าจะเป็นหอสมุดหลักของยุคนั้น ถ้าตอนนี้เราอ่านมันได้ด้วยเทคโนโลยีนี้ ภาพของการค้นพบหอสมุดสมบูรณ์ที่มีม้วนกระดาษหลายพันม้วนในหัวข้อหลากหลายคงน่าตื่นเต้นมาก
มีการประเมินว่างานเขียนกรีกและละตินโบราณที่รอดมาถึงปัจจุบันมีเพียงราว 1% ของทั้งหมดเท่านั้น ส่วนภาษาอื่นอย่าง Punic ยิ่งเหลือน้อยกว่า [0] เรารู้จักผลงานและผู้เขียนบางคนเพียงเพราะมีการอ้างชื่อไว้ในเอกสารยุคหลัง
อีกทั้งข้อความที่รอดมาได้ก็มักรอดเพราะในยุคกลาง พระได้คัดลอกมันซ้ำ ๆ ลงบนหนังสัตว์ราคาแพง และแน่นอนว่าหัวข้อที่พวกเขาสนใจกว่าย่อมได้รับการให้ความสำคัญก่อน ทุกอย่างอาจเปลี่ยนไปได้อย่างแท้จริง
[0] https://talesoftimesforgotten.com/2021/09/25/are-there-more-...
ทุกครั้งที่รู้สึกหดหู่กับสภาพของวงการเทคโนโลยี และคิดว่าคนฉลาด ๆ เอาเวลาไปทุ่มกับการยัดโฆษณาเข้าคอผู้คนให้มากขึ้น ก็ให้นึกไว้ว่าโครงการแบบนี้ก็มีอยู่เหมือนกัน
ยังมีคนฉลาดอีกมากที่กำลังทำเรื่องยิ่งใหญ่ เพียงแต่พวกเขาไม่ได้ส่งเสียงดังเท่านั้นเอง
อีกทั้งยังมีกรณีที่พบว่ายีน Alzheimer ไม่ได้เป็นแค่สัญญาณบ่งชี้ แต่มีบทบาทกระตุ้นการเกิดโรคด้วย
สงสัยว่าตัวอย่างคู่ขนานในอีก 2,000 ปีข้างหน้าจะเป็นแบบนี้ไหม: “ถอดรหัสดีวีดี Step Brothersหลังมหาพายุสุริยะปี 2484 ได้สำเร็จ”
ข้อความจากม้วนกระดาษที่ค้นพบจนถึงตอนนี้ก็ดูคล้ายแฟนฟิกโป๊ฉบับโลกโบราณอยู่ไม่น้อย สุดท้ายแล้วมนุษย์ก็ไม่ได้ต่างไปจากเดิมมากนัก
ในบรรดาสิ่งที่กำลังทำกันด้วย AI ตอนนี้ นี่เป็นงานที่น่าสนใจที่สุดกลุ่มหนึ่ง เช่นเดียวกับงานวิจัยทางการแพทย์
ผมค่อนข้างหมกมุ่นกับโลกโบราณ จึงเฝ้าฝันมาตลอดว่าจะได้อ่านข้อความใหม่จากเมื่อราว2,000 ปีก่อนในระดับทีละหน้า
ทุกครั้งที่อ่านงานแปลแบบนี้ ฉันมักสงสัยเสมอว่า น้ำเสียงถูกแปลไปด้วยหรือเปล่า
ผู้เขียนต้นฉบับตั้งใจใช้ “to the utmost” ที่เป็นทางการมาก หรือจริง ๆ แล้วเป็น “to the max” ที่เบากว่ากันแน่? อคติของผู้แปลมีส่วนมากแค่ไหนที่ทำให้ข้อเขียนแบบนี้ดูเหมือนบทความวิชาการแทนที่จะเป็นโพสต์บนโซเชียลเน็ตเวิร์ก?
ถ้าอยากอ่านข้อความโบราณ ก็มีฉบับสองภาษาอย่าง “Loeb library” อยู่ คำแปลที่ละต้นฉบับออกไปมีไว้สำหรับคนที่แค่อยากรู้เนื้อหาโดยคร่าว และไม่ได้สนใจความแม่นยำของคำแปลมากนัก
ถ้ามีฉบับสองภาษา ถึงจะรู้ภาษาเดิมไม่มากก็เข้าใจต้นฉบับได้ง่ายขึ้น เหตุผลที่ต้นฉบับสำคัญก็เพราะในภาษาเป้าหมายมักไม่มีคำที่เทียบได้ตรงตัว ทำให้ผู้แปลต้องสอดความไม่แม่นยำลงไปอย่างเลี่ยงไม่ได้
โดยเฉพาะเมื่อคำโบราณคนละคำถูกแปลเป็นคำอังกฤษคำเดียวกัน นัยก็จะหายไปและก่อให้เกิดความเข้าใจผิด ในทางกลับกัน การแปลคำโบราณคำเดียวกันเป็นคำอังกฤษต่างกันไปตามบริบทยิ่งทำให้สับสน
ความหมายของคำอาจเปลี่ยนไปตามบริบทก็จริง แต่ถ้าผู้แปลไม่มีความรู้เชิงลึกพอในบริบททางวิทยาศาสตร์หรือเทคนิคเฉพาะนั้น บางทีก็ตัดสินได้ไม่ดีกว่าผู้อ่านเอง ผู้แปลที่ดีกว่ามักชอบ การจับคู่แบบหนึ่งต่อหนึ่ง ระหว่างคำ เพื่อให้ผู้อ่านดูการใช้หลาย ๆ ครั้งแล้วค้นหาเจตนาของผู้เขียนโบราณได้เองง่ายขึ้น
ไม่จำเป็นต้องเป็นนักธนูฝีมือเยี่ยม แต่ถ้าอยากเข้าใจคนที่ใช้ธนูแบบหนึ่งโดยเฉพาะ การได้ลองจับธนูนั้นแม้เพียงชั่วครู่ก็ช่วยได้มากกว่า
งานเขียนกรีกและละตินแบบเป็นทางการนิยมใช้ประโยคยาวที่มีอนุประโยคซ้อนกันมากมาย ทุกวันนี้นอกวงวิชาการหรือวรรณกรรม “ชั้นสูง” ผู้คนไม่ค่อยเขียนกันแบบนั้นแล้ว จดหมายสบาย ๆ หรือข้อความขีดเขียนน่าจะใกล้กับทวีตมากกว่า
เมื่อข้าพเจ้าเดินผ่านหุบเขาแห่งเงามัจจุราช,
ข้าพเจ้าพินิจชีวิตของตนและตระหนักว่าไม่เหลือสิ่งใดแล้ว.
เพราะข้าพเจ้าเหวี่ยงอาวุธและหัวเราะมานานยิ่ง,
จนแม้มารดาของข้าพเจ้าก็เห็นว่าจิตของข้าพเจ้าราวกับจากไปแล้ว.
แต่ข้าพเจ้าไม่เคยลวงผู้ใด นอกจากผู้ที่สมควรถูกลวง,
เพราะฉะนั้นเรื่องที่ว่าข้าพเจ้าเป็นคนขี้ขลาดนั้น ข้าพเจ้าไม่เคยได้ยินเลยจริง ๆ.
จงระวังสิ่งที่ท่านพูด และจงระวังทิศทางที่ท่านมุ่งไป.
เพื่อมิให้ท่านและพวกพ้องของท่านถูกล้อมไว้ด้วยเส้นชอล์ก
ภาษาละตินเป็นภาษาที่มั่งคั่งมาก และนี่ก็ไม่ใช่เศษข้อความสั้น ๆ การแปลนั้นยากเสมอ โดยเฉพาะข้อความจากเมื่อหลายพันปีก่อน แต่การแปลประเภทนี้ทำได้ด้วยความมั่นใจค่อนข้างสูง
คนที่เขียนข้อความนี้มีชีวิตอยู่ใกล้กับเทคโนโลยีที่ใช้คลี่อ่านข้อความไหม้เกรียมของตนเองออกมาอ่าน ได้มากกว่าที่เขาใกล้กับเทคโนโลยีที่ใช้สร้างพีระมิดเสียอีก
พอคิดดูแล้วก็ประหลาดไม่น้อย
การที่มันถูกเก็บรักษาไว้นานขนาดนั้นด้วยความหวังว่าวันหนึ่งจะมีเทคโนโลยีที่อ่านมันได้โดยไม่ทำลายมัน รู้สึกเหมือนเป็นบทพิสูจน์อันน่าทึ่งของ ความสามารถและความมองโลกในแง่ดีของมนุษย์
เรื่องแบบนี้ให้ความหวังกับอนาคตมาก
การที่เราค้นพบประโยคอย่าง “หากเราหลุดออกไปจากตัวเราเองและธรรมชาติของเราไม่ว่าด้วยวิธีใด เราก็จะค้นคว้าบางสิ่ง แต่จะไม่สามารถยึดมันไว้ได้…” นั้นช่าง งดงามอย่างย้อนแย้ง