- ข้อความคือ เทคโนโลยีการสื่อสารที่ทรงพลังที่สุดในประวัติศาสตร์มนุษยชาติ โดยมีทั้งพลังในการแสดงออกและประสิทธิภาพเหนือกว่าสื่ออื่นทั้งหมด
- เป็นวิธีการที่เหมาะสมที่สุดในการถ่ายทอด แนวคิดเชิงนามธรรมและความคิดที่ซับซ้อน ได้อย่างแม่นยำ มากกว่าภาพ วิดีโอ หรือเสียง
- เป็นเทคโนโลยีที่ผ่านการพิสูจน์แล้วในด้าน ความทนทานและความเสถียร ถึงขั้นที่เรายังอ่านบันทึกจากเมื่อหลายพันปีก่อนได้
- ในแง่ต้นทุนการจัดเก็บและการส่งต่อ มันมี ประสิทธิภาพเหนือชั้นอย่างท่วมท้น และมักเป็นจุดเริ่มต้นของพัฒนาการด้านเทคโนโลยีการสื่อสารซ้ำแล้วซ้ำเล่า
- ในด้าน ขอบเขตและความลึกของการใช้งานทางสังคม เช่น การค้นหา การแปล การสรุป และการทำงานร่วมกัน ไม่มีสื่ออื่นใดตามทันได้
จุดยืนพื้นฐานต่อข้อความ
- ทุกครั้งที่ถูกถามเกี่ยวกับวิดีโอ, 3D, เกม, และระบบมัลติมีเดียแบบไดนามิก ผู้เขียนก็ย้ำจุดยืนเดิมมาโดยตลอด
- ไม่ได้ปฏิเสธคุณค่าของภาพ รูปถ่าย ภาพยนตร์ หรือดนตรี แต่เห็นว่า ความเหนือกว่าของข้อความนั้นเป็นสิ่งสัมบูรณ์
- นิยามข้อความว่าเป็นเทคโนโลยีการสื่อสารที่ทรงพลัง มีประโยชน์ และมีประสิทธิผลมากที่สุด
เทคโนโลยีที่เก่าแก่และเสถียรที่สุด
- ภาษาพูดและภาษามือมีอยู่โดยธรรมชาติในสังคมมนุษย์ แต่ ข้อความคือเทคโนโลยีที่ได้มาผ่านการเรียนรู้และการถ่ายทอด
- มี ความทนทานต่อกาลเวลา มากพอที่เราจะยังอ่านบันทึกเมื่อราว 5,000 ปีก่อนได้ในปัจจุบัน
- สามารถถูกสลักลงบนสื่อทางกายภาพอย่างเช่นหิน จึงอาจคงอยู่ยาวนานยิ่งกว่ามนุษยชาติเอง
เครื่องมือแสดงออกที่ยืดหยุ่นที่สุด
- ภาพอาจทรงพลังในบางสถานการณ์ แต่ เป็นไปไม่ได้ที่จะถ่ายทอดประโยคเชิงนามธรรมตามอำเภอใจด้วยภาพอย่างครบถ้วน
- ประโยคเชิงแนวคิดอย่างเช่นคำจำกัดความของสิทธิมนุษยชน ไม่สามารถแทนที่ด้วยภาพวาดได้
- ข้อความสามารถถ่ายทอดความคิดได้พร้อม ควบคุมระดับของความแม่นยำและความกำกวม
- ที่ว่าวรรณกรรม ปรัชญา ประวัติศาสตร์ คณิตศาสตร์ ตรรกะ การเขียนโปรแกรม และวิศวกรรม ล้วนตั้งอยู่บนข้อความ ไม่ใช่เรื่องบังเอิญ
วิธีการสื่อสารที่มีประสิทธิภาพที่สุด
- ข้อความมี ประสิทธิภาพคนละระดับ ในด้านพื้นที่จัดเก็บและต้นทุนการส่งต่อ
- ข้อความเพียงไม่กี่พันไบต์อาจมีขนาดเล็กกว่าภาพไอคอนง่าย ๆ เสียอีก
- ตั้งแต่ optical telegraph, electric telegraph, teletype จนถึงเครือข่ายคอมพิวเตอร์ยุคแรก ๆ ข้อความมาก่อนเสมอ
- เสียง ภาพ และวิดีโอเกิดขึ้นได้ก็ต่อเมื่อแบนด์วิดท์มีราคาถูกพอแล้วเท่านั้น
- มีความหนาแน่นมากพอจนสามารถใส่ Wikipedia ทั้งหมดไว้ในสมาร์ตโฟนได้
เทคโนโลยีที่มีประโยชน์ต่อสังคมมากที่สุด
- ทำงานได้อย่าง มีประสิทธิภาพ ทั้งในการสื่อสารแบบ 1:1, 1:N และ M:N
- สามารถ ค้นหาและทำดัชนี ได้ แม้รวมถึงการทำด้วยมือ
- เหมาะอย่างยิ่งต่อ การประมวลผลเชิงอัลกอริทึม เช่น การแปล การเปรียบเทียบ การทำ diff การจัดกลุ่ม การตรวจแก้ การสรุป และการกรอง
- ใช้งานแบบอะซิงโครนัสได้ และปรับความเร็วในการรับสารได้อย่างอิสระ
- รองรับการแก้ไขร่วมกัน การอ้างอิง คำอธิบายประกอบ การอภิปรายแบบแตกกิ่ง การสรุป การรีวิว และงานดัดแปลงต่อยอด
- ยังไม่มีเทคโนโลยีใดมาแทนที่ ความซับซ้อนทางสังคมและการรับรู้ ในระดับห้องสมุดและโพสต์บนอินเทอร์เน็ตได้
บทสรุป
- เพราะฉะนั้น จุดยืนต่อข้อความจึงชัดเจนมาก: ควร เลือกข้อความก่อนเสมอ (always pick text first)
- หากยืมคำพูดของหัวหน้าเก่ามาใช้ ก็คือควร เดิมพันกับข้อความเสมอ (always bet on text)
- หากมีสิ่งใดที่ทำด้วยข้อความได้ ก็ควรทำเช่นนั้น เพราะข้อความแทบไม่ทำให้ผิดหวัง
3 ความคิดเห็น
จริงอยู่ว่าข้อความเป็นเครื่องมือในการสื่อความหมายที่ดีมากและสำคัญมากด้วย......
แต่เราไม่สามารถเก็บทุกอย่างไว้เป็นข้อความได้ทั้งหมด
ท้ายที่สุดแล้วข้อความก็คือการแสดงออกแบบบีบอัด เราเอาสิ่งที่รับรู้ได้ผ่านประสาทสัมผัสทั้งห้า (การมองเห็น การได้ยิน การสัมผัส การรับรส การดมกลิ่น) มาบีบอัดและถ่ายทอดออกมาในรูปแบบที่สังคมตกลงร่วมกัน
แต่ถ้าไม่มีข้อมูลเกี่ยวกับสิ่งต้นแบบที่เป็นที่มานั้น ต่อให้เก็บข้อมูลไว้เป็นข้อความมากแค่ไหน ภายหลังถ้าไม่รู้จักสิ่งต้นแบบนั้น ข้อความนั้นก็จะสูญเสียความหมายไป
พวกเรารู้ว่าคาสเซ็ตคืออะไร แต่ถ้าเอาแค่คำว่าคาสเซ็ตไปให้เด็กเล็กที่เพิ่งเกิดในยุคหลัง ๆ ดู แล้วถามว่านี่คืออะไร จะมีสักกี่คนที่ตอบได้ถูก? ต่อให้อธิบายรูปร่าง หน้าที่ และวิธีการทำงานของคาสเซ็ตไว้อย่างละเอียด ข้อความนั้นเพียงอย่างเดียวจะทำให้คนในอีกหลายพันปีข้างหน้าสามารถสร้างคาสเซ็ตนั้นขึ้นมาใหม่ได้อย่างสมบูรณ์จริงหรือ?
ในกรณีแบบนั้น รูปถ่ายคาสเซ็ตสักไม่กี่ภาพ แบบแปลน หรือวิดีโอไม่กี่นาทีที่แสดงการใช้งานคาสเซ็ต อาจมีประโยชน์มากกว่า
ข้อความนั้นมั่นคงเสถียรอย่างชัดเจน แต่ผม/ฉันก็ไม่ค่อยแน่ใจนักว่ามันใช้งานได้อย่างเป็นธรรมชาติหรือไม่
ความคิดเห็นจาก Hacker News
ฉันไม่เข้าใจ การแบ่งแบบสองขั้ว ของการถกเถียงนี้
ไม่เข้าใจว่าทำไมฉันต้องอยู่ในสถานการณ์ที่ต้องเลือกอย่างใดอย่างหนึ่งระหว่าง UTF-8 กับการบันทึกการเล่นเปียโน
มันให้ความรู้สึกเหมือนคนที่ตื่นเต้นกับหัวข้อมาก ๆ พูดถึงมันได้แค่ในกรอบตรงข้ามง่าย ๆ แบบ “Ford vs. Chevy”
พวกเราทุกคนก็ชอบข้อความอยู่แล้ว เลยอยากให้เลิกพยายามโน้มน้าวกันเสียที
ฉันเห็นด้วยกับ ความยืดหยุ่นไร้ขีดจำกัด และความทนทานของข้อความ แต่หลังจากได้ดูงานของ Bret Victor ก็เริ่มรู้สึกถึงข้อจำกัดของข้อความ
ตอนเรียนเปียโนมีวงจรป้อนกลับทันที ซึ่งเป็นวิธีการเรียนรู้ที่ทำได้ยากมากถ้าพึ่งข้อความอย่างเดียว
ประเด็นหลักของ Victor คือควรนำการเรียนรู้ที่เน้นฟีดแบ็กแบบนี้ไปใช้กับ วิศวกรรมและการศึกษาทั้งหมด
ข้อความยังคงสำคัญ แต่ฉันคิดว่าวิธีที่ใช้สัญชาตญาณจากประสาทสัมผัสแบบอื่นก็ยังมีศักยภาพอีกมาก
เดโมของ Bret Victor น่าประทับใจ แต่การทำให้เกิดขึ้นจริงต้องใช้ความพยายามมหาศาล
ตัวไอเดียนั้นยอดเยี่ยม แต่ต้องเข้าใจว่าการทำให้เป็นจริงต้องใช้เงินลงทุนและความทุ่มเทอย่างมาก
การอธิบายข้อมูลหรือผลลัพธ์ด้วยข้อความนั้นยาก แต่ กราฟ สามารถส่งข้อมูลจำนวนมากได้ในทันที
ข้อความมีข้อดีตรงที่เป็นแบบอะซิงโครนัส แต่โดยสัญชาตญาณแล้วมนุษย์ชอบการพูดหรือการแสดงออกทางภาพมากกว่า
สุดท้ายแล้ว วิธีแบบ ผสมผสาน ดูเป็นธรรมชาติกว่าการใช้รูปแบบการสื่อสารเพียงแบบเดียว
เด็กแค่ดูแล้วเรียนรู้ และเข้าใจด้วย สัญชาตญาณทางกายภาพ
ความรู้ที่ต้องเรียนผ่านร่างกายอย่างการขี่จักรยาน แทบถ่ายทอดด้วยข้อความไม่ได้เลย
ข้อความเป็นเชิงสัญลักษณ์ ส่วนภาพเป็นเชิงประสาทสัมผัส
เป็นไปไม่ได้ที่จะถ่ายทอดภาพวาดของ Norman Rockwell ออกมาเป็นข้อความได้อย่างสมบูรณ์
ระบบสัญลักษณ์บนฐานข้อความ เช่น โน้ตดนตรีหรือ Feynman diagram ก็ยังทรงพลังมาก
ฉันสรุปบทความของ OP ได้ใน 30 วินาที แต่วิดีโอของ Bret Victor ยาว 54 นาที ซึ่งคนส่วนใหญ่คงไม่ดู
ข้อความยังคงเป็นสื่อที่ดีที่สุดในแง่ ประสิทธิภาพและความสามารถในการแปลงรูป
ฉันคิดว่าสื่ออื่นควรถูกใช้เป็นเครื่องมือเสริม
ฉันเรียกตัวเองว่าเป็น พวกสุดโต่งฝั่งข้อความ
ข้อความคือจุดเชื่อมต่อที่เป็นธรรมชาติระหว่างมนุษย์กับเครื่องจักร และเป็นจุดสมดุลระหว่างประสิทธิภาพกับความโปร่งใส
ทุกอย่างสามารถเก็บเป็นสตริงได้ และแสดงออกได้ด้วย base64, JSON, HTML, CSS, SQL ฯลฯ
สุดท้ายแล้ว silver bullet ที่อุตสาหกรรมตามหาก็คือสตริงนี่เอง
ฟอร์แมตไบนารีที่ซับซ้อนสูญเสียความอ่านง่าย และเมื่อบีบอัดด้วย GZIP แล้ว ข้อได้เปรียบก็แทบหายไป
โปรโตคอลแบบข้อความมักไม่เสถียรเพราะปัญหาของ กฎของ Postel
ความต่างของแบนด์วิดท์ 30% ไม่ใช่เรื่องเล็กเลย และนั่นก็เป็นเหตุผลที่ HTTP3 เปลี่ยนไปใช้ไบนารี
ต่อให้บีบอัด base64 ก็ไม่ได้ช่วย เพราะมันสูญเสียความอ่านง่ายไปตั้งแต่แรกแล้ว
ดูเพิ่มเติม: Robustness principle, ปัญหา Regex, ReDoS
ยังไง JSON ที่ถูก gzip แล้วคนก็อ่านตรง ๆ ไม่ได้อยู่ดี การต้องผ่านเครื่องมือจึงไม่ใช่ปัญหาใหญ่
สำหรับไฟล์คอนฟิกที่มนุษย์ต้องแก้ไข text proto หรือ JSON เหมาะกว่า
grep ก็ง่าย, git ก็ง่าย, การแปลงก็ง่าย
งานวิจัยเก่า ๆ ของฉันเขียนด้วย Lotus Word Pro ตอนนี้เลยเปิดอ่านไม่ได้ แต่ถ้าเป็นข้อความก็คงไม่มีปัญหา
ในระบบขนาดใหญ่มีไฟล์ข้อความวิ่งไปมามากมาย แต่แทบไม่มี ความโปร่งใส เลย
ในสภาพแวดล้อมขนาดใหญ่ การประหยัดไม่กี่บิตแปลเป็นการลดต้นทุนได้มาก จึงตัดฟิลด์แบบ self-labeled ออก
ท้ายที่สุดแล้ว ข้อความก็เป็นเพียง การแสดงแทนของไบต์
แต่เหตุผลที่ผู้คนยึดติดกับข้อความ เป็นเพราะความปิดของฟอร์แมตไบนารีและการขาดแคลนเครื่องมือ
ต่อให้ CSV มีคอลัมน์ base64 หลายล้านคอลัมน์ ถ้าไม่มีเครื่องมือที่เหมาะสม มันก็ไม่ได้ดีกว่าไบนารีเลย
ด้วยการทำให้เป็นมาตรฐาน เราจึงแบ่งปันความหมายร่วมกันได้ และโมเดลอย่าง LLM ก็เรียนรู้สิ่งนี้ได้
คำพูดที่ว่า “ลองแสดงประโยคสุ่มจากวิกิออกมาเป็นภาพสิ” ก็ชี้ให้เห็นว่าเราแทนทุกอย่างด้วยข้อความไม่ได้
ในทางกลับกัน การอธิบายคลิปภาพยนตร์เป็นข้อความอย่างสมบูรณ์ก็เป็นไปไม่ได้เช่นกัน
ข้อความไม่ใช่ซูเปอร์เซ็ตของสื่อทั้งหมด มันเป็นเพียงการแทนความหมายคนละชนิดเท่านั้น
ตัวอย่าง: Flight management system, NOTAM
ต่อข้ออ้างที่ว่า “ข้อความคือเทคโนโลยีการสื่อสารที่เก่าแก่และเสถียรที่สุด”
ที่จริงแล้ว ภาษาเอง เป็นเทคโนโลยีที่เก่าแก่กว่า
มรดกการเล่าปากต่อปากได้ส่งต่อความรู้ข้ามรุ่น และภาษามนุษย์ก็ซับซ้อนที่สุดในบรรดาสิ่งเหล่านั้น
ตัวอย่างเช่น ชนพื้นเมืองออสเตรเลีย Gunditjmara ถ่ายทอดเรื่องการปะทุของภูเขาไฟเมื่อ 30,000 ปีก่อนผ่านเรื่องเล่า (Budj Bim)
ข้อความมีลักษณะพิเศษตรงที่สามารถส่งข้อมูลข้ามรุ่นได้โดยไม่บิดเบือน
สุดท้ายแล้วข้อสรุปก็คือ “จงเดิมพันกับภาษา”
สิ่งที่ทำให้ LLM น่าทึ่ง คือมนุษยชาติได้ บันทึกความรู้ทั้งหมดเป็นข้อความ มาหลายพันปีแล้ว
โมเดลภาพก็พัฒนาขึ้นได้ด้วย พื้นที่ embedding ร่วม ระหว่างข้อความกับภาพ
มันสะดวกก็จริง แต่คงเรียกว่าเป็นโมเดลที่ “มีประสิทธิผล” อย่างแท้จริงได้ยาก
ในฐานะ นักภาษาศาสตร์ ฉันเชื่อว่าเวลาเก็บบันทึกภาษาที่ใกล้สูญพันธุ์ ข้อความ (Unicode) คือ ฟอร์แมตที่ยั่งยืน ที่สุด
ตำราไวยากรณ์ภาษากรีกหรือสันสกฤตจากเมื่อหลายพันปีก่อน เรายังอ่านได้อยู่เลย
ทีมของเราตีพิมพ์เป็น PDF แต่ภายในเก็บรักษาไว้เป็น XML
หวังว่ามันจะยังอ่านได้อีก 2,000 ปีข้างหน้า
มีความสับสนเรื่อง encoding มากมาย เช่น UTF-16, SJIS, EUC ขณะที่ PDF หรือ JPEG ยังเปิดได้สมบูรณ์
ถ้าพื้นที่จัดเก็บไม่ใช่ปัญหา ฉันกลับรู้สึกว่าเก็บเป็น ฟอร์แมตรูปภาพ จะปลอดภัยกว่า
อีกทั้งยังมีอักขระที่ Unicode ก็ยังแทนไม่ได้อยู่
ภาพวาดบนผนังถ้ำ ถ่ายทอดเจตนาได้ดีกว่าข้อความเสียอีก
ถ้าดูซีรีส์ Future Text Publishing จะเห็นว่า
“ข้อความ” โดยแก่นแท้แล้วคือ ภาพสองมิติ
คอมพิวเตอร์ไม่ได้เข้าใจข้อความ มันเพียงประมวลผลตัวเลขเท่านั้น
มนุษย์ต่างหากที่มอบความหมายให้ตัวเลขเหล่านั้น แล้วสร้างเป็น ระบบสัญลักษณ์และภาษา ขึ้นมา
DNA/RNA อาจมองได้ว่าเป็นตัวอย่างของ ระบบตัวอักษรสากล ที่ประกอบขึ้นทางกายภาพ
บทความนี้เคยขึ้น HN มาแล้วหลายครั้ง
ในปี 2014, 2015 และ 2021 ก็มีคอมเมนต์กันอย่างละหลายร้อยข้อความ
เวอร์ชัน 2014, เวอร์ชัน 2015, เวอร์ชัน 2021