- บทความว่าด้วยการล่มสลายของความน่าเชื่อถือบนอินเทอร์เน็ต โดยยกกรณีพบ บทความปลอมที่สร้างโดย AI ซึ่งไม่มีอยู่จริง ขณะค้นหาเกมรีรีลีสสำหรับ Sega Genesis ในญี่ปุ่นชื่อ ‘Phantasy Star Fukkokuban’
- เว็บไซต์ที่แสดงอยู่ลำดับบนของผลการค้นหาเผยแพร่บทความที่มีเนื้อหา ไม่ตรงกับข้อเท็จจริงเลย เช่น การปรับปรุงกราฟิกและเอฟเฟกต์สภาพอากาศ ก่อนจะพบว่าเป็นเรื่องแต่งที่สร้างขึ้นโดย โมเดลภาษาขนาดใหญ่ (LLM)
- ผู้เขียนลองให้ ChatGPT อธิบายเกมเดียวกัน ก็พบโดยตรงถึงอาการ hallucination จาก ข้อมูลฝึกที่ไม่เพียงพอ เช่น การระบุ แพลตฟอร์มและรายละเอียดผิด
- คอนเทนต์ที่สร้างอัตโนมัติลักษณะนี้ไหลเข้าสู่ เว็บไซต์โฆษณาที่ทำเพื่อ SEO จำนวนมาก ยิ่งตอกย้ำโครงสร้างที่แพร่กระจาย ข้อมูลเท็จที่ดูน่าเชื่อถือ โดยไม่มีการตรวจสอบ
- สุดท้าย ฐานความรู้ร่วมกัน ของอินเทอร์เน็ตกำลังถูกทำลาย และข้อสรุปคือข้อมูลที่พอเชื่อถือได้ยังต้องพึ่ง เว็บไซต์เก่าแก่ที่มีชื่อเสียงตั้งแต่ก่อนยุค LLM
กรณีของ Phantasy Star Fukkokuban
- ‘Phantasy Star Fukkokuban’ สำหรับ Sega Genesis ที่วางจำหน่ายในญี่ปุ่นปี 1994 เป็นฉบับนำเกม Master System ต้นฉบับมาออกซ้ำตามเดิม
- คอนโซล Genesis บางเครื่องไม่สามารถรันเกม Master System ได้ ทำให้ตลับนี้ก็ใช้งานไม่ได้เช่นกัน
- ผู้เขียนกำลังตรวจสอบวันวางจำหน่ายของเกมนี้ และพบ เว็บไซต์ที่มีข้อมูลเท็จ อยู่ด้านบนของผลการค้นหา
- เว็บไซต์ปัญหาชื่อ ‘Press Start Gaming’ กล่าวถึง การปรับปรุงกราฟิก เอฟเฟกต์สภาพอากาศ และการเปลี่ยนกลางวันกลางคืน แต่สิ่งเหล่านี้ไม่มีอยู่ในเกมจริง
- แม้ประโยคแรกของบทความจะเป็น “Game data not found” แต่หลังจากนั้นกลับตามมาด้วย คำอธิบายที่ฟังดูน่าเชื่อซึ่งสร้างโดย AI
ปัญหา hallucination ของโมเดลภาษาขนาดใหญ่
- LLM ทำงานบนพื้นฐานของ การทำนายโทเคนถัดไป และสำหรับหัวข้อหายากที่ไม่มีในข้อมูลฝึก ก็จะสร้าง เรื่องแต่งที่ฟังดูสมจริง ขึ้นมา
- โดยนำซีรีส์ ‘Phantasy Star’ มารวมกับความหมายของคำว่า ‘Fukkokuban(ฉบับพิมพ์ซ้ำ)’ แล้วจินตนาการเป็น ฉบับรีเมกที่ไม่มีอยู่จริง
- เมื่อผู้เขียนขอให้ ChatGPT อธิบายเกมเดียวกัน ก็ได้รับคำตอบที่เข้าใจผิดว่าเป็น ชุดรวมเกมสำหรับ Sega Saturn
- ดูเหมือนว่าจะสับสนกับเกมอีกเกมหนึ่งที่มีอยู่จริงชื่อ ‘Phantasy Star Collection’
- ในทำนองเดียวกัน สำหรับเกมหายากอีกเกมที่ผู้เขียนกล่าวถึงคือ ‘Mahjong Daireikai’ ก็มี คำอธิบายปลอมที่สร้างโดย AI ปรากฏอยู่บนเว็บภาษาญี่ปุ่นเช่นกัน
การพังทลายของความน่าเชื่อถือบนอินเทอร์เน็ต
- เว็บไซต์ ‘Press Start Gaming’ คาดว่าเป็น แพลตฟอร์มคอนเทนต์อัตโนมัติเพื่อหารายได้จากโฆษณา
- ด้านล่างเว็บไซต์มีข้อความ “©2025 Cloud Gears Media” แต่ไม่ชัดเจนว่ามีความเกี่ยวข้องกับบริษัทจริงหรือไม่
- เว็บไซต์ลักษณะนี้ให้ความสำคัญกับ การติดอันดับค้นหา (SEO) มากกว่าการถ่ายทอดข้อเท็จจริง
- การมาถึงของ LLM ทำให้ ต้นทุนการผลิตข้อมูลเท็จลดลงอย่างมาก และคอนเทนต์ที่ไม่ผ่านการตรวจสอบก็แพร่กระจายเป็นจำนวนมาก
- ในอดีต แม้จะเป็นนักเขียนค่าจ้างต่ำ ก็ยังมีการตรวจสอบข้อเท็จจริงขั้นต่ำอยู่บ้าง แต่ตอนนี้ AI สามารถสร้างเรื่องแต่งทั้งชิ้นได้สมบูรณ์
- ผู้เขียนระบุว่า “ตอนนี้ยากที่จะเชื่อเว็บไซต์ใหม่ ๆ” และบอกว่าตนเองลงเอยด้วยการ พึ่งพาเฉพาะสื่อที่สร้างชื่อเสียงไว้ตั้งแต่ก่อนยุค AI
ความเสียหายต่อระบบนิเวศข้อมูลในยุค AI
- ผู้เขียนประเมินว่า “ความรู้ร่วมกัน(common) ของอินเทอร์เน็ต” ถูกทำลายไปแล้วในระดับ ยากจะย้อนคืน
- แม้แต่แหล่งข้อมูลที่เชื่อถือได้ก็ยังมี ความเสี่ยงจะปนเปื้อนด้วยคอนเทนต์ AI
- ยกตัวอย่างกรณีที่ Ars Technica เคยเผยแพร่บทความที่มีคำอ้างอิงซึ่งสร้างโดย AI ก่อนจะ แก้ไขและถอนบทความ
- หากวันหนึ่ง LLM รวมข้อมูลได้มากขึ้น ความแม่นยำอาจดีขึ้นได้ แต่ ความเสียหายในปัจจุบันได้เกิดขึ้นแล้ว
- ผู้เขียนบอกว่า “บทความนี้เป็นเพียงการระบายความโกรธ (rant)” พร้อมเน้นย้ำถึง ความรู้สึกจริงว่าความไว้วางใจในอินเทอร์เน็ตได้สูญหายไปแล้ว
บทสรุป
- ระบบนิเวศคอนเทนต์ที่ขับเคลื่อนด้วย AI และ SEO ให้ความสำคัญกับ ประสิทธิภาพการผลิต มากกว่าความจริงของข้อมูล
- ผลลัพธ์คือ บทความที่สร้างอัตโนมัติโดยไม่มีการตรวจสอบข้อเท็จจริง ถูกดันขึ้นสู่อันดับบนของการค้นหา และบ่อนทำลาย รากฐานของการเรียนรู้และการสำรวจของผู้ใช้
- ผู้เขียนปิดท้ายด้วยคำประกาศว่า “เราไม่สามารถเชื่ออินเทอร์เน็ตได้อีกต่อไป” พร้อมสื่อว่า การกู้คืนความน่าเชื่อถือของความรู้ดิจิทัลเป็นเรื่องเร่งด่วน
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
กำลังสร้าง mesh network ในเมืองของเรากับเพื่อนๆ
อินเทอร์เน็ตแบบเปิดนั้นเสื่อมลงมานานแล้ว แต่ LLM กำลังเร่งจุดจบของมัน
ตอนนี้ยอมรับแล้วว่าอินเทอร์เน็ตยุค 90 ถึงต้นยุค 2000 ได้ตายไปแล้ว
ต่อจากนี้คิดว่า local network ที่เชื่อถือได้คือทางเลือก
น่าเศร้าที่ความจริงคือเราต้องถอยกลับไปอยู่ในพื้นที่ปิดเพราะผู้คนที่สนใจแต่การหาเงิน
แกนหลักไม่ใช่เครือข่าย แต่เป็น คุณภาพของคอนเทนต์
แค่สร้างฟอรัมที่เชิญเฉพาะคนที่ไว้ใจได้ก็พอ
ขอให้โชคดีกับความพยายามนี้
ตอนนี้กำลังเกลา เครื่องเล่น MP3 แบบอิงเครือข่ายอยู่ ยังอยู่ช่วงต้นมากแต่ก็มองโลกในแง่ดี
ลิงก์โปรเจ็กต์
มีความคิดว่าเหตุผลที่ ข้อมูลผิดๆ ออนไลน์ทุกวันนี้มีมากกว่าเมื่อก่อนมาก อาจเป็นเพราะ prediction markets
มันเป็นโครงสร้างที่บิดเบือนการรับรู้ของผู้คนเพื่อจะได้เอาเงินไปเดิมพัน
หลังเหตุการณ์ ตัวนำยิ่งยวด LK99 ในปี 2023 ปรากฏการณ์แบบนี้ก็เพิ่มขึ้นอย่างรวดเร็ว
prediction markets ทำให้ข้อมูลซื้อขายกันด้วยเงินได้ แต่ไม่ได้ใหญ่พอจะคุ้มกับการปล่อย ข้อมูลเท็จโดยเจตนา
กลับกันคิดว่าสาเหตุหลักคือพวกนักการเมือง อินฟลูเอนเซอร์ และ ข้อมูลเท็จแบบมีส่วนร่วม ที่หวังรายได้จากโฆษณา
ปัญหาคือ การล่มสลายของความน่าเชื่อถือ บนอินเทอร์เน็ต
เมื่อก่อนแค่โดนข้อมูลผิดหลอกเป็นครั้งคราว แต่ตอนนี้เต็มไปด้วย คอนเทนต์ที่บอตผลิตซ้ำ
สัดส่วนคนต่อบอตแทบจะเข้าใกล้ศูนย์
สุดท้ายเราก็เหมือนเผาเว็บทิ้งกันไปเอง
ตอนนี้ดูเหมือนแม้แต่คนที่เคยควบคุมมันก็ไม่รู้แล้วว่ากำลังเกิดอะไรขึ้น
เพราะงั้นโมเดลตอนนี้อาจกลับกลายเป็นเวอร์ชันที่มีอคติน้อยที่สุดก็ได้
เคยคิดอยู่ว่าจะปกป้อง HN ยังไง แต่สุดท้ายก็ดูเหมือนจะไม่มีทางอื่นนอกจาก ระบบแบบเชิญเข้า
ช่วงนี้แค่จะอ่านคอมเมนต์ก็ยังสงสัยเลยว่าเป็นของคนจริงไหม จนเหนื่อยทางอารมณ์มาก
บรรยากาศเหมือนเชื่อ AI กันเป็นศาสนา มีทั้งบัญชีบอตและ คอมเมนต์ที่ผ่านการกรองด้วย AI ปนกันอยู่
Fediverse อย่าง Mastodon ยังดูสุขภาพดีอยู่ แต่สักวันหนึ่งที่นั่นก็คงปนเปื้อนเหมือนกัน
อัตราส่วนสัญญาณต่อสัญญาณรบกวน (SNR) ของอินเทอร์เน็ตตอนนี้ต่ำที่สุดเป็นประวัติการณ์
คิดว่าทางออกมีเพียง ลายเซ็นดิจิทัลที่ยืนยันว่าเป็นมนุษย์ เท่านั้น
ควรพิสูจน์ได้ว่าเป็นมนุษย์โดยยังรักษาความไม่เปิดเผยตัวตนไว้ได้ ผ่านระบบอย่าง eIDAS
ลิงก์การถกเถียงที่เกี่ยวข้อง
ต้องมีโครงสร้างที่รักษาความไม่เปิดเผยตัวตนไว้ได้ แต่ก็ป้องกัน Sybil attack ได้ด้วย
ฉันช็อกมากตอนหาวิดีโอเกี่ยวกับ Intel i7-4790T
วิดีโอส่วนใหญ่ช่วงนี้เป็นคอนเทนต์ ‘slop’ ที่อ่านจาก สคริปต์ที่ LLM สร้างขึ้น
ตัวผลิตภัณฑ์นี้ไม่เคยวางขายปลีกเลยด้วยซ้ำ แต่ช่อง YouTube ต่างๆ กลับอัปโหลดวันละหลายสิบคลิปเพื่อหารายได้จาก ลิงก์พันธมิตร Amazon
ตัวอย่างวิดีโอ1 / ตัวอย่างวิดีโอ2
ตอนนี้ต้นทุนการสร้างคอนเทนต์ปลอมใกล้ศูนย์แล้ว จึงต้องมี กลไกความน่าเชื่อถือที่ขยายขนาดได้
ส่วนตัวมองว่าโครงสร้างแบบ Web of Trust น่าสนใจ
บางคนอาจถูกกันออกไป แต่ก็คงหลีกเลี่ยงไม่ได้
ฉันกำลังสร้างตัวเก็บถาวรเสริมบน โปรโตคอล Gemini
ตั้งใจจะบันทึกเฉพาะเว็บที่ robots.txt อนุญาต
ไม่ใช่แค่รายบุคคล แต่ยังสร้างเครือข่ายความเชื่อถือระหว่างเว็บไซต์ได้ด้วย
อาจเริ่มจากชุมชนท้องถิ่นหรือกลุ่มงานอดิเรก แล้วค่อยๆ ขยายออกไป
ช่วงหลังตอนหาข้อมูลภาคใหม่ของ Hollow Knight ฉันเจอ เว็บไกด์ปลอม ที่ LLM สร้างหลายแห่ง
เกมเพิ่งออกมาแค่ 6 เดือน ข้อมูลจริงยังมีไม่มาก ดูเหมือนทำขึ้นเพื่อหารายได้จากโฆษณา
น่าสงสัยว่าแม้แต่ใน หัวข้อเฉพาะทาง แบบนี้ การทำคอนเทนต์ปลอมมันจะคุ้มจริงหรือ
เหมือน ‘ทฤษฎีความไม่สมมาตรของเรื่องไร้สาระ’ ใช้งานได้จริง
เว็บไซต์ที่ทำ SEO ได้แย่ กลับน่าเชื่อถือกว่าเสียอีก
อนาคตของอินเทอร์เน็ตน่าจะไปทาง ชุมชนแบบเชิญเข้า
น่าสงสัยว่าจะมีฟอรัมรุ่นใหม่เกิดขึ้น หรือเราจะย้อนกลับไปสู่ยุค PHPBB
มีแต่คอนเทนต์ที่ไม่ตกเป็นเป้าของเกมหรือสแปมเท่านั้นที่จะอยู่รอดได้
บรรยากาศคล้าย HN แต่ดำเนินการด้วย โครงสร้างแบบเชิญเท่านั้น