ตอนนี้อินเทอร์เน็ตกลายเป็นพื้นที่ที่เครื่องคุยกันเอง
- อินเทอร์เน็ตได้เปลี่ยนจากพื้นที่ที่ผู้คนใช้ถามและตอบกันอย่างเรียบง่าย ไปเป็นพื้นที่ที่เต็มไปด้วยข้อมูลผิดพลาดที่สร้างโดย AI
- ผู้ใช้ Google พบว่า Google ให้ข้อมูลผิด ๆ ว่าไข่สามารถละลายได้ เรื่องนี้เกิดจากการที่ Google แทนที่จะแสดงเว็บไซต์โดยตรง กลับแสดงสแนปช็อตของหน้าเว็บในเมนูแบบดรอปดาวน์ ทำให้ผู้ใช้สามารถอ่านผลการค้นหาได้โดยไม่ต้องคลิก
- ช่วงหลังมานี้ความไร้ประโยชน์ของ Google Search เพิ่มขึ้นเรื่อย ๆ เช่น กรณีที่ค้นหาโรคไซนัสอักเสบเรื้อรัง แต่กลับได้ผลลัพธ์เกี่ยวกับอวัยวะเพศชายที่อักเสบ
การ "ช่วงชิง" ทราฟฟิกอินเทอร์เน็ต และประเด็นบทความ AI ของ Sports Illustrated
- เมื่อวานนี้ มีผู้ใช้ Twitter คนหนึ่งอ้างว่ามีการ "ช่วงชิง" ทราฟฟิกอินเทอร์เน็ต เขาดูดัชนีเว็บไซต์ของเว็บคู่แข่ง ดึง URL ของบทความออกมา แล้วใช้ AI เขียนบทความอย่างรวดเร็ว
- นอกจากนี้ ยังมีการเปิดเผยว่า Sports Illustrated เผยแพร่บทความที่เขียนด้วย AI และตีพิมพ์ในชื่อของบุคคลที่ไม่มีตัวตนจริง หลังจากมีการสอบถามเกี่ยวกับเรื่องนี้ เนื้อหาดังกล่าวก็ถูกลบออก
การทำลายล้างอินเทอร์เน็ตในระดับรากฐาน
- อินเทอร์เน็ตไม่ใช่พื้นที่สำหรับการสื่อสารระหว่างผู้คนอีกต่อไป แต่ได้เสื่อมสภาพจนกลายเป็นพื้นที่ที่เครื่องคุยกันเอง
- คำว่า "ไปถาม Google สิ" ตอนนี้แทบไม่มีความหมายอีกแล้ว เพราะมีโอกาสสูงที่จะได้ข้อมูลผิดหรือแม้แต่เรื่องแต่งล้วน ๆ
- บริษัทอย่าง Sports Illustrated สนใจการดันอันดับผลค้นหาบน Google และเพิ่มรายได้โฆษณามากกว่าการให้บริการที่มีคุณค่าต่อผู้อ่าน
ความเห็นของ GN⁺
- คุณภาพของข้อมูลบนอินเทอร์เน็ตกำลังลดลงเรื่อย ๆ และสร้างความสับสนรวมถึงความไม่สะดวกให้ผู้ใช้
- หนึ่งในผลข้างเคียงของความก้าวหน้าด้าน AI คือข้อมูลผิดพลาดที่ AI สร้างขึ้นทำให้การค้นหาข้อมูลที่เชื่อถือได้ยากขึ้น
- การเปลี่ยนแปลงนี้ทำให้ผู้ใช้ต้องกลับมาทบทวนวิธีการรับข้อมูลจากอินเทอร์เน็ต และชี้ให้เห็นถึงความจำเป็นของแนวทางใหม่เพื่อรับประกันคุณภาพของข้อมูล
1 ความคิดเห็น
ความเห็นจาก Hacker News
หนึ่งในปัญหาที่เกิดจากการแพร่หลายของโมเดลภาษาขนาดใหญ่ (Large Language Models, LLMs) คือ ในอดีตเราเคยมีฮิวริสติกที่มีประโยชน์ในการคัดกรองโพสต์ไร้ค่าได้อย่างรวดเร็วจากการสะกดหรือไวยากรณ์ที่ผิดพลาด แต่ตอนนี้คอนเทนต์ที่ AI สร้างขึ้นมีความสามารถทางภาษาที่สมบูรณ์แบบ จนวิธีนั้นใช้ไม่ได้อีกต่อไป ตัวอย่างเช่น โปรเจกต์ curl เคยประสบปัญหาจากรายงานบั๊กปลอมที่ AI สร้างขึ้น และคาดว่าปัญหานี้จะยิ่งรุนแรงขึ้นในอนาคต
มีความเห็นที่แม้จะเห็นด้วยว่าอินเทอร์เน็ตกำลังเปลี่ยนไป แต่ก็มองว่าอินเทอร์เน็ตก่อนยุค GPT-4, 3, 2 ก็ไม่ได้ต่างมากนัก บทความหัวข้อทั่วไปที่เขียนโดยเด็กฝึกงานหรือผู้ช่วยเสมือนจากอินเดีย ส่วนใหญ่ก็แย่พอๆ กับคอนเทนต์ที่ AI สร้างและแยกออกได้ยาก ปัญหาอีกอย่างคือเสิร์ชเอนจินจัดอันดับตามชื่อเสียงมากกว่าการที่ข้อความบนหน้าเว็บตรงกับคำค้น ผู้คนตอนนี้ใช้ชีวิตอยู่ในแอปมากกว่าเว็บ และคุณภาพของเว็บก็แย่ลงมานานแล้วจนอีกไม่นานอาจไม่สำคัญอีก หากอินเทอร์เน็ตยังคงอยู่ต่อไป ก็หวังว่าจะย้ายไปสู่ชั้นที่ไม่ระบุตัวตนแบบใหม่ และพัฒนาไปในทิศทางที่ต้องมีการแลกเปลี่ยนเงินบ่อยขึ้นเพื่อลดการสร้างคอนเทนต์คุณภาพต่ำ
ท่ามกลางสภาพของ clearnet ที่ย่ำแย่ในปัจจุบัน ก็มีความเห็นว่าการที่ข้อมูลถูกกักอยู่ภายใน Discord อาจไม่ได้เลวร้ายนัก เพราะเมื่อไม่ถูกเสิร์ชเอนจินทำดัชนี ก็จะหลีกเลี่ยงการไปโผล่ปะปนกับขยะ AI หรือถูกนำไปใช้เป็นข้อมูลฝึกได้ อนาคตของอินเทอร์เน็ตขึ้นอยู่กับมนุษย์ และตอนนี้เครื่องจักรก็ไม่น่าไว้วางใจแม้แต่กับงานพื้นฐานแล้ว
มีการแชร์ประสบการณ์จากโปรเจกต์ BeamMP เกี่ยวกับรายงานบั๊กปลอมและ PRs (พูลรีเควสต์) ที่ AI สร้างขึ้น สิ่งที่ AI สร้างเหล่านี้ระบุได้ไม่ยาก โดยมักมีลักษณะอย่างการแก้โค้ดที่ไม่เกี่ยวข้อง หรือเสนอวิธีแก้ที่คอมไพล์ไม่ผ่าน มนุษย์จริงๆ นั้นขี้เกียจจึงไม่ทำงานที่ไม่จำเป็น และเพราะขยะที่ AI สร้างเป็นการเสียเวลา จึงไม่ควรถูก merge
การรักษาความแท้จริงบนอินเทอร์เน็ตเป็นเรื่องสำคัญ มีเพียงคอนเทนต์ที่มีลายเซ็นกำกับเท่านั้นที่รับประกันความแท้จริงได้ ในสถานการณ์ที่ AI สามารถโพสต์ได้มากขึ้น วิธีกรองเพียงอย่างเดียวคือพึ่งพาความน่าเชื่อถือและความแท้จริงที่ทำให้เรารู้ได้ว่าใครเป็นผู้โพสต์อะไร และพวกเขากำลังพูดถึงอะไร Web of Trust เคยถูกลองใช้มาแล้วแต่ไม่เคยเข้าสู่กระแสหลัก และอาจถึงเวลาที่ต้องลองอีกครั้ง
ยังมีความเห็นว่านี่เป็นปัญหาเก่าที่ LLM เพียงเร่งให้รุนแรงขึ้น เมื่อ Google พยายามเพิ่มรายได้จากโฆษณาและอำนาจครอบงำด้านเทคโนโลยีโฆษณา SEO ก็แพร่หลายในผลการค้นหา จนทำให้เข้าถึงข้อมูลที่เป็นกลางได้ยาก การค้นหาข้อมูลจาก Reddit ก่อนอาจเป็นทางออกได้ แต่ Reddit เองก็เต็มไปด้วยคอนเทนต์ที่ถูกปั่นแต่งในช่วงไม่กี่ปีที่ผ่านมา
มีความเห็นว่าอินเทอร์เน็ตนั้นเต็มไปด้วยขยะที่มนุษย์สร้างจาก SEO อยู่ก่อนแล้ว ดังนั้นการมาของ "AI" จึงไม่ได้ทำให้เราสูญเสียอะไรไปมากนัก และก็มีคนในอุตสาหกรรมที่ชี้ปัญหานี้มานานแล้ว
โฆษณานั้นมีจุดหมายเพื่อทำเงินในท้ายที่สุด และตราบใดที่บอตไม่มีบัตรเครดิต เงินนั้นก็ยังหมายถึงเงินจากมนุษย์ บริษัทอย่าง Google ต่อให้ทราฟฟิกเพิ่มขึ้น หากมันไม่เปลี่ยนเป็นการใช้จ่ายของมนุษย์ ก็จะเริ่มรับรู้ผลกระทบทางการเงินได้ การปลดพนักงานครั้งใหญ่ในสายเทคโนโลยีที่เกิดขึ้นเมื่อไม่นานมานี้ อาจเป็นสัญญาณว่าการตอบสนองต่อปัญหานี้ได้เริ่มต้นขึ้นแล้ว
หากเคยอ่านหนังสือเรื่อง "Anathem" ก็อาจมองว่าภารกิจของเราคือการคัดกรองขยะออกจาก Reticulum