- Kagi Search เปิดตัว ‘SlopStop’ ระบบตรวจจับแบบมีส่วนร่วมจากชุมชน เพื่อช่วยทำความสะอาดเว็บที่ปนเปื้อนด้วย สแปมที่สร้างโดย AI และฟาร์มคอนเทนต์
- SlopStop แสดง ‘คะแนน AI slop’ แบบเรียลไทม์ของข้อความ·ภาพ·วิดีโอที่สร้างโดย AI ในผลการค้นหา และเปิดให้ผู้ใช้รายงานคอนเทนต์คุณภาพต่ำได้โดยตรง
- เสริมการแสดงผลข้อมูลที่น่าเชื่อถือมากขึ้นผ่าน การลดอันดับอัตโนมัติในระดับโดเมน และ ฟีเจอร์กรองสื่อที่สร้างโดย AI
- SlopStop ทำงานร่วมกับโปรเจกต์ ‘Small Web’ เพื่อจัดลำดับแสดงผลให้ ครีเอเตอร์ที่เป็นมนุษย์และคอนเทนต์ที่จริงใจ มาก่อน
- Kagi ตั้งเป้าสร้าง ชุดข้อมูล AI slop ที่ใหญ่ที่สุดในโลก จากระบบนี้ และมีแผนนำไปใช้กับเทคโนโลยีป้องกัน AI hallucination และข้อมูลเท็จในอนาคต
ความหมายของ AI Slop และแนวทางรับมือของ Kagi
- AI slop หมายถึง คอนเทนต์ AI ที่หลอกลวงหรือมีคุณค่าต่ำ ซึ่งถูกสร้างขึ้นเพื่อปั่นอันดับค้นหาหรือเรียกความสนใจ
- ตัวอย่างได้แก่ รีวิวปลอม, ความเชี่ยวชาญปลอม, ข้อมูลที่ผิด, และฟาร์มคอนเทนต์ที่มุ่งหารายได้
- Kagi ไม่ได้ปฏิเสธ AI โดยตัวมันเอง แต่ระบุว่า คอนเทนต์ AI ในรูปแบบที่เข้ามาแทนที่มุมมองและการเชื่อมโยงของมนุษย์ เป็นสิ่งที่เป็นอันตราย
- ปรัชญาของ Kagi คือ “ประสบการณ์การค้นหาที่มนุษย์ยังคงมีอำนาจควบคุม” และที่ผ่านมาได้ลดอันดับเพจคุณภาพต่ำที่ขับเคลื่อนด้วยโฆษณาและตัวติดตามอยู่แล้ว
- SlopStop ขยายจากฟิลเตอร์ภาพเดิมไปสู่การตรวจจับ คอนเทนต์ที่สร้างโดย AI ในทุกประเภท ทั้งวิดีโอ บทความ และโดเมน
วิธีการทำงานของ SlopStop
- มีการเพิ่มฟีเจอร์ แสดงคะแนน AI slop ในผลการค้นหา เพื่อให้ผู้ใช้ตรวจสอบความน่าเชื่อถือของคอนเทนต์ได้ทันที
- ผู้ใช้สามารถแจ้งคอนเทนต์คุณภาพต่ำในผลลัพธ์เว็บ ภาพ และวิดีโอ ผ่านฟีเจอร์ ‘รายงานว่าเป็นคอนเทนต์ที่สร้างโดย AI’
- Kagi จะตรวจสอบร่วมกับสัญญาณภายในของตนเอง และ ลดอันดับโดเมนที่มีสัดส่วนคอนเทนต์ AI สูงโดยอัตโนมัติ
- ในกรณีของโดเมนแบบผสม จะ ติดป้ายว่าเป็นคอนเทนต์ที่สร้างโดย AI เฉพาะในระดับหน้าเพจ
- ภาพและวิดีโอที่สร้างโดย AI จะถูกติดป้ายและลดอันดับโดยอัตโนมัติทันทีที่ยืนยันได้ และผู้ใช้ยังสามารถเลือก ฟิลเตอร์บล็อกสื่อ AI ทั้งหมด ได้
- CEO Vlad กล่าวถึงเรื่องนี้ว่า “AI slop เป็น ภัยคุกคามเชิงอัตถิภาวนิยม ต่ออินเทอร์เน็ตที่ยึดมนุษย์เป็นศูนย์กลาง และ SlopStop คือก้าวแรกในการกำจัดมัน”
การผสาน SlopStop กับ Small Web
- แม้ความก้าวหน้าของ AI จะรวดเร็ว แต่ SlopStop และ Small Web มีเป้าหมายร่วมกันในการ ฟื้นฟูระบบนิเวศเว็บที่ยึดมนุษย์เป็นศูนย์กลาง
- Small Web สร้าง ไวต์ลิสต์ของครีเอเตอร์มนุษย์ที่ผ่านการตรวจสอบแล้ว เพื่อให้คอนเทนต์ที่จริงใจถูกแสดงก่อน
- ยิ่ง SlopStop คัดกรองคอนเทนต์ AI ได้มากเท่าไร การมองเห็นของคอนเทนต์ที่สร้างสรรค์และมีความเป็นมนุษย์ ก็ยิ่งเพิ่มขึ้น
- ทั้งสองระบบทำหน้าที่เป็น กลไกป้องกันสองชั้นเพื่อปกป้องอินเทอร์เน็ตจากการทำให้เป็นเชิงพาณิชย์และการปนเปื้อนแบบจงใจ
การสร้างและการใช้งานชุดข้อมูล AI Slop
- SlopStop เป็นอีกขั้นของการเสริม ความน่าเชื่อถือทั่วทั้งระบบนิเวศของ Kagi โดยตั้งเป้าสร้าง ชุดข้อมูลโดเมน AI slop ที่ใหญ่ที่สุดในโลก ผ่านการผสานข้อมูลรายงานจากชุมชนกับเทคโนโลยีตรวจจับภายใน
- ชุดข้อมูลนี้มีแผนนำไปใช้พัฒนา เทคโนโลยีตรวจจับเพื่อป้องกัน AI hallucination, คำกล่าวอ้างเท็จ และข้อมูลผิด
- Kagi อ้างอิงผลสำรวจของ NewsGuard ว่า แชตบอตอื่น ๆ สร้างคำตอบที่เป็นเท็จ 30~41%
- ฐานข้อมูลนี้มีแผนจะเปิดเผยในอนาคต และ ผู้ใช้ที่สนใจสามารถลงทะเบียนเพื่อรับอัปเดตได้
การมีส่วนร่วมของผู้ใช้และการคุ้มครองคุณภาพ
- Kagi เดินหน้าพัฒนาโซลูชันอัตโนมัติขั้นสุดท้ายผ่าน การดำเนินงาน SlopStop แบบคราวด์ซอร์ส
- ผู้ใช้สามารถมีส่วนร่วมได้โดย คลิกไอคอนรูปโล่ข้างผลการค้นหา → เลือก ‘รายงานว่าเป็นคอนเทนต์ที่สร้างโดย AI’
- ทุกการรายงานจะถูก ทีมตรวจสอบของ Kagi ยืนยันก่อนนำไปใช้, ช่วยยกระดับคุณภาพการค้นหา
- Kagi มี เอกสารทางเทคนิคและฟอรัม ของ SlopStop เพื่ออธิบายวิธีทำงานและเปิดช่องทางรับฟีดแบ็ก
- Kagi เน้นย้ำว่า “การมีส่วนร่วมของผู้ใช้ทุกคนช่วยสร้าง ประสบการณ์การค้นหาที่น่าเชื่อถือยิ่งขึ้น”
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
ชอบแนวทางแบบ ขับเคลื่อนโดยชุมชน ของ Kagi มาก รายการ Small Web ที่เปิดเผยสาธารณะมีประโยชน์จริง ๆ
พอใช้ smallweb filter บน HN หน้าแรกจะดูสดใหม่ขึ้นมาก
บางครั้งก็มีบทความที่มีมุมมองดีมาก แต่ดันใส่ภาพ header ที่สร้างด้วย AI มา ถ้าเนื้อหาจริง ผมก็ไม่อยากกรองบทความแบบนั้นทิ้ง เลยสงสัยว่าการแยกประเภทในเอกสารจะทำให้กรองละเอียดระดับนี้ได้ไหม
เช่นกรณี “Will Smith กินสปาเกตตี” ถ้าเทียบเอนโทรปีของฉากจริงกับฉากที่สร้างขึ้น น่าจะเห็นความต่างชัดเจน ท้ายที่สุดแล้วสิ่งที่ “ดูเหมือนของจริง” ก็คือสิ่งที่ตรงกับระดับเอนโทรปีที่เราคาดหวังไว้นั่นเอง
การเพิ่มเอนโทรปีแบบประดิษฐ์ให้ AI ทำได้ง่าย สุดท้ายมันก็จะกลายเป็น สงครามข้อมูล และคนทั่วไปจะเป็นฝ่ายโดนผลกระทบ
ข้อความมีความหนาแน่นของข้อมูลสูงเกินไป และโมเดลตระกูล GPT กลับถูกฝึกมาให้ลดเอนโทรปีแบบที่คุณพูดถึงด้วยซ้ำ
แถม AI เองก็สามารถถูกฝึกให้ หลอกการตรวจจับ แบบนั้นได้อยู่ดี
ไม่นานมานี้ลองกลับไปใช้ Google Search แล้ว มันแย่มากจริง ๆ
ผมต้องการ อินเทอร์เน็ตที่เงียบสงบ — ถามแล้วได้คำตอบ ไม่มีเจตนาแอบแฝง ไม่มีโฆษณา มีแต่คำตอบที่จริงใจ
คนส่วนใหญ่น่าจะแยกข้อความ AI ที่หลุดจาก “น้ำเสียงมาตรฐาน” ของพรอมป์ต์ไม่ออก
วงจรแบบนี้จะดำเนินต่อไปเรื่อย ๆ และมันคล้ายกับโครงสร้างของ GAN (Generative Adversarial Network)
แต่บนเว็บจริงทุกวันนี้ก็ยังเต็มไปด้วย AI slop อยู่ดี
ผมมักค้นหาข้อมูลที่ข้อเท็จจริงสำคัญ ดังนั้นมากกว่าจะสนว่าตรวจพบ AI ไหม ผมสน ความน่าเชื่อถือของแหล่งที่มา มากกว่า
สุดท้ายแล้วประเด็นสำคัญคือใครเป็นคนเขียนโดยเอาชื่อหรือชื่อเสียงของตัวเองมาค้ำไว้
ไม่เข้าใจว่าทำไม CEO บางคนถึงดื้อดึงขนาดนี้ ผู้คนไม่ชอบคอนเทนต์สังเคราะห์ แต่พวกเขาก็ยังหมกมุ่นอยู่กับมัน
อย่าง วิดีโอนี้, วิดีโอนี้ ต่างก็ทำจากสคริปต์ที่ GPT เขียน ภาพประกอบ AI และเสียง AI
บน Reddit ก็มีโพสต์ที่ GPT เขียนขึ้นไปติดอันดับสูง และคนก็ชมว่าเป็น “อุปมาอันงดงาม”
สุดท้ายแล้วคนจำนวนมากก็ ชอบเสพคอนเทนต์ AI โดยรู้ตัวหรือไม่รู้ตัว
อย่างที่เห็นใน issue นี้ การตัดออกทั้งหมดทำได้ยากเพราะ ประสิทธิภาพทางเศรษฐกิจ
ทุกวันนี้หาคอนเทนต์จริงแท้ยากมาก
ปัญหาไม่ใช่ตัวคอนเทนต์ AI เองเท่านั้น แต่คือ สภาพแวดล้อมที่ทำให้ผู้สร้างที่ตั้งใจจริงถูกกลบหาย
การตรวจจับก็ซับซ้อนขึ้นเรื่อย ๆ และ AI ก็เจ้าเล่ห์ขึ้นเรื่อย ๆ เป็นการดวลแบบไม่รู้จบระหว่าง การตรวจจับกับการหลบเลี่ยง
ผมสนับสนุนทุกความพยายามที่จะหยุด น้ำท่วมของ AI slop ในผลการค้นหา
ให้ความรู้สึกเหมือน SEO spam สมัยก่อนกลับมาอีกครั้ง แค่เปลี่ยนแพ็กเกจเท่านั้นเอง
เหตุผลที่เสิร์ชเอนจินอื่นชอบของแบบนี้ก็เพราะมันช่วยเสริมบทบาทการเป็น ประตูทางเข้า ได้โดยไม่ต้องสร้างคอนเทนต์เอง
เพราะ AI summary กำลังมาแทนที่คอนเทนต์แนวล่อคลิกของพวกเขา
บางทีเบื้องหลังขบวนการกรองพวกนี้อาจเป็นพวกเขาก็ได้