5 คะแนน โดย GN⁺ 2025-11-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • Kagi Search เปิดตัว ‘SlopStop’ ระบบตรวจจับแบบมีส่วนร่วมจากชุมชน เพื่อช่วยทำความสะอาดเว็บที่ปนเปื้อนด้วย สแปมที่สร้างโดย AI และฟาร์มคอนเทนต์
  • SlopStop แสดง ‘คะแนน AI slop’ แบบเรียลไทม์ของข้อความ·ภาพ·วิดีโอที่สร้างโดย AI ในผลการค้นหา และเปิดให้ผู้ใช้รายงานคอนเทนต์คุณภาพต่ำได้โดยตรง
  • เสริมการแสดงผลข้อมูลที่น่าเชื่อถือมากขึ้นผ่าน การลดอันดับอัตโนมัติในระดับโดเมน และ ฟีเจอร์กรองสื่อที่สร้างโดย AI
  • SlopStop ทำงานร่วมกับโปรเจกต์ ‘Small Web’ เพื่อจัดลำดับแสดงผลให้ ครีเอเตอร์ที่เป็นมนุษย์และคอนเทนต์ที่จริงใจ มาก่อน
  • Kagi ตั้งเป้าสร้าง ชุดข้อมูล AI slop ที่ใหญ่ที่สุดในโลก จากระบบนี้ และมีแผนนำไปใช้กับเทคโนโลยีป้องกัน AI hallucination และข้อมูลเท็จในอนาคต

ความหมายของ AI Slop และแนวทางรับมือของ Kagi

  • AI slop หมายถึง คอนเทนต์ AI ที่หลอกลวงหรือมีคุณค่าต่ำ ซึ่งถูกสร้างขึ้นเพื่อปั่นอันดับค้นหาหรือเรียกความสนใจ
    • ตัวอย่างได้แก่ รีวิวปลอม, ความเชี่ยวชาญปลอม, ข้อมูลที่ผิด, และฟาร์มคอนเทนต์ที่มุ่งหารายได้
  • Kagi ไม่ได้ปฏิเสธ AI โดยตัวมันเอง แต่ระบุว่า คอนเทนต์ AI ในรูปแบบที่เข้ามาแทนที่มุมมองและการเชื่อมโยงของมนุษย์ เป็นสิ่งที่เป็นอันตราย
  • ปรัชญาของ Kagi คือ “ประสบการณ์การค้นหาที่มนุษย์ยังคงมีอำนาจควบคุม” และที่ผ่านมาได้ลดอันดับเพจคุณภาพต่ำที่ขับเคลื่อนด้วยโฆษณาและตัวติดตามอยู่แล้ว
  • SlopStop ขยายจากฟิลเตอร์ภาพเดิมไปสู่การตรวจจับ คอนเทนต์ที่สร้างโดย AI ในทุกประเภท ทั้งวิดีโอ บทความ และโดเมน

วิธีการทำงานของ SlopStop

  • มีการเพิ่มฟีเจอร์ แสดงคะแนน AI slop ในผลการค้นหา เพื่อให้ผู้ใช้ตรวจสอบความน่าเชื่อถือของคอนเทนต์ได้ทันที
  • ผู้ใช้สามารถแจ้งคอนเทนต์คุณภาพต่ำในผลลัพธ์เว็บ ภาพ และวิดีโอ ผ่านฟีเจอร์ ‘รายงานว่าเป็นคอนเทนต์ที่สร้างโดย AI’
    • Kagi จะตรวจสอบร่วมกับสัญญาณภายในของตนเอง และ ลดอันดับโดเมนที่มีสัดส่วนคอนเทนต์ AI สูงโดยอัตโนมัติ
    • ในกรณีของโดเมนแบบผสม จะ ติดป้ายว่าเป็นคอนเทนต์ที่สร้างโดย AI เฉพาะในระดับหน้าเพจ
  • ภาพและวิดีโอที่สร้างโดย AI จะถูกติดป้ายและลดอันดับโดยอัตโนมัติทันทีที่ยืนยันได้ และผู้ใช้ยังสามารถเลือก ฟิลเตอร์บล็อกสื่อ AI ทั้งหมด ได้
  • CEO Vlad กล่าวถึงเรื่องนี้ว่า “AI slop เป็น ภัยคุกคามเชิงอัตถิภาวนิยม ต่ออินเทอร์เน็ตที่ยึดมนุษย์เป็นศูนย์กลาง และ SlopStop คือก้าวแรกในการกำจัดมัน”

การผสาน SlopStop กับ Small Web

  • แม้ความก้าวหน้าของ AI จะรวดเร็ว แต่ SlopStop และ Small Web มีเป้าหมายร่วมกันในการ ฟื้นฟูระบบนิเวศเว็บที่ยึดมนุษย์เป็นศูนย์กลาง
  • Small Web สร้าง ไวต์ลิสต์ของครีเอเตอร์มนุษย์ที่ผ่านการตรวจสอบแล้ว เพื่อให้คอนเทนต์ที่จริงใจถูกแสดงก่อน
  • ยิ่ง SlopStop คัดกรองคอนเทนต์ AI ได้มากเท่าไร การมองเห็นของคอนเทนต์ที่สร้างสรรค์และมีความเป็นมนุษย์ ก็ยิ่งเพิ่มขึ้น
  • ทั้งสองระบบทำหน้าที่เป็น กลไกป้องกันสองชั้นเพื่อปกป้องอินเทอร์เน็ตจากการทำให้เป็นเชิงพาณิชย์และการปนเปื้อนแบบจงใจ

การสร้างและการใช้งานชุดข้อมูล AI Slop

  • SlopStop เป็นอีกขั้นของการเสริม ความน่าเชื่อถือทั่วทั้งระบบนิเวศของ Kagi โดยตั้งเป้าสร้าง ชุดข้อมูลโดเมน AI slop ที่ใหญ่ที่สุดในโลก ผ่านการผสานข้อมูลรายงานจากชุมชนกับเทคโนโลยีตรวจจับภายใน
  • ชุดข้อมูลนี้มีแผนนำไปใช้พัฒนา เทคโนโลยีตรวจจับเพื่อป้องกัน AI hallucination, คำกล่าวอ้างเท็จ และข้อมูลผิด
  • Kagi อ้างอิงผลสำรวจของ NewsGuard ว่า แชตบอตอื่น ๆ สร้างคำตอบที่เป็นเท็จ 30~41%
  • ฐานข้อมูลนี้มีแผนจะเปิดเผยในอนาคต และ ผู้ใช้ที่สนใจสามารถลงทะเบียนเพื่อรับอัปเดตได้

การมีส่วนร่วมของผู้ใช้และการคุ้มครองคุณภาพ

  • Kagi เดินหน้าพัฒนาโซลูชันอัตโนมัติขั้นสุดท้ายผ่าน การดำเนินงาน SlopStop แบบคราวด์ซอร์ส
  • ผู้ใช้สามารถมีส่วนร่วมได้โดย คลิกไอคอนรูปโล่ข้างผลการค้นหา → เลือก ‘รายงานว่าเป็นคอนเทนต์ที่สร้างโดย AI’
  • ทุกการรายงานจะถูก ทีมตรวจสอบของ Kagi ยืนยันก่อนนำไปใช้, ช่วยยกระดับคุณภาพการค้นหา
  • Kagi มี เอกสารทางเทคนิคและฟอรัม ของ SlopStop เพื่ออธิบายวิธีทำงานและเปิดช่องทางรับฟีดแบ็ก
  • Kagi เน้นย้ำว่า “การมีส่วนร่วมของผู้ใช้ทุกคนช่วยสร้าง ประสบการณ์การค้นหาที่น่าเชื่อถือยิ่งขึ้น

1 ความคิดเห็น

 
GN⁺ 2025-11-14
ความคิดเห็นจาก Hacker News
  • นี่เป็นข่าวที่ น่าสนใจมาก อยากให้ HN เอาไอเดียนี้ไปทำธงลักษณะคล้ายกันบ้าง
    • ได้ขอสิทธิ์เข้าถึงฐานข้อมูลจาก @freediver แล้ว น่าจะถูกรวมเข้า hcker.news เร็ว ๆ นี้
      ชอบแนวทางแบบ ขับเคลื่อนโดยชุมชน ของ Kagi มาก รายการ Small Web ที่เปิดเผยสาธารณะมีประโยชน์จริง ๆ
      พอใช้ smallweb filter บน HN หน้าแรกจะดูสดใหม่ขึ้นมาก
    • เห็นด้วย
  • HN ก็ควรมีอะไรแบบนี้เหมือนกัน น่าจะมี ที่หลบภัยอันปลอดภัย จากคอนเทนต์แนวสแปมขั้นสูงพวกนี้
    • วิธีแก้ง่ายมาก แค่บังคับ ยืนยันความเป็นมนุษย์ สำหรับทุกคอมเมนต์ เช่น ให้ส่งเลือดมาหยดหนึ่งต่อคอมเมนต์
  • ในเอกสารมีการแยกระหว่าง slop แบบรูปภาพ วิดีโอ และ “เว็บเพจ” เลยสงสัยว่ามีทาง กรองแบบเข้มข้น เฉพาะเว็บเพจ slop ได้ไหม
    บางครั้งก็มีบทความที่มีมุมมองดีมาก แต่ดันใส่ภาพ header ที่สร้างด้วย AI มา ถ้าเนื้อหาจริง ผมก็ไม่อยากกรองบทความแบบนั้นทิ้ง เลยสงสัยว่าการแยกประเภทในเอกสารจะทำให้กรองละเอียดระดับนี้ได้ไหม
  • อยากให้มี คนฉลาด ๆ มาศึกษาทฤษฎีที่ผมมีอยู่ แกนสำคัญของการตรวจจับอาจเป็นการเรียนรู้ ความต่างของเอนโทรปี ระหว่างคอนเทนต์ที่มนุษย์เขียนกับที่ LLM เขียน
    เช่นกรณี “Will Smith กินสปาเกตตี” ถ้าเทียบเอนโทรปีของฉากจริงกับฉากที่สร้างขึ้น น่าจะเห็นความต่างชัดเจน ท้ายที่สุดแล้วสิ่งที่ “ดูเหมือนของจริง” ก็คือสิ่งที่ตรงกับระดับเอนโทรปีที่เราคาดหวังไว้นั่นเอง
    • ผมไม่คิดว่า AI slop จะแก้ AI slop ได้ เศรษฐกิจแบบโฆษณาและการแย่งชิงความสนใจมันก็ กลายเป็น slop อยู่แล้ว และ AI แค่ทำให้มันชัดขึ้นเท่านั้น
      การเพิ่มเอนโทรปีแบบประดิษฐ์ให้ AI ทำได้ง่าย สุดท้ายมันก็จะกลายเป็น สงครามข้อมูล และคนทั่วไปจะเป็นฝ่ายโดนผลกระทบ
    • จริง ๆ แล้วนั่นก็คือหลักการพื้นฐานของ “ตัวตรวจจับ AI” นั่นแหละ เป็นโมเดลที่ฝึกมาเพื่อแยกคอนเทนต์มนุษย์กับคอนเทนต์ที่ LLM สร้าง แต่ก็อย่างที่รู้กัน ความแม่นยำแย่มาก
    • ความพยายามแบบนั้นมีอยู่แล้ว สำหรับภาพยังพอใช้ได้เพราะมี artifact ของ diffusion model แต่กับข้อความมันไม่ค่อยเวิร์ก
      ข้อความมีความหนาแน่นของข้อมูลสูงเกินไป และโมเดลตระกูล GPT กลับถูกฝึกมาให้ลดเอนโทรปีแบบที่คุณพูดถึงด้วยซ้ำ
    • มันอาจใช้แยกรูปถ่ายจริงกับรูปที่ AI สร้างได้ แต่สำหรับข้อความ ผมว่าเอนโทรปีไม่ได้สำคัญขนาดนั้น
      แถม AI เองก็สามารถถูกฝึกให้ หลอกการตรวจจับ แบบนั้นได้อยู่ดี
    • ผมนึกว่า “Will Smith สปาเกตตีเทสต์” เป็นมุกล้อเล่น พอลองค้นดูแล้วดันมีจริง ตกใจเลย
  • อินเทอร์เน็ตยังไม่ตายหรอก แต่เริ่ม มีกลิ่นแปลก ๆ แล้ว
  • ผมเป็นผู้ใช้ Kagi แบบเสียเงินมา 1 ปีแล้ว เป็นการจ่ายเงินที่ คุ้มค่าที่สุด เท่าที่เคยมีมา
    ไม่นานมานี้ลองกลับไปใช้ Google Search แล้ว มันแย่มากจริง ๆ
    ผมต้องการ อินเทอร์เน็ตที่เงียบสงบ — ถามแล้วได้คำตอบ ไม่มีเจตนาแอบแฝง ไม่มีโฆษณา มีแต่คำตอบที่จริงใจ
  • ผมคิดว่าวิธีที่ขยายขนาดได้จริงสุดท้ายคงเป็น ให้ AI ระบุ AI ด้วยกันเอง ใช่ไหม แน่นอนว่ายังต้องมีมนุษย์ตรวจทาน
    คนส่วนใหญ่น่าจะแยกข้อความ AI ที่หลุดจาก “น้ำเสียงมาตรฐาน” ของพรอมป์ต์ไม่ออก
    • โมเดลรุ่นถัดไปจะพัฒนาโดยตัดตัวอย่างที่ถูกจัดว่าเป็น AI ออกจากข้อมูลฝึก
      วงจรแบบนี้จะดำเนินต่อไปเรื่อย ๆ และมันคล้ายกับโครงสร้างของ GAN (Generative Adversarial Network)
    • การให้ AI มาจับ AI ก็คล้ายกับภาพฝันเรื่อง alignment ว่า “AI ที่ดีจะชนะ AI ที่ไม่ดี” มีความเป็นไปได้อยู่ แต่พึ่งพาสมมติฐานมากเกินไป
    • ถ้า AI ตรวจจับ AI ได้จริง ปัญหานี้ก็คงถูกแก้ไปนานแล้ว ประเด็นสำคัญคือ ความน่าเชื่อถือยังไม่พอ
    • ถ้าจัดการพรอมป์ต์อย่างระมัดระวัง ก็สร้างข้อความที่ตรวจจับได้ยากมากได้
      แต่บนเว็บจริงทุกวันนี้ก็ยังเต็มไปด้วย AI slop อยู่ดี
      ผมมักค้นหาข้อมูลที่ข้อเท็จจริงสำคัญ ดังนั้นมากกว่าจะสนว่าตรวจพบ AI ไหม ผมสน ความน่าเชื่อถือของแหล่งที่มา มากกว่า
      สุดท้ายแล้วประเด็นสำคัญคือใครเป็นคนเขียนโดยเอาชื่อหรือชื่อเสียงของตัวเองมาค้ำไว้
  • ตอนนี้โลกเหมือนถูกแบ่งเป็นสองจักรวาล จักรวาลหนึ่งคือ ยัดเยียดคอนเทนต์สร้างด้วย AI อีกจักรวาลคือปฏิเสธมันอย่างถึงที่สุด
    ไม่เข้าใจว่าทำไม CEO บางคนถึงดื้อดึงขนาดนี้ ผู้คนไม่ชอบคอนเทนต์สังเคราะห์ แต่พวกเขาก็ยังหมกมุ่นอยู่กับมัน
    • บน YouTube มีกลุ่มผู้ชม ขนาดใหญ่มาก ที่เพลิดเพลินกับคอนเทนต์ที่สร้างด้วย AI
      อย่าง วิดีโอนี้, วิดีโอนี้ ต่างก็ทำจากสคริปต์ที่ GPT เขียน ภาพประกอบ AI และเสียง AI
      บน Reddit ก็มีโพสต์ที่ GPT เขียนขึ้นไปติดอันดับสูง และคนก็ชมว่าเป็น “อุปมาอันงดงาม”
      สุดท้ายแล้วคนจำนวนมากก็ ชอบเสพคอนเทนต์ AI โดยรู้ตัวหรือไม่รู้ตัว
    • ความดื้อของเหล่า CEO ส่วนใหญ่เกิดจาก แรงกดดันจากบอร์ดและวอลล์สตรีท คนที่ไม่เคยใช้ LLM จริง ๆ แค่ตอบสนองต่อสัญญาณตลาดเท่านั้น
    • นี่คือกับดักของ ต้นทุนจมเต็มรูปแบบ และความหมกมุ่นกับการเติบโต ไม่ใช่ตรรกะ แต่เป็นกระแสและความร้อนรนของนักลงทุนที่ครอบงำ
    • Kagi เองก็ไม่ได้ตัด LLM ออกทั้งหมด จริง ๆ แล้วใช้ LLM สำหรับสรุปข่าว
      อย่างที่เห็นใน issue นี้ การตัดออกทั้งหมดทำได้ยากเพราะ ประสิทธิภาพทางเศรษฐกิจ
    • ถ้าผู้สร้างต้องเปิดเผยว่าใช้ AI หรือไม่ ผมก็ควรมี สิทธิ์ในการกรอง สิ่งนั้นออก
      ทุกวันนี้หาคอนเทนต์จริงแท้ยากมาก
      ปัญหาไม่ใช่ตัวคอนเทนต์ AI เองเท่านั้น แต่คือ สภาพแวดล้อมที่ทำให้ผู้สร้างที่ตั้งใจจริงถูกกลบหาย
  • สถานการณ์ตอนนี้เหมือน AI กำลังเล่นหมากรุกกับตัวเอง
    การตรวจจับก็ซับซ้อนขึ้นเรื่อย ๆ และ AI ก็เจ้าเล่ห์ขึ้นเรื่อย ๆ เป็นการดวลแบบไม่รู้จบระหว่าง การตรวจจับกับการหลบเลี่ยง
  • “สงคราม slop ได้เริ่มขึ้นแล้ว”
    ผมสนับสนุนทุกความพยายามที่จะหยุด น้ำท่วมของ AI slop ในผลการค้นหา
    ให้ความรู้สึกเหมือน SEO spam สมัยก่อนกลับมาอีกครั้ง แค่เปลี่ยนแพ็กเกจเท่านั้นเอง
    • คราวนี้หนักกว่ามาก SEO spam สมัยก่อนมนุษย์ดูแป๊บเดียวก็แยกออก แต่ตอนนี้มีแต่ ขยะที่ภายนอกดูสมบูรณ์แบบ เต็มไปหมด
      เหตุผลที่เสิร์ชเอนจินอื่นชอบของแบบนี้ก็เพราะมันช่วยเสริมบทบาทการเป็น ประตูทางเข้า ได้โดยไม่ต้องสร้างคอนเทนต์เอง
    • ที่น่าขันคือกลุ่มที่ เกลียดคอนเทนต์ AI มากที่สุดคือวงการ SEO
      เพราะ AI summary กำลังมาแทนที่คอนเทนต์แนวล่อคลิกของพวกเขา
      บางทีเบื้องหลังขบวนการกรองพวกนี้อาจเป็นพวกเขาก็ได้