1 คะแนน โดย GN⁺ 3 시간 전 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • คำตอบค้นหาด้วย AI อย่าง AI Overviews และ ChatGPT อาจถูกชักจูงให้เอนเอียงได้แม้ใช้เพียงหน้าเว็บหรือโพสต์เดียว ในหัวข้ออ่อนไหวอย่างสุขภาพและการเงิน
  • ในการทดลองของ BBC บทความเพียงชิ้นเดียวบนเว็บไซต์ส่วนตัวทำให้ ChatGPT และ Google ตอบว่าผู้เขียนเป็น แชมป์โลกการแข่งขันกินฮอตด็อก ได้
  • เมื่อ AI รวบรวมผลค้นหาจากเว็บแล้วสรุปออกมาเป็นคำตอบเดียว ผู้ใช้มักรับมันเป็น คำตอบที่ถูกต้อง ได้ง่ายกว่าการค้นหาแบบเดิมที่ต้องเทียบหลายลิงก์
  • Google ระบุชัดว่าการบิดเบือนคำตอบของ AI เป็นการละเมิด นโยบายสแปม และเว็บไซต์ที่ฝ่าฝืนอาจถูกลบออกจากผลค้นหาหรือถูกลดอันดับ
  • ผู้บิดเบือนอาจย้ายจากบล็อกไปใช้ YouTube อินฟลูเอนเซอร์เพื่อหลบการกวาดล้าง จึงจำเป็นต้องไม่เชื่อคำตอบจาก AI แบบตรง ๆ

ปัญหาการบิดเบือนคำตอบค้นหาด้วย AI

  • AI Overviews ที่อยู่ด้านบนของ Google Search รวมถึง ChatGPT และ Gemini สามารถถูกชักจูงให้ให้คำตอบที่เอนเอียงได้ แม้ในหัวข้อสำคัญอย่างสุขภาพและการเงินส่วนบุคคล
  • ในการสืบสวนของ BBC พบว่าสามารถทำให้ ChatGPT และ Google ตอบว่าผู้เขียนเป็น “แชมป์โลกการแข่งขันกินฮอตด็อก” ได้สำเร็จ เพียงแค่อัปโหลดบทความเดียวขึ้นเว็บไซต์ส่วนตัว
  • มีสัญญาณว่าวิธีเดียวกันนี้ถูกใช้เพื่อลดทอนความกังวลด้านสุขภาพเกี่ยวกับอาหารเสริมทางการแพทย์ หรือเพื่อชี้นำข้อมูลการเงินเกี่ยวกับการเกษียณ
  • Lily Ray ที่ปรึกษาด้าน SEO และ AI search มองว่าในสภาพแวดล้อมที่ AI ให้ “คำตอบเดียวที่ถูกต้อง” ผู้ใช้มีแนวโน้มจะเชื่อคำตอบนั้นตรง ๆ มากกว่าการเปรียบเทียบหลายลิงก์แบบการค้นหาเดิม
  • Google ระบุว่าได้นำนโยบายและระบบป้องกัน สแปม เดิมมาใช้กับฟีเจอร์ค้นหาด้วย generative AI ด้วย และได้เสริมการรับมือสแปมให้ทันกับเทคนิคใหม่ ๆ มาตั้งแต่ก่อนยุค AI แล้ว

วิธีที่การบิดเบือนนี้ทำงาน

  • คำตอบของแชตบอตทั่วไปอิงกับข้อมูลที่ฝังอยู่ในโมเดล แต่เมื่อเป็นผลิตภัณฑ์ AI อย่าง ChatGPT, Claude หรือของ Google ที่ค้นหาข้อมูลจากอินเทอร์เน็ตเพื่อหาคำตอบ ความเสี่ยงต่อการถูกบิดเบือนจะสูงขึ้น
  • หากเครื่องมือ AI ดึงข้อมูลจากหน้าเว็บเดียวหรือโพสต์บนโซเชียลมีเดีย โพสต์เท็จที่ทำมาอย่างแนบเนียนเพียงชิ้นเดียวก็อาจทำให้คำตอบปนเปื้อนได้
  • แค่เผยแพร่ บทความบล็อกที่วางแผนมาอย่างประณีต เพียงชิ้นเดียวบนโลกออนไลน์ ก็อาจเปลี่ยนสิ่งที่ AI ส่งต่อไปยังสาธารณะได้
  • การบิดเบือนลักษณะนี้ถูกมองเป็นโอกาสทำเงินอย่างรวดเร็ว และข้อมูลที่คลาดเคลื่อนหรือเอนเอียงอาจส่งผลต่อการลงคะแนนเสียง การเลือกผู้ให้บริการ คำแนะนำทางการแพทย์ และการตัดสินใจทางกฎหมาย
  • Harpreet Chatha เน้นว่าความเสี่ยงไม่ได้มีแค่ผลกระทบทางเศรษฐกิจ แต่รวมถึงอาการทรุดลงจากคำแนะนำทางการแพทย์ที่ผิด หรือการทำสิ่งที่ไม่สอดคล้องกับกฎหมายของประเทศหรือท้องถิ่นด้วย

การเปลี่ยนนโยบายและการตอบโต้ของ Google

  • เมื่อมีผู้ใช้ AI chatbot เป็นประจำมากกว่า 1 พันล้านคนทั่วโลก และมีคนเห็น AI Overviews ของ Google ถึง 2.5 พันล้านคนต่อเดือน หากใครสามารถรบกวนเครื่องมือเหล่านี้ได้ ผลกระทบก็จะมหาศาล
  • เมื่อสัปดาห์ที่ผ่านมา Google ได้อัปเดตนโยบายสแปมเพื่อยืนยันอย่างเป็นทางการว่าความพยายามบิดเบือนคำตอบ AI เป็นการละเมิดกฎของบริษัท
  • บริษัทหรือเว็บไซต์ที่ละเมิดกฎอาจถูกลบออกจากผลการค้นหาของ Google หรือถูกลดอันดับ
  • Google ระบุว่าการเปลี่ยนแปลงนี้ไม่ใช่การเปลี่ยนแนวทาง แต่เป็นการ “ทำให้ชัดเจนขึ้น” และก่อนหน้านี้ก็ได้อธิบายความพยายามป้องกันสแปมที่เกี่ยวข้องกับ AI Overview และ AI Modeไว้แล้วในปี 2025
  • อย่างไรก็ตาม การทดลองเรื่องฮอตด็อกยังคงสำเร็จแม้เวลาจะผ่านไปเกือบ 1 ปี และในสัปดาห์นี้ Lily Ray ก็ทำการทดลองคล้ายกันจน Google ตอบว่าผู้เชี่ยวชาญ SEO คนหนึ่งเป็นคนที่เก่งในการสร้างปราสาททราย

การเปลี่ยนแปลงที่สังเกตได้และข้อจำกัด

  • ตามคำบอกของ Ray และ Chatha ในช่วงไม่กี่เดือนที่ผ่านมาเริ่มเห็นความเปลี่ยนแปลงที่บ่งชี้ว่า Google และบริษัทอื่น ๆ กำลังทดลองหาวิธีแก้ปัญหา
  • มีกรณีที่ดูเหมือนว่าเมื่อ Google และ ChatGPT สงสัยว่าบริษัทหนึ่งกำลังโฆษณาตัวเองเกินจริง พวกมันจะตัดบริษัทนั้นออกจากคำตอบ AI แบบเงียบ ๆ
  • ตัวอย่างเช่น หากบทความหนึ่งอ้างว่าตัวเองเป็นนักกินฮอตด็อกที่เก่งที่สุด แม้ AI จะอ้างอิงบทความนั้น ก็อาจตัดชื่อของบุคคลนั้นออกจากรายชื่อผู้เข้าข่าย
  • ยังมีการสังเกตว่า Google และเครื่องมือ AI อื่น ๆ เริ่มใส่ ป้ายกำกับความไม่แน่นอน มากขึ้นในคำตอบ เพื่อบอกว่าแชตบอตไม่ได้มั่นใจนัก
  • ChatGPT และ Claude ของ Anthropic เริ่มตอบอย่างชัดเจนในบางคำถามว่าพวกมันกำลังพยายามกรองสแปมออก และ Anthropic คือบริษัทที่สร้าง Claude
  • Ray บอกว่าเธอยังเห็นกรณีที่ Google เพิ่มเบาะแสประกอบในคำถามที่เกี่ยวกับการตัดสินใจซื้อ และแนะนำให้ตรวจสอบรีวิวจากบุคคลที่สาม
  • OpenAI และ Anthropic ปฏิเสธที่จะแสดงความเห็น ส่วนโฆษกของ Google ก็ไม่ได้ตอบคำถามเกี่ยวกับความเปลี่ยนแปลงเหล่านี้

เกมไล่จับไม่รู้จบระหว่างผู้บิดเบือนกับแพลตฟอร์ม

  • Chatha มองว่าความเปลี่ยนแปลงเหล่านี้เพียงอย่างเดียวยังไม่เพียงพอ และเปรียบการรับมือของ Google ว่าเหมือนเกม ตีตัวตุ่น
  • เมื่อ Google กวาดล้างบทความบล็อกที่ชวนบิดเบือน บริษัทต่าง ๆ ก็จะหาวิธีโปรโมตตัวเองที่แนบเนียนยิ่งขึ้น
  • เว็บไซต์อาจถูกลงโทษได้ แต่การจ่ายเงินให้ YouTube อินฟลูเอนเซอร์ 20 คนพูดว่าผลิตภัณฑ์หนึ่งดีที่สุดนั้นเป็นเรื่องที่หยุดได้ยากกว่า
  • ตอนนี้ AI ของ Google อ้างอิงวิดีโอ YouTube ได้แล้ว เทคนิคการบิดเบือนจึงอาจย้ายตามไปและทำให้วงจรนี้ดำเนินต่อ
  • ณ ตอนนี้มีโอกาสสูงที่ฝ่ายบิดเบือนจะนำหน้าอยู่หนึ่งก้าว และการจำไว้ว่า AI เป็นเครื่องมือที่สามารถให้คำตอบเดียวอย่างมั่นใจได้ไม่ว่ามันจะถูกหรือผิด คือการป้องกันตัวที่ดีที่สุด
  • ต่อให้คำตอบนั้นมาจากอินเทอร์เฟซของบริษัทเทคโนโลยียักษ์ใหญ่ ก็ไม่ควรสรุปทันทีว่าน่าเชื่อถือกว่าเว็บไซต์สุ่มบนอินเทอร์เน็ต

1 ความคิดเห็น

 
GN⁺ 3 시간 전
ความเห็นจาก Hacker News
  • อย่างน้อยตั้งแต่ยุคที่ Blekko ทำงานในปี 2006 Google ก็กรอง ขยะสแปม ออกจากดัชนีค้นหาได้ไม่ดีอยู่แล้ว เลยไม่คิดว่าจะกันปัญหานี้ได้ดีนัก
    ถึงอย่างนั้นก็ดูเป็นอีกตัวอย่างที่ดีว่า “AI” สุดท้ายก็เป็นแค่ การค้นหาที่ถูกทำให้ดูน่าเชื่อถือ และไม่ได้มีการอนุมานหรือการคิดเกิดขึ้นเบื้องหลัง

    • ผมว่าไม่ได้สรุปไปถึงตรงนั้นนัก ถ้าจะพูดแบบหาคำดีกว่านี้ไม่ได้ มันใกล้เคียงกับการที่ LLM “โดนหลอกง่าย” มากกว่า
      มันต่างอะไรกับคนที่เชื่อทุกอย่างที่อ่านบนอินเทอร์เน็ตล่ะ มนุษย์ก็โดนสแปมและการหลอกลวงเล่นงานอยู่เสมอ แต่ก็ไม่ได้แปลว่าพวกเขาเป็นแค่การค้นหาที่ทำให้ดูน่าเชื่อถือ ;-)
      แต่สิ่งนี้ก็เผยให้เห็นปัญหาที่เสิร์ชเอนจินทุกเจ้าต้องเจอ สแปมที่สร้างด้วย AI จะยับยั้งได้ยากกว่ามากด้วยวิธีเชิงสถิติแบบดั้งเดิม และเป็นแบบนั้นอยู่แล้วแม้ยังไม่ต้องไปถึงปัญหาเชิงอัตถิภาวนิยมอย่าง prompt injection
      บางทีจุดนี้อาจเป็นช่วงที่สื่อจะกลับมาทวงตำแหน่งของตัวเองในความสัมพันธ์กับ Big Tech ได้ คือกลายเป็น แหล่งข้อมูลที่ผ่านการตรวจสอบและกลั่นกรอง ที่ LLM สามารถเชื่อถือได้แบบไม่ตั้งคำถาม และดีลอย่าง OpenAI / Atlantic ก็อาจมีความหมายในแง่นั้น
    • การสร้างโค้ดใหม่อธิบายว่าเป็นการค้นหาที่ทำให้ดูน่าเชื่อถือได้ยากนะ
      คุณสามารถให้ระบบเอเจนต์อ่าน datasheet ไม่กี่ชุด แล้วอธิบายข้อกำหนดของโปรเจกต์ และให้มันออกแบบสเปกไดรเวอร์ โปรโตคอล อินเทอร์เฟซ และ state machine ได้ จากนั้นก็ทำแผนการพัฒนา แล้วเขียนโครงแอปพลิเคชันขึ้นมาก่อนค่อยเติมรายละเอียด จนได้ระบบที่ทำงานกับชุดฮาร์ดแวร์ใหม่ได้
      ถ้าทำดี ๆ คุณจะได้โค้ดที่ บำรุงรักษาง่ายกว่าและเล็กกว่า สิ่งที่เมื่อก่อนต้องใช้ทีมเล็ก ๆ ทำ ด้วย ต้นทุน 1/100 และเวลา 1/4
      ไม่ว่าอย่างไรก็ดูใกล้กับการอนุมานมากกว่าการค้นหา แน่นอน ถ้าคุณจะเรียกการพัฒนา bare-metal C บนฮาร์ดแวร์ใหม่ว่าเป็นการค้นหา งั้นสุดท้ายการพัฒนาทั้งหมดก็คงเป็นการค้นหาหมด
    • ผมเคยลงวิดีโอและโพสต์ Reddit เกี่ยวกับเลนส์วินเทจ แล้วพยายามหาว่าเลนส์นั้นเก่าแค่ไหน
      LLM บอกช่วงเวลาอย่าง “ผลิตในยุค 1940s” แล้วอ้างโพสต์ของผมเป็นหลักฐาน ทั้งที่ในโพสต์นั้นไม่มี ปีที่ผลิต อยู่เลย
    • Google มีความสามารถพอจะแก้ปัญหานี้ได้เต็มที่ และจริง ๆ ก็ไม่ได้ยากมาก
      เหตุผลที่ปัญหายังคงยากอยู่ก็เพราะวิธีแก้ส่วนใหญ่จะทำให้ รายได้โฆษณา ลดลงอย่างมาก
    • AI Overview ของ Google ดูเหมือนใช้วิธีดึง search snippet มาด้วย RAG แล้วให้ LLM ที่เร็วมากสรุป ผมคงไม่เรียกสิ่งนั้นว่าการค้นหาที่ทำให้ดูน่าเชื่อถือ
  • สมมติฐานที่แปลกที่สุดในเธรดนี้คือ Google อยากให้คำตอบของ AI ถูกต้อง
    มันแค่ต้องถูกพอที่จะทำให้ผู้ใช้ไม่ออกจากหน้าไปไหน “ความจริง” ไม่เคยเป็นสินค้ามาตั้งแต่แรก และสินค้าคือการทำให้ผู้ใช้ยอมจ่ายเงินกับ SEO

    • ฟังดูไม่ค่อยตรงนะ SEO ส่วนใหญ่เป็นสิ่งที่บุคคลที่สามทำ
      สินค้าคือ การแสดงโฆษณา และ Google เลิกสนใจผลค้นหาที่ไม่ใช่โฆษณามานานแล้ว ถึงอย่างนั้นก็น่าจะยังแคร์ชื่อเสียงของโมเดล และเรื่องนี้ก็อาจกระทบได้จริง
  • พอเห็นว่าผลลัพธ์ที่ถูกชักจูงคือคำค้นถัดไป ความกังวลของผมก็ลดลงเยอะ
    2026 South Dakota International Hot Dog Eating Champion
    ถ้าพวกเขาเปลี่ยนภาพรวมของผู้ชนะการแข่งขัน Nathan’s ได้คงร้ายแรงกว่านี้มาก หรือถ้าแสดงตัวอย่างการชักจูงคำค้นที่คนค้นกันจริง ๆ มากกว่านี้ก็เช่นกัน
    ตอนนี้มันดูคล้ายกับการสร้างหน้า Wikipedia ปลอมเกี่ยวกับการแข่งขันกินฮอตดอกสมมติใน South Dakota แล้วเขียนบทความว่า Wikipedia ไม่น่าเชื่อถือ พอนึกดูแล้วในปี 2005 ก็น่าจะมีคนเขียนบทความแบบนั้นได้เหมือนกัน

    • ใช่ นั่นหมายความว่านั่นคือขอบเขตสิ่งที่คนคนเดียวทำได้
      พอลองคิดดูว่าใน Reddit โซเชียลมีเดียส่วนใหญ่ และความพยายามแก้ไข Wikipedia เพื่อผลประโยชน์ทางการเมือง มี โพสต์ปั่นกระแสความคิดเห็นสาธารณะ อยู่มากแค่ไหน นี่ก็เป็นปัญหาที่จริงมาก
    • ในบทความยังมีบอกอีกว่า “แต่การสืบสวนพบว่าวิธีเดียวกันนี้ยังถูกใช้เพื่อทำให้คนมองข้ามข้อกังวลด้านสุขภาพเกี่ยวกับผลิตภัณฑ์เสริมอาหารทางการแพทย์ และเพื่อมีอิทธิพลต่อข้อมูลการเงินเกี่ยวกับการเกษียณที่ Google AI แสดงผล”
      น่ากังวลกว่าฮอตดอกมาก
    • กลับกัน ผมนี่กังวลขึ้นมาทันทีเลย ช่วงหลัง Gemini เริ่มแสดง search spinner ในทุกเทิร์น
      งั้นคำตอบทุกอันที่พ่วงการค้นหาก็อาจเปิดช่องให้ prompt injection และในทางปฏิบัติก็น่าจะเป็นแทบทุกคำตอบ
      มันจะระบาดแบบไวรัลเหมือนลิงก์สแปม ทุกเว็บที่มีเนื้อหาจากผู้ใช้สร้างจะกลายเป็นโฮสต์ของ prompt injection ได้ ปัญหาคือของพวกนี้ตรวจจับยากกว่าลิงก์มาก
    • ผมเคยเจอคนสอดแทรกให้ AI Overview ใส่เบอร์โทรฝ่ายช่วยเหลือลูกค้าปลอมสำหรับมิจฉาชีพ
      Google ใช้เวลาหนึ่งสัปดาห์กว่าจะแก้ และวิธีที่เขาทำคือทำให้ผลค้นหาปนเปื้อนด้วยข้อมูลของตัวเองในแหล่งที่ดูเหมือนอยู่ในชั้นความน่าเชื่อถือสูงกว่า น่าจะเป็น เว็บไซต์สัญญาจัดซื้อของภาครัฐ เลยทำให้ใช้เบอร์ปลอมแทนเบอร์ของเรา ทั้งที่ตัวคำค้นเองเป็นแค่การค้นหาธรรมดา
    • “ฉันใช้เวลา 20 นาทีหลอก ChatGPT และ Google ให้บอกสาธารณชนว่าฉันคือแชมป์โลกกินฮอตดอก เรื่องตลกมันงี่เง่า แต่ปัญหาจริงจังมาก”
      นี่แย่กว่าการฝังการปั่นกระแสในหน้า Wikipedia อีก เพราะ Wikipedia มีระบบแหล่งอ้างอิงและการทบทวนที่เปิดเผยและจัดวางดีมากต่อสาธารณะ การจะทำให้การแก้ไขหลอกลวงอยู่ได้นานนั้นจริง ๆ ค่อนข้างยาก และคุณต้องหลอกบรรณาธิการมนุษย์จำนวนมากที่ต่อสู้กับคนแบบนี้มาหลายสิบปี แม้จะตั้งใจให้ถูกต้องและเป็นประโยชน์ แต่การแทรกตัวเข้าไปในกลุ่มปิดนั้นก็ยาก
      ตรงกันข้าม search snippet ของ Google ดูดข้อมูลทุกชนิดอย่างสิ้นหวังแล้วประมวลผลอัตโนมัติ ส่วนระบบอัลกอริทึมที่ตัดสินว่าอะไรดีอะไรเป็นสแปมนั้นเป็นกรรมสิทธิ์ปิด
      ไม่ต้องใช้จินตนาการมากก็พอมองเห็นวิธีนำไปใช้ในทางที่ผิดได้ แล้วถ้าคุณค้นชื่อของตัวเองแล้วมันมีเรื่องน่าอายติดขึ้นมาล่ะ คงยากจะหวังให้นายจ้าง ลูกค้า หรือเพื่อนที่อาจเจอผลลัพธ์นั้น จะพิถีพิถันเรื่องการตรวจสอบแหล่งที่มาเท่าบรรณาธิการ Wikipedia
  • ผมอยากอ่านกรณีตัวอย่างแบบเจาะจงของ “การใช้วิธีเดียวกันเพื่อทำให้คนมองข้ามข้อกังวลสุขภาพเกี่ยวกับผลิตภัณฑ์เสริมอาหารทางการแพทย์ หรือเพื่อมีอิทธิพลต่อข้อมูลการเงินเรื่องการเกษียณที่ Google AI แสดงผล” แต่ลิงก์ที่เกี่ยวข้องในบทความตอนนี้กลับชี้ไปยังไฟล์ในเครื่องด้านล่าง
    file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.

    • ช่วงหลัง BBC พลาดแบบนี้มาหลายครั้ง และที่แย่กว่านั้นคือแม้จะแก้แล้ว พวกเขาก็ไม่ติดหมายเหตุบอก ประวัติการแก้ไขบทความที่เผยแพร่แล้ว อีกต่อไป
    • สำหรับชื่อผู้ใช้หรืออีเมล ผมใช้แค่รูปแบบ first.last@company มาตลอด เลยงงกับรูปแบบ last[:5]initials# มาก ดูแล้วน่าจะมีชื่อผู้ใช้แปลก ๆ ออกมาเยอะ
  • เดี๋ยวนี้หลายฝ่ายดูเหมือนกำลังทำอะไรบางอย่าง “เงียบ ๆ” กันไปหมด การที่ข้อความทุกอย่างบนอินเทอร์เน็ตกำลัง กลายเป็น LLM ทำเอาแทบจะบ้า

    • ผมก็จะบ้าเหมือนกัน แต่คนเขียนพาดหัวกับบรรณาธิการติดคำว่า “เงียบ ๆ” กันมานานก่อนยุค LLM มากแล้ว วารสารศาสตร์ออนไลน์เต็มไปด้วยคำซ้ำซากแบบนี้มานานมาก
    • เกลียดจริง ๆ เมื่อวานผมอ่านโพสต์ประวัติศาสตร์ที่ AI สร้างในซับเรดดิตประวัติศาสตร์ แล้วดูเหมือนแหล่งอ้างอิงทั้งหมดเป็น หนัง Hollywood สมมติ
      ผมจับได้เพราะเคยดูหนังเรื่องนั้น แต่มันเป็นสัญญาณชัดเจนว่าอินเทอร์เน็ตกำลังพังในแง่คุณภาพของข้อมูล
    • “เงียบ ๆ” ไม่ใช่สำนวนใหม่แบบ LLM
    • แก่นของคำซ้ำซากนั้นจริง ๆ คือการพูดออกมาตรง ๆ ในสิ่งที่ควรจะทำแบบเงียบ ๆ
  • นี่ก็แค่ขั้นถัดไปของ SEO เท่านั้นเอง อาจจะเรียกว่า AIO ก็ได้
    เหมือนกับการค้นหา Google และผู้ให้บริการ AI จะออกมาตรการแก้ แล้วบริษัทที่ทำการเพิ่มประสิทธิภาพก็จะหาช่องโหว่ แล้วก็โดนแพตช์กลับ เป็น สงครามไม่รู้จบ สุดท้ายก็เป็นเรื่องของการแย่งความสนใจเพื่อการตลาด

    • ในวงการการตลาดเขามักเรียกมันว่า GEO คือ Generative Engine Optimization บางครั้งก็เรียก Answer Engine Optimization ด้วย และก็มีคนทำเงินก้อนโตจากการขายบริการนี้
      https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
    • Engineered Inference Ersatz Intelligence Optimization หรือย่อว่า EIEIO
    • ไม่ใช่ขั้นถัดไป มันคือขั้นปัจจุบันแล้ว
  • Google AI Overview เชื่อถือไม่ได้เลย มันถึงขั้นเอา sample size 1 มาใส่ในภาพรวม AI ได้
    ที่รู้เพราะผมเคยคอมเมนต์ใน Reddit เกี่ยวกับหัวข้อเฉพาะทางมากเรื่องหนึ่ง ซึ่งตอนนั้นทั้งผลค้นหา Google และ AI Overview ยังไม่มีเลย วันถัดมาผมลองค้นหาโพสต์ Reddit ของตัวเอง แล้ว Google ก็เอาคำตอบ Reddit ของผมไปคัดลอกเกือบตรงตัวใส่ในกล่อง AI “overview” แล้ว แถมโพสต์ที่ลิงก์อยู่ก็มีแค่โพสต์ของผมอันเดียว และผลค้นหา Google ก็มีแค่อันเดียวเหมือนกัน

    • ยิ่งไปกว่านั้น มันยังห่อข้อมูลด้วยบริบทที่ไม่มีอยู่ในโพสต์ต้นฉบับเลย โดยอิงจากวิธีที่ผู้ใช้ถามคำถาม ผลลัพธ์ก็เลยผิดไปตรง ๆ
      สมมติว่าคุณค้นว่า “ขนาดที่พบบ่อยที่สุดของของหายาก X คืออะไร”
      แต่มีคนแค่คนเดียวที่เคยพูดถึงขนาดของของชิ้นนั้นในเวอร์ชันที่ตัวเองมี และเขาก็ไม่ได้บอกว่ามันเป็นขนาดทั่วไป หรือแม้แต่สื่อว่ามีขนาดทั่วไปอยู่จริง แถมไม่ใช่ว่ามี 20 คนพูดตรงกัน มีแค่คนเดียวจริง ๆ
      แต่ Google กลับสามารถพูดหน้าตาเฉยว่า “โดยทั่วไปแล้ว ของ X จะมีขนาด [ขนาดที่คุณพูดถึง] และเหตุผลคือ [เหตุผลที่แต่งขึ้นล้วน ๆ]”
  • ถ้าคุณถาม Google ว่า what's the name of the whale in half moon bay harbor? มันยังใส่ Teresa T ลงในสรุป AI อย่างมั่นใจอยู่เลย จากการที่ผมเคยลองทำดัชนีให้ปนเปื้อนแบบสมัครเล่นพอสมควรเมื่อปีกว่า ๆ ก่อน
    https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...

    • ผมเพิ่งลองกับ Brave Search
      มันตอบว่าลูกวาฬหลังค่อมตัวนั้นชื่อ Teresa T และบอกว่าถึงจะไม่ใช่ชื่อทางการที่หน่วยงานรัฐตั้ง แต่สาธารณชน สื่อท้องถิ่น และชาวบ้านยอมรับกันกว้างขวางแล้ว พร้อมเสริมว่าผู้เชี่ยวชาญจาก Marine Mammal Center และ California Academy of Sciences เฝ้าดูเพื่อไม่ให้มันเครียด และแนะนำให้ประชาชนรักษาระยะอย่างน้อย 100 หลา
      จากประสบการณ์กับเรื่องที่ผมพอรู้ดี คำตอบแรก ๆ ของมันบางครั้งผิดหนักมาก ในเครื่องมือของ Brave ปกติถ้าเถียงกลับสัก 3-4 รอบ คุณจะทำให้มันยอมรับได้ว่า “คุณพูดถูกทั้งหมด” กรณี Teresa T ก็เหมือนกัน
      ในคำถามที่สอง ตอนผมถามว่ามีแหล่งที่มาใช้ชื่อนี้กี่แห่ง มันก็ยังยืนยันว่า “ABC7 News” และ “NBC Bay Area” “นำชื่อนี้ไปใช้ต่อ” พอครั้งที่สามผมขอลิงก์แบบเจาะจง มันก็ยอมรับว่าชื่อนี้ถูกใช้ใน “บริบทสื่อแบบไม่เป็นทางการ” และพอครั้งที่สี่ผมบอกว่า S.W. เป็นคนทดลอง มันก็ไปเจอคอมเมนต์ของคุณเมื่อ 21 วันก่อน
      อนาคตจะเป็นของ ชนชั้นนำ ที่สามารถให้ลูกเรียนกับติวเตอร์ส่วนตัวจริง ๆ ได้ ส่วนชนชั้นแรงงานจะได้ถอยกลับไปสู่อดีต
    • คุณไม่กลัวเหรอว่า Google จะส่งจดหมายข่มขู่เพราะพยายามชักจูงคำตอบ AI ของพวกเขา
  • แค่ไม่กี่ปีก่อน Google ก็ยังเป็นบริษัทที่ตอบอย่างมั่นใจว่า “Marilyn Monroe ยิง JFK ในปีไหน?” ว่าเป็น 1963 ทั้งที่เธอเสียชีวิตไปตั้งแต่ปี 1962 ซึ่งก็น่าทึ่งดี
    เพราะงั้นนี่ไม่ใช่เรื่องใหม่ และ “การตอบโต้เงียบ ๆ” ของ Google ก็คงเป็นการรับมือแบบครึ่ง ๆ กลาง ๆ ที่ไม่ค่อยได้ผล ถึงอย่างนั้นคนส่วนใหญ่ก็คงไม่สนใจอยู่ดี

  • สุดท้ายแล้วมันก็หมายถึง Google จะเริ่มทำ การควบคุมคุณภาพ กับผลการค้นหาเว็บบ้าง ซึ่งเป็นสิ่งที่ควรทำมาตั้งแต่แรกอยู่แล้ว
    ตลกตรงที่ต้องรอให้ชื่อเสียงของโมเดลเสียหายก่อนถึงจะเริ่มลงแรง