2 คะแนน โดย GN⁺ 2024-01-01 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

คุณภาพของผลการค้นหาแย่แค่ไหน?

  • มีการเสนอการทดลองเกี่ยวกับคุณภาพของผลการค้นหา ตัวอย่างเช่น การค้นหาโปรเจกต์โอเพนซอร์สอย่าง yt-dlp ด้วยคำทั่วไปอย่าง "youtube downloader" นั้นทำได้ยากเพราะมี content farm จำนวนมาก
  • ผู้เชี่ยวชาญด้านเทคโนโลยีจำนวนมากมองว่าผลการค้นหาของ Google แย่ลงอย่างชัดเจนเมื่อเทียบกับ 10 ปีก่อน ขณะที่บางคนก็ยังยืนยันว่าผลการค้นหายังดีอยู่

เปรียบเทียบเสิร์ชเอนจินและ ChatGPT

  • มีการเปรียบเทียบผลลัพธ์สำหรับคำถาม 3 ประเภท โดยใช้เสิร์ชเอนจินหลายตัวและ ChatGPT
  • เสิร์ชเอนจินถูกทดสอบโดยปิดตัวบล็อกโฆษณา เพื่อจำลองประสบการณ์ของผู้ใช้ทั่วไป
  • คุณภาพของผลการค้นหาถูกประเมินแบบอัตวิสัย และให้คะแนนต่างกันตามว่ามีผลลัพธ์หลอกลวงปะปนอยู่หรือไม่

การประเมินผลการค้นหา

  • Marginalia บางครั้งให้คำตอบที่พอใช้ได้ และมีสัดส่วนผลลัพธ์หลอกลวงต่ำที่สุด
  • Mwmbl เปิดให้ผู้ใช้แก้ไขอันดับผลการค้นหาได้โดยตรง
  • Google มีแนวโน้มจะคืนผลเป็นวิดีโอ YouTube ล่าสุด ซึ่งแทบไม่มีประโยชน์สำหรับผู้ใช้ส่วนใหญ่
  • ChatGPT แสดงผลงานได้น่าประทับใจในกรณีหนึ่ง ขณะที่อีกกรณีก็ทำงานได้เหมาะสมหรือปฏิเสธที่จะตอบคำถาม

ปัญหาของ Google และ Bing

  • Google และ Bing คืนผลลัพธ์ที่ผิดพลาดได้หลายรูปแบบ
  • ระบบนิเวศการค้นหาแบบดั้งเดิมให้ความสำคัญกับสิ่งที่เป็นประโยชน์ต่อห่วงโซ่อุปทานซอฟต์แวร์มากกว่าสิ่งที่เป็นประโยชน์ต่อผู้ใช้มากที่สุด

ปัญหาของการค้นหาที่ขับเคลื่อนด้วยโฆษณา

  • เสิร์ชเอนจินที่อิงโฆษณามีแรงจูงใจที่ไม่สอดคล้องกับการมอบผลการค้นหาที่ดีให้ผู้ใช้
  • Google ทำให้แยกแยะระหว่างโฆษณากับผลการค้นหาจริงได้ยาก จนผู้ใช้อาจสับสน

ความเป็นไปได้ของเสิร์ชเอนจินขนาดเล็ก

  • มีการตั้งคำถามว่าเสิร์ชเอนจินขนาดเล็กอย่าง Marginalia จะสามารถมาแทนที่ Google ได้หรือไม่ หรือเสิร์ชเอนจินขนาดเล็กหลายตัวรวมกันจะให้ผลลัพธ์ที่ดีกว่า Google ได้หรือไม่
  • ยังมีข้อสงสัยว่าแนวทางคัดสรรโดยผู้ใช้ของ Mwmbl จะได้ผลหรือไม่

ความเห็นของ GN⁺

  • การถกเถียงเรื่องคุณภาพของผลการค้นหาแสดงให้เห็นว่าผู้ใช้พึ่งพาเสิร์ชเอนจินมากเพียงใด แม้เสิร์ชเอนจินรายใหญ่อย่าง Google จะยังครองความเหนือกว่า แต่ก็ชี้ให้เห็นว่าเสิร์ชเอนจินขนาดเล็กอาจแข่งขันได้ในตลาดเฉพาะกลุ่ม
  • ปัญหาของเสิร์ชเอนจินที่อิงโฆษณาตอกย้ำว่า สิ่งนี้อาจเป็นอุปสรรคต่อการค้นหาข้อมูลที่ผู้ใช้ต้องการจริง ๆ และทำให้เห็นความจำเป็นของเสิร์ชเอนจินทางเลือกเพื่อยกระดับประสบการณ์ผู้ใช้
  • บทความนี้ช่วยให้เข้าใจว่าผู้ใช้ที่เชี่ยวชาญเทคโนโลยีกำลังรับมือกับข้อจำกัดของเสิร์ชเอนจินอย่างไร และช่วยให้เข้าใจปัญหาของเสิร์ชเอนจินที่ผู้ใช้ทั่วไปกำลังเผชิญอยู่

1 ความคิดเห็น

 
GN⁺ 2024-01-01
ความเห็นจาก Hacker News
  • แม้ว่าอัลกอริทึมของ Marginalia Search จะได้รับการปรับปรุงแล้ว แต่ก็อาจเป็นเพราะโชคดีกับคำค้นตัวอย่างบางคำอยู่ดี ยังคิดว่ามันยังมีทั้งดีและพลาดอยู่มากเมื่อเทียบกับทางเลือกอื่น ๆ ซึ่งแสดงให้เห็นว่าการประเมินคุณภาพการค้นหานั้นยาก และต้องเข้าใจด้วยว่าในฐานะเสิร์ชเอนจินแบบคีย์เวิร์ด มันไม่ได้มีความเข้าใจเชิงความหมาย
  • มีการแชร์ประสบการณ์กับ Kagi โดยบอกว่าได้ยินจาก HN แล้วสมัครใช้งานหลังค้นหาไป 100 ครั้ง เมื่อค้นหา JS และ CSS แบบสุ่ม MDN มักขึ้นเป็นผลลัพธ์แรก และถ้าไม่ใช่ก็สามารถลดอันดับเว็บไซต์สแปมลงได้
  • มีคนหนึ่งที่ยังคิดว่าผลการค้นหาของ Google ดีมาก ยอมรับว่าใช้ตัวบล็อกโฆษณา (uBlock Origin) และไม่คิดจะปิด เข้าใจมุมมองของผู้เขียนที่ปิดตัวบล็อกโฆษณาเพื่อเลียนแบบประสบการณ์ของผู้ใช้ทั่วไป แต่ก็ยังสามารถทดสอบอย่างอื่นได้แม้เปิดตัวบล็อกโฆษณาอยู่ ความคาดหวังต่อผลการค้นหาของ yt-dlp ก็ไม่ได้สอดคล้องกับประสบการณ์ของผู้ใช้ทั่วไป
  • มีการให้ลิงก์ของคำค้นหลายคำเพื่อเปรียบเทียบผลลัพธ์ปัจจุบันของ Kagi กับคนที่ไม่มีบัญชี
  • เห็นด้วยกับผู้เขียนว่าบนเว็บมีสแปมมากเกินไป Kagi ทำได้ค่อนข้างดีในการลดอันดับสแปม และผ่านโหมดค้นหาพิเศษอย่าง "Small Web" ก็แทบจะกำจัดสแปมได้เลย
  • การค้นหาเป็นเรื่องยาก และทุกคนดูเหมือนจะรู้วิธีปั่นผลลัพธ์การค้นหา จึงแนะนำให้ใช้เสิร์ชเอนจินที่สามารถปรับแต่งเว็บไซต์ได้อย่างมีประสิทธิภาพ เช่น Kagi หรือ programmable search engine ของ Google ฟีเจอร์โหวตผลลัพธ์ดูน่าสนใจ แต่ก็มีโอกาสถูกปั่นได้ วิธีแบบ whitelist ก็มีข้อเสีย แต่ยังชอบการตรวจสอบโดเมนใหม่ผ่านโซเชียลมีเดียมากกว่า
  • ข้ออ้างว่าคุณภาพการค้นหาแย่ลงมักอิงกับหลักฐานเชิงประสบการณ์ส่วนบุคคล ซึ่งควรเป็นข้ออ้างที่ตรวจสอบได้ แม้จะมีความพยายามนำเสนอหลักฐานจริงและเกณฑ์วัด แต่ขนาดตัวอย่างก็ยังเล็กเกินไปที่จะสรุปเป็นข้อกล่าวอ้างทั่วไป
  • ไม่เข้าใจว่าทำไมคนที่เขียนบทความเกี่ยวกับ ChatGPT ถึงใช้เวอร์ชัน 3.5 ทั้งที่ผลลัพธ์ต่างจาก GPT-4 อย่างชัดเจน
  • มีการแนะนำให้ลองใช้ uBlacklist ซึ่งเป็นเครื่องมือสำหรับบล็อกผลการค้นหา โดยสามารถซิงก์การตั้งค่าและรายการบล็อกส่วนตัวกับ Dropbox หรือ Google Drive ได้ และแม้จะมีฟีเจอร์สมัครรับรายการบล็อก แต่ตอนนี้ยังไม่มีฟีดในตัว
  • มีการตั้งคำถามกับความคาดหวังที่ว่าผลการค้นหาที่ดีสำหรับ "ดาวน์โหลดวิดีโอ YouTube" ควรเป็น yt-dlp หรือ yt-dlp ที่มี graphical user interface เพราะคนส่วนใหญ่ไม่ได้สนใจการเขียนโปรแกรม และทำให้เห็นว่าผลการค้นหานั้นเป็นเรื่องอัตวิสัย
  • ไม่สามารถทำซ้ำผลลัพธ์แย่ ๆ ที่ผู้เขียนบอกว่าเจอใน Kagi ได้ เพราะเมื่อค้นหาด้วยคำเดียวกันกลับได้ผลลัพธ์ที่ดีกว่ามาก จึงสงสัยว่าผู้เขียนได้ผลลัพธ์แย่ขนาดนั้นมาได้อย่างไร
  • มองว่าความคาดหวังของผู้เขียนที่ว่าผลการค้นหาควรคืนลิงก์ประเภทเดียวกันทั้งหมดนั้นแปลก การค้นหาที่ลิงก์ 10 รายการชี้ไปยังสิ่งเดียวกันทั้งหมดคือการค้นหาที่แย่ ผลลัพธ์ควรครอบคลุมการคาดเดาที่สมเหตุสมผลสำหรับคิวรีนั้น ๆ และมุมมองนี้ก็สะท้อนอยู่ในตัวชี้วัดคุณภาพของเสิร์ชเอนจินด้วย