เปรียบเทียบคุณภาพการค้นหาของ Google, Bing, Marginalia, Kagi, Mwmbl และ ChatGPT

(danluu.com)

2 คะแนน โดย GN⁺ 2024-01-01 | 1 ความคิดเห็น | แชร์ทาง WhatsApp

เพียงใช้คำค้นง่าย ๆ 6 คำ ก็พบว่าในผลลัพธ์อันดับต้น ๆ ของเสิร์ชเอนจินรายใหญ่อย่าง Google และ Bing มักปะปนไปด้วย SEO สแปม โฆษณาหลอกลวง และคำตอบที่ไม่ถูกต้อง
การเปรียบเทียบครอบคลุม Google, Bing, Marginalia, Kagi, Mwmbl และ ChatGPT 3.5 โดยทดสอบในสภาพที่ปิดตัวบล็อกโฆษณา และรวมถึง ผลลัพธ์แบบโลคัลไลซ์ ตามพื้นที่ Vancouver, BC
Marginalia แม้มักไม่สามารถให้คำตอบที่สมบูรณ์ได้ แต่มีผลลัพธ์หลอกลวงน้อยกว่าคู่แข่งโดยเปรียบเทียบ ขณะที่ ChatGPT ทำได้ดีในบางการค้นหา แต่ก็มีทั้งการปฏิเสธตอบและอาการหลอนของโมเดล
Google และ Bing แสดง เว็บไซต์หลอกลวง และผลลัพธ์เชิงโฆษณาไว้สูงมากในการค้นหาทั่วไปที่ผู้ใช้มักค้นหา เช่น ดาวน์โหลด YouTube ตัวบล็อกโฆษณา และพยากรณ์หิมะฤดูหนาว
หากต้องการผลลัพธ์ที่ดี ผู้ใช้จำเป็นต้องใช้เทคนิคขั้นสูง เช่น จำกัดเว็บไซต์ ผสมคีย์เวิร์ด และค้นหาต่อเนื่อง ซึ่งห่างไกลจากประสบการณ์ค้นหาแบบเดิมที่เคย “แค่ค้นหาก็พอ”

วิธีเปรียบเทียบและเกณฑ์ประเมิน

เปรียบเทียบ Google, Bing, Marginalia, Kagi, Mwmbl และ ChatGPT 3.5
เลือกคำค้นจาก 3 ประเภท
- คำค้นที่ผู้ใช้ทั่วไปซึ่งไม่เชี่ยวชาญอาจใช้ระหว่างตั้งค่าคอมพิวเตอร์เครื่องใหม่
- คำถามด้านเทคนิคหรือวิทยาศาสตร์ที่นักเรียนมัธยมปลายก็เข้าใจได้ แต่หาคำตอบยาก
- การค้นหาข้อมูลท้องถิ่นที่จำเป็นจริงระหว่างเขียนบทความ
คำค้นที่ใช้มี 6 รายการดังนี้
- download youtube videos
- ad blocker
- download firefox
- Why do wider tires have better grip?
- Why do they keep making cpu transistors smaller?
- vancouver snow forecast winter 2023
การประเมินแบ่งเป็น Terrible, Very Bad, Bad, Ok, Good, Great และให้ ผลลัพธ์หลอกลวง เป็นปัจจัยหักคะแนนสำคัญ
การค้นหาส่วนใหญ่ทำในเดือนพฤศจิกายน 2023 และบางส่วนทำช่วงกลางเดือนธันวาคม
คำค้นบนเสิร์ชเอนจินถูกรันในหน้าต่างไม่ระบุตัวตนใหม่หลังลบคุกกี้แล้ว ส่วน Kagi ไม่อนุญาตการค้นหาแบบไม่ล็อกอิน จึงใช้บัญชีใหม่
พิกัดอยู่ที่ Vancouver, BC และดูเหมือนว่าบางเสิร์ชเอนจินจะใช้ การจัดอันดับตามพื้นที่

ผลลัพธ์โดยรวม

Marginalia บางครั้งให้คำตอบที่พอใช้ได้แต่ไม่สมบูรณ์ และเมื่อเจอคำถามที่ตอบไม่ได้ ก็มักไม่มีผลลัพธ์หรือให้ผลลัพธ์ที่ไม่เกี่ยวข้องอย่างชัดเจน
- สัดส่วนผลลัพธ์หลอกลวงต่ำกว่าเสิร์ชเอนจินอื่น แต่ในการทดลองนี้ก็ยังมีอยู่บ้าง
Mwmbl อนุญาตให้ผู้ใช้แก้ไขลำดับผลการค้นหาได้โดยตรง
- มีหนึ่งคำค้นที่หลังแก้ไขแล้วถือว่าอยู่ระดับ Great ได้ แต่เพราะเป็นผลจากการปรับแต่งให้เข้ากับเบนช์มาร์กโดยตรง จึงไม่นำมาคิดคะแนน
Google มีแนวโน้มชอบผลลัพธ์ใหม่ล่าสุดและวิดีโอ YouTube ล่าสุดอย่างมาก
- ในการค้นหา ad blocker มีวิดีโอ YouTube เนื้อหาบางมากถูกดันขึ้นมา และวิดีโอนั้นยังกล่าวผิดด้วยว่าผลลัพธ์แรกคือ “ทางการจาก Google”
ChatGPT ดีกว่าเสิร์ชเอนจินแบบดั้งเดิมอย่างมากในหนึ่งกรณี ส่วนในกรณีอื่นก็พอใช้ได้หรือเลี่ยงตอบ และมี อาการหลอน ในหลายคำค้น
Google และ Bing ถูกประเมินว่าในบางคำค้นให้ผลลัพธ์ที่หลอนหรือถูกชี้นำมากกว่า ChatGPT เสียอีก
- ในการค้นหาพยากรณ์หิมะ มีทั้งเว็บไซต์พยากรณ์ปลอมเพื่อหารายได้จากโฆษณา และผลลัพธ์จากธุรกิจท้องถิ่นที่พยายามชวนสมัครบริการกำจัดหิมะโดยไม่จำเป็น

ผลลัพธ์แยกตามคำค้น

download youtube videos
- ผลลัพธ์ในอุดมคติคือ yt-dlp หรือ GUI ฟรีแบบบาง ๆ ที่ครอบ yt-dlp และโปรเจ็กต์ที่อัปเดตไม่บ่อยนักอย่าง youtube-dl ก็ยังถือว่ารับได้
- Google ไม่มีผลลัพธ์ที่ดีเลย โดยผลลัพธ์ทั่วไปอันดับต้น ๆ ส่วนมากเป็นการชวนติดตั้ง badware โฆษณาหลอกลวง ทางเลือกแบบเสียเงิน บทความลิสต์เชิงโฆษณา และวิดีโอ YouTube แนวบล็อกสแปม
- Bing ก็ไม่มีผลลัพธ์ที่ดีเช่นกัน และมีทั้งการชวนติดตั้งส่วนขยายที่ดูเหมือน badware ปุ่มดาวน์โหลดปลอม และโฆษณาโปรแกรมดาวน์โหลดแบบเสียเงินจำนวนมาก
- Marginalia มีผลลัพธ์แรกเป็นคำตอบเก่าเกี่ยวกับ youtube-dl และยังมีบทความบล็อกเรื่องการติดตั้งและใช้งาน yt-dlp จึงถูกประเมินว่าดีที่สุด
- Kagi เต็มไปด้วยเว็บไซต์ดาวน์โหลดที่อ้าง Norton SafeWeb, scam pop-up และลิงก์ archive.org เก่า ๆ ของ youtube-dl
- Mwmbl ปะปนทั้งซอฟต์แวร์เสียเงิน บทความติดตั้ง youtube-dl วิดีโอเกี่ยวกับ GUI wrapper และเว็บไซต์หลอกลวงหรือคุณภาพต่ำ
- ChatGPT ตอบว่าไม่ควรดาวน์โหลดโดยไม่ใช้ YouTube Premium และปฏิเสธที่จะแนะนำแอปหรือเว็บไซต์บุคคลที่สามแบบเจาะจง
ad blocker
- ผลลัพธ์ในอุดมคติคือ uBlock Origin และอย่างน้อยก็ควรเป็นตัวบล็อกโฆษณาที่ไม่หลอกลวงและบล็อกโฆษณาได้จริงตามค่าเริ่มต้น
- Google ไม่มีลิงก์ไปยัง uBlock Origin และปะปนทั้งตัวบล็อกโฆษณาที่เข้าร่วมโปรแกรม Acceptable Ads ซึ่งอนุญาตบางโฆษณาโดยค่าเริ่มต้น และโฆษณาที่ดูเหมือนหลอกลวง
- Bing มีโฆษณาด้านบนที่พาไปยัง Avast Secure Browser, TOTAL Adblock และเว็บไซต์รีวิวปลอม โดยป้ายโฆษณาก็แนบเนียนมากจนผู้ใช้ทั่วไปอาจเข้าใจว่าเป็นผลการค้นหาปกติ
- Marginalia มีผลลัพธ์ลำดับ 3 และ 4 ที่แนะนำ uBlock Origin และลำดับ 8 คือตัว uBlock Origin เอง พร้อมผลลัพธ์หลอกลวงโดยตรงน้อย จึงถือว่าทำได้ดี
- Mwmbl ปะปนทั้ง Ghostery ตัวบล็อกโฆษณาแบบเสียเงิน เว็บไซต์ที่เต็มไปด้วยโฆษณา และคำแนะนำ uBlock Origin ในคอมเมนต์ Hacker News
- Kagi มีผลลัพธ์กลุ่ม Adblock Plus และ AdBlock ครองอันดับบน และยังมีบทความที่มีป๊อปอัปชวนติดตั้ง TOTAL Adblock
- ChatGPT ตอบคำถาม How do I install the best ad blocker? โดยแนะนำ uBlock Origin เป็นตัวเลือกแรก จึงถูกประเมินว่าดีที่สุดสำหรับคำค้นนี้
download firefox
- ผลลัพธ์ในอุดมคติคือลิงก์ดาวน์โหลด Firefox และต้องไม่มีลิงก์ปลอมหรือหลอกลวง
- Bing, Mwmbl และ Kagi ให้ลิงก์เกี่ยวกับการดาวน์โหลด Firefox จึงได้ระดับ Great
- ChatGPT ให้คำแนะนำการติดตั้งที่ไม่แม่นยำทางเทคนิค แต่ยังพาไปยังเว็บไซต์ที่ถูกต้อง จึงมองว่าผู้ใช้มีแนวโน้มจะดาวน์โหลด Firefox ได้สำเร็จ
- Marginalia ไม่มีลิงก์ดาวน์โหลด Firefox โดยตรง มีเพียงลิงก์อ้อม ๆ ที่เกี่ยวข้องกับ Firefox จึงได้ระดับ Ok
- Google แม้ลิงก์อันดับต้น ๆ ส่วนใหญ่จะเป็นลิงก์ดาวน์โหลดที่ถูกต้อง แต่ผลลัพธ์อันดับ 7 และ 10 มีลิงก์หลอกลวงที่นำไปสู่การติดตั้ง badware หรือการขอข้อมูลบัตรเครดิต จึงถูกประเมินว่า Bad
Why do wider tires have better grip?
- คำตอบที่ถูกต้องควรอธิบายผลของยางที่กว้างขึ้นต่อการเบรกบนพื้นแห้งและเวลาในการทำรอบ ผลของการเบรกบนพื้นเปียกและการเหินน้ำ ความแตกต่างเมื่อเปลี่ยนความกว้างล้อกับความกว้างยางแยกกัน รวมถึงผลของแรงดันลมยาง
- Google, Bing และ Kagi ส่งคืนคำอธิบายที่ไม่ครบหรือผิด เช่น เรื่องพื้นที่ผิว พื้นที่สัมผัส และโหลดแบบไดนามิก พร้อมหน้าเชิงโฆษณาจำนวนมาก
- ChatGPT ให้คำตอบที่ไวยากรณ์ดี แต่เป็น คำตอบหลอน แบบคอมเมนต์อินเทอร์เน็ตที่ฟังดูน่าเชื่อถือ
- Marginalia ไม่มีผลลัพธ์สำหรับคำถามเดิม และเมื่อเอาเครื่องหมายคำถามออก ก็ส่งคืนผลลัพธ์ที่ผิดเพียงรายการเดียว
- Mwmbl ส่งคืนบทความ NYT ที่ไม่เกี่ยวข้องหรือบทความเกี่ยวกับยางจักรยาน
- ไม่มีเสิร์ชเอนจินใดให้คำอธิบายที่ถูกต้อง และ Marginalia ถูกมองว่าดีกว่าเล็กน้อยเพราะมีผลลัพธ์ผิดและลิงก์หลอกลวงน้อยกว่า
Why do they keep making cpu transistors smaller?
- คำตอบที่คาดหวังคือแหล่งข้อมูลที่อธิบายอย่างเข้าใจง่ายว่าเหตุใดทรานซิสเตอร์ที่เล็กลงจึงเร็วขึ้น และเกี่ยวข้องกับกำลังไฟและความจุไฟฟ้าอย่างไร
- Google ส่งคืน knowledge card พร้อมผลลัพธ์จาก Stack Exchange และ Quora แต่ส่วนใหญ่เป็นเพียงคำตอบบางส่วนอย่าง “ยิ่งเล็กยิ่งเร็ว” หรือเป็นคำตอบของคำถามอื่น
- Bing มี knowledge card ด้านบนบางส่วนที่ให้คำตอบแบบไม่สมบูรณ์แต่พอช่วยให้ค้นหาต่อได้ จึงได้ระดับ Ok
- Kagi ส่งคืนผลลัพธ์จาก Reddit, Stack Exchange, Quora และ Metafilter และแม้ลิงก์อันดับ 10 จะพาไปสู่เรื่อง Dennard Scaling ได้ แต่คำตอบตรง ๆ ยังอ่อน
- Marginalia ไม่มีผลลัพธ์ ส่วน Mwmbl ส่งคืนเพียงบทความ Vox ที่ไม่เกี่ยวข้องชื่อ “Why do artists keep making holiday albums?”
- ChatGPT ให้คำตอบกว้าง ๆ เรื่องประสิทธิภาพที่ไม่ค่อยตอบคำถาม และเมื่อขออธิบายเพิ่มก็ให้คำตอบที่อาจทำให้เข้าใจผิดเกี่ยวกับการแพร่กระจายสัญญาณในวงจรและ interconnect
vancouver snow forecast winter 2023
- ผลลัพธ์ที่ดีควรเป็นพยากรณ์หลายเดือนของฤดูหนาวปี 2023 จาก Environment Canada ที่ระบุว่าหิมะใน Vancouver จะน้อยกว่าค่าเฉลี่ยมากและอุณหภูมิจะสูงกว่าเดิม
- Google แสดง knowledge card จากพยากรณ์ปลอมของบริษัทกำจัดหิมะท้องถิ่น ซึ่งทำนายว่าหิมะจะตกหนักและอากาศจะหนาวเพื่อชวนให้ซื้อบริการกำจัดหิมะ
- หน้าที่ดูเหมือนผลลัพธ์เกี่ยวข้องอันดับต้นของ Bing เป็นเว็บไซต์พยากรณ์ปลอมแบบ SEO ที่คล้ายปรับแต่ง “ความน่าจะเป็นของพายุฤดูหนาว” รายวัน
- Kagi แสดงเว็บไซต์พยากรณ์ปลอมเดียวกับของ Bing ใน 4 อันดับแรก พร้อมข่าวที่ไม่เกี่ยวข้องและ SEO สแปม
- Marginalia ไม่มีผลลัพธ์ ส่วน Mwmbl ส่งคืนผลลัพธ์ไม่เกี่ยวข้อง เช่น ข่าวไฟดับปี 2022 พยากรณ์หิมะของ Philadelphia การจับตัวเป็นน้ำแข็งของแม่น้ำใน Ohio และข่าวท้องถิ่นใน Oregon
- ChatGPT ไม่ตอบตรง ๆ และบอกให้ไปดูเว็บไซต์หรือแอปพยากรณ์อากาศ โดยครั้งหนึ่งเคยแนะนำ Environment Canada จากพรอมป์ตที่พลาดมี User\n ติดมาด้วย

วิธีที่โฆษณา, SEO และอาการหลอนปะปนกัน

ในผลลัพธ์ของเสิร์ชเอนจินมีทั้งผลลัพธ์ที่ถูกบิดเบือนโดยตั้งใจและหน้าฟาร์ม SEO เชิงโฆษณาทั่วไปปะปนกันอยู่
ในการค้นหาพยากรณ์หิมะ มีทั้งเว็บไซต์พยากรณ์ปลอมเพื่อหารายได้จากโฆษณา และพยากรณ์ปลอมที่ชวนซื้อบริการกำจัดหิมะ
ในการค้นหาตัวบล็อกโฆษณา มีเว็บไซต์รีวิวปลอมที่ทำเหมือนเป็นรีวิวอย่างเป็นกลาง แต่จริง ๆ พยายามชวนติดตั้งตัวบล็อกโฆษณาบางตัว
ในการค้นหาดาวน์โหลด YouTube สิ่งที่โผล่ซ้ำ ๆ คือซอฟต์แวร์เสียเงิน ส่วนขยายที่น่าสงสัยว่าเป็น badware และปุ่มดาวน์โหลดปลอม แทนที่จะเป็นเครื่องมือโอเพนซอร์สฟรี
ระบบนิเวศการค้นหาแบบดั้งเดิมดูเหมือนถูกผลักอย่างหนักให้วางผลลัพธ์ที่เป็นประโยชน์ต่อซัพพลายเชนซอฟต์แวร์มากที่สุดไว้ก่อนผลลัพธ์ที่ดีที่สุดสำหรับผู้ใช้
สัญญาณจัดอันดับอย่างการคลิกและการมีส่วนร่วมจะช่วยเสริมผลลัพธ์ที่ดีได้ก็ต่อเมื่อผู้ใช้มีทักษะมากพอจะแยกแยะผลลัพธ์ที่ดีออก

ปัญหาแรงจูงใจของการค้นหาที่พึ่งโฆษณา

บทความ PageRank ดั้งเดิมของ Sergey Brin และ Larry Page มองว่าการค้นหาที่พึ่งโฆษณามี แรงจูงใจไม่สอดคล้องกัน กับการให้ผลลัพธ์ค้นหาที่ดี
บทความอธิบายว่ารายได้จากโฆษณาอาจทำให้เสิร์ชเอนจินเอนเอียงไปทางผู้ลงโฆษณาและห่างจากความต้องการของผู้บริโภค
ปัจจุบัน Google และ Bing เปลี่ยนไปในทิศทางที่ทำให้โฆษณาดูคล้ายผลการค้นหาจริง และผู้ใช้จำนวนมากก็แยกไม่ออกระหว่างโฆษณากับผลลัพธ์ธรรมชาติ
การประเมินอันดับอิงตามลำดับที่มองเห็นบนหน้า
- ถ้ามีโฆษณา 4 รายการอยู่เหนือผลลัพธ์ธรรมชาติ ก็จะนับว่าโฆษณาเป็นอันดับ 1-4 และผลลัพธ์ธรรมชาติเริ่มที่อันดับ 5
ในตัวอย่างการค้นหา cellular phone ผลลัพธ์ด้านบนของ Google เต็มไปด้วย Google Store Pixel 7, โทรศัพท์ Android จาก Amazon, Wikipedia, ผลลัพธ์เชิงพาณิชย์ และ SEO สแปม
ผลลัพธ์ชั้นดีที่บทความ PageRank ยกตัวอย่างไว้คือ “The Effect of Cellular Phone Use Upon Driver Attention” ถูกกลบอยู่ใต้กองผลลัพธ์เชิงพาณิชย์จนแทบมองไม่เห็น

ความเป็นไปได้ของเสิร์ชเอนจินขนาดเล็กและเมตาเสิร์ช

Marginalia เป็นตัวอย่างที่น่าสนใจ เพราะแม้จะเป็นเสิร์ชเอนจินที่พัฒนาโดยคนคนเดียว ก็ยังทำผลงานได้ค่อนข้างดีในบางคำค้น
การสร้างเสิร์ชเอนจินกระแสหลักมาทดแทน Google ยังเป็นเรื่องยากอยู่
- การทำดัชนีสิ่งที่เปลี่ยนแบบเรียลไทม์อย่าง Twitter และข่าว
- NLP ที่ต้องเกินระดับพื้นฐาน
- ฟีเจอร์ที่ผู้ใช้คาดหวังจากเสิร์ชเอนจินมีมากขึ้น
ในทางกลับกัน การสร้างเสิร์ชเอนจินที่มีประโยชน์สำหรับผู้ใช้กลุ่มเล็กกลับง่ายขึ้น
- เพราะผลลัพธ์ของ Google แย่ลงกว่าสมัยก่อนในหลายคำค้น
ผู้เขียนระบุว่า Google มักส่งคืนหน้าไม่ตรงกับที่ต้องการมากขึ้น แม้แต่ในคำค้นหาหน้าที่ไม่ค่อยนิยม หรือการค้นหาด้วยสตริงที่จำได้อย่างแม่นยำ
- สิ่งที่แทบไม่เคยเกิดในอดีต เริ่มเกิดประปรายในปี 2015 และปัจจุบันเกิดขึ้นในสัดส่วนที่ค่อนข้างสูง
ผู้เขียนมองว่าการผสมเสิร์ชเอนจินขนาดเล็กหลายตัวเข้าด้วยกันน่าจะให้ผลลัพธ์ที่ดีกว่า Google สำหรับผู้ใช้จำนวนมากมาหลายปีแล้ว
แนวทางคัดสรรโดยผู้ใช้ของ Mwmbl ถูกมองว่ายังใช้งานยากหากไม่มีการปรับแต่งเพิ่ม
- มีกรณีผู้ใช้แก้ผลการค้นหา RSS โดยใส่ blogspam ไว้อันดับบน และไม่มีวิธีรายงานที่หาได้ง่าย
แนวทางแบบ Metacrawler ยุค 1996 ที่รวมผลจากหลายเสิร์ชเอนจิน รวมถึง ChatGPT และ Bard อาจทำงานได้ดีพอสมควรในทางเทคนิค หากไม่นับปัญหากฎหมายและค่าไลเซนส์

ภาคผนวก: เสิร์ชเอนจินอื่น

DuckDuckGo ในอดีตคล้าย Bing มาก และครั้งนี้ก็ยังคล้ายอยู่หากตัดโฆษณาของ Bing ออก แม้จะไม่เหมือนเดิมทั้งหมด จึงมองว่าไม่คุ้มแยกใส่ตารางต่างหาก
- หากผู้ใช้มีทักษะและใช้คำค้นเก่งก็พอใช้ได้เหมือน Google แต่สำหรับคำค้นแบบตรงไปตรงมาของการเปรียบเทียบนี้ถือว่าไม่ดี
wiby.me เป็นเสิร์ชเอนจินสำหรับค้นหาผลลัพธ์ที่ค่อนข้างคลุมเครือ คล้าย Marginalia
- ให้ผลลัพธ์ที่น่าสนใจและแตกต่างมากใน 4 คำค้น แต่ไม่สามารถส่งคืนผลลัพธ์ที่เกี่ยวข้องได้
searchmysite.net ให้ผลลัพธ์ที่เกี่ยวข้องได้บ้างในบางคำค้น แต่ยังเกี่ยวข้องน้อยกว่า Marginalia
- อย่างไรก็ตาม มีเพจหลอกลวงและเชิงโฆษณาน้อยกว่า Google, Bing และ Kagi มาก
indieweb-search.jamesg.blog ใช้งานไม่ได้ในทุกคำค้นเนื่องจากเซิร์ฟเวอร์เออร์เรอร์
Teclis ยังมีช่องค้นหาอยู่ แต่ปิดบริการเพราะ bot abuse โดยหน้าแรกระบุว่า 99.9% ของทราฟฟิกเป็นบอต
- มีการระบุว่าสามารถใช้ผลลัพธ์ของ Teclis ได้ผ่านเลนส์ Non-commercial Web และ API ของ Kagi

ภาคผนวก: กระบวนการอ้อมเพื่อหาคำตอบที่ดี

สำหรับคำถามเรื่องการยึดเกาะของยางกว้าง เสิร์ชเอนจินทั่วไปไม่สามารถให้คำตอบที่ดีได้ และกระบวนการค้นหาจึงลากยาวไปสู่การค้นหาใน YouTube การอ่านคอมเมนต์ หนังสือด้านรถยนต์ การสำรวจหนังสือที่คล้ายกัน และการค้นหาด้วยชื่อรุ่นเฉพาะ
Tune To Win ของ Carroll Smith กล่าวว่ายางที่มีหน้าสัมผัสกว้างขึ้นช่วยลดการสะสมความร้อน และทำให้สามารถออกแบบยางด้วยเนื้อยางที่นุ่มกว่าแต่ทำงานในช่วงอุณหภูมิที่แคบลงได้ อย่างไรก็ตาม ผู้เขียนมองว่ายังอธิบายปรากฏการณ์ที่สังเกตได้ไม่เพียงพอ
The Unified Theory of Tire and Rubber Friction ของ Kummer, The Physics of Tire Traction ของ Hays and Browne และ Race Car Vehicle Dynamics ของ Milliken and Milliken ก็ยังอธิบายได้ไม่ถึงระดับที่ต้องการ
The Science of Vehicle Dynamics ของ Guiggiani เข้าใกล้วิธีคิดและการสร้างแบบจำลองของปัจจัยที่เกี่ยวข้องมากกว่า
จากเบาะแส brush model ในบทสุดท้าย ผู้เขียนค้นหา brush model tire width แล้วไปเจอ Tire and Vehicle Dynamics ของ Pacejka ซึ่งเป็นหนังสือที่เริ่มอธิบายเรื่องการยึดเกาะของยางกว้างและแบบจำลองพลวัตของยางกับรถที่จำเป็นได้
การจะได้ผลการค้นหาที่ดีต้องใช้ เทคนิคของผู้เชี่ยวชาญ ในการผสมคำค้น เว็บไซต์ และการค้นหาต่อเนื่อง ซึ่งไม่ใช่สิ่งที่ผู้ใช้ทุกคนมี

กรณีตัวอย่าง Google knowledge card

ผู้เขียนระบุว่าผลลัพธ์จาก Google knowledge card มักไม่แม่นยำแม้กับคำตอบที่หาได้ง่ายหรือคำถามขำ ๆ
oc2 gemini length ส่งคืน 20″ ซึ่งเป็นความยาวของทารกในบทความ แทนที่จะเป็นความยาวของเรือ
busy beaver number ส่งคืนหมายเลขโทรศัพท์ (604) 375-2754
Feedly revenue ส่งคืน $5.2M/yr โดยอิงจากเว็บไซต์ที่ดูเหมือนปั่นตัวเลขประมาณการรายได้และกำไรของบริษัทเอกชน
boston up118s dimensions ส่งคืนขนาดเปียโนเป็น 5826298 x 5826899 x 582697 in
Intel number of engineers ส่งคืนหมายเลขโทรศัพท์แทนจำนวนวิศวกร
fraser river current speed ส่งคืนค่าไม่ถูกต้องคือ 97 to 129 kilometers per hour
futura c-4 surfski weight ส่งคืนน้ำหนัก 39 pounds ของ surfski คนละรุ่น

คำตอบต่อคำวิจารณ์

การเปรียบเทียบนี้ไม่ใช่งานวิจัยที่ผ่าน peer review และมีการประเมินเชิงอัตวิสัยจากคำค้นเพียงไม่กี่รายการ
ผู้เขียนให้เหตุผลว่า ด้วยประสบการณ์ด้านงานวิจัย information retrieval และรางวัล best paper การเป็นบทความวิชาการไม่ได้แปลว่าจะเข้มงวดกว่ากันโดยอัตโนมัติ
ผู้เขียนระบุว่าคำโต้แย้งจากผู้ใช้ Kagi บางส่วนอาศัยการปักหมุดผลลัพธ์ GitHub หรือเลือกเฉพาะคำค้นที่ GitHub มีแนวโน้มจะให้ผลลัพธ์ดี
จนถึงตอนนั้นยังไม่มีคำโต้แย้งใดที่แสดงให้เห็นว่าคำค้นเรื่องยาง ทรานซิสเตอร์ หรือพยากรณ์หิมะ ได้ผลลัพธ์ที่ดีจริง
แก่นของข้อถกเถียงเรื่องคุณภาพการค้นหาไม่ใช่เทคนิคการค้นหาของผู้เชี่ยวชาญ แต่คือผู้ใช้ทั่วไปที่ค้นหาแบบง่าย ๆ จะเจอโฆษณาหลอกลวงและ SEO สแปมได้ง่ายแค่ไหน

1 ความคิดเห็น

GN⁺ 2024-01-01

ความคิดเห็นจาก Hacker News

แม้เมื่อเร็ว ๆ นี้จะปรับปรุง อัลกอริทึมการค้นหา ไปมาก แต่คิดว่า Marginalia Search ค่อนข้างโชคดีกับตัวอย่างคำค้น
ผลลัพธ์ยังคงขึ้น ๆ ลง ๆ กว่าทางเลือกอื่น ๆ และนั่นก็หมายความว่า การประเมินคุณภาพการค้นหา เป็นเรื่องยากด้วย
ประสิทธิผลยังขึ้นอยู่มากว่าผู้ใช้เข้าใจหรือไม่ว่านี่เป็นเสิร์ชเอนจินแบบค้นหาด้วยคีย์เวิร์ดที่ไม่มีความเข้าใจเชิงความหมาย
- ดีตรงที่เป็น การค้นหาด้วยคีย์เวิร์ด โดยไม่มีความเข้าใจเชิงความหมาย
  “ความเข้าใจเชิงความหมาย” บางครั้งอาจมีอคติและทำงานอย่างน่าสงสัยได้
- อยากฟังเพิ่มเติมในส่วนที่คุณประทับใจเป็นการส่วนตัวเกี่ยวกับความยากของการประเมินคุณภาพการค้นหา
  ผมติดตามฝั่งเสิร์ชแบบ DIY/ไม่ใช่องค์กรอย่าง YaCY อยู่บ้าง และอยากรู้เบื้องหลังการตัดสินใจเชิงวิศวกรรมเวลาสร้างเสิร์ชเอนจินมากขึ้น
  โดยรวม Marginalia เป็นงานที่น่าประทับใจมาก และผมได้ยินแต่เสียงชื่นชมจากผู้ใช้ที่นี่
- นี่เป็นฟีดแบ็กหลังจากลองใช้เพื่อดูว่าจริง ๆ แล้วมันคืออะไร
  ผมหา marginalia ใน DDG แต่ไม่เจอในหน้าแรก ส่วนใน Google โผล่มาหลังผลลัพธ์จิปาถะหลายรายการ
  เข้า marginalia.nu แล้วเกิด ข้อผิดพลาด SSL ส่วน search.marginalia.nu ใช้งานได้
  เมื่อค้นหา duckduckgo ใน Marginalia ลิงก์แรกเกี่ยวกับแอป จึงถือว่าเกี่ยวข้องอยู่บ้าง แต่ที่เหลือแม้จะเกี่ยวกับ DDG ก็มีความเกี่ยวข้องไม่ชัดเจน
  แม้ค้นหา uBlacklist ที่กล่าวถึงข้างต้น ก็ไม่เห็นผลลัพธ์ที่เกี่ยวข้องโดยตรง
- ดูเหมือนจะหลบคำถามที่ว่า “นักพัฒนาคนเดียวทำได้ดีขนาดนั้นได้อย่างไร” ไปหมดเลย ;)
  จริงอยู่ที่การค้นหาแย่ลงมาก แต่ความสามารถในการรู้จัก คำวิเศษ และจัดรูปคำค้น เช่น “ublock origin” แทน “Adblock” หรือ “yt-dlp” แทน “download YouTube” ก็ดีขึ้นด้วย
  เท่ากับว่าพวกเราทุกคนทำ prompt engineering ใส่โมเดลภาษาขนาดใหญ่ระดับทั้งอินเทอร์เน็ตที่ทุกคนเป็นพวกสแปมกันมาโดยตลอด
ทุกวันนี้การค้นหาค่อนข้างยาก และทุกคนรู้วิธีปั่นผลลัพธ์กันหมด
แนะนำเสิร์ชเอนจินที่สามารถปรับได้อย่างมีประสิทธิภาพว่าไซต์ใดจะปรากฏ เช่น Kagi หรือ Programmable Search Engines ของ Google
โดยเฉพาะ YouTube ผมบล็อกไว้ เพราะไม่ชอบที่มันปนเปื้อนผลลัพธ์ทั่วไปด้วยวิดีโอ แม้บางครั้งจะมีผลลัพธ์ที่ตรงก็ตาม การดึงข้อมูลจากวิดีโอใช้เวลานานเกินไป
ฟีเจอร์ที่ให้แนะนำผลลัพธ์สำหรับคำค้นเฉพาะได้นั้นน่าสนใจ แต่ก็น่าจะถูกปั่นได้ง่ายเช่นกัน สุดท้ายดูเหมือนมีแต่ แนวทาง DIY เท่านั้นที่พอจัดการได้
สำหรับผมจะอนุญาตเฉพาะผลลัพธ์จากโดเมนที่ผมเชื่อว่าถูกต้องเท่านั้น วิธีแบบ whitelist มีข้อเสีย และปกติผมตรวจสอบโดเมนใหม่ผ่านช่องทางทางสังคมอย่าง Reddit หรือที่นี่ ไม่ใช่จากผลการค้นหา
ผมคิดว่ามี trade-off โดยเนื้อแท้ระหว่างความสามารถในการค้นพบกับความเป็นไปได้ที่ผลลัพธ์จะถูกปั่น
เข้าใจความรู้สึกคิดถึงผลการค้นหา Google ปี 2008 แต่ตอนนั้นมีคอนเทนต์น้อยกว่าปัจจุบันหลายหลัก และภาคธุรกิจยังไม่รู้ว่าการจัดอันดับค้นหามีคุณค่าแค่ไหน จึงน่าจะมี SEO น้อยมาก
อีกอย่าง ผมไม่เห็นด้วยว่าเมื่อผู้ใช้ทั่วไปค้นหา “Youtube Download” แล้ว yt-dlp คือ “คำตอบที่ถูกต้อง” ผู้ใช้ทั่วไปมีโอกาสสูงที่จะไม่รู้จัก command line และไม่อยากใช้ด้วย
- ทุกวันนี้เวลาค้นหา กลับให้ความสำคัญกับ วิดีโอ YouTube มากกว่า
  เว็บไซต์จำนวนมากเป็นเพียงการนำเนื้อหาเดิมมาปั่นใหม่เหมือนฟาร์ม SEO คุณภาพต่ำ เพราะทำง่ายและโฮสต์ก็ถูก
  ในทางกลับกัน การทำวิดีโอต้องใช้เวลาและความพยายาม จึงมีอุปสรรคสูงกว่าสำหรับการใช้เป็น click farm
  หลายครั้งเมื่อการค้นหาแบบดั้งเดิมล้มเหลว วิดีโอบน YouTube ที่อัปโหลดราวปี 2009 กลับอธิบายสิ่งที่ผมหาอยู่ได้อย่างชัดเจน ใจเย็น และละเอียด
  เวลาหาข้อมูลเพื่อซื้อสินค้าก็มักเป็นแหล่งที่ดีกว่า เช่น ถ้ากำลังหาว่าควรซื้อพัดลมตัวไหน ก็มีช่องเฉพาะทางที่ทดสอบประโยชน์ใช้สอยของพัดลมหลายรุ่น แล้วแสดงวิธีการและผลลัพธ์เป็นวิดีโอ
  ช่องกระแสหลักไม่ค่อยช่วยเท่าไร แต่มีวิดีโอที่ทำด้วยความหลงใหลสไตล์ “เว็บยุคเก่า” อยู่แทบทุกหัวข้อ และเหมือนขุมทรัพย์
- ปี 2008 คือ 10 ปีหลังจาก Google ก่อตั้ง ผู้คนเข้าใจ SEO กันแล้ว และ Google ก็อัปเดตอย่างต่อเนื่องเพื่อพยายามลงโทษการปั่นอัลกอริทึม
  ตัวอย่างเช่น บทความ Wikipedia เรื่อง “link farming” อธิบายว่ามีเรื่องแบบนี้มาตั้งแต่ปี 1999 และมุ่งเป้าไปที่ SEO ของ Inktomi
  https://en.wikipedia.org/wiki/Link_farm
  ผมจำได้ว่าราวปี 2004 ในพรีเซนเทชันภายในของ Amazon ก็มีเนื้อหาว่าการเสริม Google SEO ให้เว็บเพจของ Amazon จะเพิ่มทราฟฟิกและยอดขายได้ Amazon กลับค่อนข้างตามหลังอยู่บ้างด้วยเหตุผลคล้ายกลุ่มอาการ NIH
- ยากจะเชื่อว่าเสิร์ชเอนจินจะแยกแยะไซต์เก่าแก่ที่น่าเชื่อถือออกจากขยะที่สร้างขึ้นมาเพื่อให้เป็นผลการค้นหาได้ยากขนาดนั้น
  ถ้ามนุษย์แยกแยะได้ โดยหลักการแล้วคอมพิวเตอร์ก็ควรทำได้
- PSE ของ Google ก็โอเค แต่ไม่มีวิธีที่ดีในการสลับและจัดการหลายตัว
  แค่เพิ่ม dropdown เล็ก ๆ ใน UI ลิงก์สาธารณะของแต่ละ PSE เพื่อเลือกว่าจะใช้ตัวไหนก็น่าจะพอ น่าเสียดาย
  Giggle[1] มีฟีเจอร์นี้ และผมรันมันในเครื่องร่วมกับ Kagi เพื่อค้นหาแบบเฉพาะเจาะจงมากขึ้นในรายชื่อโดเมนที่สะสมมาหลายปี
  1. https://github.com/dan-lovelace/giggle
- ผมชอบ เสิร์ชเอนจินสำหรับค้นหาไซต์ที่ไม่ใช่เชิงพาณิชย์ เพราะประเด็นเรื่องการปั่นผลลัพธ์
  ถ้าการคลิกไม่ก่อให้เกิดรายได้ เกมนี้ก็หายไปแทบทั้งหมด
  ไม่ได้หมายความว่าไม่ควรมีสิทธิ์ทำเงิน แต่โมเดลนั้นกระตุ้นพฤติกรรมที่เป็นปฏิปักษ์ต่อผู้ใช้อย่างชัดเจน
  แม้แต่ไซต์ถูกกฎหมายอย่างสื่อมวลชนก็ใช้โมเดลนี้ ดังนั้นการมีไว้เป็นตัวเลือกอาจเป็นเรื่องดี
ผมรู้จัก Kagi จาก HN และหลังจากลองค้นหา 100 ครั้งก็สมัครสมาชิก
ถ้าค้นหาเรื่องเกี่ยวกับ JS หรือ CSS แบบสุ่ม MDN จะขึ้นมาเป็นผลลัพธ์แรก หรือไม่ก็สามารถลดอันดับเว็บไซต์สแปมที่อยู่ด้านบนได้
คงจะดีถ้าโมเดลภาษาขนาดใหญ่แบบโลคัลถูกฝึกให้ตรวจจับ คลิกเบต หรือคอนเทนต์ที่ทำแบบขอไปทีได้
ลองนึกภาพการค้นหา YouTube ที่คลิกเบตทั้งหมดถูกพับเก็บเหมือนที่ Kagi รวมบทความแบบลิสต์ไว้ และเหลือแต่คอนเทนต์ที่อาจมีคุณภาพสูง ไม่รู้ว่าตอนนี้ทำได้หรือยัง
- สำหรับวิดีโอ YouTube ใช้ Kagi Summarizer แล้วจะไม่ต้องเสียเวลาดูวิดีโอขยะ
  เป็น life hack ที่ยอดเยี่ยม
- เห็นจาก HN แล้วกลายเป็นแฟนตัวยงของ Kagi
  น่าทึ่งมากว่าเสิร์ชเอนจินที่ไม่ได้เต็มไปด้วยโฆษณาจะดีขึ้นได้แค่ไหน
- จ่ายเงินใช้ Kagi มานานกว่า 6 เดือนแล้ว และพอใจมาก
  ปกติค่อนข้างไม่ชอบการสมัครสมาชิก แต่สำหรับบริการในหมวดที่เดิมทีฟรีได้ขนาดนี้ ก็ถือเป็นการประเมินที่มีนัยสำคัญทีเดียว
  บางครั้งการค้นหาในพื้นที่ยังต้องกลับไปใช้ Google แต่เรื่องอื่น ๆ ก็พอใจ
แชร์ ผลลัพธ์ของ Kagi ปัจจุบันไว้ให้คนที่ไม่มีบัญชีได้เปรียบเทียบ
youtube downloader
https://kagi.com/search?q=youtube+downloader&r=us&sh=_szITdy...
ad blocker
https://kagi.com/search?q=Ad+blocker&r=us&sh=-BHzV2ZoCDpmgOu...
download Firefox
https://kagi.com/search?q=Download+Firefox&r=us&sh=zkkmc_EQX...
why do wider tires have better grip?
https://kagi.com/search?q=Why+do+wider+tires+have+better+gri...
why do they keep making cpu transistors smaller?
https://kagi.com/search?q=Why+do+they+keep+making+cpu+transi...
vancouver snow forecast winter 2023
https://kagi.com/search?q=Vancouver+snow+forecast+winter+202...
เห็นด้วยกับผู้เขียนว่าเว็บมีสแปมมากเกินไป โดยทั่วไปมองว่า Kagi ลดอันดับสแปมได้ค่อนข้างดี และจำนวนโฆษณา/ตัวติดตามเป็นสัญญาณเชิงลบในการจัดอันดับของ Kagi
แต่ก็ยังทำได้ดีกว่านี้ และโหมดค้นหาเฉพาะอย่าง “Small Web” แทบจะกำจัดสแปมออกไปได้จริง
ยินดีต้อนรับการตรวจสอบแบบนี้จากชุมชน และหวังว่าจะช่วยคอยยึดเราไว้ให้ซื่อตรงต่อไป
- Kagi ให้เว็บไซต์ที่ต้องคลิกเข้าไปมากกว่า ส่วน Google ให้คำตอบที่สมเหตุสมผลทันที
  ในตัวอย่างก็ไม่เห็นสแปมเช่นกัน
  สำหรับ “why do wider tires have better grip?” คำตอบคือยางที่กว้างกว่าจะกระจายน้ำหนักได้สม่ำเสมอกว่าด้วยหน้าสัมผัสที่ใหญ่ขึ้น และเพิ่มการยึดเกาะตอนเข้าโค้ง ทำให้การควบคุมและเสถียรภาพดีขึ้น
  สำหรับ “why do they keep making cpu transistors smaller?” คำตอบคือ ทรานซิสเตอร์ ที่เล็กลงทำการคำนวณได้มากขึ้นโดยไม่ร้อนเกินไป มีประสิทธิภาพด้านพลังงานดีกว่า ลดขนาดไดเพื่อลดต้นทุน และเพิ่มความหนาแน่นจนเพิ่มจำนวนคอร์ต่อชิปได้
  สำหรับ “vancouver snow forecast winter 2023” คำตอบคือในฤดูกาล 2023/2024 คาดว่าจะมีหิมะตกมากพอสมควรและอุณหภูมิแกว่งอยู่เหนือและต่ำกว่าจุดเยือกแข็ง จึงควรเตรียมตัวไว้
เรื่องที่เกี่ยวกับ ChatGPT นี่เข้าใจยากจริง ๆ ว่าทำไมถึงใช้ 3.5
เป็นวิธีที่ทำให้เข้าใจผลลัพธ์ที่ได้จาก ChatGPT เวอร์ชันดีที่สุดที่ใช้งานได้อยู่ผิดไปค่อนข้างมาก
เพื่อเปรียบเทียบ นี่คือผลลัพธ์จากการโยนคำถามทั้งหมดของผู้เขียนให้ GPT-4
https://chat.openai.com/share/ed8695cf-132e-45f3-ad27-600da7...
- เพราะสิ่งที่คนส่วนใหญ่เข้าถึงได้คือ ChatGPT 3.5
  การพูดถึงสิ่งที่ผู้อ่านส่วนใหญ่จะไม่จ่ายเงินใช้แทบไม่มีประโยชน์ และบุคคลที่สามทั่วไปก็ไม่มีหน้าที่ต้องชักจูงให้คนอื่นส่งเงินให้ OpenAI
  ถ้าไม่พอใจที่ผู้คนใช้ 3.5 ก็ควรไปประท้วง OpenAI ไม่ใช่คนที่ใช้บริการที่ให้ใช้ฟรี
  โดยส่วนตัวไม่รู้สึกว่าการยกย่องความต่างระหว่าง 4 กับ 3.5 แบบเกินจริงนั้นมีเหตุผลรองรับ
  https://news.ycombinator.com/item?id=38304184
- ถ้ามันแย่ขนาดนั้น แล้วทำไม OpenAI ยังให้บริการ ChatGPT 3.5 ต่อไป
- สำหรับคนส่วนใหญ่ ใช้ค่อนข้างยาก
  ต้องจ่ายแบบเหมาจ่ายเดือนละ 20 ดอลลาร์ที่มีขีดจำกัดจำนวนข้อความ หรือต้องเข้าใจวิธีขอ API key หรือใช้บริการของบุคคลที่สามที่มีค่าใช้จ่ายและข้อจำกัดใกล้เคียงกัน
ลองใช้ uBlacklist ก็ดี เป็นเครื่องมือคล้าย uBlock สำหรับผลการค้นหา
https://addons.mozilla.org/en-US/firefox/addon/ublacklist/
https://chromewebstore.google.com/detail/ublacklist/pncfbmia...
สามารถซิงก์การตั้งค่าและรายการบล็อกส่วนตัวผ่าน Dropbox หรือ Google Drive ได้ และยังสมัครรับรายการบล็อกได้ด้วย
แต่ต้องเปิดใช้เสิร์ชเอนจินเองและสมัครรับรายการเอง ในการตั้งค่าสมัครรับของ uBlacklist ยังไม่มีฟีดในตัว
เว็บไซต์ของ uBlacklist มีฟีดอยู่บางส่วน
https://iorate.github.io/ublacklist/subscriptions
ยังเจอรายการฟีดที่ดีกว่านี้ด้วย
https://github.com/quenhus/uBlock-Origin-dev-filter#other-fi...
- ฟีเจอร์นี้มีอยู่ใน Kagi แล้ว
  สามารถเลื่อนอันดับโดเมนขึ้น หรือใส่ไว้ใน แบล็กลิสต์ ได้จากผลการค้นหา
- uBlacklist ยอดเยี่ยมจริง ๆ
  ใช้มาหลายปีแล้วไม่เคยมีปัญหาเลย
  ทิปสั้น ๆ คือเปิด “Skip the "Block this site" dialog” และปิด “Hide the "Block this site" links” จะช่วยให้บล็อกเว็บไซต์สแปมได้เร็วขึ้นมาก
- ถ้าใช้ uBlacklist ร่วมกับแบล็กลิสต์ของตัวเอง Google ก็ใช้งานได้ค่อนข้างดีขึ้น
ผมอยู่ฝั่งที่มองว่าผลลัพธ์ของ Google ยังดีมาก
เพียงแต่ผมใช้ uBlock Origin อยู่ และจะไม่แม้แต่ลองปิดมัน
เข้าใจเจตนาของผู้เขียนที่ปิดตัวบล็อกโฆษณาเพื่อให้ได้ “ประสบการณ์ท่องเว็บแบบผู้ไม่เชี่ยวชาญ” แต่ก็น่าจะทดสอบแยกอีกชุดโดยเปิด uBlock กับทุกคำค้นได้เหมือนกัน
อีกอย่าง การจำลองประสบการณ์ของผู้ไม่เชี่ยวชาญแต่คาดหวังให้ผลลัพธ์ดาวน์โหลดวิดีโอมี yt-dlp โผล่มา ก็ไม่ค่อยสอดคล้องกันนัก
yt-dlp เป็นยูทิลิตี Python แบบ command line ซึ่งห่างไกลจากผู้ไม่เชี่ยวชาญมาก
คนส่วนใหญ่ไม่รู้ด้วยซ้ำว่าวิดีโอเป็นไฟล์ที่ดาวน์โหลดได้ และในกลุ่มคนที่รู้ ส่วนใหญ่ก็ไม่รู้จัก command line หรือ Python
ถ้าค้นหา “how to download youtube videos” ใน Google ผลลัพธ์แรกคือบริการชื่อ savefrom.net ซึ่งใช้งานได้ดีและดูไม่เหมือนเว็บหลอกลวง ตามเกณฑ์ของผมถือว่า “ดีมาก”
ถ้าค้นหา “how to download youtube videos from the command line” ผลลัพธ์แรก ๆ หลายรายการจะเกี่ยวกับ youtube-dl และมีลิงก์ GitHub กับ Super User รวมอยู่ด้วย แม้จะไม่พูดถึง yt-dlp แต่ youtube-dl ก็เป็นจุดเริ่มต้นที่ดี
- ถ้าค้นหา “how to download youtube videos” ใน Google จากแท็บไม่ระบุตัวตน ผลลัพธ์สองรายการแรกจะออกมาแบบนี้
  https://msunduziassociation.online/perfect-online-videos/
  https://gssaction.org/program-all-in-one-media-solutions/
  ผมคงจัดเข้าหมวด “แย่มาก” อย่างชัดเจนเหมือนผู้เขียน
- สงสัยว่าเคยลองใช้ savefrom.net จริง ๆ ไหม
  พอใส่ “https://www.youtube.com/watch?v=IkYVmtgxebU” แล้วกด “Download” จะเปิดแท็บใหม่ที่พยายามติดตั้งมัลแวร์
  ถ้าปฏิเสธการติดตั้ง แท็บใหม่นั้นจะพาไปยังหน้าแรกของมัลแวร์
  เมื่อปิดแท็บแล้วกลับไปแท็บเดิม savefrom.net จะแสดงข้อผิดพลาด “The download link not found.” และไม่ได้ช่วยดาวน์โหลดวิดีโอให้
- ตัวบล็อกโฆษณาเป็นสิ่งจำเป็น และโดยส่วนตัวคิดว่า ตัวบล็อกสคริปต์ ก็จำเป็นด้วย
  มีความรู้สึกคลุมเครือว่าการค้นหาแย่ลงเมื่อเวลาผ่านไป แต่ไม่ใช่ปัญหาใหญ่ ปกติเซตเว็บที่ดีจะอยู่ในหนึ่งหรือสองหน้าแรก เข้าไปตรวจดูได้
  แต่ถ้าหมายความว่าทันทีที่คลิกเข้าเว็บก็ถูกโจมตี สถานการณ์จะรุนแรงขึ้นมาก ไม่ใช่แค่ว่ามีเว็บดีอยู่ไหม แต่ต้องสนใจด้วยว่าไม่มีเว็บร้ายอยู่หรือเปล่า
  นอกจากนั้น ผู้คนควรถูกฝึกให้โดยทั่วไปไม่ดาวน์โหลดโปรแกรมจากเว็บไซต์ เรื่องนี้ดูเหมือนจะดีขึ้นบ้างตามเวลา
  Google น่าจะลดอันดับเว็บไซต์ที่มีลิงก์ไฟล์ปฏิบัติการได้ และบางทีก็คงทำอยู่แล้ว
- ผมอยู่ฝั่งที่มองว่า Google และเสิร์ชเอนจินอื่น ๆ แย่มาก เว้นแต่จะเป็นคำศัพท์เทคนิคที่เฉพาะเจาะจงและโดดเด่นมากอย่าง “weak neutral currents”
  การค้นหาที่เป็นเรื่องทั่วไปกว่านั้นกลายเป็นการคุ้ยกองขยะที่ไม่มีแม้แต่คำที่กำลังหา
  แม้แต่การค้นหาแบบ “verbatim” ก็ต้องพึ่งดวง ไม่ก็ถูกมองข้าม หรือได้ผลลัพธ์ 0 รายการ
- แก่นสำคัญที่ได้จากบทความนั้นคือ “อย่าพึ่งพาความรู้สึกของคนอื่น หรือมีมที่ว่า X แย่ Y ดี ทุกคนสามารถสร้างการทดสอบของตัวเองได้”
  การจำลองประสบการณ์ของผู้ไม่เชี่ยวชาญโดยไม่มีวิธีเลี่ยงใด ๆ ไม่ใช่รูปแบบการใช้งานทั่วไป เพราะทุกคนต่างมีวิธีของตนในการดึงคุณค่าเพิ่มจากเครื่องมือที่ชอบ
  แต่บทความนี้แสดงให้เห็นวิธีจัดโครงสร้างการทดลอง เช่น “ทำไมถึงเลือกคำค้นนี้ ประเมินการหลอกลวงอย่างไร”
  อยากให้ผู้คนลองประเมินด้วยแนวคิดเดียวกันว่า เครื่องมือที่ตนเลือกใช้อยู่ตอนนี้ติดอยู่ใน local optimum หรือไม่
เข้าใจได้ว่าทำไมผู้คนถึงรู้สึกว่าผลการค้นหาแย่
ผลลัพธ์ที่ยอดเยี่ยมสำหรับ “Download youtube videos” คือ “ในอุดมคติ ผลลัพธ์อันดับต้น ๆ ควรเป็น yt-dlp หรือกราฟิกแรปเปอร์แบบบาง” เนี่ยนะ
สำหรับผม แค่มีเว็บไซต์ที่ใส่ลิงก์ดาวน์โหลดแล้วโหลดลงฮาร์ดดิสก์ได้ก็พอ ไม่สนหรอกว่าใช้แพ็กเกจอะไร
ผมไม่ได้กังวลเรื่อง มัลแวร์ เหมือนยุค 90 และคน 99.999% ก็ไม่ใช่คนที่ยุ่งกับการเขียนโปรแกรม
ทำให้ตระหนักว่าผลการค้นหามันเป็นเรื่องอัตวิสัยแค่ไหน ผลลัพธ์ที่ “ยอดเยี่ยม” ของพวกเขา สำหรับผมล้วนเป็นผลลัพธ์ที่ “แย่มาก”
- มัลแวร์ในยุค 90 หรือพูดให้ถูกคือไวรัสจริง ๆ นั้นอยู่ในระดับที่น่าขำ
  โดยเฉพาะเพราะคอมพิวเตอร์เป็นสิ่งที่โดดเดี่ยว คอมพิวเตอร์ที่เชื่อมต่อกันต่างหากที่เป็นข้อยกเว้น
- เพิ่งลองดูเมื่อกี้ ผลลัพธ์แรกของ Kagi เป็นเว็บแบบนั้นพอดี
  มันประมวลผลวิดีโอและให้ดาวน์โหลดได้เร็วมาก
  คนมีเหตุผลจะชอบ youtube-dl ไปทำไมกัน
สิ่งที่ทำให้สับสนเสมอในท่าทีว่า “การค้นหาแย่ลงมาก” คือ หลายครั้งมันอิงอยู่กับ หลักฐานเชิงเรื่องเล่า อย่างดีที่สุด หรือถ้าแย่กว่านั้นก็เป็นความทรงจำเชิงเรื่องเล่า
ผมเองก็รู้สึกว่าการค้นหาแย่ลงในช่วงหลายปีที่ผ่านมา แต่จะรู้ได้อย่างไรว่ามันเป็นแบบนั้นจริง
มันควรเป็นข้อกล่าวอ้างที่ตรวจสอบได้ ลองใช้คำค้นยอดนิยม N อันดับแรกจากที่อย่าง Google Trends แล้วดูประสิทธิภาพก็ได้
ดูเหมือนจะสร้างเบนช์มาร์กได้ง่าย แต่ในบรรดาคนที่บ่นเรื่องนี้ ไม่มีใครพยายามทำแบบนั้นเลย
Dan เริ่มเสนอหลักฐานจริงและเกณฑ์ให้คะแนนผลลัพธ์แล้ว แต่แม้แต่เขาก็ดูแค่ 5 ตัวอย่างเท่านั้น เป็นกลุ่มตัวอย่างที่เล็กมากสำหรับการกล่าวอ้างทั่วไป
เลยยังสงสัยว่าทำไมจึงมีบทความมากมายเกี่ยวกับความรู้สึกว่าการค้นหาแย่ลง แต่ไม่มีใครตรวจสอบข้อกล่าวอ้างนั้น
- ประเด็นหลักดูเหมือนจะเป็นว่าหน้าผลลัพธ์ของเสิร์ชเอนจินกระแสหลักเป็น ทุ่งทุ่นระเบิดของการหลอกลวง ที่คนทั่วไปผ่านไปได้อย่างปลอดภัยยาก
  ถ้าเป็นปัญหาเรื่องความเกี่ยวข้องอย่างเดียว คำวิจารณ์เรื่องกลุ่มตัวอย่างเล็กก็สมเหตุสมผล แต่ถ้าจุดเน้นคือความเสียหาย กลุ่มตัวอย่างเล็กก็มีความหมาย
  ถ้าบอกว่า “พบเข็มฉีดยาที่ใช้แล้วในสนามเด็กเล่น 3 จาก 5 แห่ง” โดยปกติคงไม่มีใครเรียกร้องค่า p-value กับ error bar
- ไม่คิดว่านั่นเป็นคำวิจารณ์ที่ยุติธรรม
  1. ขั้นตอนการประเมินว่า “ทำงานได้ดีแค่ไหน” ย่อมเป็นอัตวิสัยโดยหลีกเลี่ยงไม่ได้
  2. ออกแบบงานวิจัยและรับสมัครผู้เข้าร่วมได้ก็จริง แต่นั่นไม่ใช่งานของบล็อกเกอร์
  3. ในบทความยังลิงก์แบบสำรวจที่ผู้คนเห็นตรงกันว่าผลลัพธ์แย่ลงด้วย แม้จะมีปัญหาเรื่องกลุ่มตัวอย่าง แต่ก็ดีกว่าไม่มีอะไรเลย
    โดยเฉพาะกรณีนี้ ผู้เขียนกำลังตอบคำถามว่า “ตามรสนิยมของผม ผลลัพธ์ไหนดีที่สุด?”
- ผมไม่ได้เป็นตัวแทนของคนอื่น แค่พยายามหาอะไรสักอย่างออนไลน์เท่านั้น
  ไม่ได้จะสร้างเสิร์ชเอนจินมาแข่งกับ Google หรือเขียน论文
  ปัญหานี้ถูกหยิบยกขึ้นมาหลายครั้งตลอดหลายปีในที่นี่ แต่คำตอบมักเป็นคำอธิบาย ไม่ใช่วิธีแก้
  คุณภาพที่ลดลง ไม่ได้เกิดขึ้นชั่วข้ามคืน แต่ค่อย ๆ ดำเนินไปเป็นเวลาหลายปี
  Google เริ่มเสนอ “did you mean...?” โดยอ้างว่าคำค้นบางคำพบได้น้อยกว่า และบังคับให้ต้องคลิกครั้งที่สองเพื่อทำการค้นหาเดิมที่ตั้งใจไว้ แถมยังแย่ลงอีกเมื่อมันถึงกับเมินตัวระบุที่ใช้สั่งให้ไม่ต้องสนใจสิ่งนั้น
  ตอนที่ตระหนักว่าคำค้นสั้น ๆ สามคำที่เลือกมาอย่างระมัดระวังให้ผลลัพธ์นับพันรายการแต่ไม่มีอะไรเกี่ยวข้องเลย ผมก็รู้สึกว่าพอแล้ว เรื่องนี้อาจต่างกันไปในแต่ละคน
- Dan เข้าหาปัญหานี้จาก มุมมองเชิงคุณภาพ
  ถ้ามีคนมากกว่านี้ใช้แนวทางแบบนี้ แทนที่จะยึดติดกับการทำทุกอย่างให้เป็นตัวเลขแบบสุดโต่ง เราอาจมีผลิตภัณฑ์ที่ทำให้เราแทบคลั่งน้อยลงก็ได้
  สิ่งสำคัญคือความรู้สึกท่วมท้นว่าการค้นหาแย่ลง ไม่ใช่สเปรดชีตอีกแผ่นหนึ่งที่พาเรามาถึงจุดนี้
- ถ้าจะทำแบบนั้น จำเป็นต้องมีนิยาม “คุณภาพ” ที่ครอบคลุม ซึ่งไม่ง่ายเลย และอย่างน้อยบางส่วนก็หลีกเลี่ยงความเป็นอัตวิสัยไม่ได้
  การรวมสิ่งที่ตกหล่นไว้ในนิยามคุณภาพก็ทำได้ยาก และสิ่งใดควรถูกละไว้ก็เป็นเรื่องอัตวิสัย
  ตัวอย่างเช่น เมื่อค้นหา “Gaza” เสิร์ชเอนจินหนึ่งอาจเน้นเฉพาะเหตุการณ์ล่าสุด ส่วนอีกเอนจินอาจไม่สนใจเหตุการณ์ล่าสุดและใส่แต่ข้อมูลทั่วไป
  แบบไหนมีคุณภาพสูงกว่ากัน? ในความเป็นจริงขึ้นอยู่กับว่ากำลังมองหาอะไร
  สุดท้ายก็ทำได้เพียงสร้างรายการสิ่งที่คิดว่าสำคัญขึ้นมาแบบอัตวิสัย แล้วให้คะแนนตามนั้น ซึ่งแทบไม่ต่างจากการประเมินเชิงเรื่องเล่าที่มีขั้นตอนเพิ่มเข้ามา
ถ้าอยากรู้ว่าทำไม Google หรือเสิร์ชเอนจินใด ๆ ถึงไม่ค่อยดี ให้ดูว่าพวกเขาวัดผลการค้นหาของตัวเองอย่างไร
บริษัทค้นหาส่วนใหญ่ทำสิ่งคล้ายกับที่ผู้เขียนทำ แต่ทำในระดับใหญ่ภายใต้แนวทางที่เฉพาะเจาะจงมาก
ตัวอย่างเช่น Google มีแนวทาง 168 หน้าสำหรับผู้ประเมินคุณภาพการค้นหา
https://static.googleusercontent.com/media/guidelines.raterh...
ในนั้นมีเรื่องการทำความเข้าใจความหมายของคำค้น การตัดสินเจตนาของผู้ใช้ การประเมิน “คุณภาพ” ของเว็บไซต์ และการให้คะแนนว่าไซต์มีประโยชน์เพียงใดเมื่อเทียบกับความหมายและเจตนาของคำค้น เป็นต้น
กล่าวคือ ไม่ใช่ว่าบริษัทค้นหาไม่ได้ทำสิ่งที่ผู้เขียนทำ เพียงแต่ เกณฑ์ ของพวกเขาต่างจากผู้เขียน
เกณฑ์นั้นอาจสอดคล้องกับผู้ใช้มากกว่าผู้เขียนก็ได้ แต่อาจไม่ใช่ก็ได้ และอาจไม่เป็นเช่นนั้นตลอดไป
- ยากที่จะบอกว่าคำพูดนั้นถูกต้อง
  หน้า 29 ของเอกสารที่ลิงก์อธิบาย “Lowest Quality Content”
  ผลการค้นหาส่วนใหญ่ที่ผู้เขียนประเมินว่าเป็นสแปมหรือหลอกลวง เข้ากับแนวทางนี้อย่างชัดเจน
  ถ้าอย่างนั้นก็เป็นไปได้ว่าผู้ประเมินไม่รู้หัวข้อนั้นมากพอจนแยกแยะไซต์ที่เป็นอันตรายหรือชวนเข้าใจผิดไม่ได้ หรือไม่ก็ผู้ประเมินประเมินได้ถูกต้องแล้วแต่ไม่เกิดผลตามที่ต้องการ
- อาจเกี่ยวข้องกับวิธีที่ Google เข้าใจการค้นหาของ “คนทั่วไป”
  Google กลายเป็นเสิร์ชเอนจินสำหรับสินค้าและเว็บไซต์เปรียบเทียบราคา และในด้านนั้นมันยอดเยี่ยม
  ไม่ว่าจะเป็นสินค้าใดที่ควรพิจารณาซื้อ มันก็ช่วยหาสินค้าที่เกี่ยวข้องสูงให้ได้ ดังนั้น Google อาจปรับให้เหมาะกับด้านนั้น
  การค้นหาส่วนใหญ่ของผมเกี่ยวกับ IT, การเขียนโปรแกรม, ซอฟต์แวร์ และคอมพิวเตอร์โดยรวม แต่คนทั่วไปค้นหาสินค้า ข่าว และเวลาเปิดปิดร้าน
  Google ทำเรื่องพวกนั้นได้ค่อนข้างดี และเงินอยู่ใน “การไปซื้ออะไรสักอย่าง”
  โฆษณาค้นหาสินค้าของ Google แม่นยำกว่าผลการค้นหาจริงเสมอ
  ผมมองว่า Google ปรับให้เหมาะกับ การขายสินค้า
- ผู้ใช้ทั่วไปจะอยากได้ผลการค้นหาแบบ บล็อกสแปม ไปทำไม
  หวังว่าเมื่อโมเดลภาษาขนาดใหญ่ดีขึ้น จะสามารถคัดกรองผลลัพธ์ที่ส่งกลับมาได้ดีขึ้น

เปรียบเทียบคุณภาพการค้นหาของ Google, Bing, Marginalia, Kagi, Mwmbl และ ChatGPT

วิธีเปรียบเทียบและเกณฑ์ประเมิน

ผลลัพธ์โดยรวม

ผลลัพธ์แยกตามคำค้น

`download youtube videos`

`ad blocker`

`download firefox`

`Why do wider tires have better grip?`

`Why do they keep making cpu transistors smaller?`

`vancouver snow forecast winter 2023`

วิธีที่โฆษณา, SEO และอาการหลอนปะปนกัน

ปัญหาแรงจูงใจของการค้นหาที่พึ่งโฆษณา

ความเป็นไปได้ของเสิร์ชเอนจินขนาดเล็กและเมตาเสิร์ช

ภาคผนวก: เสิร์ชเอนจินอื่น

ภาคผนวก: กระบวนการอ้อมเพื่อหาคำตอบที่ดี

กรณีตัวอย่าง Google knowledge card

คำตอบต่อคำวิจารณ์

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News

เปรียบเทียบคุณภาพการค้นหาของ Google, Bing, Marginalia, Kagi, Mwmbl และ ChatGPT

วิธีเปรียบเทียบและเกณฑ์ประเมิน

ผลลัพธ์โดยรวม

ผลลัพธ์แยกตามคำค้น

download youtube videos

ad blocker

download firefox

Why do wider tires have better grip?

Why do they keep making cpu transistors smaller?

vancouver snow forecast winter 2023

วิธีที่โฆษณา, SEO และอาการหลอนปะปนกัน

ปัญหาแรงจูงใจของการค้นหาที่พึ่งโฆษณา

ความเป็นไปได้ของเสิร์ชเอนจินขนาดเล็กและเมตาเสิร์ช

ภาคผนวก: เสิร์ชเอนจินอื่น

ภาคผนวก: กระบวนการอ้อมเพื่อหาคำตอบที่ดี

กรณีตัวอย่าง Google knowledge card

คำตอบต่อคำวิจารณ์

บทความที่เกี่ยวข้อง

1 ความคิดเห็น

ความคิดเห็นจาก Hacker News

`download youtube videos`

`ad blocker`

`download firefox`

`Why do wider tires have better grip?`

`Why do they keep making cpu transistors smaller?`

`vancouver snow forecast winter 2023`