- เป็นเสิร์ชเอนจินเฉพาะทางที่เน้นคอนเทนต์ที่ไม่ใช่เชิงพาณิชย์ เช่น "indieweb", "small web", "digital gardens"
- มุ่งเป้าไปที่เว็บไซต์ส่วนตัวและเว็บไซต์อิสระเป็นหลัก โดยให้ความสำคัญกับประสบการณ์ผู้ใช้โดยไม่มีโฆษณา
- มีประโยชน์เมื่อคุณต้องการค้นหาข้อมูลเชิงลึกเกี่ยวกับประสบการณ์ส่วนบุคคล หรือหัวข้อเฉพาะ งานอดิเรก และความสนใจต่าง ๆ
- ช่วยหลีกเลี่ยงเว็บไซต์การตลาดและบล็อกสแปมจากเสิร์ชเอนจินรายใหญ่ได้
-
คุณสมบัติหลัก
- ทำดัชนีเฉพาะเว็บไซต์ที่ผู้ใช้ส่งเข้ามาและผ่านการตรวจทานแล้วเท่านั้น เพื่อคัดสแปม เนื้อหา "search engine optimization" และเนื้อหา "ล่อให้คลิก" ออก
- ไม่แสดงโฆษณา และสนับสนุนหน้าผลลัพธ์แบบไม่มีโฆษณา เพื่อลดแรงจูงใจของสแปมและทุนนิยมการเฝ้าระวัง
- ไม่พึ่งพาโฆษณา และครอบคลุมค่าใช้จ่ายในการดำเนินงานผ่านฟีเจอร์ "search service" จึงหลีกเลี่ยงความขัดแย้งกับผู้ใช้ได้
- มอบความเป็นส่วนตัวในระดับสูงด้วยโมเดลการดำเนินงานที่ไม่ได้ตั้งอยู่บนโฆษณาหรือการเก็บข้อมูลส่วนบุคคล
- เป็นโอเพนซอร์สอย่างสมบูรณ์ ช่วยเพิ่มความโปร่งใสของกระบวนการค้นหา การจัดอันดับ และการทำดัชนี พร้อมส่งเสริมการมีส่วนร่วมของชุมชนในการปรับปรุงบริการ
1 ความคิดเห็น
ความคิดเห็นบน Hacker News
เสิร์ชเอนจิน Wiby มีเป้าหมายเพื่อรวบรวมหน้าเว็บที่สร้างขึ้นในสไตล์ยุคแรกเริ่มของอินเทอร์เน็ต
Marginalia เคยถูกแนะนำบน HN หลายครั้งมาก่อน
เว็บไซต์อื่น ๆ:
โดยทั่วไปจะครอลอินเทอร์เน็ตเพื่อค้นหาหน้าเว็บ และผลลัพธ์อยู่ใน Internet-Places-Database บน GitHub โดยหน้าส่วนตัวจะถูกติดแท็กว่า "personal"
ชอบความเรียบง่ายของ pagefind.app
ขอบคุณที่สร้างโปรเจ็กต์นี้ขึ้นมา สงสัยว่า Postgres จะเป็นฐานข้อมูลที่ใหญ่เกินไปสำหรับเครื่องมือค้นหาเว็บไซต์ส่วนตัวหรือไม่ จะลองใช้งานดู ต้องการเครื่องมือแบบนี้มากกว่านี้
ชอบโปรเจ็กต์นี้ เสียเวลาไปหนึ่งชั่วโมงกับเว็บไซต์ส่วนตัวที่ทั้งสุ่มแต่ก็ผ่านการใส่ใจแบบที่ทำให้เว็บยุคแรกยอดเยี่ยม
โปรเจ็กต์ประเภทนี้เหมาะมากสำหรับการค้นหาบล็อกที่น่าสนใจและเว็บไซต์ที่ไม่ค่อยเป็นที่รู้จัก ตัวเลือกของฉันคือ marginalia-search.com
ดีใจที่ได้เห็นโปรเจ็กต์นี้ น่าแปลกตรงที่แม้ Google จะครองอำนาจอย่างมากตลอด 10 ปีที่ผ่านมา แต่ก็รู้สึกอย่างแรงว่าผู้ชนะรายใหญ่ในด้าน AI จะเป็นเสิร์ชเอนจินฝั่งแบ็กเอนด์ การค้นหาเว็บสมัยใหม่ปนเปื้อนด้วยกลเม็ดมากเกินไปจนคอนเทนต์ดี ๆ จำนวนมากหายไปเพียงเพื่อให้ไปถึงหน้าแรกของ Google ตอนนี้เมื่อโมเดลขนาดใหญ่จำนวนมากสามารถเรียกใช้เว็บได้ ความเกินเลยแบบนี้ก็กำลังปรากฏใน AI search เช่นกัน เราต้องการเอนจินที่ขับเคลื่อนด้วยข้อมูลอย่างเหมาะสม ไม่มีโฆษณา และให้ความสำคัญกับข้อมูลที่มีโครงสร้างมากกว่าการนำเสนอ
รู้สึกสับสนนิดหน่อย Solr คือเสิร์ชเอนจิน มีการโหลดโมเดล LLM เลยสงสัยว่าโมเดล LLM เพิ่มอะไรให้กับโซลูชันนี้
ขอแนะนำ greppr.org (หมายเหตุ: ฉันเป็นคนสร้างมันขึ้นมา)