1 ความคิดเห็น

 
GN⁺ 2024-12-26
ความคิดเห็นของ Hacker News
  • มีคำถามว่าทำไมจึงเลือกใช้โมเดลของ mixbread
  • มีคำถามเกี่ยวกับการแปลง embedding เป็นแบบไบนารีและการใช้ระยะฮัมมิงเพื่อเพิ่มประสิทธิภาพ
  • มีคำถามว่าทำไมจึงเลือก milvus มากกว่า vector store ตัวอื่น
  • มีคำถามว่าจะมีการทำ metadata รายสัปดาห์แบบอัตโนมัติหรือไม่
  • ผู้ใช้ให้ความเห็นว่าคำค้น "Transformer ระดับไบต์" ใช้งานได้ดี แต่ไม่พบบทความวิจัยล่าสุด
    • หากต้องการความหนาแน่นของผลลัพธ์ที่มากขึ้น อาจเพิ่มตัวเลือก UI ให้ย่อ abstract เพื่อแสดงมากขึ้นในมุมมองแรก
  • เมื่อขยายไปนอก arXiv สัญญาใหญ่ ๆ บังคับให้ออกบทคัดย่อจาก OpenAlex เป็นต้น ทำให้การทำ literature review ยุ่งยากขึ้น
  • มีคำถามว่าผู้ใช้เคยตรวจสอบเครื่องมืออื่น ๆ อย่าง undermind.ai, scite.ai, elicit.org หรือไม่
  • ควรพิจารณาว่าใน workflow ของผลิตภัณฑ์เฉพาะสำหรับ literature review จะมีอะไรได้อีกนอกเหนือจากการค้นหา
  • ในอดีตสามารถทำ CPU brute force แบบเรียลไทม์บน vector database อย่าง gensim/doc2vec ได้
  • มีไอเดียอื่น ๆ เกี่ยวกับสาขาที่ semantic search อาจมีประโยชน์มาก
    • ค้นหาโฆษณาออนไลน์: ฝังและสร้างดัชนีโฆษณาวิดีโอและภาพเพื่อค้นหาแรงบันดาลใจด้านการตลาด
    • ค้นหาข้ามหลายแพลตฟอร์มอีคอมเมิร์ซ: ค้นหาสินค้าจาก Sephora, zara, h&m และอื่น ๆ
  • มีความเห็นว่าถ้าทุก paper มีลิงก์ "งานวิจัยที่คล้ายกัน" เพิ่มเข้าไป ก็จะช่วยให้ค้นหาหัวข้อได้ดีขึ้น
  • มีคำถามว่า semantic search มีข้อดีเหนือ text search อย่างไร
    • มีคำถามว่ามี benchmark ใดสามารถยืนยันได้ว่าการค้นหาถูกปรับปรุงหรือไม่
  • มีคำถามว่ามันคล้ายกับ Semantic Scholar ของ Allen Institute for AI หรือไม่
  • มีข้อเสนอให้เพิ่ม search tool client ใน backend ของ paper-qa
  • มีความคิดเห็นอยากลอง crawl scihib แล้วเชื่อมต่อ
  • มีข้อสังเกตเกี่ยวกับปัญหาการเข้ารหัส
    • หากค้นหา "การประเมินการคำนวณประสิทธิภาพสูงของ UPC" จะแสดงผล paper ที่มีข้อผิดพลาดในชื่อผู้เขียน