9 คะแนน โดย xguru 2020-10-14 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • องค์กรขนาดใหญ่จำนวนมากสร้างระบบค้นหาข้อมูลและเอนจินเมทาดาทาภายในขึ้นมาแยกต่างหาก

→ Netflix(Metacat), Lyft(Amundsen), Linkedin(DataHub), Uber(Databook)

→ เป็นแพลตฟอร์มที่ช่วยให้ค้นหาเมทาดาทา เช่น ใคร/เมื่อไร/ค้นหา/สร้างข้อมูลใดบ้าง เพื่อให้สามารถนำกลับมาใช้ซ้ำได้ง่าย

  • ผสานรวม Hive, Scuba, Cubrick รวมถึงแดชบอร์ดหลายตัวและชุดข้อมูล AI

  • ใช้ Unicorn ที่ใช้สำหรับการค้นหา social graph

  • สามารถใช้คำค้นแบบภาษาธรรมชาติด้วย spaCy : "Instagram มี WAU (ผู้ใช้งานที่ใช้งานประจำรายสัปดาห์) กี่คน?"

1 ความคิดเห็น

 
xguru 2020-10-14

Nemo ไม่ได้เปิดเผยเป็นโอเพนซอร์ส แต่เครื่องมือของบริษัทอื่น ๆ เปิดเผยเป็นโอเพนซอร์สอยู่แล้ว

Lyft - Amundsen https://github.com/amundsen-io/amundsen

Netflix - Metacat https://github.com/Netflix/metacat

Linkedin - DataHub https://github.com/linkedin/datahub