• ทำให้วิศวกรวิเคราะห์สามารถเชื่อมต่อ data silo ที่หลากหลายและสร้างมุมมองแบบรวมศูนย์ได้

→ เครื่องมือ No Code ML สำหรับ Data Unification

  • ทำไมจึงจำเป็น?

→ ในข้อมูลจริงจะมีหลายเรกคอร์ดต่อหนึ่งลูกค้า

→ แต่ละเรกคอร์ดกระจายอยู่ในระบบเดียวหรือหลายระบบ ทำให้เมื่อข้อมูลมีขนาดใหญ่ขึ้น การวิเคราะห์ลูกค้าทำได้ยาก

→ ใน ELT ส่วน T ต้องใช้ความพยายามมาก และเครื่องมืออย่าง dbt ก็จัดการเรื่องนี้ได้สำเร็จ

→ จึงจำเป็นต้อง “สร้าง Single Source of Truth” สำหรับอ็อบเจ็กต์ทางธุรกิจหลัก ก่อนการดึงข้อมูลหรือโหลดข้อมูล ด้วยวิธีที่รวดเร็วและขยายขนาดได้

  • กรณีใช้งานที่มีประโยชน์

→ สร้างมุมมองลูกค้าแบบรวมและเชื่อถือได้จากหลายระบบ

→ การยืนยันเอนทิตีขนาดใหญ่ เช่น AML/KYC

→ การลบข้อมูลซ้ำและคุณภาพข้อมูล

→ การรวม data silo

→ การเพิ่มคุณค่าข้อมูลจากแหล่งภายนอก

  • แหล่งข้อมูลที่รองรับ

→ รองรับ Snowflake, Cassandra, S3, Azure, Elastic, RDMBS หลัก ๆ และแหล่งข้อมูลที่ Spark รองรับ

→ รองรับไฟล์อย่าง Parquet, Avro, JSON, XLSX, CSV และ TSV

ยังไม่มีความคิดเห็น

ยังไม่มีความคิดเห็น