PayPal: วิธีป้องกันการฉ้อโกงด้วยการวิเคราะห์ฐานข้อมูลกราฟแบบเรียลไทม์
(yozm.wishket.com)-
อุตสาหกรรมอีคอมเมิร์ซเติบโตอย่างรวดเร็วจากโควิด-19
-
เมื่อการชำระเงินดิจิทัลเพิ่มขึ้น การฉ้อโกงการชำระเงินก็เพิ่มขึ้นตามไปด้วย
-
PayPal ป้องกันการฉ้อโกงด้วยการวิเคราะห์กราฟแบบเรียลไทม์
-
การคำนวณแบบเรียลไทม์เกิดขึ้นได้ด้วยเฟรมเวิร์ก Graph DSL โอเพนซอร์สของ Apache ชื่อ 'Gremlin'
-
เทคโนโลยีกราฟมีประสิทธิภาพอย่างมากในการตรวจจับและป้องกันการฉ้อโกงในอุตสาหกรรมอีคอมเมิร์ซ
2 ความคิดเห็น
มีคีย์เวิร์ดที่ไม่ได้เห็นมานานแล้ว เลยอ่านอย่างสนใจครับ
Aerospike เป็นที่เก็บข้อมูลแบบ key-value แบบโอเพนซอร์ส (APL) มีความโดดเด่นด้านการทำงานที่ปรับแต่งมาอย่างเหมาะสมสำหรับ In-memory และ SSD จึงมีประสิทธิภาพสูงมาก แต่เท่าที่ทราบก็มีข้อจำกัดเรื่องขนาดของคลัสเตอร์ รวมถึงขนาดของคีย์และค่า จึงต้องพิจารณาให้ดีตอนนำมาใช้งาน
การวาง query layer ไว้บน key-value storage ซึ่งในที่นี้คือ Gremlin ผมคิดว่าเป็นสถาปัตยกรรมที่สมเหตุสมผล การสร้าง graph query layer ขึ้นมาเองตั้งแต่ต้นไม่ใช่เรื่องง่าย
แต่ก็น่าเสียดายที่คำอธิบายเกี่ยวกับองค์ประกอบเชิงกายภาพยังมีไม่มากนัก เพราะฐานข้อมูลกราฟมีคิวรีที่ซับซ้อนมาก ทำให้เมื่อแยก data node กับ query node ออกจากกัน หรือเมื่อ scale-out แล้ว ประสิทธิภาพจะลดลงอย่างมาก ด้วยความซับซ้อนของคิวรี ทำให้มีข้อมูลชั่วคราวสำหรับการคำนวณสะสมอยู่มากใน intermediate node จนเกิดปัญหาหน่วยความจำไม่พอได้ง่าย และ qps ก็ลดลง
เลยสงสัยว่าเขาแก้ปัญหานี้ด้วยการ scale-up หรือ scale-out กันแน่ ถ้าเป็น scale-out ก็อยากให้เขียนรายละเอียดของกระบวนการนั้นเพิ่มอีกหน่อยครับ จึงยังรู้สึกค้างคาอยู่บ้าง
เหมือนจะผ่านมาราว 8 ปีแล้วตั้งแต่ผมเห็นพวก Gremlin หรือ Titan และดูเหมือนว่าวงการฐานข้อมูลกราฟจะไม่ได้พัฒนาเร็วอย่างที่คิด
เนื้อหาค่อนข้างเข้าใจยากอยู่เล็กน้อย เลยทำความเข้าใจได้ยาก แต่พออ่านคอมเมนต์แล้วก็เข้าใจได้ง่ายขึ้นนิดหน่อย ขอบคุณครับ