อนาคตของ kdb+?
(timestored.com)กรณีการใช้งาน
-
การจัดเก็บและวิเคราะห์ข้อมูลตลาดย้อนหลัง
- ตัวอย่าง: MS Horizon, Citi CloudKDB, UBS Krypton
-
การวิเคราะห์เชิงปริมาณแบบโลคัล
- ตัวอย่าง: การวิเคราะห์สภาพคล่อง, การวิเคราะห์ PnL, การวิเคราะห์ความสามารถในการทำกำไรแยกตามลูกค้า
-
เอนจินคำนวณสตรีมมิงแบบเรียลไทม์
- ตัวอย่าง: สตรีมมิง VWAP, สตรีมมิง TCA
-
การประมวลผลแบบกระจาย
- ตัวอย่าง: การคำนวณมาร์จินหรือการวิเคราะห์ความเสี่ยงของพอร์ตหุ้น
ทางเลือก
ข้อมูลตลาดย้อนหลัง - ทางเลือกของ kdb+
-
เทคโนโลยีฐานข้อมูลใหม่
- Clickhouse, QuestDB
-
ผู้ให้บริการคลาวด์
- Bigquery, Redshift
-
บริการข้อมูลตลาด
- ผู้ใช้ส่วนใหญ่ไม่จำเป็นต้องใช้ "ความเร็ว" ของ kdb+
- แพลตฟอร์มภายในของธนาคารส่วนใหญ่ยังใช้ประโยชน์จากความเร็วของ kdb+ ได้ไม่เต็มที่
- คู่แข่งตอนนี้ก็เร็วเพียงพอแล้วเช่นกัน
ผลลัพธ์ที่คาดการณ์
- kdb+ อาจรักษาฐานลูกค้าเดิมไว้ได้ แต่จะไม่ได้บริษัทระดับรองที่ต้องการความเป็น cloud-native หรือสิ่งอื่นแทน
การวิเคราะห์เชิงปริมาณแบบโลคัล - ทางเลือก
- Python
- DuckDB, Polars, PyKX, dataframe/modin เป็นต้น
ผลลัพธ์ที่คาดการณ์
- DuckDB หรือ Polars จะเป็นผู้ชนะ เพราะใช้ฟรี
สตรีมมิงแบบเรียลไทม์ / การประมวลผลแบบกระจาย
- จุดแข็งที่สุดของ kdb+ คือการรวมข้อมูลสตรีมมิงและข้อมูลย้อนหลังไว้ในโมเดลเดียว
- แต่ต้องใช้คนที่มีประสบการณ์สูง ไม่เช่นนั้นจะทำให้เกิดความสับสน
ผลลัพธ์ที่คาดการณ์
- kdb+ จะไม่ชนะ Kafka ได้ครองพื้นที่ในความรับรู้ของตลาดไปแล้ว และ flink/risingwave ก็กำลังเป็นดาวรุ่ง
สรุป
-
kdb+ เป็นเทคโนโลยีที่น่าทึ่ง แต่ยังอยู่ในระดับเดียวกับเมื่อ 15 ปีก่อน
-
บริษัทโอเพนซอร์สชั้นนำได้ขโมยแนวคิดของ kdb+ ไป
- Parquet/Iceberg คือฟอร์แมตบนดิสก์ของ kdb+
- Apache Arrow คือฟอร์แมตในหน่วยความจำของ kdb+
- แนวคิด log/replay/ksql ของ Kafka ก็คล้ายกัน
- QuestDB, DuckDB, Clickhouse ต่างก็รองรับ asof join
-
คู่แข่งได้ทำให้ส่วนที่ดีที่สุดของ kdb+ กลายเป็นมาตรฐานแล้ว
- ตัวอย่าง: Snowflake, Dremio, Confluent, Databricks ต่างก็รองรับ Apache Iceberg/parquet
- QuestDB, DuckDB, Python ต่างก็รองรับ parquet แบบเนทีฟ
-
KX ต้องทำ 4 อย่างต่อไปนี้
- ต้องมีเวอร์ชันฟรี และมีไลเซนส์ที่ใช้งานได้ในต้นทุนต่ำ
- ต้องทำให้ผลิตภัณฑ์หลักยอดเยี่ยม
- ต้องลดความชันของการเรียนรู้
- ต้องทำให้ได้รับความนิยมมากขึ้น
สรุปโดย GN⁺
- kdb+ ยังเป็นเทคโนโลยีที่ทรงพลัง แต่คู่แข่งกำลังไล่ตามอย่างรวดเร็ว
- เครื่องมือฟรีและโอเพนซอร์สกำลังได้รับความนิยม ทำให้มีโอกาสสูงที่ส่วนแบ่งตลาดของ kdb+ จะลดลง
- หาก kdb+ ต้องการได้รับความนิยมมากขึ้น จำเป็นต้องมีเวอร์ชันฟรี ลดความชันของการเรียนรู้ และเสริมความแข็งแกร่งให้ผลิตภัณฑ์หลัก
- ผลิตภัณฑ์ที่มีความสามารถคล้ายกัน ได้แก่ DuckDB, Polars, QuestDB เป็นต้น
1 ความคิดเห็น
ความคิดเห็นจาก Hacker News
TimeScale เป็นส่วนขยายของ Postgres จึงสามารถใช้ความสามารถของ SQL ได้โดยตรง
มีกรณีที่ลาออกภายใน 2 สัปดาห์เพราะประสบการณ์การใช้ kdb+
ความสามารถด้านการบูรณาการแนวดิ่งของ kdb+ เป็นข้อดี
kdb+ เป็นที่รู้จักน้อยเพราะไม่มีเวอร์ชันฟรี
มีกรณีที่ไม่ชอบ q/kdb+ จนพัฒนาภาษาของตัวเองขึ้นมา
มีประสบการณ์ใช้งาน kdb+ จนดำเนินสตาร์ทอัปได้สำเร็จ
kdb+ น่าสนใจ แต่ราคาสูงเกินไป
มีการแก้ไขบางประการเกี่ยวกับ ClickHouse
ปัจจุบัน Python เหนือกว่า แต่หนี้ทางเทคนิคทำให้เปลี่ยนไปใช้แพลตฟอร์มใหม่ได้ยาก
มีคำถามว่านักพัฒนา kdb+ สามารถทำเงินก้อนใหญ่ได้หรือไม่