Databases in 2024 : ย้อนมองตลอดปี
(cs.cmu.edu)Andy Pavlo(ศาสตราจารย์แห่ง CMU) รีวิวภาพรวมทั้งอุตสาหกรรมฐานข้อมูลในปี 2024
ฐานข้อมูลของฉัน ฉันจะกำหนดไลเซนส์แบบที่ต้องการเอง!
- ภาวะกลืนไม่เข้าคายไม่ออกของฐานข้อมูลและโอเพนซอร์ส:
- DBMS โอเพนซอร์สมักถูกพัฒนาโดยบริษัทที่ทำกำไรได้และได้รับการสนับสนุนจาก VC
- เกิดปัญหาที่ผู้ให้บริการคลาวด์นำ DBMS ยอดนิยมไปให้บริการในรูปแบบเซอร์วิสและทำกำไรได้มากกว่าบริษัทผู้พัฒนา
- MongoDB เปลี่ยนมาใช้ SSPL(Server Side Public License) ในปี 2018 เพื่อพยายามแก้ปัญหานี้
- การเปลี่ยนแปลงไลเซนส์ของ Redis:
- Redis Ltd. ระหว่างเตรียม IPO ในปี 2024 ได้เปลี่ยนจากไลเซนส์ BSD-3 ไปเป็น SSPL และ Redis Source Available License ของตนเอง
- เดือนมีนาคม 2024 บริษัทประกาศเปลี่ยนไลเซนส์พร้อมกับการเข้าซื้อ Speedb ซึ่งเป็นฟอร์กของ RocksDB
- การต่อต้านจากชุมชน:
- ในสัปดาห์เดียวกันมีการประกาศโปรเจกต์ฟอร์กชื่อ Valkey และ Redict
- Valkey เริ่มต้นจาก Amazon และมี Google, Oracle และรายอื่น ๆ เข้าร่วม ก่อนถูกรวมเข้า Linux Foundation
- ความเป็นไปได้ที่ผู้ก่อตั้ง Redis จะกลับมา:
- เดือนธันวาคม 2024 มีการประกาศว่าผู้ก่อตั้ง Redis จะร่วมมือกับ Redis Ltd. เพื่อหาทางรวมชุมชนกลับมาอีกครั้ง
- Elasticsearch ย้อนกลับเรื่องไลเซนส์:
- Elastic N.V. เปลี่ยนไปใช้ SSPL และ Elastic License ในปี 2021 แล้วเกิดความขัดแย้งกับ Amazon
- Amazon ตอบโต้ด้วยฟอร์ก OpenSearch
- เดือนสิงหาคม 2024 Elastic N.V. เปลี่ยนกลับไปใช้ AGPL พร้อมอ้างถึงเพลงของ Kendrick Lamar
- เดือนกันยายน 2024 Amazon ส่งมอบโปรเจกต์ OpenSearch ให้ Linux Foundation
- มุมมองของ Andy:
- คำวิจารณ์ต่อ Redis:
- ชี้ว่ามีประสิทธิภาพต่ำ มีปัญหาเรื่องทรานแซกชันปลอม และภาษาคิวรีที่ไม่มีประสิทธิภาพ
- Redis มีทางเลือกทดแทนจำนวนมาก จึงอยู่ในสถานการณ์ที่รับแรงต้านจากชุมชนได้ยาก
- แพตเทิร์นที่คล้ายกับ Elasticsearch:
- เปลี่ยนไลเซนส์ → เกิดโปรเจกต์ฟอร์ก → ย้อนกลับสู่ไลเซนส์โอเพนซอร์ส
- เหตุผลที่ Redis และ Elasticsearch เจอแรงต้านมากกว่า:
- Redis นั้นผู้ก่อตั้งไม่ใช่ผู้สร้างดั้งเดิม และเป็นระบบที่มีผู้มีส่วนร่วมจากภายนอกจำนวนมาก จึงเกิดข้อถกเถียงเรื่อง “ความชอบธรรมไม่เพียงพอ”
- ปฏิกิริยานี้คล้ายกับกรณี Terraform ของ HashiCorp ที่เปลี่ยนไลเซนส์ในปี 2023
- อิทธิพลของผู้ให้บริการคลาวด์:
- ผู้ให้บริการคลาวด์สามารถผนวกโปรโตคอลของ DBMS โอเพนซอร์สเข้ากับ DBMS เดิมของตน หรือใช้บริการของตนเองเพื่อลดทอนฐานรายได้ของ ISV
- ตัวอย่าง: AWS เพิ่มโปรโตคอล InfluxDB v2 ให้กับ Timestream DBMS และประกาศบริการที่รองรับ Valkey ซึ่งถูกกว่าบริการที่เข้ากันได้กับ Redis ถึง 30%
- คำวิจารณ์ต่อ Redis:
- อัปเดตเพิ่มเติม:
- AWS ให้บริการ managed service ของ InfluxDB v2 DBMS ร่วมกับ Influx Data
- ScyllaDB ยุติเวอร์ชันโอเพนซอร์ส AGPL ในเดือนธันวาคม 2024 และเปลี่ยนเวอร์ชันเอนเทอร์ไพรส์เป็น “เปิดเผยซอร์ส”
การแข่งขันไม่รู้จบของ Databricks และ Snowflake
- ศึก LLM แบบเปิด:
- Databricks:
- เดือนมีนาคม 2024 เปิดตัว LLM โอเพนซอร์ส DBRX
- มีพารามิเตอร์ 132 พันล้านตัว พัฒนาโดยทีม Mosaic ที่เข้าซื้อมาในปี 2023 ด้วยมูลค่า $1.3 พันล้าน
- ลงทุน $10 ล้านในการพัฒนาโมเดล
- Snowflake:
- เดือนเมษายน 2024 เปิดตัว LLM โอเพนซอร์ส Arctic
- มีพารามิเตอร์ 480 พันล้านตัว และอ้างว่าเหนือกว่า DBRX ในงาน “ระดับองค์กร” เช่น การสร้าง SQL
- ลงทุน $2 ล้านในการพัฒนาโมเดล
- การประกาศของ Snowflake เน้นการเปรียบเทียบกับ DBRX มากกว่า LLM อื่น ๆ แสดงให้เห็นภาพการแข่งขันอย่างชัดเจน
- Databricks:
- สงครามเมทาดาทาคาตาล็อก:
- HCatalog ของ Hive กลายเป็นมาตรฐานของ data lake ในช่วงทศวรรษ 2010
- Iceberg ของ Netflix และ Hudi ของ Uber ปรากฏขึ้นในช่วงปลายทศวรรษ 2010 และเติบโตเป็นโปรเจกต์ Apache
- Databricks:
- ให้บริการแพลตฟอร์ม DeltaLake และบริการคาตาล็อกแบบปิดชื่อ Unity
- เดือนมิถุนายน 2024 ในวันเดียวกับที่ CEO ของ Snowflake ประกาศบริการคาตาล็อก Polaris บริษัทได้เข้าซื้อ Tabular ซึ่งสนับสนุน Iceberg ด้วยมูลค่า $2 พันล้าน
- สัปดาห์ถัดมาประกาศโอเพนซอร์ส Unity catalog
- Snowflake:
- หลังประกาศรองรับ Iceberg ในปี 2022 ก็ขยายต่อมาอย่างค่อยเป็นค่อยไป
- ระหว่างเจรจาเข้าซื้อ Tabular กลับถูก Databricks ตัดหน้าคว้าไปก่อน
- มุมมองของ Andy:
- ความต่างจากการแข่งขันแบบดั้งเดิม:
- ต่างจากการแข่งขันด้านประสิทธิภาพระหว่าง Oracle และ Informix ในอดีต ศึกของ Snowflake และ Databricks เน้นที่ ecosystem และเครื่องมือจัดการข้อมูล
- เอนจินประมวลผลแบบ vectorized ตอนนี้ถือเป็นเทคโนโลยีพื้นฐานไปแล้ว
- สิ่งสำคัญในตอนนี้คือคุณภาพเสริมอย่างความง่ายในการใช้งาน ความเข้ากันได้ของเครื่องมือ และการผสาน AI/LLM
- เป็นประโยชน์ต่อผู้บริโภค:
- การแข่งขันที่ดุเดือดหมายถึงผลิตภัณฑ์และเทคโนโลยีที่ดีกว่า
- Polaris ของ Snowflake ถูกเปลี่ยนเป็นโปรเจกต์ Apache ทำให้เข้าถึงเทคโนโลยีที่ดีกว่าได้
- ท้ายที่สุดคาดหวังได้ทั้งความก้าวหน้าทางเทคโนโลยีและราคาที่ลดลง
- การเปรียบเทียบในแง่บวก:
- ต่างจากการแข่งขันวัดอีโก้ล้วน ๆ ของ CEO อย่าง Oracle กับ Salesforce ศึกของ Snowflake และ Databricks นำไปสู่นวัตกรรมจริงและการเสริมความสามารถในการแข่งขัน
- ความต่างจากการแข่งขันแบบดั้งเดิม:
ความพยายามในการผสาน DuckDB ไปไว้ทุกที่
- การเติบโตของ DuckDB:
- DuckDB กำลังกลายเป็นตัวเลือกตั้งต้นใหม่สำหรับคิวรีวิเคราะห์ข้อมูล
- ก่อนหน้านี้ Pandas เคยทำหน้าที่นี้ แต่ DuckDB เข้ามาแทนด้วยความพกพาสูงและประสิทธิภาพที่ยอดเยี่ยม
- มี DBMS มากขึ้นที่พยายามผสาน DuckDB เพื่อเสริมการรองรับ workload แบบ OLAP
- ในปี 2024 มีการประกาศส่วนขยายใหม่ 4 ตัวที่ผสาน Postgres กับ DuckDB
- การประกาศส่วนขยาย Postgres-DuckDB:
- พฤษภาคม 2024 - Crunchy Data:
- ประกาศบริดจ์แบบปิดที่ส่งต่อคิวรี OLAP จาก Postgres ไปยัง DuckDB
- เพิ่มส่วนขยายที่เร่งคิวรี PostGIS โดยใช้ความสามารถด้านการวิเคราะห์เชิงภูมิศาสตร์ของ DuckDB
- มิถุนายน 2024 - ParadeDB:
- ประกาศส่วนขยายโอเพนซอร์ส pg_analytics
- เดิมใช้ pg_lakehouse ที่อิง DataFusion แต่เปลี่ยนมาใช้ DuckDB
- สิงหาคม 2024 - pg_duck:
- เป็นส่วนขยาย DuckDB ที่ได้รับการสนับสนุนอย่างเป็นทางการจาก DuckDB Labs GitHub
- เริ่มจากความร่วมมือระหว่าง MotherDuck, Hydra, Microsoft และ Neon แต่ Microsoft กับ Neon ถูกตัดออกจากโปรเจกต์เพราะข้อพิพาทเรื่องอำนาจควบคุมการพัฒนา
- ปัจจุบัน MotherDuck และ Hydra ดูแลร่วมกัน
- พฤศจิกายน 2024 - pg_mooncake:
- ประกาศส่วนขยายที่เขียนข้อมูลลงตาราง Iceberg ผ่าน Postgres และรองรับทรานแซกชัน
- พฤษภาคม 2024 - Crunchy Data:
- มุมมองของ Andy:
- จุดเด่นของ DuckDB:
- คิวรี OLAP ส่วนใหญ่สแกนข้อมูลไม่ถึง 100MB และ DuckDB ก็จัดการได้เพียงพอด้วยอินสแตนซ์เดียว
- ด้วยความพกพาและความสะดวกที่ยอดเยี่ยม จึงแพร่กระจายเร็วในชุมชน Postgres
- รวม ecosystem ข้อมูลหลากหลายแบบไว้ในส่วนขยายเดียว รวมถึงการเข้าถึงข้อมูล Iceberg และ S3
- ให้การวิเคราะห์ประสิทธิภาพสูงพร้อมศักยภาพในการแทน data warehouse ราคาแพง
- ความสามารถในการขยายของ Postgres:
- Postgres ตั้งเป้าความสามารถในการขยายและความยืดหยุ่นมาตั้งแต่ตอนออกแบบในยุค 1980
- ด้วย API “hook” ของ Postgres (เพิ่มเข้ามาในปี 2006) จึงสร้าง ecosystem ของส่วนขยายที่กว้างและหลากหลายที่สุด
- แต่ก็มีความเสี่ยงที่จะเกิดการรบกวนกันระหว่างส่วนขยายและพฤติกรรมผิดพลาด
- การผสาน DuckDB กับ Postgres:
- ส่วนขยาย Postgres เดิมอย่าง Citus และ Timescale ให้แค่ storage แบบคอลัมน์ จึงแก้ปัญหาได้เพียงบางส่วน
- DuckDB ให้ทั้ง storage แบบคอลัมน์และการประมวลผลคิวรีแบบ vectorized
- การเปรียบเปรยเชิงขำขัน:
- กล่าวถึงความเป็นไปได้ของมุก turducken ที่เล่นกับช้างของ Postgres และ DuckDB แต่ขอละไว้เพื่อหลีกเลี่ยงบทลงโทษจากมหาวิทยาลัย
- จุดเด่นของ DuckDB:
Random Happenings in the Database World
รีลีสสำคัญ:
- Amazon Aurora DSQL:
- AWS เปิดตัว DBMS ใหม่แบบ “คล้าย Spanner”
- อิงกับ distributed log service และการจัดเรียงตาม timestamp(Time Sync)
- ใช้ชื่อ Aurora แต่ไม่ได้แชร์โค้ดกับ Aurora Postgres RDS เดิม
- CedarDB:
- DBMS เชิงพาณิชย์ที่ฟอร์กโค้ดจาก Umbra
- Thomas Neumann ผู้สร้าง Umbra ยังคงโฟกัสงานวิจัยและรักษาอันดับสูงสุดบน Clickbench leaderboard
- Google Bigtable:
- Bigtable ผู้บุกเบิก NoSQL เพิ่มการรองรับ SQL ในปี 2024
- Limbo:
- Turso ประกาศโปรเจกต์ที่เขียน SQLite ใหม่ทั้งหมดด้วย Rust
- จุดแข็งของ SQLite ไม่ได้อยู่แค่โค้ด แต่รวมถึงวิศวกรรมการทดสอบที่รับประกันว่ามันจะทำงานได้ถูกต้องเหมือนกันในทุกสภาพแวดล้อม
- มีการร่วมมือกับอดีตวิศวกรของ FoundationDB เพื่อนำ deterministic testing มาใช้
- Microsoft Garnet:
- คีย์-แวลูสโตร์ที่เข้ากันได้กับ Redis และเป็นภาคต่อของ FASTER
- รองรับ query parallelism, ฐานข้อมูลที่ใหญ่เกินหน่วยความจำ และทรานแซกชันที่แท้จริง
- MySQL v9:
- เวอร์ชันใหม่ที่ออกหลังจากห่างไป 6 ปี
- มีปัญหาที่จะ crash หากในฐานข้อมูลมีตารางมากกว่า 8,000 ตาราง
- ขาดฟีเจอร์สำคัญ และ Oracle ดูจะโฟกัสกับบริการ MySQL Heatwave มากกว่า
- Prometheus v3:
- อัปเดตใหญ่ครั้งแรกในรอบ 7 ปี
- มีตัวเลือกทดแทนมากมายจนการใช้งาน OG Prometheus ลดลง
การเข้าซื้อสำคัญ:
- Alteryx → Private Equity: คนใช้น้อย และไม่มีความเห็นมากนัก
- MariaDB → Private Equity: คาดว่าจะช่วยแก้ปัญหาด้านการบริหารจัดการ
- OrioleDB → Supabase: ปรับปรุงสถาปัตยกรรม storage แบบเก่าของ Postgres
- PeerDB → ClickHouse: เครื่องมือ ETL ส่งข้อมูล Postgres ไปยัง ClickHouse
- PopSQL → Timescale: เข้าซื้อ UI ตัวแก้ไข SQL ขั้นสูง
- Speedb → Redis Ltd.: ฟอร์กของ RocksDB ที่อาจช่วยเพิ่มความสามารถจัดเก็บข้อมูลบนดิสก์
- Rockset → OpenAI: ยุติบริการ DBaaS ในเดือนกันยายน 2024
- Tabular → Databricks: เข้าซื้อเพื่อเสริม ecosystem ของ Iceberg
- Verta.ai → Cloudera: Cloudera ยังไม่ตาย
- Warpstream → Confluent: เขียน Kafka ใหม่ด้วย golang และผสานกับ S3
การลงทุนสำคัญ:
- Databricks: ซีรีส์ J มูลค่า $1 พันล้าน
- DBOS: seed round มูลค่า $8.5 ล้าน
- LanceDB: seed round มูลค่า $8 ล้าน
- SDF: seed round มูลค่า $9 ล้าน
- SpiceDB: ซีรีส์ A มูลค่า $12 ล้าน
- TigerBeetle: ซีรีส์ A มูลค่า $24 ล้าน
จุดจบสำคัญ:
- Amazon QLDB: แม้แต่ Amazon เองก็ทำเงินไม่ได้
- OtterTune: การเดินทางตลอด 10 ปีของงานวิจัยและสตาร์ทอัปสิ้นสุดลง เพราะปัญหากับบางบริษัทจึงมีการห้ามรับนักศึกษา CMU-DB เข้าทำงาน
มุมมองของ Andy:
- การระดมทุนครั้งใหญ่ของ Databricks:
- ซีรีส์ J มูลค่า $1 พันล้านในปี 2024 ทำลายสถิติการระดมทุนสูงสุดในอุตสาหกรรมฐานข้อมูล
- เงินทุนถูกนำไปใช้ซื้อหุ้นของพนักงานเพื่อแก้ปัญหาความไม่พอใจที่ IPO ล่าช้า
- หลัง Databricks IPO ก็มีความเป็นไปได้ว่าสตาร์ทอัปด้านฐานข้อมูลอีกหลายรายจะเตรียม IPO ตามมา
- แนวโน้มปีหน้า:
- อัตราดอกเบี้ยที่ลดลงอาจเปิดโอกาสให้บริษัทที่ระดมทุนก้อนใหญ่มาแล้วอย่าง CockroachDB, Starburst และ Imply ระดมทุนเพิ่มเติมได้
- dbtLabs ถูกมองว่าปักหลักความสำเร็จได้เรียบร้อยแล้ว
Larry Ellison ไม่ยอมหยุด: ความเคลื่อนไหวสุดน่าทึ่งในปี 2024
- ผลงานเด่นของ Larry Ellison ในปี 2024:
- อายุครบ 80 ปี แต่ยังคงเดินเกมอย่างกล้าหาญ
- กลายเป็นมหาเศรษฐีอันดับ 3 ของโลกจากการที่หุ้น Oracle พุ่งขึ้น
- เดือนมีนาคม 2024 เขาทำเงินได้ $15 พันล้านในวันเดียวจากการพุ่งขึ้นของหุ้น Oracle
- เดือนกรกฎาคม ซื้อ Paramount Studio ด้วยเงิน $6 พันล้านเป็นของขวัญให้ลูกชาย(ที่เกิดกับภรรยาคนที่สาม)
- เข้าซื้อรีสอร์ตใน Palm Beach ในราคา $277 ล้าน เพิ่มสินทรัพย์หรูอีกชิ้น
- การสนับสนุนทีมอเมริกันฟุตบอลของมหาวิทยาลัยมิชิแกน:
- เดือนพฤศจิกายน 2024 บริจาค $12 ล้านให้แคมเปญสนับสนุนฟุตบอลของมหาวิทยาลัยมิชิแกน
- เงินบริจาคนี้มีบทบาทชี้ขาดในการดึงควอเตอร์แบ็กระดับท็อปที่ย้ายจาก LSU มามิชิแกน
- ข่าวประชาสัมพันธ์ของมหาวิทยาลัยระบุถึงผลงานของ “Larry และภรรยาของเขา Jolin”
- เป็นความเชื่อมโยงครั้งใหญ่ครั้งแรกของ Larry กับมหาวิทยาลัยมิชิแกน ทั้งที่เขาไม่มีประวัติเรียนจบมหาวิทยาลัย
- เดือนพฤศจิกายน 2024 บริจาค $12 ล้านให้แคมเปญสนับสนุนฟุตบอลของมหาวิทยาลัยมิชิแกน
- “Jolin” คือใคร:
- จากรายงานของสื่อพบว่าภรรยาใหม่ของ Larry คือ Jolin(Churen) Zhu
- มีภาพ Larry ไปชมการแข่งขันเทนนิส และ Jolin สวมหมวกของมหาวิทยาลัยมิชิแกน
- สองสัปดาห์ต่อมา ข่าวการแต่งงานถูกเผยแพร่ผ่านข่าวช่วงตี 5 ทำให้ยืนยันตัวตนของเธอได้
- จากรายงานของสื่อพบว่าภรรยาใหม่ของ Larry คือ Jolin(Churen) Zhu
- มุมมองของ Andy:
- การสนับสนุนมหาวิทยาลัยมิชิแกนของ Larry มีความหมายพิเศษ
- อดีตนักศึกษา CMU-DB ของ Andy ปัจจุบันเป็นศาสตราจารย์ในกลุ่มฐานข้อมูลของมหาวิทยาลัยมิชิแกน
- เขาแสดงความยินดีกับความรักครั้งใหม่และการแต่งงานของ Larry พร้อมย้ำว่าการหาความรักในสังคมยุคใหม่เป็นเรื่องยาก
- แม้จะผ่านการหย่าร้างมาแล้ว Larry ก็ยังกลับมาพบรักอีกครั้ง แสดงให้เห็นถึงความยืดหยุ่นและทัศนคติเชิงบวกที่น่าชื่นชม
- การสนับสนุนมหาวิทยาลัยมิชิแกนของ Larry มีความหมายพิเศษ
- การแต่งงานครั้งที่หกของ Larry:
- หลังจาก Melanie Craft(หย่าในปี 2010) และ Nikita Kahn(หย่าในปี 2020) เขาก็แต่งงานอีกครั้งจนทำให้ทุกคนประหลาดใจ
- การแต่งงานกับ Jolin Zhu เป็นการพิสูจน์อีกครั้งถึงความมุ่งมั่นของเขาในการไล่ตามความสุข
บทสรุป
- แผนปีใหม่และสถานการณ์ปัจจุบัน:
- ตั้งใจจะต้อนรับปีใหม่อย่างมีสุขภาพดีเป็นครั้งแรกในรอบ 3 ปี แต่กลับติด COVID จากลูกสาวและต้องเริ่มปีใหม่บนเตียงคนป่วย
- ฉีดบูสเตอร์ในเดือนกันยายน 2024 และกำลังฟื้นตัวได้ดีโดยไม่มีปัญหาใหญ่ด้วยการรักษา Paxlovid
- การยุติของ OtterTune:
- รู้สึกผิดหวังที่โปรเจกต์ OtterTune ต้องยุติลง
- ได้เรียนรู้อย่างมากจากการร่วมงานกับผู้คนที่ยอดเยี่ยมมากมาย
- ขอบคุณ Intel Capital และ Race Capital ที่สนับสนุนจนถึงที่สุด
- กำลังวางแผนสตาร์ทอัปใหม่อยู่(ขอใบ้ว่าเกี่ยวกับฐานข้อมูลอีกเช่นเคย)
- การเริ่มต้นใหม่ที่ CMU:
- กลับสู่ Carnegie Mellon University(CMU) และกลับมาทำวิจัยเต็มเวลาอีกครั้ง
- กำลังเตรียมโปรเจกต์วิจัยที่น่าสนใจร่วมกับ Jignesh Patel
- ภาคการศึกษานี้จะเปิดวิชาใหม่เรื่อง query optimization
- หลัง Wikipedia ลบบทความเกี่ยวกับตัวเขาในเดือนกันยายน 2024 เขากำลังหาทางเพิ่มจำนวน citation ของงานวิจัยของตน
- การสนับสนุนต่อ DJ Mooshoo:
- ยังคงสนับสนุน DJ Mooshoo ที่ถูกคุมขังอยู่ใน Cook County
- เฝ้ารอและหวังว่าจะได้รับการปล่อยตัวในปี 2025
- การกล่าวถึง ByteBase:
- ขอบคุณ ByteBase สำหรับบทความรีวิวเครื่องมือฐานข้อมูลปี 2024(Database Tools in 2024: A Year in Review)
- ปีก่อน ByteBase ขออนุญาตแปลบทความสรุปฐานข้อมูลปลายปีของเขาเป็นภาษาจีน แต่ปีนี้ไม่ได้รอ และเขียนบทความของตนเองในหัวข้อและชื่อที่คล้ายกัน
3 ความคิดเห็น
ขอบคุณสำหรับบทความดีๆ ครับ
ลืมของปี 2023 ไปครับ ตอนนั้นเป็นลิงก์ OtterTune แต่ตอนนี้ปิดให้บริการไปแล้ว เลยย้ายมาไว้ที่บล็อกส่วนตัวแทน
รีวิวฐานข้อมูลปี 2022
รีวิวฐานข้อมูลปี 2021
ความคิดเห็นจาก Hacker News
มีความเห็นว่าคำวิจารณ์เกี่ยวกับ API คำสั่งของ Redis ในวิดีโอของ Andy ยังไม่หนักแน่นพอ แม้จะวิจารณ์ API ของ Redis ได้ แต่ก็ควรมีเหตุผลที่แข็งแรงกว่านี้ พร้อมเน้นว่าควรเข้าใจวิธีใช้งานและข้อดีของ Redis
ตอนที่โค้ดของ Greenplum ถูกปิด เดิมทีนักพัฒนาต้นฉบับได้สร้างโอเพนซอร์สฟอร์กชื่อ Cloudberry ขึ้นมา และต่อมาก็ถูกรับเข้าเป็นโปรเจกต์ของ Apache แล้ว Cloudberry ซิงก์กับ Postgres 14 แต่ Greenplum ยังหยุดอยู่ที่ Postgres 12
มีความเห็นที่วิจารณ์ Redis ในเชิงส่วนตัวว่า Redis ช้า มีทรานแซ็กชันแบบหลอก ๆ และไวยากรณ์คิวรียุ่งยาก พร้อมกล่าวถึงว่า Dragonfly แสดงประสิทธิภาพได้ดีกว่าที่ CMU
มีความเห็นว่า DuckDB เป็นเครื่องมือที่ยอดเยี่ยม และการบรรยายของผู้ก่อตั้ง DuckDB ที่ CMU ซึ่งอธิบายว่าทำไมนักวิทยาศาสตร์ข้อมูลจึงไม่ใช้ RDBMS นั้นน่าประทับใจมาก
มีความเห็นว่าแปลกที่ไม่มีการพูดถึง SQL Server และสายผลิตภัณฑ์ฝั่ง Azure ทั้งที่มันครองตลาดในบางด้าน และถูกจัดให้เป็นฐานข้อมูลยอดนิยมอันดับสามบน DBEngines
มีความเห็นว่าความไม่พอใจต่อ Elastic และ Redis แตกต่างจาก MongoDB เพราะเรื่องไลเซนส์และขนาดของชุมชนผู้ร่วมพัฒนา ไลเซนส์ที่มีข้อจำกัดอย่าง AGPL ทำให้นำไปใช้แบบฝังรวมได้ยาก และถ้าไม่มีชุมชนผู้ร่วมพัฒนา การทำฟอร์กก็ยาก
มีความเห็นว่าเหตุผลที่ไม่มีความพยายามฟอร์กจากการเปลี่ยนไลเซนส์ของ MongoDB, Neo4j, Kafka และ CockroachDB เป็นเพราะผู้คนไม่ได้ใส่ใจกับโปรเจกต์เหล่านี้มากนัก
มีความเห็นว่าแม้ Amazon จะสามารถให้บริการฐานข้อมูลในรูปแบบบริการได้ แต่หลายคนก็ไม่ต้องการบริการแบบ managed ของ AWS หลายทีมชอบโซลูชันบน k8s และมีแนวโน้มจะย้ายไปใช้การติดตั้ง OSS กระแสหลัก
เพื่อตอบความเห็นที่บอกว่าไม่เคยเจอใครใช้ Alteryx เลย มีคำอธิบายว่า Alteryx เป็นเครื่องมือกราฟิกสำหรับ ELT+Analytics ที่แทบไม่ต้องเขียนโค้ด และมีความเข้ากันได้ดี จึงใช้ร่วมกับฐานข้อมูลหรือไฟล์อื่น ๆ ได้
มีการแสดงความประหลาดใจกับข่าวที่สตาร์ตอัปฐานข้อมูลซึ่งระดมทุนได้ 12M ล้มเหลวภายใน 3 ปี โดยมองว่านี่เป็นตัวอย่างที่แสดงให้เห็นว่าการทำให้สตาร์ตอัปด้านฐานข้อมูลประสบความสำเร็จนั้นยากเพียงใด และยังสงสัยว่าทำไมถึงหานักลงทุนเพิ่มไม่ได้ ทั้งที่มีไอเดียใช้ AI เพื่อปรับปรุงประสิทธิภาพ DB