18 คะแนน โดย GN⁺ 2025-01-02 | 3 ความคิดเห็น | แชร์ทาง WhatsApp

Andy Pavlo(ศาสตราจารย์แห่ง CMU) รีวิวภาพรวมทั้งอุตสาหกรรมฐานข้อมูลในปี 2024

ฐานข้อมูลของฉัน ฉันจะกำหนดไลเซนส์แบบที่ต้องการเอง!

  • ภาวะกลืนไม่เข้าคายไม่ออกของฐานข้อมูลและโอเพนซอร์ส:
    • DBMS โอเพนซอร์สมักถูกพัฒนาโดยบริษัทที่ทำกำไรได้และได้รับการสนับสนุนจาก VC
    • เกิดปัญหาที่ผู้ให้บริการคลาวด์นำ DBMS ยอดนิยมไปให้บริการในรูปแบบเซอร์วิสและทำกำไรได้มากกว่าบริษัทผู้พัฒนา
    • MongoDB เปลี่ยนมาใช้ SSPL(Server Side Public License) ในปี 2018 เพื่อพยายามแก้ปัญหานี้
  • การเปลี่ยนแปลงไลเซนส์ของ Redis:
    • Redis Ltd. ระหว่างเตรียม IPO ในปี 2024 ได้เปลี่ยนจากไลเซนส์ BSD-3 ไปเป็น SSPL และ Redis Source Available License ของตนเอง
    • เดือนมีนาคม 2024 บริษัทประกาศเปลี่ยนไลเซนส์พร้อมกับการเข้าซื้อ Speedb ซึ่งเป็นฟอร์กของ RocksDB
    • การต่อต้านจากชุมชน:
      • ในสัปดาห์เดียวกันมีการประกาศโปรเจกต์ฟอร์กชื่อ Valkey และ Redict
      • Valkey เริ่มต้นจาก Amazon และมี Google, Oracle และรายอื่น ๆ เข้าร่วม ก่อนถูกรวมเข้า Linux Foundation
    • ความเป็นไปได้ที่ผู้ก่อตั้ง Redis จะกลับมา:
      • เดือนธันวาคม 2024 มีการประกาศว่าผู้ก่อตั้ง Redis จะร่วมมือกับ Redis Ltd. เพื่อหาทางรวมชุมชนกลับมาอีกครั้ง
  • Elasticsearch ย้อนกลับเรื่องไลเซนส์:
    • Elastic N.V. เปลี่ยนไปใช้ SSPL และ Elastic License ในปี 2021 แล้วเกิดความขัดแย้งกับ Amazon
    • Amazon ตอบโต้ด้วยฟอร์ก OpenSearch
    • เดือนสิงหาคม 2024 Elastic N.V. เปลี่ยนกลับไปใช้ AGPL พร้อมอ้างถึงเพลงของ Kendrick Lamar
    • เดือนกันยายน 2024 Amazon ส่งมอบโปรเจกต์ OpenSearch ให้ Linux Foundation
  • มุมมองของ Andy:
    • คำวิจารณ์ต่อ Redis:
      • ชี้ว่ามีประสิทธิภาพต่ำ มีปัญหาเรื่องทรานแซกชันปลอม และภาษาคิวรีที่ไม่มีประสิทธิภาพ
      • Redis มีทางเลือกทดแทนจำนวนมาก จึงอยู่ในสถานการณ์ที่รับแรงต้านจากชุมชนได้ยาก
    • แพตเทิร์นที่คล้ายกับ Elasticsearch:
      • เปลี่ยนไลเซนส์ → เกิดโปรเจกต์ฟอร์ก → ย้อนกลับสู่ไลเซนส์โอเพนซอร์ส
    • เหตุผลที่ Redis และ Elasticsearch เจอแรงต้านมากกว่า:
      • Redis นั้นผู้ก่อตั้งไม่ใช่ผู้สร้างดั้งเดิม และเป็นระบบที่มีผู้มีส่วนร่วมจากภายนอกจำนวนมาก จึงเกิดข้อถกเถียงเรื่อง “ความชอบธรรมไม่เพียงพอ”
      • ปฏิกิริยานี้คล้ายกับกรณี Terraform ของ HashiCorp ที่เปลี่ยนไลเซนส์ในปี 2023
    • อิทธิพลของผู้ให้บริการคลาวด์:
      • ผู้ให้บริการคลาวด์สามารถผนวกโปรโตคอลของ DBMS โอเพนซอร์สเข้ากับ DBMS เดิมของตน หรือใช้บริการของตนเองเพื่อลดทอนฐานรายได้ของ ISV
      • ตัวอย่าง: AWS เพิ่มโปรโตคอล InfluxDB v2 ให้กับ Timestream DBMS และประกาศบริการที่รองรับ Valkey ซึ่งถูกกว่าบริการที่เข้ากันได้กับ Redis ถึง 30%
  • อัปเดตเพิ่มเติม:
    • AWS ให้บริการ managed service ของ InfluxDB v2 DBMS ร่วมกับ Influx Data
    • ScyllaDB ยุติเวอร์ชันโอเพนซอร์ส AGPL ในเดือนธันวาคม 2024 และเปลี่ยนเวอร์ชันเอนเทอร์ไพรส์เป็น “เปิดเผยซอร์ส”

การแข่งขันไม่รู้จบของ Databricks และ Snowflake

  • ศึก LLM แบบเปิด:
    • Databricks:
      • เดือนมีนาคม 2024 เปิดตัว LLM โอเพนซอร์ส DBRX
      • มีพารามิเตอร์ 132 พันล้านตัว พัฒนาโดยทีม Mosaic ที่เข้าซื้อมาในปี 2023 ด้วยมูลค่า $1.3 พันล้าน
      • ลงทุน $10 ล้านในการพัฒนาโมเดล
    • Snowflake:
      • เดือนเมษายน 2024 เปิดตัว LLM โอเพนซอร์ส Arctic
      • มีพารามิเตอร์ 480 พันล้านตัว และอ้างว่าเหนือกว่า DBRX ในงาน “ระดับองค์กร” เช่น การสร้าง SQL
      • ลงทุน $2 ล้านในการพัฒนาโมเดล
      • การประกาศของ Snowflake เน้นการเปรียบเทียบกับ DBRX มากกว่า LLM อื่น ๆ แสดงให้เห็นภาพการแข่งขันอย่างชัดเจน
  • สงครามเมทาดาทาคาตาล็อก:
    • HCatalog ของ Hive กลายเป็นมาตรฐานของ data lake ในช่วงทศวรรษ 2010
    • Iceberg ของ Netflix และ Hudi ของ Uber ปรากฏขึ้นในช่วงปลายทศวรรษ 2010 และเติบโตเป็นโปรเจกต์ Apache
    • Databricks:
      • ให้บริการแพลตฟอร์ม DeltaLake และบริการคาตาล็อกแบบปิดชื่อ Unity
      • เดือนมิถุนายน 2024 ในวันเดียวกับที่ CEO ของ Snowflake ประกาศบริการคาตาล็อก Polaris บริษัทได้เข้าซื้อ Tabular ซึ่งสนับสนุน Iceberg ด้วยมูลค่า $2 พันล้าน
      • สัปดาห์ถัดมาประกาศโอเพนซอร์ส Unity catalog
    • Snowflake:
      • หลังประกาศรองรับ Iceberg ในปี 2022 ก็ขยายต่อมาอย่างค่อยเป็นค่อยไป
      • ระหว่างเจรจาเข้าซื้อ Tabular กลับถูก Databricks ตัดหน้าคว้าไปก่อน
  • มุมมองของ Andy:
    • ความต่างจากการแข่งขันแบบดั้งเดิม:
      • ต่างจากการแข่งขันด้านประสิทธิภาพระหว่าง Oracle และ Informix ในอดีต ศึกของ Snowflake และ Databricks เน้นที่ ecosystem และเครื่องมือจัดการข้อมูล
      • เอนจินประมวลผลแบบ vectorized ตอนนี้ถือเป็นเทคโนโลยีพื้นฐานไปแล้ว
      • สิ่งสำคัญในตอนนี้คือคุณภาพเสริมอย่างความง่ายในการใช้งาน ความเข้ากันได้ของเครื่องมือ และการผสาน AI/LLM
    • เป็นประโยชน์ต่อผู้บริโภค:
      • การแข่งขันที่ดุเดือดหมายถึงผลิตภัณฑ์และเทคโนโลยีที่ดีกว่า
      • Polaris ของ Snowflake ถูกเปลี่ยนเป็นโปรเจกต์ Apache ทำให้เข้าถึงเทคโนโลยีที่ดีกว่าได้
      • ท้ายที่สุดคาดหวังได้ทั้งความก้าวหน้าทางเทคโนโลยีและราคาที่ลดลง
    • การเปรียบเทียบในแง่บวก:
      • ต่างจากการแข่งขันวัดอีโก้ล้วน ๆ ของ CEO อย่าง Oracle กับ Salesforce ศึกของ Snowflake และ Databricks นำไปสู่นวัตกรรมจริงและการเสริมความสามารถในการแข่งขัน

ความพยายามในการผสาน DuckDB ไปไว้ทุกที่

  • การเติบโตของ DuckDB:
    • DuckDB กำลังกลายเป็นตัวเลือกตั้งต้นใหม่สำหรับคิวรีวิเคราะห์ข้อมูล
    • ก่อนหน้านี้ Pandas เคยทำหน้าที่นี้ แต่ DuckDB เข้ามาแทนด้วยความพกพาสูงและประสิทธิภาพที่ยอดเยี่ยม
    • มี DBMS มากขึ้นที่พยายามผสาน DuckDB เพื่อเสริมการรองรับ workload แบบ OLAP
    • ในปี 2024 มีการประกาศส่วนขยายใหม่ 4 ตัวที่ผสาน Postgres กับ DuckDB
  • การประกาศส่วนขยาย Postgres-DuckDB:
    • พฤษภาคม 2024 - Crunchy Data:
      • ประกาศบริดจ์แบบปิดที่ส่งต่อคิวรี OLAP จาก Postgres ไปยัง DuckDB
      • เพิ่มส่วนขยายที่เร่งคิวรี PostGIS โดยใช้ความสามารถด้านการวิเคราะห์เชิงภูมิศาสตร์ของ DuckDB
    • มิถุนายน 2024 - ParadeDB:
      • ประกาศส่วนขยายโอเพนซอร์ส pg_analytics
      • เดิมใช้ pg_lakehouse ที่อิง DataFusion แต่เปลี่ยนมาใช้ DuckDB
    • สิงหาคม 2024 - pg_duck:
      • เป็นส่วนขยาย DuckDB ที่ได้รับการสนับสนุนอย่างเป็นทางการจาก DuckDB Labs GitHub
      • เริ่มจากความร่วมมือระหว่าง MotherDuck, Hydra, Microsoft และ Neon แต่ Microsoft กับ Neon ถูกตัดออกจากโปรเจกต์เพราะข้อพิพาทเรื่องอำนาจควบคุมการพัฒนา
      • ปัจจุบัน MotherDuck และ Hydra ดูแลร่วมกัน
    • พฤศจิกายน 2024 - pg_mooncake:
      • ประกาศส่วนขยายที่เขียนข้อมูลลงตาราง Iceberg ผ่าน Postgres และรองรับทรานแซกชัน
  • มุมมองของ Andy:
    • จุดเด่นของ DuckDB:
      • คิวรี OLAP ส่วนใหญ่สแกนข้อมูลไม่ถึง 100MB และ DuckDB ก็จัดการได้เพียงพอด้วยอินสแตนซ์เดียว
      • ด้วยความพกพาและความสะดวกที่ยอดเยี่ยม จึงแพร่กระจายเร็วในชุมชน Postgres
      • รวม ecosystem ข้อมูลหลากหลายแบบไว้ในส่วนขยายเดียว รวมถึงการเข้าถึงข้อมูล Iceberg และ S3
      • ให้การวิเคราะห์ประสิทธิภาพสูงพร้อมศักยภาพในการแทน data warehouse ราคาแพง
    • ความสามารถในการขยายของ Postgres:
      • Postgres ตั้งเป้าความสามารถในการขยายและความยืดหยุ่นมาตั้งแต่ตอนออกแบบในยุค 1980
      • ด้วย API “hook” ของ Postgres (เพิ่มเข้ามาในปี 2006) จึงสร้าง ecosystem ของส่วนขยายที่กว้างและหลากหลายที่สุด
      • แต่ก็มีความเสี่ยงที่จะเกิดการรบกวนกันระหว่างส่วนขยายและพฤติกรรมผิดพลาด
    • การผสาน DuckDB กับ Postgres:
      • ส่วนขยาย Postgres เดิมอย่าง Citus และ Timescale ให้แค่ storage แบบคอลัมน์ จึงแก้ปัญหาได้เพียงบางส่วน
      • DuckDB ให้ทั้ง storage แบบคอลัมน์และการประมวลผลคิวรีแบบ vectorized
    • การเปรียบเปรยเชิงขำขัน:
      • กล่าวถึงความเป็นไปได้ของมุก turducken ที่เล่นกับช้างของ Postgres และ DuckDB แต่ขอละไว้เพื่อหลีกเลี่ยงบทลงโทษจากมหาวิทยาลัย

Random Happenings in the Database World

รีลีสสำคัญ:

  • Amazon Aurora DSQL:
    • AWS เปิดตัว DBMS ใหม่แบบ “คล้าย Spanner”
    • อิงกับ distributed log service และการจัดเรียงตาม timestamp(Time Sync)
    • ใช้ชื่อ Aurora แต่ไม่ได้แชร์โค้ดกับ Aurora Postgres RDS เดิม
  • CedarDB:
    • DBMS เชิงพาณิชย์ที่ฟอร์กโค้ดจาก Umbra
    • Thomas Neumann ผู้สร้าง Umbra ยังคงโฟกัสงานวิจัยและรักษาอันดับสูงสุดบน Clickbench leaderboard
  • Google Bigtable:
    • Bigtable ผู้บุกเบิก NoSQL เพิ่มการรองรับ SQL ในปี 2024
  • Limbo:
    • Turso ประกาศโปรเจกต์ที่เขียน SQLite ใหม่ทั้งหมดด้วย Rust
    • จุดแข็งของ SQLite ไม่ได้อยู่แค่โค้ด แต่รวมถึงวิศวกรรมการทดสอบที่รับประกันว่ามันจะทำงานได้ถูกต้องเหมือนกันในทุกสภาพแวดล้อม
    • มีการร่วมมือกับอดีตวิศวกรของ FoundationDB เพื่อนำ deterministic testing มาใช้
  • Microsoft Garnet:
    • คีย์-แวลูสโตร์ที่เข้ากันได้กับ Redis และเป็นภาคต่อของ FASTER
    • รองรับ query parallelism, ฐานข้อมูลที่ใหญ่เกินหน่วยความจำ และทรานแซกชันที่แท้จริง
  • MySQL v9:
    • เวอร์ชันใหม่ที่ออกหลังจากห่างไป 6 ปี
    • มีปัญหาที่จะ crash หากในฐานข้อมูลมีตารางมากกว่า 8,000 ตาราง
    • ขาดฟีเจอร์สำคัญ และ Oracle ดูจะโฟกัสกับบริการ MySQL Heatwave มากกว่า
  • Prometheus v3:
    • อัปเดตใหญ่ครั้งแรกในรอบ 7 ปี
    • มีตัวเลือกทดแทนมากมายจนการใช้งาน OG Prometheus ลดลง

การเข้าซื้อสำคัญ:

  • Alteryx → Private Equity: คนใช้น้อย และไม่มีความเห็นมากนัก
  • MariaDB → Private Equity: คาดว่าจะช่วยแก้ปัญหาด้านการบริหารจัดการ
  • OrioleDB → Supabase: ปรับปรุงสถาปัตยกรรม storage แบบเก่าของ Postgres
  • PeerDB → ClickHouse: เครื่องมือ ETL ส่งข้อมูล Postgres ไปยัง ClickHouse
  • PopSQL → Timescale: เข้าซื้อ UI ตัวแก้ไข SQL ขั้นสูง
  • Speedb → Redis Ltd.: ฟอร์กของ RocksDB ที่อาจช่วยเพิ่มความสามารถจัดเก็บข้อมูลบนดิสก์
  • Rockset → OpenAI: ยุติบริการ DBaaS ในเดือนกันยายน 2024
  • Tabular → Databricks: เข้าซื้อเพื่อเสริม ecosystem ของ Iceberg
  • Verta.ai → Cloudera: Cloudera ยังไม่ตาย
  • Warpstream → Confluent: เขียน Kafka ใหม่ด้วย golang และผสานกับ S3

การลงทุนสำคัญ:

  • Databricks: ซีรีส์ J มูลค่า $1 พันล้าน
  • DBOS: seed round มูลค่า $8.5 ล้าน
  • LanceDB: seed round มูลค่า $8 ล้าน
  • SDF: seed round มูลค่า $9 ล้าน
  • SpiceDB: ซีรีส์ A มูลค่า $12 ล้าน
  • TigerBeetle: ซีรีส์ A มูลค่า $24 ล้าน

จุดจบสำคัญ:

  • Amazon QLDB: แม้แต่ Amazon เองก็ทำเงินไม่ได้
  • OtterTune: การเดินทางตลอด 10 ปีของงานวิจัยและสตาร์ทอัปสิ้นสุดลง เพราะปัญหากับบางบริษัทจึงมีการห้ามรับนักศึกษา CMU-DB เข้าทำงาน

มุมมองของ Andy:

  • การระดมทุนครั้งใหญ่ของ Databricks:
    • ซีรีส์ J มูลค่า $1 พันล้านในปี 2024 ทำลายสถิติการระดมทุนสูงสุดในอุตสาหกรรมฐานข้อมูล
    • เงินทุนถูกนำไปใช้ซื้อหุ้นของพนักงานเพื่อแก้ปัญหาความไม่พอใจที่ IPO ล่าช้า
    • หลัง Databricks IPO ก็มีความเป็นไปได้ว่าสตาร์ทอัปด้านฐานข้อมูลอีกหลายรายจะเตรียม IPO ตามมา
  • แนวโน้มปีหน้า:
    • อัตราดอกเบี้ยที่ลดลงอาจเปิดโอกาสให้บริษัทที่ระดมทุนก้อนใหญ่มาแล้วอย่าง CockroachDB, Starburst และ Imply ระดมทุนเพิ่มเติมได้
    • dbtLabs ถูกมองว่าปักหลักความสำเร็จได้เรียบร้อยแล้ว

Larry Ellison ไม่ยอมหยุด: ความเคลื่อนไหวสุดน่าทึ่งในปี 2024

  • ผลงานเด่นของ Larry Ellison ในปี 2024:
    • อายุครบ 80 ปี แต่ยังคงเดินเกมอย่างกล้าหาญ
    • กลายเป็นมหาเศรษฐีอันดับ 3 ของโลกจากการที่หุ้น Oracle พุ่งขึ้น
      • เดือนมีนาคม 2024 เขาทำเงินได้ $15 พันล้านในวันเดียวจากการพุ่งขึ้นของหุ้น Oracle
    • เดือนกรกฎาคม ซื้อ Paramount Studio ด้วยเงิน $6 พันล้านเป็นของขวัญให้ลูกชาย(ที่เกิดกับภรรยาคนที่สาม)
    • เข้าซื้อรีสอร์ตใน Palm Beach ในราคา $277 ล้าน เพิ่มสินทรัพย์หรูอีกชิ้น
  • การสนับสนุนทีมอเมริกันฟุตบอลของมหาวิทยาลัยมิชิแกน:
    • เดือนพฤศจิกายน 2024 บริจาค $12 ล้านให้แคมเปญสนับสนุนฟุตบอลของมหาวิทยาลัยมิชิแกน
      • เงินบริจาคนี้มีบทบาทชี้ขาดในการดึงควอเตอร์แบ็กระดับท็อปที่ย้ายจาก LSU มามิชิแกน
      • ข่าวประชาสัมพันธ์ของมหาวิทยาลัยระบุถึงผลงานของ “Larry และภรรยาของเขา Jolin”
    • เป็นความเชื่อมโยงครั้งใหญ่ครั้งแรกของ Larry กับมหาวิทยาลัยมิชิแกน ทั้งที่เขาไม่มีประวัติเรียนจบมหาวิทยาลัย
  • “Jolin” คือใคร:
    • จากรายงานของสื่อพบว่าภรรยาใหม่ของ Larry คือ Jolin(Churen) Zhu
      • มีภาพ Larry ไปชมการแข่งขันเทนนิส และ Jolin สวมหมวกของมหาวิทยาลัยมิชิแกน
      • สองสัปดาห์ต่อมา ข่าวการแต่งงานถูกเผยแพร่ผ่านข่าวช่วงตี 5 ทำให้ยืนยันตัวตนของเธอได้
  • มุมมองของ Andy:
    • การสนับสนุนมหาวิทยาลัยมิชิแกนของ Larry มีความหมายพิเศษ
      • อดีตนักศึกษา CMU-DB ของ Andy ปัจจุบันเป็นศาสตราจารย์ในกลุ่มฐานข้อมูลของมหาวิทยาลัยมิชิแกน
    • เขาแสดงความยินดีกับความรักครั้งใหม่และการแต่งงานของ Larry พร้อมย้ำว่าการหาความรักในสังคมยุคใหม่เป็นเรื่องยาก
      • แม้จะผ่านการหย่าร้างมาแล้ว Larry ก็ยังกลับมาพบรักอีกครั้ง แสดงให้เห็นถึงความยืดหยุ่นและทัศนคติเชิงบวกที่น่าชื่นชม
  • การแต่งงานครั้งที่หกของ Larry:
    • หลังจาก Melanie Craft(หย่าในปี 2010) และ Nikita Kahn(หย่าในปี 2020) เขาก็แต่งงานอีกครั้งจนทำให้ทุกคนประหลาดใจ
    • การแต่งงานกับ Jolin Zhu เป็นการพิสูจน์อีกครั้งถึงความมุ่งมั่นของเขาในการไล่ตามความสุข

บทสรุป

  • แผนปีใหม่และสถานการณ์ปัจจุบัน:
    • ตั้งใจจะต้อนรับปีใหม่อย่างมีสุขภาพดีเป็นครั้งแรกในรอบ 3 ปี แต่กลับติด COVID จากลูกสาวและต้องเริ่มปีใหม่บนเตียงคนป่วย
    • ฉีดบูสเตอร์ในเดือนกันยายน 2024 และกำลังฟื้นตัวได้ดีโดยไม่มีปัญหาใหญ่ด้วยการรักษา Paxlovid
  • การยุติของ OtterTune:
    • รู้สึกผิดหวังที่โปรเจกต์ OtterTune ต้องยุติลง
    • ได้เรียนรู้อย่างมากจากการร่วมงานกับผู้คนที่ยอดเยี่ยมมากมาย
    • ขอบคุณ Intel Capital และ Race Capital ที่สนับสนุนจนถึงที่สุด
    • กำลังวางแผนสตาร์ทอัปใหม่อยู่(ขอใบ้ว่าเกี่ยวกับฐานข้อมูลอีกเช่นเคย)
  • การเริ่มต้นใหม่ที่ CMU:
    • กลับสู่ Carnegie Mellon University(CMU) และกลับมาทำวิจัยเต็มเวลาอีกครั้ง
    • กำลังเตรียมโปรเจกต์วิจัยที่น่าสนใจร่วมกับ Jignesh Patel
    • ภาคการศึกษานี้จะเปิดวิชาใหม่เรื่อง query optimization
    • หลัง Wikipedia ลบบทความเกี่ยวกับตัวเขาในเดือนกันยายน 2024 เขากำลังหาทางเพิ่มจำนวน citation ของงานวิจัยของตน
  • การสนับสนุนต่อ DJ Mooshoo:
    • ยังคงสนับสนุน DJ Mooshoo ที่ถูกคุมขังอยู่ใน Cook County
    • เฝ้ารอและหวังว่าจะได้รับการปล่อยตัวในปี 2025
  • การกล่าวถึง ByteBase:
    • ขอบคุณ ByteBase สำหรับบทความรีวิวเครื่องมือฐานข้อมูลปี 2024(Database Tools in 2024: A Year in Review)
    • ปีก่อน ByteBase ขออนุญาตแปลบทความสรุปฐานข้อมูลปลายปีของเขาเป็นภาษาจีน แต่ปีนี้ไม่ได้รอ และเขียนบทความของตนเองในหัวข้อและชื่อที่คล้ายกัน

3 ความคิดเห็น

 
daumkakao 2025-01-04

ขอบคุณสำหรับบทความดีๆ ครับ

 
xguru 2025-01-02

ลืมของปี 2023 ไปครับ ตอนนั้นเป็นลิงก์ OtterTune แต่ตอนนี้ปิดให้บริการไปแล้ว เลยย้ายมาไว้ที่บล็อกส่วนตัวแทน

รีวิวฐานข้อมูลปี 2022
รีวิวฐานข้อมูลปี 2021

 
GN⁺ 2025-01-02
ความคิดเห็นจาก Hacker News
  • มีความเห็นว่าคำวิจารณ์เกี่ยวกับ API คำสั่งของ Redis ในวิดีโอของ Andy ยังไม่หนักแน่นพอ แม้จะวิจารณ์ API ของ Redis ได้ แต่ก็ควรมีเหตุผลที่แข็งแรงกว่านี้ พร้อมเน้นว่าควรเข้าใจวิธีใช้งานและข้อดีของ Redis

  • ตอนที่โค้ดของ Greenplum ถูกปิด เดิมทีนักพัฒนาต้นฉบับได้สร้างโอเพนซอร์สฟอร์กชื่อ Cloudberry ขึ้นมา และต่อมาก็ถูกรับเข้าเป็นโปรเจกต์ของ Apache แล้ว Cloudberry ซิงก์กับ Postgres 14 แต่ Greenplum ยังหยุดอยู่ที่ Postgres 12

  • มีความเห็นที่วิจารณ์ Redis ในเชิงส่วนตัวว่า Redis ช้า มีทรานแซ็กชันแบบหลอก ๆ และไวยากรณ์คิวรียุ่งยาก พร้อมกล่าวถึงว่า Dragonfly แสดงประสิทธิภาพได้ดีกว่าที่ CMU

  • มีความเห็นว่า DuckDB เป็นเครื่องมือที่ยอดเยี่ยม และการบรรยายของผู้ก่อตั้ง DuckDB ที่ CMU ซึ่งอธิบายว่าทำไมนักวิทยาศาสตร์ข้อมูลจึงไม่ใช้ RDBMS นั้นน่าประทับใจมาก

  • มีความเห็นว่าแปลกที่ไม่มีการพูดถึง SQL Server และสายผลิตภัณฑ์ฝั่ง Azure ทั้งที่มันครองตลาดในบางด้าน และถูกจัดให้เป็นฐานข้อมูลยอดนิยมอันดับสามบน DBEngines

  • มีความเห็นว่าความไม่พอใจต่อ Elastic และ Redis แตกต่างจาก MongoDB เพราะเรื่องไลเซนส์และขนาดของชุมชนผู้ร่วมพัฒนา ไลเซนส์ที่มีข้อจำกัดอย่าง AGPL ทำให้นำไปใช้แบบฝังรวมได้ยาก และถ้าไม่มีชุมชนผู้ร่วมพัฒนา การทำฟอร์กก็ยาก

  • มีความเห็นว่าเหตุผลที่ไม่มีความพยายามฟอร์กจากการเปลี่ยนไลเซนส์ของ MongoDB, Neo4j, Kafka และ CockroachDB เป็นเพราะผู้คนไม่ได้ใส่ใจกับโปรเจกต์เหล่านี้มากนัก

  • มีความเห็นว่าแม้ Amazon จะสามารถให้บริการฐานข้อมูลในรูปแบบบริการได้ แต่หลายคนก็ไม่ต้องการบริการแบบ managed ของ AWS หลายทีมชอบโซลูชันบน k8s และมีแนวโน้มจะย้ายไปใช้การติดตั้ง OSS กระแสหลัก

  • เพื่อตอบความเห็นที่บอกว่าไม่เคยเจอใครใช้ Alteryx เลย มีคำอธิบายว่า Alteryx เป็นเครื่องมือกราฟิกสำหรับ ELT+Analytics ที่แทบไม่ต้องเขียนโค้ด และมีความเข้ากันได้ดี จึงใช้ร่วมกับฐานข้อมูลหรือไฟล์อื่น ๆ ได้

  • มีการแสดงความประหลาดใจกับข่าวที่สตาร์ตอัปฐานข้อมูลซึ่งระดมทุนได้ 12M ล้มเหลวภายใน 3 ปี โดยมองว่านี่เป็นตัวอย่างที่แสดงให้เห็นว่าการทำให้สตาร์ตอัปด้านฐานข้อมูลประสบความสำเร็จนั้นยากเพียงใด และยังสงสัยว่าทำไมถึงหานักลงทุนเพิ่มไม่ได้ ทั้งที่มีไอเดียใช้ AI เพื่อปรับปรุงประสิทธิภาพ DB