29 คะแนน โดย GN⁺ 2026-01-06 | 1 ความคิดเห็น | แชร์ทาง WhatsApp
  • ปี 2025 เป็นปีที่สรุปได้ด้วย การครองอิทธิพลที่แข็งแกร่งขึ้นของ PostgreSQL, การแพร่หลายของมาตรฐาน MCP, การควบรวมและซื้อกิจการครั้งใหญ่, การแข่งขันด้านไฟล์ฟอร์แมตที่ลุกโชนอีกครั้ง, และ การผงาดขึ้นมาของ Larry Ellison
  • PostgreSQL กลายเป็น DBaaS หลักของผู้ให้บริการคลาวด์รายใหญ่ และมี โปรเจกต์แบบกระจายศูนย์ (Multigres, Neki, PgDog) เกิดขึ้นใหม่
  • DBMS รายใหญ่ทั้งหมดนำ Model Context Protocol (MCP) ของ Anthropic มาใช้ ทำให้การผสานรวมระหว่าง LLM กับฐานข้อมูลเริ่มต้นอย่างจริงจัง
  • MongoDB ยื่น ฟ้องร้องเกี่ยวกับการเลียนแบบ API ต่อ FerretDB และในฝั่งไฟล์ฟอร์แมต การแข่งขันเพื่อมาแทนที่ Parquet ก็ทวีความดุเดือด
  • ทั้งการซื้อกิจการ การปิดตัว และการระดมทุนเกิดขึ้นอย่างคึกคักทั่วทั้งอุตสาหกรรม ทำให้ปีนี้ถูกมองว่าเป็นปีที่ การปรับโครงสร้างและการรวมศูนย์ของอุตสาหกรรมฐานข้อมูล เร่งตัวขึ้น

การขยายตัวอย่างต่อเนื่องของ PostgreSQL

  • PostgreSQL เวอร์ชัน 18 เปิดตัวในเดือนพฤศจิกายน 2025 โดยเพิ่ม ระบบย่อยจัดเก็บข้อมูลแบบ asynchronous I/O และความสามารถ skip scan
    • ลดการพึ่งพา OS page cache และปรับปรุงการใช้ประโยชน์จากดัชนีหลายคีย์
  • Databricks เข้าซื้อ Neon ด้วยมูลค่า 1 พันล้านดอลลาร์ และ Snowflake เข้าซื้อ CrunchyData ด้วยมูลค่า 250 ล้านดอลลาร์
    • Microsoft เปิดตัว HorizonDB ทำให้ผู้ให้บริการคลาวด์รายใหญ่ทั้งหมดต่างมีบริการที่อิงกับ PostgreSQL
  • มี โปรเจกต์ PostgreSQL แบบกระจายศูนย์ ใหม่เกิดขึ้น เช่น Multigres ของ Supabase, Neki ของ PlanetScale และ PgDog
    • Supabase ดึงตัว Sugu ผู้ร่วมก่อตั้ง Vitess มานำการพัฒนา sharding middleware
  • ในกลุ่มบริการ PostgreSQL แบบอิสระ มีผู้เล่นอย่าง Supabase, YugabyteDB, TigerData, PlanetScale, Xata, PgEdge และ Nile
    • สตาร์ทอัพบางราย เช่น Hydra และ PostgresML ปิดตัวลงในปี 2025
  • การแข่งขันด้าน M&A และวิวัฒนาการทางเทคโนโลยี ที่มี PostgreSQL เป็นศูนย์กลาง กลายเป็นแรงขับสำคัญของอุตสาหกรรม

การแพร่หลายเต็มรูปแบบของ MCP (Model Context Protocol)

  • ในปี 2025 DBMS รายใหญ่ทั้งหมดรองรับ มาตรฐาน MCP ของ Anthropic
    • MCP คือ อินเทอร์เฟซบนพื้นฐาน JSON-RPC ที่ทำให้ LLM สามารถโต้ตอบกับฐานข้อมูลได้
  • หลังจาก OpenAI ประกาศรองรับ MCP ในเดือนมีนาคม 2025 ระบบหลักอย่าง ClickHouse, Snowflake, Oracle และ MongoDB ก็เปิดตัว MCP server
    • บริการที่อิงกับ PostgreSQL ต่างก็มี MCP server ของตนเองเช่นกัน (เช่น Supabase, Timescale, Xata)
  • MCP server เข้าถึงฐานข้อมูลแบบหนึ่งคำขอต่อครั้ง และ ยังไม่รองรับการ join ข้ามฐานข้อมูลต่างชนิด
  • Neon ระบุว่าด้วยความสามารถด้าน data branching ทำให้รับภาระ 80% ของฐานข้อมูลที่ AI agent สร้างขึ้น
  • ในด้านความปลอดภัย มีการเน้นย้ำถึงความจำเป็นของ การให้สิทธิ์เท่าที่จำเป็นและกลไกป้องกันอัตโนมัติ
    • บางระบบมีฟังก์ชันป้องกันพื้นฐาน เช่น จำกัดแบบอ่านอย่างเดียว, query timeout และการจำกัดผลลัพธ์

ข้อพิพาททางกฎหมายระหว่าง MongoDB กับ FerretDB

  • MongoDB ยื่น ฟ้องร้องเรื่องการละเมิดสิทธิบัตร ลิขสิทธิ์ และเครื่องหมายการค้า ต่อ FerretDB ในปี 2025
    • FerretDB เป็น middleware proxy ที่แปลงคำสั่ง query ของ MongoDB ไปเป็น PostgreSQL โดยมีการชี้ว่าการใช้คำว่า “drop-in replacement” เป็นประเด็นปัญหา
  • Microsoft บริจาค DocumentDB โอเพนซอร์สที่เข้ากันได้กับ MongoDB ให้กับ Linux Foundation
    • Amazon, Yugabyte และรายอื่น ๆ ก็เข้าร่วมในโปรเจกต์นี้
  • มีการชี้ว่าคำกล่าวอ้างของ MongoDB ที่ว่า “บุกเบิกฐานข้อมูลแบบไม่สัมพันธ์” นั้น ก่อนหน้านี้มีระบบอย่าง IDS, IMS ตั้งแต่ทศวรรษ 1960 อยู่แล้ว
  • ชื่อเริ่มแรกของ FerretDB ที่เคยใช้ว่า “MangoDB” ถูกยกมาเป็นประเด็น ข้อถกเถียงเรื่องความสับสนของเครื่องหมายการค้า

การกลับมาร้อนแรงของการแข่งขันด้านไฟล์ฟอร์แมต

  • ในปี 2025 มี ไฟล์ฟอร์แมตโอเพนซอร์สใหม่ 5 แบบ ที่เข้ามาท้าทายอำนาจของ Parquet
    • FastLanes (CWI), F3 (CMU+มหาวิทยาลัยชิงหัว), Vortex (SpiralDB), AnyBlox (ทีมนักวิจัยเยอรมนี), Amudai (Microsoft)
  • Vortex ของ SpiralDB ได้รับความสนใจหลังถูกบริจาคให้ Linux Foundation และ AnyBlox คว้า รางวัลบทความยอดเยี่ยมของ VLDB
  • ทีมพัฒนา Parquet จึงผลักดัน การปรับปรุงสเปกให้ทันสมัย เพื่อตอบโต้
  • F3 format ที่ Pavlo มีส่วนร่วม ตั้งเป้าแก้ปัญหาความเข้ากันได้ด้วย ดีโคเดอร์ในตัวที่อิงกับ WASM
  • การแข่งขันในระยะถัดไปมีแนวโน้มสูงว่าจะไปอยู่ที่ การรองรับ GPU หรือไม่

แนวโน้มการควบรวม การลงทุน และการปิดกิจการ

  • กรณีการเข้าซื้อกิจการสำคัญในปี 2025
    • IBM เข้าซื้อ DataStax และ Confluent, Databricks เข้าซื้อ Neon·Tecton·Mooncake
    • Snowflake เข้าซื้อ CrunchyData·Datometry, Salesforce เข้าซื้อ Informatica, Nvidia เข้าซื้อ HeavyDB
    • Fivetran และ dbt Labs ควบรวมกันแบบสายฟ้าแลบ ปรับโครงสร้างใหม่เป็นแพลตฟอร์ม ETL แบบบูรณาการ
  • รอบการลงทุนสำคัญ
    • เช่น Databricks (4 พันล้านและ 1 พันล้านดอลลาร์), ClickHouse (350 ล้านดอลลาร์), Supabase (200 ล้านและ 100 ล้านดอลลาร์), Timescale (110 ล้านดอลลาร์)
  • กรณีปิดกิจการ
    • เช่น Fauna, PostgresML, Hydra, MyScaleDB, Voltron Data, Apache Derby
    • การปิดตัวของห้องวิจัย IBM Research Almaden ถูกกล่าวถึงว่าเป็น จุดสิ้นสุดเชิงสัญลักษณ์ของงานวิจัยด้านฐานข้อมูล
  • Pavlo ชี้ข้อจำกัดเชิงพาณิชย์ของฐานข้อมูลที่อิงกับ GPU และเน้นย้ำถึง ความสุกงอมของ OLAP engine บน CPU และการแข่งขันที่เน้นประสบการณ์ผู้ใช้เป็นศูนย์กลาง

‘ปีที่ดีที่สุด’ ของ Larry Ellison

  • ในปี 2025 Larry Ellison ผู้ก่อตั้ง Oracle ขึ้นเป็น บุคคลที่ร่ำรวยที่สุดในโลก (393 พันล้านดอลลาร์)
    • ทรัพย์สินพุ่งขึ้นจากราคาหุ้น Oracle ที่ทะยานและการลงทุนในศูนย์ข้อมูล AI
  • Oracle มีส่วนเกี่ยวข้องกับดีลขนาดใหญ่อย่าง การเข้าซื้อกิจการ TikTok สหรัฐฯ และ ความพยายามของ Paramount ในการเข้าซื้อ Warner Bros
  • Pavlo บรรยายเส้นทางของ Ellison ว่าเป็น “สัญลักษณ์ของบุคคลที่พิชิตโลกด้วยฐานข้อมูล”
    • แม้จะมีเสียงวิจารณ์ แต่ อิทธิพลของ Oracle และการมีตัวตนของ Ellison ก็ยังแข็งแกร่งอย่างยิ่ง

บทสรุป

  • อุตสาหกรรมฐานข้อมูลในปี 2025 สรุปได้ด้วย การปรับโครงสร้างใหม่โดยมี PostgreSQL เป็นศูนย์กลาง, การเร่งผสานรวม AI·LLM, และ การแบ่งขั้วระหว่าง M&A ขนาดใหญ่กับการปิดกิจการ
  • Pavlo เน้นย้ำว่าทั้งนักวิจัยและภาคอุตสาหกรรมต้องมุ่งเน้นที่ ความปลอดภัย มาตรฐานกลาง และระบบอัตโนมัติด้านปฏิบัติการ
  • ปิดท้ายด้วยการประกาศเปิดตัวสตาร์ทอัพใหม่ของทีมนักวิจัย CMU ชื่อ Sydht.ai

1 ความคิดเห็น

 
GN⁺ 2026-01-06
ความคิดเห็นจาก Hacker News
  • ต้องไปดู สไตล์การสอน ที่เป็นเอกลักษณ์ของ CMU DB Group ให้ได้
    ดูได้จากผลการค้นหา YouTube
    โดยเฉพาะ gangsta intro กับ DJ set ที่น่าประทับใจมาก
    ยังจำคลิปเก่า ๆ ที่มีคนนอนหลับอยู่บนพื้นระหว่างเลกเชอร์ได้ด้วย เลยยิ่งอยากรู้ ประวัติและบริบท ของ Andy มากขึ้น

    • ถ้าเป็นแฟน Wu-Tang กับฮิปฮอปก็น่าจะอินเหมือนกัน อินโทรนั้นเท่มากจริง ๆ
    • สับสนว่า “Intro to Database Systems” ของ CMU เป็นวิชาระดับปริญญาตรี หรือเป็นคอร์สขั้นสูงที่ลงลึกเรื่องโครงสร้างภายในกันแน่ ในฐานะคนเริ่มต้นด้านฐานข้อมูล อยากหาคอร์สเริ่มต้นที่เหมาะสม
    • ฉันแก้ลิงก์ให้กดได้แล้วโดยเติม https://
  • เสียดายที่รีวิวในช่วงไม่กี่ปีที่ผ่านมาไม่ได้พูดถึง immutable หรือ ฐานข้อมูลแบบ bi-temporal เลย
    DB แบบนี้มีประโยชน์มากโดยเฉพาะใน อุตสาหกรรมฟินเทค
    ตัวอย่างที่เด่นคือ XTDB v2 (2025) และ Datomic Free (2023)

    • ที่ CMU มี สัมมนาเชิงเทคนิค เกี่ยวกับ XTDB เมื่อ 5 สัปดาห์ก่อน
      เลยสงสัยว่าการแค่พูดว่า “มันมีอยู่” เพียงเท่านั้นจะพอหรือไม่
    • ใช้ type tstzrange ของ PostgreSQL และ ส่วนขยาย pg_bitemporal ก็ไปได้ไกลพอสมควร
      พวกเราใช้ ระบบ audit log แบบ row trigger เพื่อทำประวัติการเปลี่ยนแปลงและฟังก์ชัน undo
      อีกทั้งยังย้าย log ไปเก็บในสตอเรจแยกเพื่อคง offline backup เอาไว้ด้วย
    • ข้อดีของ Immutable DB เริ่มเป็นที่ยอมรับมากขึ้นเรื่อย ๆ ไม่ใช่แค่เรื่อง audit อย่างเดียว แต่ยังมีข้อดีอย่าง การอ่านพร้อมกัน, การทำ replica ได้เร็ว, การ undo ธุรกรรม และอื่น ๆ
      ตอนนี้ฉันกำลังพัฒนา immutable SQLite อยู่ — xitdb-java
    • บางคนกำลังเพิ่มความเป็นเชิงเวลาและความไม่เปลี่ยนแปลงเข้าไปใน triple store เพราะ xtdb กับ datomic ช้าในการไล่กราฟแบบ SPARQL
      หวังว่าจะได้เห็น triple store ที่รองรับ time travel
    • ฉันก็แสดงความเห็นคล้ายกันไว้ในคอมเมนต์อื่น
  • เทรนด์ฐานข้อมูลปี 2025 สรุปได้เป็นสองข้อ
    1️⃣ ย้ายทุกอย่างไปเป็น SQLite
    2️⃣ ใช้งานแบบเน้น ฟิลด์ JSON
    SQLite ใช้ง่ายเพราะเป็นไฟล์เดียวและไม่ต้องมีเดมอน แถมฟังก์ชัน JSON ก็ทำให้จัดการข้อมูลแบบยืดหยุ่นได้สนุก

    • ในมุมของฉัน ตอนนี้คือ DuckDB ทั้งหมดเลย ไฟล์เดียว รองรับหลายฟอร์แมต แถมมี S3, Parquet, คอลัมน์สโตร์, WASM ครบมาก
    • จริง ๆ แล้วก็รู้สึกว่า “จำเป็นต้องมี DB ไหม?” SQLite เหมือนอยู่กึ่งกลางระหว่าง DB เต็มรูปแบบกับ object storage ที่เขียนเอง
      มันให้ API สำหรับเข้าถึงอ็อบเจ็กต์แบบ normalized
    • ถ้า SQLite ไม่ได้อยู่ในสภาพแวดล้อมหลายผู้ใช้ แล้วมีหลายเว็บคอนเนกชันเขียนพร้อมกัน มันจะรับมือได้แค่ไหนกัน
    • เมื่อก่อนมีภาพจำว่าไม่ควรใช้ SQLite ในโปรดักชัน แต่ดูเหมือนตอนนี้จะเปลี่ยนไปแล้ว
    • สำหรับฉัน ชุดที่เหมาะที่สุดคือ “SQLite ถ้าเป็นไปได้, PostgreSQL ถ้าจำเป็น, DuckDB สำหรับงานวิเคราะห์, BigQuery สำหรับ BI ขนาดใหญ่”
  • เข้าใจว่าทำไม Pavlo ถึงมอง MCP ด้านความปลอดภัยอย่างกังขา MCP มีปรัชญาแบบเปิดเผยบริบท ซึ่งสวนทางกับ หลักสิทธิ์น้อยที่สุด
    ถ้าเอา DB ไปเปิดผ่านโปรโตคอลแบบนี้ ไม่ใช่แค่ข้อมูลธรรมดาที่ถูกเปิดให้โมเดลเห็น แต่รวมถึง ความซับซ้อนของสคีมา ด้วย
    สุดท้ายมันให้ความรู้สึกเหมือน การกลับมาของ SQL injection — เพียงแต่คราวนี้ต้นเหตุไม่ใช่ผู้ใช้ไม่หวังดี แต่เป็นอาการหลอนของโมเดล

    • ฉันสร้าง MCP gateway ที่อาศัยความที่ LLM เป็น stateless เพื่อตามรอยแหล่งที่มาของบริบทขาเข้า และบล็อกการเปลี่ยนสถานะที่เสี่ยงอันตราย
      อิงจากกรอบคิด lethal trifecta ของ Simon Willison และดูได้ที่ open-edison
    • คงไม่มีใครใช้ DB MCP ที่มีสิทธิ์เขียน ในโปรดักชันหรอก การโทษว่าเป็นปัญหาของโปรโตคอลจึงไม่ค่อยยุติธรรม
    • ฉันสงสัยว่าเรามีคุณค่ามากพอจะยอมทิ้งหลักการเหล่านี้หรือไม่ อาจเป็นแค่ส่วนต่อเนื่องของแนวคิด “move fast, break things” เท่านั้น
  • รู้สึกว่าจำเป็นต้องเปลี่ยนไปใช้ Immutable DB
    Datomic ทรงพลัง แต่ ซับซ้อนและเส้นโค้งการเรียนรู้ชันมาก ส่วน immudb ก็ยัง ไม่พร้อมสำหรับโปรดักชัน นัก
    พอเกินไม่กี่แสนเรคคอร์ดก็เริ่มมีปัญหา

  • Supabase เติบโตแรงมาก
    ได้ยินมาว่าสตาร์ตอัปของ YC ประมาณ 70% ใช้อยู่
    เลยสงสัยว่าในอนาคตพวกเขาจะย้ายไปแบบ self-hosted กันไหม

  • มีการพูดถึงเหตุผลที่ EdgeDB เปลี่ยนชื่อเป็น Gel แต่ควรเพิ่มไว้ในส่วน acquisition ด้วย
    Gel ได้เข้าร่วมกับ Vercelแล้ว

    • ขอบคุณ ฉันเพิ่มลิงก์แก้ไขข้อมูล ไว้ในบล็อกแล้ว
      ควรหาวิธีติดตามการเปลี่ยนแปลงแบบนี้โดยอัตโนมัติ
    • พูดตรง ๆ ว่าน่าผิดหวัง ต่อให้อ่านโพสต์ทางการ ของ Vercel ก็ยังรู้สึกว่าอนาคตของ Gel ไม่ชัดเจน
      คอมมิตล่าสุดบน GitHub ก็เมื่อ 2 สัปดาห์ก่อน
  • Andy กับ DB Group ของ CMU ทำให้ฐานข้อมูลกลายเป็นเรื่องที่ เข้าถึงคนทั่วไปมากขึ้น อย่างมาก เป็นทีมระดับโลกจริง ๆ

    • อยากรู้ว่าพวกเขาทำอะไรไว้บ้างแบบเป็นรูปธรรม
  • การออก PostgreSQL 18 ยอดเยี่ยมมาก
    คนส่วนใหญ่พูดถึงแค่ async IO worker แต่ Unicode locale, การเพิ่ม constraint แบบ unvalidated, virtual column, btree skip scan, UUIDv7 และอื่น ๆ ก็เป็นการปรับปรุงครั้งใหญ่เช่นกัน

  • เทรนด์หลายปีต่อเนื่อง ในช่วงหลังน่าประทับใจมาก
    Databricks กับ Snowflake พิสูจน์ให้เห็นถึง ความคล่องตัวและความอยู่รอด ท่ามกลางการแข่งขันด้านคลาวด์
    ในทางกลับกัน Cloudera กับ Hortonworks กลับล้มเหลว
    อีกทั้ง ClickHouse ก็กำลังเติมเต็มช่องทางเฉพาะของตัวเองได้อย่างสมบูรณ์แบบแบบเงียบ ๆ