跳过正文
  1. 数据库老司机/

别争了,AI时代数据库已经尘埃落定

·3245 字·7 分钟· ·
数据库 AI PostgreSQL
冯若航
作者
冯若航
Pigsty 创始人, @Vonng
目录

今天早上业界爆出一个收购案,继 Databricks 以十亿美元收购 Neon 之后,它的老对手 Snowflake 紧接着收购了 CrunchyData。

据知情人士透露,这笔交易的价格为 2.5亿美元。虽然价格是 Neon 的 1/4 ,但不同于 DataBricks 股票置换,这次 SnowFlake 是真金白银出了钱的,颇有 “Databricks 买啥我买啥” 针锋相对的意味。

twitter.webp

但这并非两家数仓巨头的意气之争,而是 PostgreSQL 确实占尽了 AI 时代数据库崛起的天时 —— 加上业界正在流传的 OpenAI 将收购 Supabase,不难发现,这些收购案(或者潜在收购意向)的共同点是 —— 这些都是做 PostgreSQL 的公司 —— PostgreSQL 公司正在成为资本市场最抢手的香饽饽。

WSJ: Snowflake 将以 2.5 亿美元收购 Crunchy Data[1]


为什么是PostgreSQL?
#

为什么会出现这样的现象呢?微软 CEO 纳德拉已经说的很清楚了,AI 时代的不变量是数据库(《SaaS已死?AI时代,软件从数据库开始》)。前端可能会收缩成一个对话框或者干脆就是语音交互,而后端一部分被 Agent 替代,另一部份融入数据库里

(比如 Supabase)。整个 IT 领域中,只有数据库,依然在 AI 时代不可或缺。

那么谁会成为 AI 时代的数据库?在全球开发者中,这个问题早就已经有公论了。PostgreSQL 早在三年前就已经成为全球开发者使用率最高,最喜爱,需求量最大的数据库

trend.webp

比如,当我问 OpenAI 的朋友,你们为什么选型 PostgreSQL 的时候,他反问了我一句:”PostgreSQL 难道不是现在的默认选择和安全牌吗?不用 PostgreSQL 才需要特殊的理由吧!“(《OpenAI:将PostgreSQL伸缩至新阶段》)

像 OpenAI 和 Curosr 这样的公司,他们的 ”真·Web Scale“ 应用规模可以只用一套主从 PostgreSQL 支撑起其业务,其他的公司的场景自然也更不在话下。

openai.webp

而现在,PostgreSQL 不仅仅已经成为开发者,创业者,产业界的共识,更是赢得了资本的青睐。资本已经用脚投好票了 —— PostgresQL 就是 AI 时代的数据库。

很多人问,为什么是 PostgreSQL? 这个问题,老冯已经在《PostgreSQL 正在吞噬数据库世界》 一文中解释过了。PostgreSQL 是唯一具有吞噬整个数据库世界能力的 框架

开源与先进是 PG 的 BackBone,而它的 Edge 是 “可扩展性”。**越来越多的数据库细分领域开始以“插件”的形式被整合到 PostgreSQL 生态中,**强大的可扩展性不仅让 PostgreSQL 已经成为了 OLTP 世界的事实标准 ,更是让它在 整合 OLAP 大数据生态 占尽先机。

ecosystem.gif

关于 CrunchyData
#

本次被收购的 CrunchyData 就是 DuckDB 缝合大赛 的主要玩家之一。他们最近主要发力的点就在于 PostgreSQL 数据仓库 (Crunchy Bridge),他们还有一个相关的开源项目 pg_parquet ,提供了在 PG 中读写 S3 上 Parquet 文件的能力,刚出来的时候我就打好了包放在 Pigsty 扩展仓库中,也真的有一些用户在用。

CrunchyData 是 PostgreSQL 生态的知名公司,PostgreSQL 社区的核心组成员 Tom Lane 就任职于这家公司。他们的核心业务大致可以概括为以下几项:

crunchy.webp

一个 PostgreSQL 数据库发行版:Crunchy Certified PostgreSQL,大体上就还是那些高可用监控备份恢复的东西,比较有特色的是一些企业安全特性,比如 SELinux 集成/ TDE 与合规认证。还有一些远程DBA,培训认证之类的服务。

一个 Postgres Kubernetes Operator,老冯对 K8S放数据库这种事不感冒 ,但显然 CrunchyData 的 PGO 在这个领域绝对算是第一梯队的头部玩家。

以及从去年开始发力的 PostgreSQL 数据仓库,啊对,就是把 DuckDB 和 Iceberg 这些东西缝合进 PostgreSQL 里面。

老冯点评
#

老冯觉得 Snowflake 收购 CrunchyData 是很明智的,除了 PostgreSQL 本身确实非常有用之外(Snowflake一直想要进军 OLTP 领域)(建设性要素参与分配),还有一条隐藏的重要线索(破坏性要素参与分配)。

大数据期货死人
#

这里涉及到一条关键行业认知与洞察 —— 正如 DuckDB 宣言说的那样:大数据已死(期货死人)。其实这个趋势在十年前就出现苗头《小数据的失落十年:分布式分析的错付》,但真正的影响在最近几年在开始显现 —— 也就是以现代硬件的表现水平,单机(PostgreSQL / DuckDB)已经足以处理绝大多数(let’s say 99.99%)应用场景的数据分析了。

CrunchyData 正好是在去年我那篇 《PostgreSQL is eating the database world),而这会对以数仓起家的 Snowflake 起到釜底抽薪的效果。

简单来说,OLTP 的事实标准已经是 PG 了,那么用户直接拿 PG 同样干 OLAP 是不是比 ETL 到 Snowflake 或者其他大数据方案更省事,省人,省心呢?几年前我们在 Apple 就是这么干的,同时用 PostgreSQL 作为工控系统的 OLTP / OLAP ,一个数据库搞定所有问题,直接省掉整个“大数据”部门。但五年前这算小众前沿探索,五年后这种实践已经进入大众视野了。

现在这种实践成为主流的最后的临门一脚,就是 PG 缝合 DuckDB,(DuckLake 或者 Iceberg) 一旦缝合足够好,PG 的 OLAP 分析性能直接进入 T0 梯队,那么这些 OLAP / 大数据方案就没有活路了 —— 我将其形容为数据库世界中的 “火星撞地球”。

这件事的关键阻碍是什么,是 PG 的存储引擎表访问接口(TAM)。这就正好卡在 CrunchyData 的 Tom Lane 手中。

PG内核的否决权
#

过去一年,Tom Lane 在 CrunchyData 就给 PG 的表访问接口(TAM)使过不少绊子,这让 CrunchyBridge 能够在数仓缝合(Duck/Iceberg)上获得一些优势,圈子内引起了一些非议,比如德哥就直白的说过这个事:

好,现在如果你是 Snowfake 的 CEO,最有效地阻止(或引导控制) PG Duck 合流趋势的做法是什么?就是直接控制一名 PG 社区核心组的成员,掌握了 PG 社区新特性的 veto 一票否决权,就可以有效阻止 PG TAM 表访问接口的演进,从而锁死 pg 与 duckdb 缝合的天花板。收购 CrunchyData 实际上就起到了这个效果。

而且 Snowflake 还可以推动一些有利于整合 PG / Snowfalke 的变化进入 PG 内核,从而在 PG 吞噬数据库世界的进程中,在 OLAP 世界整合上占据先机与优势。而它的对手(比如 Supabase 收购的 OrioleDB ,pg_duckdb, pg_mooncake )会受到一些牵制,隐隐有一种 “挟天子以令诸侯” 的感觉。

举个例子,Neon 创始人投资了 pg_mooncake ,而 Snowflake 的老对手 Databricks 收购了 Neon,既然死对头已经有了 PG OLAP 分析的布局,那么这一收购还能起到牵制竞争对手的效果。

当然,这条路最多只能说的上是 “牵制”,而堵不死。比如 pg_mooncake 最近就在整个用 Rust 重写,简单使用 TAM 而非锁死在上面。只要思想不滑坡,办法总比困难多。

pg_mooncake.webp

另一方面,OpenAI 传言要收购的 Supabase,它准备使用 OrioleDB 内核,也依赖几个表访问方法的补丁,一直卡着没进入 PG 18 内核,那么这一收购还能牵制住其他想走这条路的公司,可谓一石二鸟。

人才是最关键的因素
#

Databricks,Snowflake,以及(OpenAI) 毫无疑问的拉起了数据库市场中的新一轮抢购战斗。

背后的逻辑很清楚:数据库在 AI 时代依然是坚挺的核心部门,而 PostgreSQL 正在 “统一与征服” 整个数据库世界,那么及时培养收购自己在这个领域的代理人就非常重要了。那些在 PostgreSQL 领域独占鳌头,令人赞叹的优秀公司,如今只剩下极少数,这是一场“抢椅子”游戏,谁能抓住这些公司里的核心人才,将其收入囊中,谁就能抢先在未来占据更大的生态位。

在这一点上,老冯还是比较得意的,因为所有这些 PostgreSQL 公司里面,只有老冯是 “一人公司”。老冯很清楚这个领域有多热闹,就连我这个 “个体户” 都有一个亿的估值(by 陆奇) —— 而且已经有不只一家云厂商开价两千万尝试收购了,不过他们都很鸡贼的想用更便宜的价格直接挖走锁死我个人。反正老冯已经稳定盈利了,着急的也不是我。

背后的逻辑是,一个在野的顶级人才能毁坏达成行业垄断联盟的尝试 —— 以现在开源 Pigsty 使用的部署规模来看,给 RDS 每年造成过亿损失算是非常保守估计了 —— 而且还在不断增长,毕竟价格战谁打的过用爱发电的零元购呢?

何况现在这股 “开源癌” 已经从中国溢出来卷全球了(40+% 用户来自海外)。老实说 —— **这种改变世界的掀桌子乐趣是赚多少钱都比不了的。**老冯也努努力,看看能不能把 Pigsty 做成数据库领域的 DeepSeek,哈哈。

广告时间
#

老规矩,不打广告,写啥文章?😁

开源免费 PostgreSQL 发行版:认准 Pigsty

https://pigsty.io

pigsty.webp

pigsty2.webp

相关文章

数据库火星撞地球:当PG爱上DuckDB
·4140 字·9 分钟
PostgreSQL DuckDB 数据库
老冯很看好 “ DuckDB + PostgreSQL深度融合” 这路径。 我甚至认为,它可能会引爆数据库世界下一场“火星撞地球”式的变革。
七周七数据库(2025年)
·4555 字·10 分钟
数据库 PostgreSQL
PostgreSQL是无聊数据库之王?2025年哪些是有前途能打的数据库?
MySQL安魂九霄,PostgreSQL驶向云外
·7541 字·16 分钟
数据库 MySQL PostgreSQL
MySQL 9 新发布,这个所谓“创新版”成为一个酸楚的笑话 —— 曾经“最流行”的数据库 MySQL 正在死去。MySQL is dead,Long live PostgreSQL!
OpenAI:将PostgreSQL伸缩至新阶段
·4837 字·10 分钟
PostgreSQL OpenAI
在 PGConf.Dev 2025 全球 PG 开发者大会上, 来自 OpenAI 的 Bohan Zhang 分享了 OpenAI 在 PostgreSQL 上的最佳实践, 让我们得以一窥最牛独角兽内部的数据库使用情况。
Postgres Extension Day,咱们不见不散
·4015 字·9 分钟
PostgreSQL 扩展
一年一度的 PostgreSQL 开发者大会即将在五月于蒙特利尔举办。同上次第一届 PG Con.Dev 一样,这次也有一天的额外的专场活动 —— Postgres Extensions Day
OrioleDB 来了!4x性能,消除顽疾,存算分离
·2562 字·6 分钟
PostgreSQL
Supabase 收购的一个 PG 内核分支,号称解决了 PG XID 回卷的问题,没有表膨胀问题,性能提升4倍,还支持云原生存储,现已加入 Pigsty 全家桶。