Ontology 就是数据库建模。“本体论”这个词唯一的作用,就是让不懂数据库的人觉得这是个新东西,然后心甘情愿地为旧东西付出一千倍的价格。
《设计数据密集型应用》(DDIA)第二版终于出了。原作者 Martin Kleppmann 的播客访谈聊到了这本书,翻译了一下。
一个上午用 codex 翻译完 DDIAv2,相比八年前三个月手工精翻,AI 的能力,在同一本书上形成了鲜明的对照。
我们还要招应届大学生吗?在AI和老司机的双重夹击下,新程序员的出路在哪里?—— 用对工具、主动出击、找对师傅。
图灵奖得主 + CMU 教授:2025 数据库圈最犀利的一场对话。关于数据库,LLM,Agent,AI 落地的实际效果,程序员的职业生涯……
图灵奖得主 + CMU 教授:2025 数据库圈最犀利的一场对话。关于数据库,LLM,Agent,AI 落地的实际效果,程序员的职业生涯……
AI Agent 的瓶颈不在数据库内核,而在上层整合。肌肉记忆(库内计算)、联想记忆(向量+图谱融合)、试错魄力(Git for Data)将成为关键,不过这些能力不需要新引擎。
互联网的MySQL就像中国的白酒:明明很难喝,却在文化规训下成了琼浆玉液,本质都是一种服从测试。
上下文窗口经济学,多元持久化的问题,以及零胶水架构的胜利,让 PG 成为 AI 时代的数据库之王。
曾经的互联网名著DDIA——设计数据密集型应用第二版已经发布到第十章了。老冯用Claude Code翻译成中文,并用Hugo/Hextra重构成易读的网页版。第二版新增了向量数据库HNSW索引等内容,温故知新。
数据库领域充满着太多胡言乱语与不实营销,数据库老司机带您拨云见日,穿透迷糊,直击行业核心与本质。
懂车帝搞的智驾评测视频让一众国产自动驾驶现了原形,封闭高速真实测试结果全军覆没,只有特斯拉能打。什么时候国产数据库和云计算也能有个"封闭高速"给大家上来溜一溜,拆穿这股满嘴跑火车的行业歪风?
Google推出了一个针对数据库的MCP工具箱GenAI Toolbox,通过封装参数模板SQL的方式,显著提高了数据库MCP的实用性与安全性。不同于以前那种直接把整个数据库对Agent开放的粗暴做法,这可能是第一个生产可用的方案。
OLTP与OLAP谁先被AI革命?一体化还是专业化,如何选型?AI时代的DBA该何去何从?来自 HOW 2025 大会圆桌讨论的观点整理:OLAP岗位正被NL2SQL替代,而DBA因语料稀缺暂时安全。
AI时代的数据库格局已经尘埃落定。Databricks收购Neon,Snowflake收购CrunchyData,OpenAI传闻收购Supabase——资本市场对PostgreSQL标的密集出手,PG已成为AI时代的默认数据库。
数据世界正在浮出水面的三大新标准:Postgres、Open Telemetry,以及Iceberg。Postgres已是事实标准,OTel和Iceberg尚在成长,但它们具备当年让Postgres走红的同样配方——关键在于开源的姿势本身。
如果2012年DuckDB问世,也许那场数据分析向分布式架构的大迁移根本就不会发生。在2012年的MacBook上运行TPC-H评测显示,数据分析确实在分布式架构上走了十年弯路。数据其实没那么大。
因为Etcd而翻车的公司并非少数。Etcd有一个坑爹的默认设计:写满2GB数据就挂了。如果你在自己折腾Kubernetes或使用Patroni做PostgreSQL高可用,大概率会在这上面翻车。
未来的软件形态是 Agent + 数据库,没有前后端中间商,Agent直接CRUD。微软CEO纳德拉预言SaaS已死,软件从数据库开始。数据库技能相当保值,PostgreSQL将成为AI Agent时代的核心数据库。
在2025年的当下,MySQL无论是在功能特性集、质量正确性、性能表现还是生态与社区上都被PostgreSQL拉开了差距,而且这个差距还在进一步扩大中。本文从功能、性能、质量、生态来全方位对比两者。
老冯很看好"DuckDB + PostgreSQL深度融合"这条路径,它可能会引爆数据库世界下一场"火星撞地球"式的变革。相比折腾分布式DuckDB,这才是更有前景的方向。
PG社区开始骑在Oracle头上输出了。Cybertec专家对比Oracle和PostgreSQL事务系统的特性,帮助用户理解两者差异,为从Oracle迁移到PostgreSQL提供关键参考,避免性能和数据完整性问题。
数据库是业务架构的核心,这是不言自明的共识。但如果更进一步,将数据库作为业务架构本身,将业务逻辑、Web Server甚至整个前后端都放入数据库中,又会擦出怎样的火花?
虽然有趣,但是很鸡贼的题目,用 SQL 计算扑克24点。PostgreSQL 的正解。
PostgreSQL是无聊数据库之王?2025年值得深入学习的七个数据库:PostgreSQL、SQLite、DuckDB、ClickHouse、FoundationDB、TigerBeetle、CockroachDB,每个都值得花一周时间研究。
Supabase 非常棒,拥有你自己的 Supabase 那就是棒上加棒!本文介绍了如何在本地/云端物理机/裸金属/虚拟机上自建企业级 Supabase。
本文是一篇关于硬件发展如何影响数据库设计的综述,介绍了网络、存储、计算三个领域的关键硬件进展。充分利用好新硬件而非折腾分布式,才是数据库内核发展的正路。
Percona创始人Peter Zaitsev讨论MySQL是否还能跟上PostgreSQL的脚步。作为MySQL生态的主要扛旗者,Percona的看法在相当程度上代表了MySQL社区的想法,这篇文章值得每个关注数据库发展的人阅读。
MongoDB在诚信上劣迹斑斑,在产品和技术上乏善可陈,在正确性、性能、功能上被PostgreSQL吊打,开发者口碑崩塌,热度下滑,股价腰斩,亏损扩大。碰瓷引战PG,好营销也救不了它。
MongoDB 3.2的分析子系统竟然是一个嵌入式的PostgreSQL数据库?由MongoDB的合作伙伴发出的血泪控诉与吹哨故事,揭露了MongoDB对待生态伙伴的态度和一些黑历史。
MySQL 9.0终于发布,距离上一次大版本更新已经过去八年。然而这个空洞无物的所谓"创新版本"犹如一个恶劣的玩笑,宣告着MySQL正在死去。Percona CEO也表示:有了PostgreSQL,谁还需要MySQL呢?
Percona创始人Peter Zaitsev在官方博客上公开表达了对MySQL及其知识产权属主Oracle的失望,以及对版本越高性能越差的不满。作为MySQL生态的主要扛旗者,Percona的公开表态是一个值得关注的信号。
Peter Zaitsev是MySQL生态重要公司Percona的创始人,他撰文痛批Oracle的作为与不作为杀死了MySQL。约15年前Oracle收购了Sun从而拥有了MySQL,当时关于Oracle何时会"扼杀MySQL"的讨论此起彼伏,如今一语成谶。
MySQL版本越高性能反而越差?Percona监控发现从5.7迁移到8.x的步伐明显缓慢。在PostgreSQL高歌猛进吞噬数据库世界的同时,MySQL的性能和功能被甩开越来越远。云厂商白嫖是主要原因之一。
国产数据库到底能不能打?这是个得罪人的问题,不妨用数据说话。本文通过流行度等指标分析数据库生态格局,帮助读者建立更为准确的比例感认知,了解国产数据库在全球市场中的真实位置。
PolarDB数据库每节点许可证只卖130块?国内IT已经卷到这个阶段了吗?今天来聊聊商业数据库、开源数据库、云数据库、国产数据库的公允价格到底是多少。
MySQL的事务ACID存在缺陷,且与文档承诺不符。JEPSEN测试揭示MySQL的可重复读隔离级别既不原子也不单调,连基本的单调原子视图都不满足。这可能导致严重的正确性问题,使用时请务必谨慎。
数据库是否应该放入Kubernetes里,到今天仍然是一个充满争议的话题。K8S在无状态应用管理上非常趁手,但处理有状态服务特别是数据库时有本质局限性。本文深入探讨为什么将数据库放入K8S不是明智选择。
向量存储检索是个真需求,然而专用向量数据库已经凉了。小微需求OpenAI亲自下场解决了,标准需求被加装向量扩展的现有成熟数据库抢占。想靠讲AI故事做成一个产业已经是不可能了。
很多"国产数据库"就是烂泥扶不上墙的残次品,信创约等于IT预制菜进校园。用户捏着鼻子迁移,开发者假装在卖力。基础软件行业其实没人卡脖子,真卡脖子的都是所谓"自己人"。
当我们说自主可控时,到底在说什么?运维自主可控与研发自主可控,国家/用户真正需要的自主可控是前者,而不是华而不实的"自研"。国家的需求很简单:打仗吃制裁后,现有系统还能不能继续跑起来。
降本增效的主旋律触发了所有技术的价值重估,当然也包括数据库。本系列将评述数据库领域热点技术,并对其在当下的利弊权衡发出灵魂拷问:云数据库、分布式数据库、微服务、K8S容器化等技术,究竟是真需求还是伪需求?
与马斯洛需求金字塔类似,用户对数据库的需求也有递进的层次:功能正确性、安全备份、高可用监控、性能成本、可观测性、易用性控制、标准化产品化、最终达到超越与自我实现。
随着硬件技术进步,单机数据库的容量和性能已达到前所未有的高度。分布式TP数据库在这种变革面前显得极为无力,和"数据中台"一样穿着皇帝的新衣,处于自欺欺人的状态里。
生产环境的数据库是否应当放入容器中,仍然是一个充满争议的问题。站在开发者角度我喜欢Docker,但站在DBA立场上,我认为就目前而言,将生产环境数据库放入Docker/K8S中仍然是一个馊主意。
四年一遇的闰年2月29日,总有土鳖软件出现大翻车。对时间的正确理解,对正确处理工作生活中的时间问题很有帮助。本文聊一聊闰年、闰秒、时间与时区的原理,以及在数据库与编程语言中的注意事项。
并发程序很难写对,更难写好。很多程序员只是把问题丢给数据库,但即使最强大的ACID数据库也会使用弱隔离级别。本文阐述SQL92标准定义的隔离级别及其缺陷,以及现代模型中的隔离级别定义。
区块链的技术本质、提供的功能及演化方向就是分布式数据库。确切地讲,是拜占庭容错(抗恶意节点攻击)的分布式(无领导者复制)数据库。智能合约本质上就是这个分布式数据库上的存储过程。
一致性这个词重载得很厉害,在不同语境中代表着不同的东西。ACID里的C指事务一致性,CAP里的C指线性一致性,此外还有"一致性哈希"、“最终一致性"等不同涵义。本文梳理这些概念的区别。
只会写代码的是码农,学好数据库基本能混口饭吃。然而对优秀的工程师来说,只会用数据库是远远不够的。绝大多数应用都是数据密集型应用,数据库提供了对应用通用存储需求的高级抽象。