跳过正文
  1. AI/

这几天的新东西可真不少

·3227 字·7 分钟· ·
冯若航
作者
冯若航
Pigsty 创始人, @Vonng
目录

这两天,对搞基础设施的人来说是真热闹。Ubuntu 今天发了两年一度的 LTS,阿里 Qwen 团队昨天丢出一个 27B 稠密模型,吊打自家 397B MoE 前代旗舰。OpenAI 前天上了新一代图像模型 Images 2.0,并且昨天又甩了一个专门做数据脱敏的开源小模型。挑几个有意思的聊聊。

Ubuntu 26.04 LTS 发布
#

今天(4 月 23 日),Canonical 正式发布了 Ubuntu 26.04 LTS,代号 “Resolute Raccoon”(坚毅浣熊)。4 月 23 日是 Ubuntu 历史上最常用的发布日期:Ubuntu 9.04、15.04、20.04 LTS 都是挑的这一天。

作为时隔两年的 LTS 版本,26.04 的支持周期拉得很长:标准支持到 2031 年 4 月,Ubuntu Pro 订阅的 ESM 扩展支持到 2036 年,再往后的 Legacy 附加支持可以续到 2041 年。对企业用户来说,这基本等于“选一个跑十年”的底座系统。

这次有几个亮点我比较关心。

一是 Linux 7.0 内核。7.0 这个版本号看着像里程碑,其实是 Linus 觉得 6.x 的小版本号拖得太长,顺势滚到 7.0,改动本身并不颠覆。但对 Ubuntu 而言,把 24.04 时代的 6.8 一路推到 7.0,硬件和驱动支持覆盖面自然宽了一大截。

二是 AMD ROCm 和 NVIDIA CUDA 都直接进仓了。Canonical 这次和 AMD 深度合作,把 ROCm 打进了官方仓库,以后一句 sudo apt install rocm 就能装好 AMD 显卡的 AI 计算栈。CUDA 也是同样待遇。对需要在两家之间折腾的人来说,总算不用再到处翻驱动包、跟依赖地狱搏斗了。

三是安全侧的全面现代化。TPM 支持的全盘加密、默认启用的后量子密码、Rust 重写的 sudo(sudo-rs)、强制 cgroup v2(Docker 20.10 之前的老容器会让升级直接被拒)——这些改动单看都不惊艳,叠加起来倒是能让 Ubuntu 在服务器合规场景里的地位更稳。

公有云镜像方面,AWS、GCP、Azure 都承诺首发日支持,国内云(阿里云、腾讯云、华为云)按历史惯例会慢几个月。不过本地测试不用等,Docker 镜像已经可以拉了,Vagrant Box 用 cloud-image/ubuntu-26.04 也能直接起。

Pigsty 这边我也已经开始对 26.04 做适配了,先把仓库结构弄好。新系统各种依赖缺失是难免的,PG 扩展一个一个慢慢往里面填吧。

Qwen3.6-27B:27B 稠密模型吊打 397B MoE
#

昨天(4 月 22 日),Qwen 团队把 Qwen3.6 系列的第二个开源模型——Qwen3.6-27B 丢了出来,一个 27B 的稠密模型。

官方的说法是,Qwen3.6-27B 在所有主流 coding benchmark 上超越了上一代开源旗舰 Qwen3.5-397B-A17B(总参 397B、激活 17B 的 MoE)。具体数字也放出来了:SWE-bench Verified 77.2 vs 76.2,SWE-bench Pro 53.5 vs 50.9,Terminal-Bench 2.0 59.3 vs 52.5,SkillsBench 48.2 vs 30.0。后两个的差距相当可观。

这挺夸张的。一个 27B 稠密模型能摸到自家上一代闭源旗舰的门槛,这本身就是个标志性事件:Hugging Face 上的 Qwen3.5-397B-A17B 权重是 807GB,而 Qwen3.6-27B 只有 55.6GB,4-bit 量化后 14GB 出头。一张 RTX 5090 或者 M5 Max 跑起来毫无压力,几十 tokens/秒是基本盘。

这意味着个人助理类的工作负载本地化开始变得实际起来。这种助理不需要最顶尖的能力,但需要够用、够快、够私密,Qwen3.6-27B 刚好踩在这条线上。很欣慰看到 Qwen 还在继续走开源路线。老实说,在开源模型这件事上,阿里云/千问做了大好事,有大功德。老冯已经很久没喷阿里云了。

OpenAI 这两天甩了两个东西
#

ChatGPT Images 2.0
#

先说前天(4 月 21 日)上线的 ChatGPT Images 2.0(API 里叫 gpt-image-2)。好多朋友问在哪里能用,其实不用找,直接在 ChatGPT 对话框里让它画图就行,默认已经切到新模型了。

这几天群里朋友玩得不亦乐乎,整出了各种花活:有人给 pigsty.io 设计了一个淘宝店面,有人用“漫画风格的 Pigsty 暴打 RDS”就生成出了相当精美的设计物料。

对比一年前 Claude Code 给程序员带来的冲击,这波对设计师的震撼一点不差。而且 Images 2.0 在伪造截图和界面上,肉眼真已经辨不出真假了。以前讲“有图有真相”,现在这几个字可以直接扔了。

Privacy Filter:专做 PII 脱敏的小模型
#

昨天,OpenAI 又甩了一个挺有意思的开源模型:Privacy Filter,权重挂在 Hugging Face 上,Apache 2.0 协议。

这不是一个聊天模型,是一个专门用来检测和脱敏 PII(个人可识别信息)的小模型。1.5B 总参、50M 激活的 gpt-oss 架构稀疏 MoE,128K 上下文,笔记本甚至浏览器里直接跑。它不是 autoregressive 的生成模型,而是被改造成了双向 token 分类器:一次 forward pass 给每个 token 打标签,配合 Viterbi 约束解码输出 BIOES 风格的 span 标注,能识别 8 类隐私信息:账户号码、私人地址、邮箱、姓名、电话、URL、日期和密钥。在 PII-Masking-300k 基准上开箱即用 96% F1,修正版数据集上到 97.43%。

有意思的是它的定位。OpenAI 明确说这不是匿名化工具,不是合规认证,不能替代策略审查,就是一个“privacy-by-design”体系里的零件。用处很直接:批量处理企业数据时先过一道本地 PII 过滤,再把脱敏后的内容送给云端大模型。想把 ChatGPT 接入公司内部流程,但又担心敏感数据外流的人,这个模型给了一个可以放在数据管线最前端的轻量化组件。

这个发布其实带出一个我早就注意到的行业趋势:相对“千亿参数竞赛”,今年越来越多厂商开始认真做小而专的专用模型。一个只做一件事、能在笔记本上跑、能在浏览器里跑、Apache 2.0 可商用的 1.5B 模型,对企业 AI 工程的实际价值,有时候比又一个号称吊打 GPT 的 600B 大模型要高得多。

Anthropic 这边:Mythos 越权与 Pro 套餐风波
#

Anthropic 这两天日子不太太平。

一个是 Mythos。Claude Mythos Preview 是前段时间 Anthropic 推出的一个被描述为“太危险不能公开发布”的模型,专做漏洞挖掘。它已经在 OpenBSD 里找到一个 27 年没被发现的漏洞,在 FFmpeg 里找到一个自动化测试工具碰过 500 万次都没抓到的 16 年老 bug,还在 Linux 内核里自主串联了几个漏洞做本地提权。Anthropic 把这个模型限量发给 Amazon、Apple、Cisco、JPMorgan、NVIDIA 等一批大公司,做所谓 Project Glasswing 的防御性合作。

结果这两天 Bloomberg 报出,一个 Discord 小圈子通过 Anthropic 某个第三方供应商的环境,越权拿到了 Mythos 的访问权。Anthropic 已经确认在调查,说目前没有证据表明自家系统被影响。那伙人看起来纯粹是想尝鲜,不是搞破坏,但这件事本身很尴尬:一个“太危险不能放出来”的模型,结果被一个 Discord 的小圈子给摸到了。

另一个是 Pro 套餐的闹剧。4 月 21 日下午,有人发现 Anthropic 把 Claude Code 从 20 美元/月的 Pro 套餐里移除了,文档和定价页都同步更新,Claude Code 变成了 Max(100/200 美元)才能用。消息一出,Reddit 和 Twitter 直接炸锅。几个小时后,Anthropic Growth 负责人 Amol Avasare 出来发推解释,说这只是在 2% 的新注册用户上做的小实验,存量 Pro 和 Max 用户不受影响,然后又把定价页和文档改回去了。

但他话里透露出来的意思更值得琢磨:Max 套餐最早设计出来的时候,Claude Code 还没出现,Cowork 还不存在,能跑好几小时的 agent 也不是日常工作流。一年下来,每个订阅用户的用量上去了不止一点半点,现有套餐结构其实已经扛不住了。老冯之前写文章也说过这个事儿:对重度用户来说,200 美元的订阅可以薅走 1 万块列表价的 API 额度,相当于倒贴 50 倍。

这种结构注定难以持续。所以“龙虾之父”也说得很清楚,这些 coding plan 说白了,就是用算力补贴来换你的代码数据。对老冯来说,这肯定是稳赚的,因为我的代码都是开源的,你都拿去好了。但是对于那些在私有代码和数据上工作的用户来说,需要好好再思考权衡一下了。

某神秘产品内测
#

另一个有趣的 AI 产品,也是昨天晚上刚刚发布并开放了早期内测。老冯试用了一下,体验非常出色。但是早期内测嘛,是什么肯定是不能说的。我的评价是,至少是一个 Manus 级别的东西,上限可以更高。这个就等正式测试的时候再说吧。

最后
#

这两天信息量挺大的,挑主要的聊了聊。Ubuntu 26.04 这种基础系统发布影响最长远,Qwen3.6-27B 和 Privacy Filter 代表了“小而专”的方向,OpenAI Images 2.0 的冲击还在酝酿发酵中;Anthropic 这边 Mythos 和 Pro 套餐则体现了模型能力快速爬升带来的新麻烦:一个是安全边界被不断试探,一个是商业模式和用量现实的矛盾。

嘿,2026 年的基础设施行业还是很有看头的。

相关文章

两个半球:Transformer、Diffusion 与智能的边界

·4761 字·10 分钟
一次关于智能的对话,智能的底层也许既不是语言,也不是视觉,而是符号推理与场态直觉这两种不可化约的计算范式,在有限带宽的边界中保持分化、互相校准。