奔跑的高达

SaaS 估值崩盘,OpenAI 迎接性能之神

2026-02-08

✍️ 主编按语

今天的技术圈冰火两重天:一级市场正在疯狂重塑 AI 时代的价值锚点,SaaS 模式遭遇“降维打击”,硬科技与算力基础设施迎来狂欢;而在微观技术层面,从视觉感知的原理级修正到底层算子的极致优化,工程师们正在为下一代智能系统夯实每一块地基。这不仅是一场资本的迁徙,更是一次技术范式的彻底重构。

行业剧变:SaaS 的葬礼与硬科技的崛起

SaaS 的葬礼与硬科技的狂欢 | SVTR Signal #003

这是一份令人战栗的 2026 年开年体检报告。文章核心观点极为锋利:当 AI Agent 能够独立完成工作流时,过去二十年赖以生存的“按人头收费” SaaS 模式已成行尸走肉。这不是周期性调整,而是估值逻辑的崩塌。资本正在疯狂逃离“比特世界”,涌向“原子世界”——无论是 Lawhive 这种直接卖结果的 Service-as-Software,还是 Waymo 这种掌握物理主权的自动驾驶,抑或是 Cerebras 这种试图打破 Nvidia 垄断的算力军火商,都在证明:只有拥有物理护城河或定价权的公司,才能在新的冬天存活。

教科书《性能之巅》作者入职 OpenAI!迷弟总裁亲自欢迎

正当旧世界崩塌之时,OpenAI 招来了现代系统性能领域的“定海神针” Brendan Gregg。这位发明了火焰图、写了《性能之巅》的传奇人物,从 Intel 离职加入 OpenAI,信号意义极强。这意味着 AI 基础设施的竞争已从“堆算力”进入“抠性能”的深水区。面对数万张 GPU 组成的超级集群和海量的并发请求,旧时代的通用计算优化工具已失效。Brendan 的加入,预示着 OpenAI 正在构建一套专门针对大模型的工程方法体系,试图在昂贵的硬件缝隙中通过极致的软件优化榨出每一分算力价值。

深度技术:视觉原理与算子重构

AI 看图一本正经胡说八道?「一拉一推」让模型看得全又准|微软 x 清华

如果你觉得视觉模型经常“一本正经胡说八道”,问题可能不在推理,而在第一眼就看错了。微软亚研院与清华提出的 BiPS(双向感知塑形),试图解决 VLM“视线错位”的根本顽疾。不同于以往在推理阶段用各种外挂工具提示模型看哪里,BiPS 将这种能力“内化”到训练阶段。通过“拉”模型看全证据链、“推”模型聚焦关键细节的机制,让模型学会“带着问题看图”。仅用 13K 样本就在 8 个基准上实现显著提升,说明这种可迁移的感知能力才是通往通用视觉智能的硬道理,而非简单的参数堆砌。

从 FlashAttention 到 Streaming Reduction:如何把“全局算子”改写成可分块计算

这是一篇极具工程美学的深度好文。作者从 FlashAttention 的 Online Softmax 出发,抽丝剥茧地提炼出了高性能计算的“上帝模式”——Streaming Reduction。只要算子具备“可结合的累积结构”与“平移/缩放不变性”,就能通过维护 O(1) 的状态和动态补偿,将全局依赖改写为流式分块计算。文章不仅打通了 Softmax、LayerNorm、Adam 乃至分布式 AllReduce 的底层逻辑,更提供了一套系统化挖掘算子性能极限的方法论。对于想要深入理解 AI 计算底层的开发者而言,这种“代数结构”层面的洞察比单纯的代码实现更有价值。

编者按

从商业模式的重构到底层算子的重写,今天的文章串联起了一个完整的逻辑链条:资本在追逐物理世界的确定性,而工程师在数字世界的底层构建确定性的性能。SaaS 的葬礼宣告了“套利时代”的结束,Brendan Gregg 的入职和 BiPS、Streaming Reduction 的出现,则预示着“深耕时代”的开启。在这个新时代,无论是做系统还是做应用,唯有深入到不可替代的物理层面或数学原理层面,才能建立起真正的护城河。

🔥 热门文章 (19 篇)

AI/ML硅谷科技评论9.0

SaaS 的葬礼与硬科技的狂欢 | SVTR Signal #003

文章深入分析了2026年初AI Agent对传统SaaS商业模式的毁灭性打击,以及资本向Service-as-Software、自动驾驶和能源算力等硬科技领域的重大转向。

AI/ML卡尔的AI沃茨8.0

实测可灵3.0,普通人的导演梦成真了

文章深度评测了AI视频生成工具可灵3.0及3.0 Omni,重点展示了其自动分镜生成、多角色多语言对话、4K高画质及声音复刻等新功能,指出AI视频已进入多镜头叙事的新阶段。

AI/ML极客公园8.0

Seedance 2.0:AI 视频第一阶段的比赛,结束了|AI 上新

文章深度评测了字节跳动推出的 Seedance 2.0 视频生成模型,通过实测展示了其在自动运镜、多模态参考、音画同步及多镜头叙事上的突破,并分析了该技术对视频制作行业成本结构和创作流程的重大影响。

AI/ML腾讯科技8.0

懂了很多道理,AI 依然要发疯|Hao好聊论文

文章解读了Anthropic论文《The Hot Mess of AI》,指出自回归模型在长程任务中存在不可根除的“方差”问题,导致模型越强反而越容易在复杂推理中随机出错。

数据库dbaplus社群8.0

国产数据库AWR,还差多远?

文章以Oracle AWR为标杆,深入剖析了其在数据采集、诊断分析及架构设计上的核心优势,并对比国产数据库(如Kingbase)在报告完整性、指标丰富度及交互性等方面的差距,提出了具体的改进方向。

AI/ML笔记侠8.0

奥特曼最新座谈:未来最值钱的,是注意力!

OpenAI CEO Sam Altman 在座谈中深入探讨了AI对软件工程、创业、教育及科研的变革性影响,指出人类注意力和创意将是未来的稀缺资源,并强调了高性能通用模型与安全平衡的重要性。

AI/ML有机大橘子8.0

Agent 时代,最稀缺的是欲望

文章探讨了Agent时代对劳动、工具和公司形态的深层影响,认为未来软件将转向面向Agent的2A模式,而人类的价值将从执行劳动转向提供欲望和方向。

快速浏览

吴晓波频道6.0

深圳们的“软法”

文章探讨了城市治理中的“软法”概念及其应用,对比了“软法”与传统“硬法”的区别,并分析了助推理论、倡导性工具、宽容手段及激励机制在解决公共问题中的实际案例。

花叔6.0

DeepSeek V4出了?外网出现个神秘Pony模型

文章评测了OpenRouter上出现的神秘模型Pony Alpha,作者通过将其接入Claude Code,成功将网页版红白机游戏项目重构为iOS App,以此验证模型的代码规划与逻辑能力。