SaaS 估值崩盘，OpenAI 迎接性能之神

2026-02-08

✍️ 主编按语

今天的技术圈冰火两重天：一级市场正在疯狂重塑 AI 时代的价值锚点，SaaS 模式遭遇“降维打击”，硬科技与算力基础设施迎来狂欢；而在微观技术层面，从视觉感知的原理级修正到底层算子的极致优化，工程师们正在为下一代智能系统夯实每一块地基。这不仅是一场资本的迁徙，更是一次技术范式的彻底重构。

行业剧变：SaaS 的葬礼与硬科技的崛起

SaaS 的葬礼与硬科技的狂欢 | SVTR Signal #003

这是一份令人战栗的 2026 年开年体检报告。文章核心观点极为锋利：当 AI Agent 能够独立完成工作流时，过去二十年赖以生存的“按人头收费” SaaS 模式已成行尸走肉。这不是周期性调整，而是估值逻辑的崩塌。资本正在疯狂逃离“比特世界”，涌向“原子世界”——无论是 Lawhive 这种直接卖结果的 Service-as-Software，还是 Waymo 这种掌握物理主权的自动驾驶，抑或是 Cerebras 这种试图打破 Nvidia 垄断的算力军火商，都在证明：只有拥有物理护城河或定价权的公司，才能在新的冬天存活。

教科书《性能之巅》作者入职 OpenAI！迷弟总裁亲自欢迎

正当旧世界崩塌之时，OpenAI 招来了现代系统性能领域的“定海神针” Brendan Gregg。这位发明了火焰图、写了《性能之巅》的传奇人物，从 Intel 离职加入 OpenAI，信号意义极强。这意味着 AI 基础设施的竞争已从“堆算力”进入“抠性能”的深水区。面对数万张 GPU 组成的超级集群和海量的并发请求，旧时代的通用计算优化工具已失效。Brendan 的加入，预示着 OpenAI 正在构建一套专门针对大模型的工程方法体系，试图在昂贵的硬件缝隙中通过极致的软件优化榨出每一分算力价值。

深度技术：视觉原理与算子重构

AI 看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软 x 清华

如果你觉得视觉模型经常“一本正经胡说八道”，问题可能不在推理，而在第一眼就看错了。微软亚研院与清华提出的 BiPS（双向感知塑形），试图解决 VLM“视线错位”的根本顽疾。不同于以往在推理阶段用各种外挂工具提示模型看哪里，BiPS 将这种能力“内化”到训练阶段。通过“拉”模型看全证据链、“推”模型聚焦关键细节的机制，让模型学会“带着问题看图”。仅用 13K 样本就在 8 个基准上实现显著提升，说明这种可迁移的感知能力才是通往通用视觉智能的硬道理，而非简单的参数堆砌。

从 FlashAttention 到 Streaming Reduction：如何把“全局算子”改写成可分块计算

这是一篇极具工程美学的深度好文。作者从 FlashAttention 的 Online Softmax 出发，抽丝剥茧地提炼出了高性能计算的“上帝模式”——Streaming Reduction。只要算子具备“可结合的累积结构”与“平移/缩放不变性”，就能通过维护 O(1) 的状态和动态补偿，将全局依赖改写为流式分块计算。文章不仅打通了 Softmax、LayerNorm、Adam 乃至分布式 AllReduce 的底层逻辑，更提供了一套系统化挖掘算子性能极限的方法论。对于想要深入理解 AI 计算底层的开发者而言，这种“代数结构”层面的洞察比单纯的代码实现更有价值。

编者按

从商业模式的重构到底层算子的重写，今天的文章串联起了一个完整的逻辑链条：资本在追逐物理世界的确定性，而工程师在数字世界的底层构建确定性的性能。SaaS 的葬礼宣告了“套利时代”的结束，Brendan Gregg 的入职和 BiPS、Streaming Reduction 的出现，则预示着“深耕时代”的开启。在这个新时代，无论是做系统还是做应用，唯有深入到不可替代的物理层面或数学原理层面，才能建立起真正的护城河。

🔥 热门文章 (19 篇)

AI/ML硅谷科技评论9.0

SaaS 的葬礼与硬科技的狂欢 | SVTR Signal #003

文章深入分析了2026年初AI Agent对传统SaaS商业模式的毁灭性打击，以及资本向Service-as-Software、自动驾驶和能源算力等硬科技领域的重大转向。

2026-02-08 03:31

AI/ML量子位9.0

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

微软亚研院与清华提出BiPS双向感知塑形技术，通过在训练阶段内化“带问题看图”的能力，解决了视觉语言模型捕捉错误视觉证据的根本问题，显著提升了跨任务的视觉理解精度。

2026-02-08 06:08

AI/MLAINLP9.0

从 FlashAttention 到 Streaming Reduction：如何把“全局算子”改写成可分块计算

文章从FlashAttention的Online Softmax机制出发，提炼出高性能计算中的通用模式——Streaming Reduction，揭示了Softmax、LayerNorm、Adam等算子通过维护有限状态和代数补偿实现分块计算的底层统一逻辑。

2026-02-08 05:56

DevOps量子位9.0

教科书《性能之巅》作者入职OpenAI！迷弟总裁亲自欢迎

系统性能优化领域顶级专家、《性能之巅》作者Brendan Gregg正式入职OpenAI，将致力于ChatGPT性能团队的工作。

2026-02-08 05:38

AI/ML卡尔的AI沃茨8.0

实测可灵3.0，普通人的导演梦成真了

文章深度评测了AI视频生成工具可灵3.0及3.0 Omni，重点展示了其自动分镜生成、多角色多语言对话、4K高画质及声音复刻等新功能，指出AI视频已进入多镜头叙事的新阶段。

2026-02-08 04:01

AI/ML极客公园8.0

Seedance 2.0：AI 视频第一阶段的比赛，结束了｜AI 上新

文章深度评测了字节跳动推出的 Seedance 2.0 视频生成模型，通过实测展示了其在自动运镜、多模态参考、音画同步及多镜头叙事上的突破，并分析了该技术对视频制作行业成本结构和创作流程的重大影响。

2026-02-08 03:33

AI/ML腾讯科技8.0

懂了很多道理，AI 依然要发疯｜Hao好聊论文

文章解读了Anthropic论文《The Hot Mess of AI》，指出自回归模型在长程任务中存在不可根除的“方差”问题，导致模型越强反而越容易在复杂推理中随机出错。

2026-02-08 05:56

AI/ML新智元8.0

OpenAI强制「处死」GPT-4o！80万老粉全网拯救：它不是代码是爱人

文章报道了OpenAI计划强制退役GPT-4o模型引发的80万用户强烈抗议，揭示了用户对AI伴侣产生的深度情感依赖与AI安全伦理之间的激烈冲突。

2026-02-08 05:24

数据库dbaplus社群8.0

国产数据库AWR，还差多远？

文章以Oracle AWR为标杆，深入剖析了其在数据采集、诊断分析及架构设计上的核心优势，并对比国产数据库（如Kingbase）在报告完整性、指标丰富度及交互性等方面的差距，提出了具体的改进方向。

2026-02-08 00:03

AI/ML笔记侠8.0

奥特曼最新座谈：未来最值钱的，是注意力！

OpenAI CEO Sam Altman 在座谈中深入探讨了AI对软件工程、创业、教育及科研的变革性影响，指出人类注意力和创意将是未来的稀缺资源，并强调了高性能通用模型与安全平衡的重要性。

2026-02-08 13:37

AI/MLDatawhale8.0

学AI别再刷朋友圈！AI大神Karpathy的92个信源公布了

AI大神Andrej Karpathy公开了包含92个顶级科技博客的RSS清单，倡导回归长文深度阅读以对抗算法推荐下的碎片化信息。

2026-02-08 14:23

AI/ML新智元8.0

机器人成精了？Figure 03下厨房，不经意关抽屉那一下，太像人了

文章介绍了Figure 03机器人搭载最新Helix 02系统在厨房场景下的突破性表现，强调了其实现全身级自主控制及像人一样的身体直觉。

2026-02-08 05:24

其他量子位8.0

中国第一批没有论文的工科博士毕业了

文章详细介绍了中国首批以实践成果替代学术论文毕业的工科博士案例，并分析了2025年《学位法》实施背后的教育评价体系改革。

2026-02-08 05:11

AI/ML甲子光年8.0

对话蚂蚁灵波首席科学家沈宇军：2万小时真机数据，用“慢功夫”做具身智能｜甲子光年

文章深入对话蚂蚁灵波首席科学家沈宇军，解读了其团队开源四个具身智能模型的技术路线，强调了在“GPT-1时刻”积累2万小时真机数据和坚持工程务实的重要性。

2026-02-08 05:08

AI/ML魔搭ModelScope社区8.0

美团开源 LongCat-Flash-Lite：实现轻量化 MoE 高效推理

美团开源了68.5B参数的MoE模型LongCat-Flash-Lite，通过N-gram Embedding架构和系统优化实现高效推理，在Agent工具调用和代码生成场景表现优异。

2026-02-08 09:10

AI/ML量子位8.0

11位顶尖数学家发了篇没结果的论文，陶哲轩推荐都关注一下

11位顶尖数学家发布论文提出10道“研究级”数学难题，旨在测试AI的推理与探索能力，并获陶哲轩推荐关注。

2026-02-08 04:54

AI/MLInfoQ 中文8.0

在参与OpenAI、Google、Amazon的50个AI项目后，他们总结出了大多数AI产品失败的原因

文章基于OpenAI、Google等大厂的50个AI项目实战经验，深入剖析了AI产品失败的根本原因，指出设计而非技术构建是关键，并提出了'CC/CD'框架与从低自治逐步过渡的开发路径。

2026-02-08 02:18

AI/ML硅星人Pro8.0

“炒作”之外，OpenClaw和Moltbook 真正的创新是什么？

文章深入分析了 OpenClaw 的无头架构与本地优先策略，以及 MoltBook 在 A2A 网络交互与信任机制上的探索，揭示了未来 AI 智能体演进在工程落地与安全治理上的关键挑战。

2026-02-08 04:02

AI/ML有机大橘子8.0

Agent 时代，最稀缺的是欲望

文章探讨了Agent时代对劳动、工具和公司形态的深层影响，认为未来软件将转向面向Agent的2A模式，而人类的价值将从执行劳动转向提供欲望和方向。

2026-02-08 00:54

⚡ 快速浏览

吴晓波频道6.0

SaaS 估值崩盘，OpenAI 迎接性能之神

✍️ 主编按语

行业剧变：SaaS 的葬礼与硬科技的崛起

深度技术：视觉原理与算子重构

编者按

🔥 热门文章 (19 篇)

SaaS 的葬礼与硬科技的狂欢 | SVTR Signal #003

AI看图一本正经胡说八道？「一拉一推」让模型看得全又准｜微软x清华

从 FlashAttention 到 Streaming Reduction：如何把“全局算子”改写成可分块计算

教科书《性能之巅》作者入职OpenAI！迷弟总裁亲自欢迎

实测可灵3.0，普通人的导演梦成真了

Seedance 2.0：AI 视频第一阶段的比赛，结束了｜AI 上新

懂了很多道理，AI 依然要发疯｜Hao好聊论文

OpenAI强制「处死」GPT-4o！80万老粉全网拯救：它不是代码是爱人

国产数据库AWR，还差多远？

奥特曼最新座谈：未来最值钱的，是注意力！

学AI别再刷朋友圈！AI大神Karpathy的92个信源公布了

机器人成精了？Figure 03下厨房，不经意关抽屉那一下，太像人了

中国第一批没有论文的工科博士毕业了

对话蚂蚁灵波首席科学家沈宇军：2万小时真机数据，用“慢功夫”做具身智能｜甲子光年

美团开源 LongCat-Flash-Lite：实现轻量化 MoE 高效推理

11位顶尖数学家发了篇没结果的论文，陶哲轩推荐都关注一下

在参与OpenAI、Google、Amazon的50个AI项目后，他们总结出了大多数AI产品失败的原因

“炒作”之外，OpenClaw和Moltbook 真正的创新是什么？

Agent 时代，最稀缺的是欲望

⚡ 快速浏览

深圳们的“软法”

抖音为什么每隔一段时间冒出一个草根网红？

单品月销2870万，又一中国制造在欧美卖疯了

“猪茅”牧原股份港股上市！一年卖猪7800万头，市值超2300亿港元；逐际动力完成2亿美元融资丨全球投融资周报01.31-02.06

安踏进军美国市场；OpenAI首款AI硬件曝光丨Going Global

苹果的“折叠屏矩阵”计划：一场「柔性」形态革命

追觅CEO称每天研发投入4000万；泡泡玛特王宁：LABUBU去年全球销量超1亿只；OpenAI首款硬件命名曝光丨邦早报

“千问奶茶”在二手平台6元转售；追觅俞浩：年终奖最高20个月奖金，总量会达到10亿级；京东001号快递员：退休金4000多，存款百万｜AI周报

盘点 8 个本周 yyds 的 GitHub 开源项目。

Z Product｜Product Hunt最佳产品（1.26-2.1），三款华人产品上榜

DeepSeek V4出了？外网出现个神秘Pony模型

不是DeepSeek V4就是Sonnet 4.6？

配置一改就要重启的时代结束了：Dev Proxy 2.1 正式上线