AI估值泡沫隐现，流式学习与具身智能迎来新突破

2026-05-10

✍️ 主编按语

编者按

今日技术圈呈现出一种奇妙的张力：一边是资本市场对 AI Agent 估值逻辑的深层质疑，另一边则是学术界在强化学习、数学难题及具身智能上的硬核突破。从商业模式的经济本质回溯到底层算法的步长重构，再到机器人学习的历史复盘，我们正见证着技术从狂热回归理性的关键时刻。

行业洞察：被错配的 SaaS 估值神话

AI Agent 真正的对手不是 Salesforce，是 Accenture

这是一篇足以让许多 AI 创业者背脊发凉的深度檄文。文章尖锐地指出，像 Sierra 这样的明星 AI Agent 公司，虽然享受着 100 倍 ARR 的 SaaS 级估值，但其经济本质——按工作量计费、高算力边际成本、深度定制集成——却更像是埃森哲等传统咨询公司。资本之所以愿意下注，是赌“软件吃服务”能让毛利从 60% 攀升至 80%，但这仍是一个未经验证的假设。未来 12 个月，如果这批公司无法证明其规模化的毛利曲线，估值修正将不可避免。对于开发者和从业者而言，这提醒我们：在 AI 落地时，不要被“软件”的外衣迷惑，要清晰地算清每一笔推理成本的经济账。

前沿算法：用 1967 年的公式驯服流式学习

图灵奖得主Sutton新作：用一个1967年的公式，解决流式强化学习一大缺陷

强化学习之父 Richard Sutton 团队的新研究，以一种极其优雅的方式解决了“流式强化学习”的顽疾。问题的核心在于：在单样本、无回放的流式环境中，传统的固定步长更新会导致严重的“过冲与欠训”。团队借鉴了 1967 年自适应滤波领域的“归一化最小均方差”思想，提出了“意图更新”——不再是规定参数移动多少，而是直接规定函数输出改变多少。这不仅大幅降低了计算量，更在不依赖海量 GPU 集群的情况下，性能比肩主流算法。这一突破的意义在于，它让 AI 离人类“边做边学”的实时适应模式更近了一步，对于边缘计算和机器人控制等领域具有极高的实用价值。

科学探索：低成本算力挑战数学极限

浙大校友用AI突破32年拉姆齐数下界

纯数学领域的高墙正被 AI 一点点推倒。浙大校友王宜平仅凭一台 CPU 服务器和开源模型，就打破了困扰数学界 32 年的拉姆齐数 R(3,17) 下界纪录，将数值从 92 提升至 93，超越了同期 DeepMind 的表现。这一成就并非依赖暴力算力，而是胜在策略的创新：通过逆向思维和复合删除修复策略，构建了一套自我迭代的 AI 框架。这证明了在科学探索中，巧妙的算法架构往往比单纯的算力堆砌更有效。对于 AI 研究者来说，这是一个鼓舞人心的信号：AI for Science 的门槛正在降低，创新的力量更多地来自于对问题本质的深刻理解。

具身智能：谷歌老兵复盘机器人的进化之路

具身智能来时路：谷歌RT1、2，SayCan作者Ted Xiao复盘机器人学习三大时代

如果说前几篇文章关注的是点状突破，那么这篇访谈则勾勒出了具身智能进化的全景图。Google DeepMind 前技术负责人 Ted Xiao 回顾了过去十年的三个时代：从最初用强化学习证明“端到端能行”的存在性时代，到引入 SayCan 和 RT-2 借助大模型东风的基础模型时代，再到如今疯狂 Scaling 的数据爆发时代。最精彩的洞见在于他对“Code Yellowish”阶段的描述：当技术路径受阻时，团队敢于停发论文，花一年半时间专注于攒数据和重写底层设施。这种“慢下来是为了更快”的战略定力，最终促成了模仿学习的爆发。如今，机器人领域正面临从 Locomotion（运动控制）到 Manipulation（操控）与推理融合的挑战，机器人的“ChatGPT 时刻”或许不再遥远，但拼图仍需时间打磨。

结语

从估值逻辑的祛魅到底层算法的革新，再到数学与物理世界的征服，今日的技术资讯揭示了科技发展的两面性：在商业层面，我们需要警惕泡沫回归常识；在技术层面，古老的智慧与新的范式正在碰撞出惊人的火花。

🔥 热门文章 (15 篇)

AI/ML机器之心9.0

图灵奖得主Sutton新作：用一个1967年的公式，解决流式强化学习一大缺陷

图灵奖得主Richard Sutton团队提出“意图更新”算法，通过改变步长定义单位，解决了深度强化学习在流式环境下的训练崩溃问题。

2026-05-10 06:03

AI/ML机器之心9.0

具身智能来时路：谷歌RT1、2，SayCan作者Ted Xiao复盘机器人学习三大时代

本文是Google DeepMind前Staff Research Scientist Ted Xiao对具身智能发展史的深度复盘，详细解析了从存在性证明、基础模型到Scaling时代的三大阶段关键决策。

2026-05-10 06:03

AI/ML硅谷科技评论9.0

AI Agent 真正的对手不是 Salesforce，是 Accenture｜SVTR Signal #015

文章深入分析了当前AI Agent公司（如Sierra）获得高估值背后的逻辑悖论，指出其经济结构实质上更接近咨询服务业而非传统SaaS。文章认为，未来这些公司的估值将取决于能否通过技术手段将毛利提升至软件水平，否则面临大幅估值回调。

2026-05-10 02:31

AI/ML量子位9.0

浙大校友用AI突破32年拉姆齐数下界

浙大校友利用AI技术成功将32年未解的拉姆齐数R(3,17)下界从92提升至93，实现了数学领域的重大突破。

2026-05-10 04:01

AI/MLAI前线8.0

微软警告称，AI 正在掏空初级开发者的培养渠道

微软高管发文警示，AI 编码工具虽然提升资深工程师效率，但因初级开发者缺乏判断力验证 AI 产出，导致其就业率下降及行业人才梯队崩塌。

2026-05-10 05:31

后端架构InfoQ 中文8.0

布隆过滤器：理论、工程权衡与 Go 语言实现

文章详细介绍了如何通过Go语言实现布隆过滤器来解决推荐系统中的高开销历史查询问题，涵盖了理论原理、工程实现及参数调优的最佳实践。

2026-05-10 02:15

云计算InfoQ 中文8.0

Agent 时代需要怎样的分布式基础设施

文章分析了AI Agent时代的非确定性特征给现有云原生基础设施带来的高动态、不安全及长会话等挑战，并探讨了构建类似单机OS的分布式系统（如openYuanrong）以支持Agent大规模落地的必要性。

2026-05-10 02:15

DevOpsdbaplus社群8.0

一条命令让CDN视频带宽成本降低90%！！！

文章通过分析浏览器MP4播放产生的异常大量HTTP 206 Range请求，揭示了因视频文件索引信息位置不当及音数据交错不良导致的带宽激增问题，并提供使用FFmpeg命令优化文件结构的解决方案。

2026-05-10 00:05

其他笔记侠8.0

三星“撤出”中国，什么信号？

三星退出中国家电市场并非溃败，而是战略重心向半导体等高利润上游产业链转移的结果，文章分析了中企如何通过本土化和生态优势赢得市场。

2026-05-10 14:54

AI/ML硅星人Pro8.0

本周AI项目推荐：Slock，Float，Buda…当Agent成为社会活动主体

文章分析了AI Agent从工具转变为社会活动主体的趋势，推荐并解析了Slock、FloatIM、Buda等6个项目，分别探讨了Agent在对话关系、组织管理和经济关系三个层面的应用与挑战。

2026-05-10 02:31

AI/ML新智元8.0

大模型自信且短视！Next-ToBE破除Next Token预测诅咒 | ICLR'26

文章介绍了ICLR 2026的一项工作Next-ToBE，旨在通过调整训练目标，让模型在预测时兼顾未来token分布，从而缓解传统Next-Token Prediction的短视问题，提升复杂推理能力。

2026-05-10 04:49

产品设计极客公园8.0

华为 Pura X Max 卖爆了，但「阔折叠」还只赢了一半

文章分析了华为 Pura X Max 作为首款「阔折叠」手机的热销现象，指出尽管产品力获用户认可，但该形态要成为市场主流仍需等待同行跟进及苹果等巨头的抉择。

2026-05-10 05:31

AI/MLDatawhale8.0

刚刚，Claude Code 团队这篇文章爆了！

文章探讨了Claude Code团队使用HTML替代Markdown作为AI输出格式的实践，旨在解决AI生成内容过多导致人类阅读困难的问题。

2026-05-10 14:01

工具效率AINLP8.0

别再用 Markdown 了，HTML 才是 AI 时代真正的输出格式

Anthropic 工程师阐述了为何在 AI 时代应从 Markdown 转向 HTML 作为输出格式，强调了 HTML 在信息密度、视觉表现力及交互性上的显著优势。

2026-05-10 11:19

AI/ML深思圈8.0

个人生产力暴增10倍，公司价值却没变：AI时代最昂贵的教训

文章对比了个人生产力提升与组织价值增长之间的脱节，引用电力革命的历史教训，阐述了Individual AI与Institutional AI的根本区别，强调只有重新设计组织流程和协作模式，AI才能真正创造商业价值。

2026-05-10 04:29

⚡ 快速浏览

创业邦6.0

AI估值泡沫隐现，流式学习与具身智能迎来新突破

✍️ 主编按语

编者按

行业洞察：被错配的 SaaS 估值神话

前沿算法：用 1967 年的公式驯服流式学习

科学探索：低成本算力挑战数学极限

具身智能：谷歌老兵复盘机器人的进化之路

结语

🔥 热门文章 (15 篇)

图灵奖得主Sutton新作：用一个1967年的公式，解决流式强化学习一大缺陷

具身智能来时路：谷歌RT1、2，SayCan作者Ted Xiao复盘机器人学习三大时代

AI Agent 真正的对手不是 Salesforce，是 Accenture｜SVTR Signal #015

浙大校友用AI突破32年拉姆齐数下界

微软警告称，AI 正在掏空初级开发者的培养渠道

布隆过滤器：理论、工程权衡与 Go 语言实现

Agent 时代需要怎样的分布式基础设施

一条命令让CDN视频带宽成本降低90%！！！

三星“撤出”中国，什么信号？

本周AI项目推荐：Slock，Float，Buda…当Agent成为社会活动主体

大模型自信且短视！Next-ToBE破除Next Token预测诅咒 | ICLR'26

华为 Pura X Max 卖爆了，但「阔折叠」还只赢了一半

刚刚，Claude Code 团队这篇文章爆了！

别再用 Markdown 了，HTML 才是 AI 时代真正的输出格式

个人生产力暴增10倍，公司价值却没变：AI时代最昂贵的教训

⚡ 快速浏览

人均610万！海力士天价年终奖，炸出AI时代最痛的真相

突发！霍尔木兹海峡，传来大消息

我们最近买的 3 个「新玩意」

英伟达黄仁勋痛批Anthropic阿莫迪；比亚迪4月出口占比达41.9%，海外单月销量13.5万辆创历史新高丨Going Global

月之暗面完成20亿美元D轮融资；天星医疗登陆港交所，最新市值118.44亿港元丨全球投融资周报05.02-05.08

Altman 或官宣 OpenAI 硬件；李想谈 L9 4 年才换代：汽车非手机，AI 帮助有限；多家车企否认「被约谈」 | 极客早知道

字节跳动据悉将AI基础设施支出增加25%；Figure发布最新人形机器人演示视频，市场反应冷淡丨智能制造日报

腾讯研究院AI每周关键词Top50

大反转！网传“新能源车企因锁电问题被约谈、立案”为不实信息；Deepseek和阿里谈崩了？市场人士回应；微信输入法新增隔空传送丨邦早报

Claude 8.4亿狂奔34%、百度DuMate飙升114%、智谱Zai登顶国内增速榜！AI产品榜·网站榜 2026.04

梁文锋出资200亿元，DeepSeek阿里谈崩？宇树机器人韩国佛门受戒，法号迦悲；员工人均奖金达610万，被婚恋市场追捧？官方回应｜AI周报

百度发布文心5.1，预训练成本仅为业界6%；Anthropic据悉同Akamai签署18亿美元计算协议丨AIGC日报