何恺明一步生成颠覆扩散，清北柔性登顶Nature

2026-02-02

✍️ 主编按语

今天的科技圈格外喧嚣，从算法架构到底层硬件，再到应用落地，每一条赛道都传来了令人振奋的信号。何恺明团队再次以极简主义思路颠覆了图像生成范式，而清北合作的柔性芯片更是登上了 Nature 期刊；与此同时，Agent 的形态正在从“对话框”走向“真实世界”，无论是长链条推理还是物理世界交互，都在迈向通用与落地。这不仅是一场技术的迭代，更是一场关于 AI 未来形态的重新定义。

算法范式革新

何恺明带大二本科生颠覆扩散图像生成：扔掉多步采样和潜空间，一步像素直出

何恺明团队总是能在看似成熟的领域找到“第一性原理”。他们提出的 Pixel Mean Flow (pMF) 砍掉了现代扩散模型的两根支柱——多步采样和潜空间，实现了像素级的一步生成。这不仅仅是速度的提升，更是对“流形假设”的一次精彩实践：让网络直接预测低维流形上的量，远比在高维噪声中“猜”容易得多。这意味着图像生成正在摆脱对复杂 pipeline 的依赖，向着更高效、更直接的未来演进。

基础模型与 Agent 智能

How To Play AI Beta：拾象 2026 AGI 投资思考开源

这是一份价值连城的“情报地图”。拾象团队不仅理清了 Google、OpenAI 和 Anthropic 三足鼎立的竞争格局，更敏锐地指出了下一个范式级机遇——Continual Learning（持续学习）。如果 Pre-training 是利用存量知识，那么 Continual Learning 就是赋予模型“即时学习能力”，这是从“静态百科全书”到“动态超级实习生”的质变。对于开发者和投资者而言，押注那些能突破数据墙、具备实时学习能力的团队，才是抓住了结构性机会。

阶跃星辰 Step 3.5 Flash 上线！更快更强更稳的 Agent 大脑，开源！

在模型能力日益趋同的今天，“快”和“稳”成为了杀手级特性。Step 3.5 Flash 采用稀疏 MoE 架构，通过滑动窗口与全局注意力的混合设计，实现了高达 350 TPS 的推理速度，同时支持 256K 长上下文。对于开发者而言，这意味着在构建 Agent 时，不再需要在“响应速度”和“推理深度”之间做痛苦的权衡。它证明了开源模型完全有能力在 Agent 场景下比肩闭源 SOTA，这无疑是给 Agent 开发者送上的一份厚礼。

多维创新打造强泛化智能体模型，LongCat-Flash-Thinking-2601技术报告发布

为什么很多模型在基准测试中拿满分，一上线就“翻车”？美团 LongCat 团队给出的答案是：缺乏真实世界的“噪声训练”。他们构建了覆盖 20 多个领域、上万个异构环境的训练场，并系统化地注入了工具失效、指令歧义等真实噪声。这种“把模型扔进泥坑里练”的思路，产出了一个极具鲁棒性的 5600 亿参数 MoE 模型。它告诉我们，真正的强泛化，不是在温室里刷榜，而是在风雨中学会如何在不确定中做决策。

具身智能与物理 AI

陈亦伦和李震宇创立的具身公司它石智航，不做 VLA、不仿真，不走主流路线

在 VLA（视觉-语言-动作）架构大行其道的当下，它石智航选择了一条“离经叛道”的路。他们认为具身智能不应是 LLM 的下游分支，而应拥有独立的模型表达，追求对时间、空间、力等物理量的深度理解。更令人印象深刻的是他们的数据采集策略：放弃昂贵的遥操作，改用可穿戴设备低成本采集人类真实操作数据。这种对数据第一性的深刻洞察，或许正是突破具身智能数据墙的关键。

像开发软件一样造世界，Agent2World来了，把世界模型做成可运行的符号环境

AI 如何真正理解物理法则并用于推演？Agent2World 给出了一种工程化的解法。它将世界模型的生成转化为软件工程流程：Researcher 补全知识、Developer 编写环境代码、Testing Team 进行行为级验收。这一框架不仅能生成可执行的符号环境，更能通过自我修正的数据飞轮反哺模型训练。这标志着 AI 从“理解文本”迈向“理解规则”，是通往具身智能的重要基础设施。

硬件与基础设施

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

这是一次里程碑式的突破。清华大学与北京大学合作研发的柔性 AI 芯片登上了 Nature，它不再是一块简单的柔性电路板，而是具备存内计算架构的完整集成电路。这意味着未来的电子设备可以像贴纸一样贴在皮肤上，甚至植入机器人关节中，独立完成复杂推理。这不仅填补了柔性电子在“思考”层面的空白，更为可穿戴设备、生物医疗等领域开启了全新的应用纪元。

淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉：以策略正则化突破DRL在库存管理中的落地瓶颈

学术界的顶尖奖项往往属于理论突破，而淘天团队两次入围 INFORMS 决选，证明了工业界也能产出世界级的研究。他们提出的“策略正则化”方法，巧妙地将库存管理的经典直觉融入深度强化学习，解决了 DRL 在工业落地中“黑箱、难调参”的痛点。这表明，AI 落地的关键不在于模型多大，而在于如何将领域知识优雅地嵌入算法，实现可解释、可信赖的智能决策。

速递｜AI安全初创公司Outtake“全明星”背书，ARR同比增长六倍，B轮融资4000万美元

随着生成式 AI 的普及，数字身份欺诈的门槛被大幅降低。Outtake 的异军突起，正是抓住了这一痛点。它用 AI 解决 AI 带来的安全问题，实现了对仿冒账户、流氓应用的自动化清除。微软 CEO 萨提亚·纳德拉等全明星投资人的加持，不仅是对其技术实力的认可，更揭示了未来的安全逻辑：在 AI 时代，防御体系必须具备同样的智能化和自动化能力，否则只能望尘莫及。

🔥 热门文章 (42 篇)

AI/ML海外独角兽9.0

How To Play AI Beta：拾象 2026 AGI 投资思考开源

拾象团队对AI领域竞争格局进行系统复盘，提出Continual Learning是2026年的关键技术范式，并构建了包含Google、NVIDIA、OpenAI等公司的理想AGI投资篮子。

2026-02-02 01:12

AI/ML阶跃星辰9.0

阶跃星辰 Step 3.5 Flash 上线！更快更强更稳的 Agent 大脑，开源！

阶跃星辰发布了专为Agent设计的开源基座模型Step 3.5 Flash，具备高推理速度（350 TPS）和卓越的数学与长文本处理能力，采用了稀疏MoE及MTP-3等核心技术架构。

2026-02-02 02:08

AI/ML魔搭ModelScope社区9.0

阶跃星辰 Step 3.5 Flash 上线！更快更强更稳的 Agent 大脑，开源！

阶跃星辰发布开源模型 Step 3.5 Flash，采用稀疏 MoE 架构，具备 350 TPS 的极致推理速度和强大的 Agent 智能性能。

2026-02-02 13:04

AI/ML量子位9.0

Nature | 清北合作研发全球首个全柔性存算一体AI芯片

清华大学与北京大学合作研发出全球首个全柔性存算一体AI芯片，该芯片薄如纸片且可卷曲，代表了硬件领域的重大技术突破。

2026-02-02 07:43

AI/ML大淘宝技术9.0

淘天集团自营技术运营算法团队4年2次荣膺 INFORMS“杰出实践奖”决选荣誉：以策略正则化突破DRL在库存管理中的落地瓶颈

淘天集团自营技术团队提出DeepStock算法，通过策略正则化解决了深度强化学习在库存管理中的落地难题，并在INFORMS奖项中获决选荣誉。

2026-02-02 09:05

AI/ML美团技术团队9.0

多维创新打造强泛化智能体模型，LongCat-Flash-Thinking-2601技术报告发布

美团发布5600亿参数MoE智能体模型LongCat-Flash-Thinking-2601，通过环境扩展、多环境强化学习及抗噪训练实现强泛化能力，并推出Zigzag注意力机制支持百万级上下文。

2026-02-02 00:00

AI/ML晚点LatePost9.0

陈亦伦和李震宇创立的具身公司它石智航，不做 VLA、不仿真，不走主流路线

专访它石智航创始人陈亦伦，阐述其反主流的具身智能技术路线，主张自研可穿戴设备采集真实数据、独立于VLA架构开发AWE模型，并计划落地工业制造场景。

2026-02-02 02:03

AI/ML量子位9.0

何恺明带大二本科生颠覆扩散图像生成：扔掉多步采样和潜空间，一步像素直出

何恺明团队提出一项颠覆性图像生成技术，抛弃传统扩散模型的多步采样和潜空间机制，实现一步像素直出。

2026-02-02 07:54

安全Z Potentials9.0

速递｜AI安全初创公司Outtake“全明星”背书，ARR同比增长六倍，B轮融资4000万美元

AI安全初创公司Outtake获得4000万美元B轮融资，凭借微软CEO萨提亚·纳德拉等全明星投资阵容及ARR六倍增长引发关注，该平台利用AI自动化解决数字身份欺诈难题。

2026-02-02 04:59

AI/ML机器之心9.0

像开发软件一样造世界，Agent2World来了，把世界模型做成可运行的符号环境

文章介绍了 Agent2World 框架，它通过模仿软件开发流程的多智能体协作，解决了自动生成可执行符号世界模型的难题，并在多个基准测试中取得 SOTA 性能。

2026-02-02 06:12

AI/ML人人都是产品经理8.0

AI 社交元年：Moltbook 背后的机机交互革命与行业新机遇

本文深入探讨了名为 Moltbook 的 AI 专属社交平台及其技术底座 OpenClaw，展示了 AI 之间自主涌现的社交、宗教和经济行为，并分析了其中的技术风险与“机机交互”带来的新市场机遇。

2026-02-01 23:46

AI/MLCSDN8.0

退隐3年后回归，周末写的AI一夜刷屏、一周拿下10万Star增速超Linux，Clawdbot之父首次长谈：如今几乎不看自己发布的代码

本文是对知名开发者Peter Steinberger的专访，讲述他退隐3年后借助AI工具（如Claude）单枪匹马开发爆火项目OpenClaw的经历，探讨了AI如何改变软件开发模式，包括不再阅读代码、将PR视为“Prompt Request”等前卫观点。

2026-02-02 10:20

AI/ML阿里云开发者8.0

生产级Prompt自动化推理评估A/B实验结果的工程实践

文章介绍了一套生产级Prompt自动化推理系统，用于替代传统人工巡检，解决大规模A/B实验评估的低效与误判问题。

2026-02-02 00:31

AI/ML创业邦8.0

OpenAI再不上市，财务窟窿就要把巨头们拖垮了

文章深度分析了OpenAI面临的严峻财务危机，指出其高昂的算力成本与收入增长之间的巨大缺口，探讨了其IPO、政府救市或被收购等可能的未来出路。

2026-02-02 10:09

AI/ML量子位8.0

Agent当上群主后，群聊变成办事大厅了

文章深入剖析了百度文心APP内测的“多人、多Agent”群聊功能，详细介绍了其背后的Group-MAS技术架构及攻克高并发、语义理解、任务协作等难题的解决方案。

2026-02-02 07:41

AI/MLInfoQ 中文8.0

未来两年软件工程展望：从写代码到管 AI，程序员正分化成两种职业

文章探讨了未来两年软件工程领域的五大关键转变，包括初级开发者面临的挑战、核心技能的演变、角色从编码者到协调者的转型、全栈工程师的重要性以及教育体系的变革。

2026-02-02 06:37

AI/MLInfoQ 中文8.0

Moltbook底裤被扒了！150万用户99%是水军，创始团队自导自演

文章深度剖析了AI社交平台Moltbook的爆火现象，揭露了其150万用户多为水军、数据造假及存在严重安全漏洞的真相，并引用专家观点探讨了AI智能体交互的未来范式与安全风险。

2026-02-02 06:37

AI/ML字节跳动技术团队8.0

OpenViking：面向 Agent 的上下文数据库

字节跳动开源 OpenViking，一款采用文件系统范式设计的 AI Agent 上下文数据库，通过分层存储和递归检索解决上下文管理混乱与高成本问题。

2026-02-02 10:04

AI/ML量子位8.0

大事不好！机器人学会预测未来了

蚂蚁灵波开源全球首个用于通用机器人控制的因果视频-动作世界模型LingBot-VA，该模型通过预测未来画面来指导动作，实现了从“观察-反应”到“想象-行动”的突破。

2026-02-02 07:11

AI/ML腾讯技术工程8.0

这大概是我读过关于AI大模型最全面、好读又易懂的文章了

文章以通俗易懂的方式，通过类比计算机网络技术，深入浅出地讲解了神经网络的基本概念、运作机制以及大模型的思考过程。

2026-02-02 09:41

后端架构前端早读课8.0

【第3652期】告别 dotenv？Node.js 原生支持 .env 文件加载了

文章介绍了Node.js v24原生支持加载.env文件的新特性，对比了原生方案与dotenv库的优劣，并提供了多环境加载的代码封装示例。

2026-02-02 01:01

工具效率真格基金8.0

MIT 工程师如何打造 80% YC 创业者都在用的工具

文章讲述了 Apollo.io 如何从濒临破产到 ARR 2 亿的创业历程，核心在于从 SLG 转向 PLG、聚焦特定细分市场并利用 AI 重构 GTM 流程。

2026-02-02 01:04

其他腾讯科技8.0

星环聚能CEO陈锐：核聚变加速，历史性拐点已至

星环聚能CEO陈锐深度解析核聚变商业化进程，探讨AI对研发的实际影响、资本与技术路线的选择，并预测行业未来4-5年的关键节点。

2026-02-02 12:34

AI/MLFounder Park8.0

Clawdbot 如何搭建永久记忆管理系统：全靠 MD 文档

文章深入解析了AI智能体Clawdbot（OpenClaw）独特的本地化记忆管理系统，该系统利用纯Markdown文档作为存储核心，结合SQLite与向量化技术实现了持久、可搜索且用户完全掌控的记忆机制。

2026-02-02 11:56

AI/ML甲子光年8.0

月费3万，成本为零：谁在收割企业的GEO焦虑？| 甲子光年

文章深度解析了GEO（生成引擎优化）行业的现状，揭露了部分服务商利用企业焦虑进行“割韭菜”的乱象，探讨了流量入口向AI迁移的趋势及品牌在AI时代的生存空间。

2026-02-02 09:19

AI/ML人人都是产品经理8.0

AI产品经理如何用四个接地气的场景，让业务部门不得不佩服

文章通过四个接地气的业务案例，阐述了AI产品经理如何避开技术黑话，从解决业务痛点出发，利用AI实现业务增值。

2026-02-01 23:46

AI/ML网易科技8.0

解读 | 围观Clawdbot 爆火后，投资人告诉我：得亏Manus卖了

文章解读了开源AI助手OpenClaw爆火背后的原因，指出其核心在于从“短任务”向“长任务”和“24小时托管执行”的范式转变，同时分析了该技术在产品化过程中面临的可控性及全链路安全风险。

2026-02-02 02:45

AI/MLThe JetBrains Blog8.0

Koog x ACP: Connect an Agent to Your IDE and More

文章介绍了如何利用 Koog 框架的原生 ACP（Agent Client Protocol）集成功能，构建符合 ACP 标准的 AI 编程代理并将其连接到 JetBrains IDE 中。

2026-02-02 13:02

AI/ML腾讯研究院8.0

AI是人的延伸，人是AI的尺度

文章论述了AI是人类神经系统和认知功能的延伸，提出人类应从“执行力”转向“判断力”，并在人机共生中确立人的价值尺度。

2026-02-02 08:31

工具效率51CTO技术栈8.0

CC之父曝内部团队使用Claude Code的10条技巧！同时启动3-5个工作树，重度投入CLAUDE.md文件；网友：工作流很管用，但钱包有点痛

文章介绍了Claude Code内部团队提升生产力的10条实战技巧，涵盖并行工作树、计划模式、CLAUDE.md文件利用及自定义技能等，展示了高频使用AI辅助编程的最佳实践。

2026-02-02 03:27

AI/ML量子位8.0

两个95后华人，搞出硬件版Clawdbot，售价1700元

文章介绍了名为Distiller Alpha的硬件版AI Agent设备，通过软硬一体设计解决了本地Agent部署与安全痛点，并探讨了AI时代电脑形态的演变。

2026-02-02 07:46

其他创业邦8.0

“网红”电动车，谁能跨过“斩杀线”

文章通过分析2025年多款热门新能源车型的销量曲线，揭示了市场从追求“网红爆款”向注重“长红价值”的转变，总结了智能平权、矩阵化布局及综合持有成本等行业新规则。

2026-02-02 03:33

后端架构得物技术8.0

大模型网关：大模型时代的智能交通枢纽｜得物技术

文章介绍了得物技术自建大模型网关的实践，通过统一模型入口、建设全流程成本管控体系及分钟级实时观测能力，解决了企业AI应用中的资源浪费、成本失控及稳定性挑战，实现了显著降本增效。

2026-02-02 10:30

产品设计有新Newin8.0

拓竹的 3D 打印机，让我想起了珍妮纺织机、缝纫机，以及被错过的“下一个大疆”

文章通过分析拓竹3D打印机的成功，探讨了如何通过降低体验门槛将技术从“极客玩具”转化为“大众工具”，并类比珍妮纺纱机阐述了分布式制造与长尾经济的潜力。

2026-02-02 04:05

移动开发CSDN8.0

9999元的iPhone 16 PM连“2+2”都算不对？排查3天以为是自己菜，最终发现是硬件Bug

开发者在使用iPhone 16 Pro Max调试MLX框架时，因硬件缺陷导致模型输出乱码，经过三天排查发现是Neural Engine相关的硬件故障。

2026-02-02 10:20

AI/MLZ Potentials8.0

深度｜谷歌DeepMind CEO：中国在AI技术能否实现重大突破尚未验证，发明新东西比复制难一百倍

谷歌DeepMind CEO Demis Hassabis接受采访，探讨了AGI的发展现状，指出仅靠LLM规模扩展不足，需要引入World Models等新架构，并强调了AI在科学发现与能源领域的潜力及相应的伦理责任。

2026-02-02 04:59

安全Z Potentials8.0

速递｜云安全新范式“由内而外”，Upwind获2.5亿美元融资，年收入同比增长900%

Upwind Security获2.5亿美元B轮融资，其主张“由内而外”的运行时安全模式，通过内部信号提供上下文，有效解决传统外部扫描的高误报问题。

2026-02-02 04:59

AI/ML白鲸出海8.0

AI社交元年：Moltbook背后的机机交互革命与行业新机遇

文章深入剖析了AI社交平台Moltbook的现象，探讨了基于OpenClaw框架的AI自主社交、技术架构及涌现行为，并分析了其中的伦理风险与机机交互带来的新市场机遇。

2026-02-02 13:31

AI/ML印记中文8.0

AI 周刊 #069 - Kimi K2.5 开源、OpenAI Prism、Genie 3 世界模型

本期AI周刊汇总了月之暗面开源Kimi K2.5、OpenAI发布Prism科研工具与内部数据Agent、DeepMind Genie 3世界模型等重磅行业新闻，同时分享了Claude Code高阶用法及MCP Apps等开发工具的实战经验。

2026-02-02 05:18

AI/ML大模型智能8.0

DeepSeek论文发表16天后，国内团队已经写出了模型的「生物字典」

杭州团队受DeepSeek Engram启发，推出Gengram模块，通过可微分k-mer哈希表和上下文门控机制，显著提升了基因组模型的性能与数据效率。

2026-02-01 16:02

AI/ML智东西8.0

改写AI历史的魔幻周末：154万Agent疯狂社交，赛博诈骗横行，大牛API密钥被盗

文章深入剖析了AI社交网络Moltbook在短时间内爆发、混乱到质疑的全过程，揭示了大规模Agent自治实验背后的技术泡沫、安全风险及人为操控现象。

2026-02-02 05:39

AI/MLCSDN8.0

谷歌AI掌门人、诺奖得主Demis：AGI 需要打破“金鱼记忆”，而谷歌无论泡沫破裂与否都将是赢家

文章收录了 Google DeepMind 掌门人 Demis Hassabis 的专访，深入探讨了 AGI 的科学定义、打破模型“金鱼记忆”的技术路径，以及他对 AI 泡沫和未来智能眼镜形态的独特见解。

2026-02-02 10:20

⚡ 快速浏览

硅星人Pro6.0