LeCun叛变大模型，微软医疗基座与AI物理博士同日爆发

2026-01-24

✍️ 主编按语

今日技术圈迎来了久违的「思想大爆炸」。从 LeCun 宣布出走 Meta 创业，剑指 Next-token 预测范式，到亚马逊展示自学习架构的商业化落地，再到上交大推出能闭环做科研的「AI 物理博士」，以及微软攻克医疗时序数据的基座模型。我们看到的不仅是算法的迭代，更是 AI 正试图从「语言游戏」向「理解世界」迈进的坚实一步。

AI 新范式：LeCun 的「叛变」与世界模型的野心

估值35亿美元，LeCun创业公司官宣核心方向，掀起对Next-token范式的「叛变」

图灵奖得主 Yann LeCun 终于揭开了新公司 AMI Labs 的面纱，这位深度学习先驱正带着 35 亿美元的估值，向硅谷主流的 LLM 路线发起正面挑战。LeCun 长期以来对「预测下一个 token」持怀疑态度，他认为这无法通过概率统计真正理解物理世界。AMI Labs 的核心方向——世界模型，旨在构建能够理解真实动态、具备持久记忆和推理能力的系统。

这不仅是技术的分野，更是资本对「下一代 AI」的押注。如果主流大模型是在「读万卷书」，那么 LeCun 想做的是「行万里路」，让 AI 在工业控制、机器人等高可靠性场景中，真正理解行动与后果的因果关系。对于行业而言，这意味着除了继续卷参数规模，关于架构本质的创新战争才刚刚开始。

架构演进：亚马逊的自学习系统与微软的医疗基座

How the Amazon.com Catalog Team built self-learning generative AI at scale with Amazon Bedrock

在 AI 落地的实战层面，亚马逊展示了一套极具启发性的「自学习」架构。与其盲目追求单一大模型的完美，他们采用「多小模型+监督者」的模式：让多个低成本模型并行处理，仅在出现分歧时唤醒更强大的模型进行裁决，并将裁决经验沉淀为知识库。这种「从分歧中学习」的思路，巧妙地平衡了成本与质量。

对于开发者来说，这提供了一种超越微调的新范式。AI 系统不再需要频繁重新训练，而是像员工一样，在实际工作中通过「解决麻烦」来积累经验，实现越用越聪明。这正是将 AI 从一次性部署转变为可持续进化的关键一步。

微软发布医疗时序基座模型：4540亿数据预训练，解决不规则采样

医疗 AI 的一大痛点在于数据的「不规则性」，生命体征的记录往往时疏时密。微软亚洲研究院发布的 MIRA 模型，通过引入连续时间旋转位置编码（CT-RoPE）和神经常微分方程，攻克了这一难题。它不再依赖强制插值，而是像医生一样理解时间流逝的物理意义，甚至在数据极度稀疏的情况下保持高鲁棒性。

MIRA 的出现，填补了通用大模型在处理动态生命体征时的空白。这标志着医疗 AI 正从处理静态切片（如 CT 影像）向理解生命动态过程演进，未来在 ICU 预警和慢病管理等领域，这种具备「时间直觉」的基座模型将大有可为。

AI for Science：从辅助工具到自主研究者

上交大 SciMaster 团队新作：一个「AI 物理博士」的诞生

如果说前述技术还在优化工具，那么上交大 SciMaster 团队的 PhysMaster 则在重塑科研流程。这个系统能像物理博士一样，完成从理论推导、代码编写到数值验证的全闭环研究。在五个真实物理任务中，它不仅复现了复杂计算，甚至在开放性问题上展现了自主探索能力。

这不仅仅是效率的提升，更是科研范式的潜在变革。PhysMaster 证明 AI 可以承担科研中重复性高、工程量大的环节，让人类科学家更专注于提出假设和设计实验。未来，我们或许会看到人类作为「导师」，AI 作为「苦力」的新型科研协作模式，这将极大加速科学发现的进程。

结语

从 LeCun 对世界模型的理论攻坚，到亚马逊、微软在垂直领域的架构创新，再到上交大对科研自动化的实践，今天的资讯共同指向了一个趋势：AI 正在走出单纯的语言生成，向着更深层的认知、感知和自主行动迈进。对于身处浪潮中的我们，关注点不应仅限于模型的参数大小，更应看向这些解决现实痛点的新范式。

🔥 热门文章 (24 篇)

AI/ML机器之心9.0

估值35亿美元，LeCun创业公司官宣核心方向，掀起对Next-token范式的「叛变」

图灵奖得主Yann LeCun创立的AMI Labs官宣核心方向为开发「世界模型」，旨在突破现有大语言模型「Next-token」范式的局限，构建能理解、推理并作用于真实世界的智能系统。

2026-01-24 04:06

AI/MLAWS Machine Learning Blog9.0

How the Amazon.com Catalog Team built self-learning generative AI at scale with Amazon Bedrock

文章介绍了Amazon商品目录团队如何利用Amazon Bedrock构建自学习生成式AI系统，通过多模型共识与差异触发监督代理，在提高准确性的同时降低大规模部署成本。

2026-01-23 17:49

AI/MLAI科技评论9.0

上交大 SciMaster 团队新作：一个「AI 物理博士」的诞生

上交大 SciMaster 团队发布了 AI 物理研究系统 PhysMaster，通过五个真实物理任务验证了从推导、写码到数值验证的端到端闭环能力，标志着 AI 从辅助工具向自主研究主体的转变。

2026-01-24 03:03

AI/ML量子位9.0

微软发布医疗时序基座模型：4540亿数据预训练，解决不规则采样

微软发布了基于4540亿数据预训练的医疗时序基座模型，专门解决医疗数据中不规则采样的难题，标志着医疗AI进入通用基座时代。

2026-01-24 05:18

云计算InfoQ 中文8.0

微软为 MCP 服务器发布了 Azure 函数支持

微软将模型上下文协议（MCP）对Azure Functions的支持提升至一般可用性，通过原生OBO认证和流式HTTP传输解决了AI智能体访问企业数据的安全痛点，并支持自托管选项。

2026-01-24 02:16

AI/ML机器之心8.0

不止于Prompt：揭秘「神经网络可重编程性」

文章提出了“神经网络可重编程性”这一统一理论框架，将模型重编程、Prompt Tuning、In-context Learning等技术归纳为通过修改任务呈现方式而非模型参数来适配下游任务。

2026-01-24 04:06

AI/ML机器之心8.0

挑战Claude Code？OpenAI Codex发布月将至，今先揭秘智能体循环

文章详细解读了OpenAI官方关于Codex CLI智能体循环的技术博客，揭示了其核心架构、Responses API交互方式及性能优化策略（如提示词缓存与上下文压缩）。

2026-01-24 04:06

AI/ML新智元8.0

多奖励场景全面领先！清华新作高熵驱动，强化学习效率飙升

清华大学团队提出熵感知的E-GRPO框架，通过合并低熵步骤优化流模型强化学习，解决了奖励信号稀疏与归因模糊问题，在多奖励场景下实现性能显著提升。

2026-01-24 05:10

后端架构AI前线8.0

Agent Skills 落地实战：拒绝“裸奔”，构建确定性与灵活性共存的混合架构

文章分享了在构建企业级文档分析Agent时，如何通过Java主控与DSL封装的混合架构，解决纯Code Interpreter模式在稳定性、安全性及可控性上的问题。

2026-01-24 05:31

AI/MLAI前线8.0

硅谷“钱太多”毁了AI ？！前OpenAI o1负责人炮轰：别吹谷歌，Q-Star 被炒成肥皂剧，7年高压被“逼疯”！

文章详细采访了前OpenAI o1负责人Jerry Tworek关于离职原因的阐述，深度剖析了AI行业商业化与基础研究之间的冲突，以及对行业同质化竞争现状的批评。

2026-01-24 05:31

AI/MLAINLP8.0

UltraRAG3.0发布：拒绝“盲盒”开发，让每一行推理逻辑都清晰可见

清华大学、面壁智能等联合发布 UltraRAG 3.0，通过可视化 Pipeline 构建器、推理全链路白盒化及内嵌智能助手，解决 RAG 开发中的调试难与开发效率痛点。

2026-01-24 11:51

AI/ML创业邦8.0

AI手机的终局，“读屏”还是“对话”？

文章深度解析了AI手机的两大技术路线：基于系统权限读屏的GUI路线与基于API接口调用的A2A路线，并对比了两者在技术实现、安全隐私及商业成本上的差异。

2026-01-24 10:41

AI/ML腾讯科技8.0

与郭毅可深聊：AI 逼近“全知”，人类会走向精神荒芜吗？

本文是对香港科技大学首席副校长郭毅可的深度访谈，探讨了生成式AI时代人类智慧的护城河、人机协作的必要性以及AI对职业和社会结构的影响。

2026-01-24 01:02

AI/MLDatawhale8.0

刚刚，Anthropic首次公开：Claude Skills的完整思考！

Anthropic首次公开详细介绍了“Agent Skills”技术架构，解释了如何通过打包领域专业知识将通用智能体转变为专家，并发布了开放标准。

2026-01-24 14:58

云计算AWS Machine Learning Blog8.0

Build AI agents with Amazon Bedrock AgentCore using AWS CloudFormation

文章介绍了如何利用 AWS CloudFormation 模板部署 Amazon Bedrock AgentCore 服务，构建端到端的天气活动规划 AI 智能体。

2026-01-23 17:54

产品设计人人都是产品经理8.0

手把手教你写年度规划：产品思维是2026年的升职加薪必备能力

文章通过健康APP实战案例，剖析了传统“Excel式路线图”的缺陷，并介绍了一套从指标锚定、假设验证到愿景呈现的年度规划科学方法论。

2026-01-24 02:01

AI/ML智东西8.0

文心5.0正式版发布，霸榜LMArena的“最强文科生”到底强在哪？

文章介绍了百度发布的文心5.0正式版，重点解析了其2.4万亿参数、原生全模态架构及在LMArena的优异表现，并通过实测展示了其复杂语言理解与逻辑推理能力。

2026-01-24 02:05

AI/MLInfoQ 中文8.0

AI不抢工作反而抢人？黄仁勋首次亮相达沃斯：它掀起了人类最大规模基建潮

英伟达CEO黄仁勋在达沃斯论坛阐述AI产业的五层架构及三大技术突破，并指出AI将推动人类最大规模基建潮，创造就业而非取代工作。

2026-01-24 02:16

后端架构InfoQ 中文8.0

千亿级请求下，飞猪如何将广告外投系统超时率爆降至0.01%

文章详细阐述了飞猪广告外投（RTA）系统在千亿级请求场景下，通过架构解耦、技术栈升级及全链路性能优化，将超时率显著降低并大幅提升研发效能的实践历程。

2026-01-24 02:16

工具效率The JetBrains Blog8.0

Spring Boot Debugging – Now Remote

JetBrains 发布了 Spring Debugger 插件的更新版本，引入了对远程应用程序调试的支持，且无需使用调试代理（agents）。

2026-01-23 16:17

AI/MLAI寒武纪8.0

万字实录！Claude Code之父最新私教课来了：手把手教Claude Cowork使用，还有个人CC配置详解

本文是对Claude Code之父Boris Cherny的深度访谈实录，详细演示了Claude Cowork的实际应用场景，并分享了其个人的高效工作流配置与AI代理的核心理念。

2026-01-23 23:38

工具效率花叔8.0

Skills商店来了：5万人在用的Top 10热门Skills，我帮你试了一遍

文章深入测评了新推出的Claude Skills应用商店skills.sh，通过拆解Top 10热门技能及额外宝藏仓库，展示了如何一键安装并利用现成技能提升开发、设计和运营效率。

2026-01-24 00:43

AI/MLAINLP8.0

为什么我放弃235B/671B，转而训练8B？

文章通过实战案例对比，阐述了在垂直领域Agent落地中，通过8B小模型的SFT与DPO后训练固化工具调用契约，比单纯依赖大模型和Prompt工程更具稳定性和可控性。

2026-01-24 11:51

AI/ML51CTO技术栈8.0

OpenAI核心模型主要贡献者翁家翌：OpenAI所做的，并非完全不能复刻；DS是唯一一次让内部真正警觉；模型公司本质上拼的是Infra的修Bug速度

文章是对OpenAI核心模型主要贡献者翁家翌的深度访谈，揭示了OpenAI内部通过快速迭代Infra、后训练（RLHF）及工程能力来推动技术突破的底层逻辑。

2026-01-23 16:07

⚡ 快速浏览

创业邦6.0