奔跑的高达

LeCun叛变大模型,微软医疗基座与AI物理博士同日爆发

2026-01-24

✍️ 主编按语

今日技术圈迎来了久违的「思想大爆炸」。从 LeCun 宣布出走 Meta 创业,剑指 Next-token 预测范式,到亚马逊展示自学习架构的商业化落地,再到上交大推出能闭环做科研的「AI 物理博士」,以及微软攻克医疗时序数据的基座模型。我们看到的不仅是算法的迭代,更是 AI 正试图从「语言游戏」向「理解世界」迈进的坚实一步。

AI 新范式:LeCun 的「叛变」与世界模型的野心

估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」

图灵奖得主 Yann LeCun 终于揭开了新公司 AMI Labs 的面纱,这位深度学习先驱正带着 35 亿美元的估值,向硅谷主流的 LLM 路线发起正面挑战。LeCun 长期以来对「预测下一个 token」持怀疑态度,他认为这无法通过概率统计真正理解物理世界。AMI Labs 的核心方向——世界模型,旨在构建能够理解真实动态、具备持久记忆和推理能力的系统。

这不仅是技术的分野,更是资本对「下一代 AI」的押注。如果主流大模型是在「读万卷书」,那么 LeCun 想做的是「行万里路」,让 AI 在工业控制、机器人等高可靠性场景中,真正理解行动与后果的因果关系。对于行业而言,这意味着除了继续卷参数规模,关于架构本质的创新战争才刚刚开始。

架构演进:亚马逊的自学习系统与微软的医疗基座

How the Amazon.com Catalog Team built self-learning generative AI at scale with Amazon Bedrock

在 AI 落地的实战层面,亚马逊展示了一套极具启发性的「自学习」架构。与其盲目追求单一大模型的完美,他们采用「多小模型+监督者」的模式:让多个低成本模型并行处理,仅在出现分歧时唤醒更强大的模型进行裁决,并将裁决经验沉淀为知识库。这种「从分歧中学习」的思路,巧妙地平衡了成本与质量。

对于开发者来说,这提供了一种超越微调的新范式。AI 系统不再需要频繁重新训练,而是像员工一样,在实际工作中通过「解决麻烦」来积累经验,实现越用越聪明。这正是将 AI 从一次性部署转变为可持续进化的关键一步。

微软发布医疗时序基座模型:4540亿数据预训练,解决不规则采样

医疗 AI 的一大痛点在于数据的「不规则性」,生命体征的记录往往时疏时密。微软亚洲研究院发布的 MIRA 模型,通过引入连续时间旋转位置编码(CT-RoPE)和神经常微分方程,攻克了这一难题。它不再依赖强制插值,而是像医生一样理解时间流逝的物理意义,甚至在数据极度稀疏的情况下保持高鲁棒性。

MIRA 的出现,填补了通用大模型在处理动态生命体征时的空白。这标志着医疗 AI 正从处理静态切片(如 CT 影像)向理解生命动态过程演进,未来在 ICU 预警和慢病管理等领域,这种具备「时间直觉」的基座模型将大有可为。

AI for Science:从辅助工具到自主研究者

上交大 SciMaster 团队新作:一个「AI 物理博士」的诞生

如果说前述技术还在优化工具,那么上交大 SciMaster 团队的 PhysMaster 则在重塑科研流程。这个系统能像物理博士一样,完成从理论推导、代码编写到数值验证的全闭环研究。在五个真实物理任务中,它不仅复现了复杂计算,甚至在开放性问题上展现了自主探索能力。

这不仅仅是效率的提升,更是科研范式的潜在变革。PhysMaster 证明 AI 可以承担科研中重复性高、工程量大的环节,让人类科学家更专注于提出假设和设计实验。未来,我们或许会看到人类作为「导师」,AI 作为「苦力」的新型科研协作模式,这将极大加速科学发现的进程。

结语

从 LeCun 对世界模型的理论攻坚,到亚马逊、微软在垂直领域的架构创新,再到上交大对科研自动化的实践,今天的资讯共同指向了一个趋势:AI 正在走出单纯的语言生成,向着更深层的认知、感知和自主行动迈进。对于身处浪潮中的我们,关注点不应仅限于模型的参数大小,更应看向这些解决现实痛点的新范式。

🔥 热门文章 (24 篇)

云计算InfoQ 中文8.0

微软为 MCP 服务器发布了 Azure 函数支持

微软将模型上下文协议(MCP)对Azure Functions的支持提升至一般可用性,通过原生OBO认证和流式HTTP传输解决了AI智能体访问企业数据的安全痛点,并支持自托管选项。

AI/ML机器之心8.0

不止于Prompt:揭秘「神经网络可重编程性」

文章提出了“神经网络可重编程性”这一统一理论框架,将模型重编程、Prompt Tuning、In-context Learning等技术归纳为通过修改任务呈现方式而非模型参数来适配下游任务。

AI/ML创业邦8.0

AI手机的终局,“读屏”还是“对话”?

文章深度解析了AI手机的两大技术路线:基于系统权限读屏的GUI路线与基于API接口调用的A2A路线,并对比了两者在技术实现、安全隐私及商业成本上的差异。

工具效率The JetBrains Blog8.0

Spring Boot Debugging – Now Remote

JetBrains 发布了 Spring Debugger 插件的更新版本,引入了对远程应用程序调试的支持,且无需使用调试代理(agents)。

AI/MLAINLP8.0

为什么我放弃235B/671B,转而训练8B?

文章通过实战案例对比,阐述了在垂直领域Agent落地中,通过8B小模型的SFT与DPO后训练固化工具调用契约,比单纯依赖大模型和Prompt工程更具稳定性和可控性。

快速浏览