估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」
图灵奖得主Yann LeCun创立的AMI Labs官宣核心方向为开发「世界模型」,旨在突破现有大语言模型「Next-token」范式的局限,构建能理解、推理并作用于真实世界的智能系统。
今日技术圈迎来了久违的「思想大爆炸」。从 LeCun 宣布出走 Meta 创业,剑指 Next-token 预测范式,到亚马逊展示自学习架构的商业化落地,再到上交大推出能闭环做科研的「AI 物理博士」,以及微软攻克医疗时序数据的基座模型。我们看到的不仅是算法的迭代,更是 AI 正试图从「语言游戏」向「理解世界」迈进的坚实一步。
估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」
图灵奖得主 Yann LeCun 终于揭开了新公司 AMI Labs 的面纱,这位深度学习先驱正带着 35 亿美元的估值,向硅谷主流的 LLM 路线发起正面挑战。LeCun 长期以来对「预测下一个 token」持怀疑态度,他认为这无法通过概率统计真正理解物理世界。AMI Labs 的核心方向——世界模型,旨在构建能够理解真实动态、具备持久记忆和推理能力的系统。
这不仅是技术的分野,更是资本对「下一代 AI」的押注。如果主流大模型是在「读万卷书」,那么 LeCun 想做的是「行万里路」,让 AI 在工业控制、机器人等高可靠性场景中,真正理解行动与后果的因果关系。对于行业而言,这意味着除了继续卷参数规模,关于架构本质的创新战争才刚刚开始。
How the Amazon.com Catalog Team built self-learning generative AI at scale with Amazon Bedrock
在 AI 落地的实战层面,亚马逊展示了一套极具启发性的「自学习」架构。与其盲目追求单一大模型的完美,他们采用「多小模型+监督者」的模式:让多个低成本模型并行处理,仅在出现分歧时唤醒更强大的模型进行裁决,并将裁决经验沉淀为知识库。这种「从分歧中学习」的思路,巧妙地平衡了成本与质量。
对于开发者来说,这提供了一种超越微调的新范式。AI 系统不再需要频繁重新训练,而是像员工一样,在实际工作中通过「解决麻烦」来积累经验,实现越用越聪明。这正是将 AI 从一次性部署转变为可持续进化的关键一步。
微软发布医疗时序基座模型:4540亿数据预训练,解决不规则采样
医疗 AI 的一大痛点在于数据的「不规则性」,生命体征的记录往往时疏时密。微软亚洲研究院发布的 MIRA 模型,通过引入连续时间旋转位置编码(CT-RoPE)和神经常微分方程,攻克了这一难题。它不再依赖强制插值,而是像医生一样理解时间流逝的物理意义,甚至在数据极度稀疏的情况下保持高鲁棒性。
MIRA 的出现,填补了通用大模型在处理动态生命体征时的空白。这标志着医疗 AI 正从处理静态切片(如 CT 影像)向理解生命动态过程演进,未来在 ICU 预警和慢病管理等领域,这种具备「时间直觉」的基座模型将大有可为。
上交大 SciMaster 团队新作:一个「AI 物理博士」的诞生
如果说前述技术还在优化工具,那么上交大 SciMaster 团队的 PhysMaster 则在重塑科研流程。这个系统能像物理博士一样,完成从理论推导、代码编写到数值验证的全闭环研究。在五个真实物理任务中,它不仅复现了复杂计算,甚至在开放性问题上展现了自主探索能力。
这不仅仅是效率的提升,更是科研范式的潜在变革。PhysMaster 证明 AI 可以承担科研中重复性高、工程量大的环节,让人类科学家更专注于提出假设和设计实验。未来,我们或许会看到人类作为「导师」,AI 作为「苦力」的新型科研协作模式,这将极大加速科学发现的进程。
从 LeCun 对世界模型的理论攻坚,到亚马逊、微软在垂直领域的架构创新,再到上交大对科研自动化的实践,今天的资讯共同指向了一个趋势:AI 正在走出单纯的语言生成,向着更深层的认知、感知和自主行动迈进。对于身处浪潮中的我们,关注点不应仅限于模型的参数大小,更应看向这些解决现实痛点的新范式。
图灵奖得主Yann LeCun创立的AMI Labs官宣核心方向为开发「世界模型」,旨在突破现有大语言模型「Next-token」范式的局限,构建能理解、推理并作用于真实世界的智能系统。
文章介绍了Amazon商品目录团队如何利用Amazon Bedrock构建自学习生成式AI系统,通过多模型共识与差异触发监督代理,在提高准确性的同时降低大规模部署成本。
上交大 SciMaster 团队发布了 AI 物理研究系统 PhysMaster,通过五个真实物理任务验证了从推导、写码到数值验证的端到端闭环能力,标志着 AI 从辅助工具向自主研究主体的转变。
微软发布了基于4540亿数据预训练的医疗时序基座模型,专门解决医疗数据中不规则采样的难题,标志着医疗AI进入通用基座时代。
微软将模型上下文协议(MCP)对Azure Functions的支持提升至一般可用性,通过原生OBO认证和流式HTTP传输解决了AI智能体访问企业数据的安全痛点,并支持自托管选项。
文章提出了“神经网络可重编程性”这一统一理论框架,将模型重编程、Prompt Tuning、In-context Learning等技术归纳为通过修改任务呈现方式而非模型参数来适配下游任务。
文章详细解读了OpenAI官方关于Codex CLI智能体循环的技术博客,揭示了其核心架构、Responses API交互方式及性能优化策略(如提示词缓存与上下文压缩)。
清华大学团队提出熵感知的E-GRPO框架,通过合并低熵步骤优化流模型强化学习,解决了奖励信号稀疏与归因模糊问题,在多奖励场景下实现性能显著提升。
文章分享了在构建企业级文档分析Agent时,如何通过Java主控与DSL封装的混合架构,解决纯Code Interpreter模式在稳定性、安全性及可控性上的问题。
文章详细采访了前OpenAI o1负责人Jerry Tworek关于离职原因的阐述,深度剖析了AI行业商业化与基础研究之间的冲突,以及对行业同质化竞争现状的批评。
清华大学、面壁智能等联合发布 UltraRAG 3.0,通过可视化 Pipeline 构建器、推理全链路白盒化及内嵌智能助手,解决 RAG 开发中的调试难与开发效率痛点。
文章深度解析了AI手机的两大技术路线:基于系统权限读屏的GUI路线与基于API接口调用的A2A路线,并对比了两者在技术实现、安全隐私及商业成本上的差异。
本文是对香港科技大学首席副校长郭毅可的深度访谈,探讨了生成式AI时代人类智慧的护城河、人机协作的必要性以及AI对职业和社会结构的影响。
Anthropic首次公开详细介绍了“Agent Skills”技术架构,解释了如何通过打包领域专业知识将通用智能体转变为专家,并发布了开放标准。
文章介绍了如何利用 AWS CloudFormation 模板部署 Amazon Bedrock AgentCore 服务,构建端到端的天气活动规划 AI 智能体。
文章通过健康APP实战案例,剖析了传统“Excel式路线图”的缺陷,并介绍了一套从指标锚定、假设验证到愿景呈现的年度规划科学方法论。
文章介绍了百度发布的文心5.0正式版,重点解析了其2.4万亿参数、原生全模态架构及在LMArena的优异表现,并通过实测展示了其复杂语言理解与逻辑推理能力。
英伟达CEO黄仁勋在达沃斯论坛阐述AI产业的五层架构及三大技术突破,并指出AI将推动人类最大规模基建潮,创造就业而非取代工作。
文章详细阐述了飞猪广告外投(RTA)系统在千亿级请求场景下,通过架构解耦、技术栈升级及全链路性能优化,将超时率显著降低并大幅提升研发效能的实践历程。
JetBrains 发布了 Spring Debugger 插件的更新版本,引入了对远程应用程序调试的支持,且无需使用调试代理(agents)。
本文是对Claude Code之父Boris Cherny的深度访谈实录,详细演示了Claude Cowork的实际应用场景,并分享了其个人的高效工作流配置与AI代理的核心理念。
文章深入测评了新推出的Claude Skills应用商店skills.sh,通过拆解Top 10热门技能及额外宝藏仓库,展示了如何一键安装并利用现成技能提升开发、设计和运营效率。
文章通过实战案例对比,阐述了在垂直领域Agent落地中,通过8B小模型的SFT与DPO后训练固化工具调用契约,比单纯依赖大模型和Prompt工程更具稳定性和可控性。
文章是对OpenAI核心模型主要贡献者翁家翌的深度访谈,揭示了OpenAI内部通过快速迭代Infra、后训练(RLHF)及工程能力来推动技术突破的底层逻辑。
文章介绍了哈佛辍学团队创立的AI芯片公司Etched.ai完成5亿美元融资,其核心产品Sohu芯片专注于Transformer架构,旨在通过ASIC专用芯片在推理效率上挑战英伟达。
Sam Altman预告OpenAI将在一个月内发布Codex编程模型的重磅更新,并透露网络安全防御策略将转向'防御性加速'以应对即将出现的强大AI模型。
文章介绍了 Claude Code 将 Todos 功能升级为 Tasks,旨在通过支持跨 session 协作和依赖管理来应对更复杂的项目开发需求。
文章汇总了多个开源技术项目,重点介绍了Anthropic官方发布的Claude Skills技能系统及其生态项目,同时也涵盖了Go代理服务和视频生成框架等内容。
文章介绍了中国科学技术大学博士后郑值关于“多维度用户需求感知的推荐系统技术”的学术报告预告,涵盖去偏方法、包推荐及多行为建模等研究内容。
文章介绍了MLNLP社区将于2026年1月25日举办的第三十八次学术研讨会,邀请了来自曼彻斯特大学、CMU、密歇根大学等知名学府的博士生分享关于LLM架构、视觉学习及推理框架的最新研究。
文章汇总了近期AI行业的重要商业动态,包括李飞飞World Labs的大额融资计划、OpenAI的API收入增长以及谷歌对Hume AI人才的挖角。
该文章是一则直播预告,旨在探讨AIOps如何通过UModel、Benchmark体系及大小模型协同架构从Demo走向规模化落地。
文章汇总了大连GDP破万亿、中国太空旅游项目预售、TikTok成立美国数据安全公司、阿里平头哥拟独立上市等近期财经热点新闻。
这是一篇涵盖科技、汽车、电商及投融资等多个领域的综合性早报,汇总了特斯拉FSD进展、理想汽车辟谣、李亚鹏直播带货及多家AI创企融资等热点新闻。
文章分析了 OpenAI 可能于 2026 年推出的首款 AI 硬件设备“Sweet Pea”,推测其为由 Jony Ive 设计的智能耳机,主打全天候语音交互与情感感知。