奔跑的高达

国产AI硬核大爆发:万亿模型刷榜,具身智能决战

2026-01-26

✍️ 主编按语

今天的技术资讯呈现出极强的“硬核”特质,从底层万亿参数大模型的重磅发布,到物理世界具身智能的深度布局,再到计算机操作智能体的实战进化,国产科技力量不仅在算法层面与全球顶尖水平并驾齐驱,更在芯片制造、医疗诊断等实体产业中展现了惊人的落地能力。这不仅是技术参数的竞赛,更是 AI 从“云端”走向“物理世界”的全面冲锋。

AI 基座与推理新范式

那个用半成品刷爆SOTA的Qwen3超大杯推理版,现在正式上线 - 阿里千问今日正式发布了 Qwen3-Max-Thinking 完全体,以超万亿参数和 36T Tokens 的预训练数据,在多项权威基准中赶超 GPT-5.2 和 Claude-Opus 4.5。这不仅仅是参数规模的堆叠,其核心在于“自适应工具调用”与“测试时扩展”技术的引入,让模型在推理时能像人类一样边思考边调用工具。这意味着 AI 正在从单纯的对话者进化为具备原生 Agent 能力的执行者,这对开发者和企业构建复杂应用来说,是一个极具说服力的新基座选择。

刷新 Google AlphaEvolve 进化结果,百度开源 Agent 开发框架 LoongFlow - 如果说 Qwen 是能力的提升,那么百度的 LoongFlow 则是思维模式的革新。该框架通过 PES(Plan-Execute-Summarize)范式和混合进化记忆系统,让 AI 学会了“专家级思考”,在数学和算法发现任务中甚至超越了人类专家和 Google 的 AlphaEvolve。这对行业的影响是深远的:它证明了通过系统化的架构设计,AI 可以解决长程复杂推理问题,为科研、工业设计等需要高精度试错的领域提供了全新的自动化路径。

美团 EvoCUA 刷新开源 SOTA,会用电脑还会持续进化的智能体! - 美团技术团队推出的 EvoCUA,则将目光投向了计算机操作领域。通过构建十万级并发的交互沙盒和“可验证数据合成引擎”,EvoCUA 将模型训练从静态模仿转变为“经验进化学习”,在 OSWorld 评测中大幅刷新了开源记录。这项技术的价值在于,它让 AI 具备了在真实 GUI 环境中自我纠错和进化的能力,是实现“AI 办公员”或“自动化运维”的关键一步,标志着人机交互正从“指令驱动”向“意图驱动”跨越。

具身智能与物理 AI 的全面突围

Yann LeCun新动向:加入逻辑智能!新公司AMI Labs官宣核心路线 - “图灵奖”得主 Yann LeCun 的动向总是行业风向标。他官宣加入逻辑智能并推出 AMI Labs,核心直指 LLM 的局限性——无法真正理解物理世界。AMI Labs 致力于构建非生成式的“世界模型”,在抽象表示空间进行预测,而非逐像素生成。这与国内 Physical AI 的热潮形成了有趣的共振,说明全球顶尖科学家都意识到,只有解决对物理世界的因果理解,AI 才能真正走进机器人和自动驾驶的广阔天地。

阶跃星辰官宣印奇任董事长,B+轮融资50亿 - 国内 Physical AI 赛道也迎来了重磅整合。印奇同时执掌阶跃星辰(AI 大脑)与千里科技(终端载体),并完成 50 亿融资,旨在打造类似“x.AI + 特斯拉”的软硬闭环。这种战略协同极具前瞻性:大模型公司往往缺乏真实场景数据,而硬件公司缺乏顶尖算法能力,二者的结合将加速 AI 在智能汽车、机器人等物理终端的落地,为行业树立了新的竞争壁垒。

飞捷科思完成近亿元Pre-A1轮融资 |【经纬低调新闻】 - 具身智能的爆发离不开基础设施。飞捷科思获得经纬创投领投,其自研的新一代物理仿真引擎,能够通过合成数据大幅降低机器人本体的训练成本。这就像是给机器人行业提供了“核反应堆”,解决了真实数据匮乏的痛点。随着这类底层工具的成熟,我们有理由相信,未来几年具身智能将从实验室演示走向规模化商用。

芯片硬科技与产业落地

清华女博士造芯7年,冲刺106亿港股IPO,华为海思17年老将加盟 - 爱芯元智冲刺港股“中国边缘AI芯片第一股”,这则新闻展示了半导体行业的硬核实力。作为国产智驾 SoC 出货量第二的企业,其创始人仇肖莘带领团队在视觉端侧 AI 芯片领域拿下了全球第一的市场份额。更引人注目的是华为海思 17 年老将孙微风的加入,这预示着公司将在车载高端市场进一步发力。在当前国际环境下,这种拥有自研 NPU、AI-ISP 核心技术并能实现大规模商业落地的芯片公司,是国家科技自主可控的重要支柱。

医疗 AI 与工具效能

复旦中山医院联合阿里达摩院用AI检测喉癌、下咽癌转移,准确性远超人类专家 - 在医疗这一高风险领域,AI 再次证明了其价值。复旦中山医院与达摩院合作的 DeepENE 模型,在淋巴结转移检测上的准确率远超人类专家,尤其是在早期微小病变的识别上。这不仅是技术的胜利,更是对患者生存质量的直接贡献。随着此类 AI 逐渐整合进临床流程,医生将从繁琐的阅片中解脱出来,专注于治疗方案的设计,标志着“AI + 医疗”正在进入深水区。

How We Made Variable Inspections 87 Times Faster for Unreal Engine in Rider - 除了宏大的 AI 叙事,工程效率的提升同样令人振奋。JetBrains 团队通过重写表达式求值器,将 Rider 中 Unreal Engine 变量的检查速度提升了 87 倍。这对游戏开发者来说是一个巨大的福音,大幅缩短了调试等待时间。它提醒我们,在追求 AI 变革的同时,底层工具的极致优化依然能带来生产力的质变。

工程文化与创业哲学

对话拓竹陶冶:我们一群工程师,一起造个朴素的硬核公司 - 在喧嚣的创投圈,拓竹的故事如同一股清流。一群来自大疆的工程师,用 22 个月的隐身开发,将 3D 打印机这个小众产品做到了世界第一。他们的成功不靠营销,而是靠解决“调机难”这一核心痛点,通过自研传感器和算法将工具变成了“机器人”。陶冶关于“信任是不可再生资源”、“不要瞎折腾”的管理哲学,对正在经历规模扩张的科技公司极具参考意义——回归产品本质,保持工程师文化,或许是穿越周期的最佳路径。

🔥 热门文章 (45 篇)

AI/ML人人都是产品经理8.0

别再迷信Prompt了,这才是Agent的真正战场

文章指出随着大模型推理能力的提升,Prompt Engineering在Agent开发中的权重已大幅下降,核心竞争转向工作流编排、记忆管理和自动化评估等系统工程能力。

产品设计人人都是产品经理8.0

AI项目能跑起来的前提,是先把AI降级

文章指出AI项目落地的关键在于将AI降级,优先梳理业务流程与数据治理,通过真实招聘案例阐述了如何构建可控的数据闭环来发挥AI价值。

AI/ML阿里云开发者8.0

RTP-LLM 在相关性大模型中的推理优化最佳实践

文章分享了淘宝搜索场景下基于RTP-LLM框架进行大模型推理优化的实践,详细介绍了Proxy负载均衡、批次内KV-Cache复用及MoE Kernel动态调优等关键技术,成功在严苛时延下落地了3.5B MoE模型。

其他晚点LatePost8.0

在喧嚣中,看见另一种造车逻辑

文章分析了极氪汽车在 CES 展会的表现及其背后的造车逻辑,强调其凭借吉利技术积淀、全球化研发和“笨功夫”在高端市场取得突破。

AI/MLHugging Face8.0

使用 Hugging Face 轻松构建并共享 ROCm 内核

文章介绍了如何使用 Hugging Face 的 kernel-builder 和 kernels 库,将针对 AMD GPU 优化的自定义 ROCm 内核(以 GEMM 为例)构建、集成到 PyTorch 中并发布到社区。

AI/ML腾讯科技8.0

AI会带来经济爆发,但引线很长|Hao好聊论文

文章基于斯坦福经济学家Charles I. Jones的最新论文,探讨了AI对经济增长的长期影响,提出尽管AI潜力巨大,但受限于经济系统中的「薄弱环节」,经济爆发将是跨越数十年的渐进过程。

AI/ML大淘宝技术8.0

如何设计一个AI Agent系统

本文从工程视角系统阐述了如何基于大模型设计、实现和落地可控可用的AI Agent系统,涵盖了软件范式演进、核心架构组件及关键工程技术。

AI/ML深网腾讯新闻8.0

百度没有退路 | 深网

文章深度分析了百度在2026年面临的业务困境与转型战略,阐述了搜索广告收入下滑背景下,百度通过组织架构调整、全栈AI布局及芯片上市押注AI未来的决绝。

AI/ML量子位8.0

瑞幸背后的芯片,藏不住了

文章报道了国产通用GPU公司天数智芯发布彤央系列边端算力产品,并披露了其对标英伟达的架构路线图及商业落地情况。

AI/ML量子位8.0

Skills刚火,就有零Skill的Agent来了…

文章介绍了云玦科技提出的“原位自进化”Agent框架,该Agent能在推理阶段自主生成并复用工具,无需人类预设,在多项高难评测中表现优异并已开源。

快速浏览

创业邦6.0

送黄景瑜上太空,300万3分钟值吗?

文章分析了国内商业航天公司“穿越者”推出的300万元太空旅游项目,对比了国际竞品及历史交通发展,探讨了其商业价值、用户体验及风险。

人人都是产品经理6.0

李亚鹏等来福报

文章复盘了李亚鹏从负债累累到直播带货爆红的戏剧性转折,分析了其个人情怀如何转化为商业流量及社会支持。