国产AI硬核大爆发：万亿模型刷榜，具身智能决战

2026-01-26

✍️ 主编按语

今天的技术资讯呈现出极强的“硬核”特质，从底层万亿参数大模型的重磅发布，到物理世界具身智能的深度布局，再到计算机操作智能体的实战进化，国产科技力量不仅在算法层面与全球顶尖水平并驾齐驱，更在芯片制造、医疗诊断等实体产业中展现了惊人的落地能力。这不仅是技术参数的竞赛，更是 AI 从“云端”走向“物理世界”的全面冲锋。

AI 基座与推理新范式

那个用半成品刷爆SOTA的Qwen3超大杯推理版，现在正式上线 - 阿里千问今日正式发布了 Qwen3-Max-Thinking 完全体，以超万亿参数和 36T Tokens 的预训练数据，在多项权威基准中赶超 GPT-5.2 和 Claude-Opus 4.5。这不仅仅是参数规模的堆叠，其核心在于“自适应工具调用”与“测试时扩展”技术的引入，让模型在推理时能像人类一样边思考边调用工具。这意味着 AI 正在从单纯的对话者进化为具备原生 Agent 能力的执行者，这对开发者和企业构建复杂应用来说，是一个极具说服力的新基座选择。

刷新 Google AlphaEvolve 进化结果，百度开源 Agent 开发框架 LoongFlow - 如果说 Qwen 是能力的提升，那么百度的 LoongFlow 则是思维模式的革新。该框架通过 PES（Plan-Execute-Summarize）范式和混合进化记忆系统，让 AI 学会了“专家级思考”，在数学和算法发现任务中甚至超越了人类专家和 Google 的 AlphaEvolve。这对行业的影响是深远的：它证明了通过系统化的架构设计，AI 可以解决长程复杂推理问题，为科研、工业设计等需要高精度试错的领域提供了全新的自动化路径。

美团 EvoCUA 刷新开源 SOTA，会用电脑还会持续进化的智能体！ - 美团技术团队推出的 EvoCUA，则将目光投向了计算机操作领域。通过构建十万级并发的交互沙盒和“可验证数据合成引擎”，EvoCUA 将模型训练从静态模仿转变为“经验进化学习”，在 OSWorld 评测中大幅刷新了开源记录。这项技术的价值在于，它让 AI 具备了在真实 GUI 环境中自我纠错和进化的能力，是实现“AI 办公员”或“自动化运维”的关键一步，标志着人机交互正从“指令驱动”向“意图驱动”跨越。

具身智能与物理 AI 的全面突围

Yann LeCun新动向：加入逻辑智能！新公司AMI Labs官宣核心路线 - “图灵奖”得主 Yann LeCun 的动向总是行业风向标。他官宣加入逻辑智能并推出 AMI Labs，核心直指 LLM 的局限性——无法真正理解物理世界。AMI Labs 致力于构建非生成式的“世界模型”，在抽象表示空间进行预测，而非逐像素生成。这与国内 Physical AI 的热潮形成了有趣的共振，说明全球顶尖科学家都意识到，只有解决对物理世界的因果理解，AI 才能真正走进机器人和自动驾驶的广阔天地。

阶跃星辰官宣印奇任董事长，B+轮融资50亿 - 国内 Physical AI 赛道也迎来了重磅整合。印奇同时执掌阶跃星辰（AI 大脑）与千里科技（终端载体），并完成 50 亿融资，旨在打造类似“x.AI + 特斯拉”的软硬闭环。这种战略协同极具前瞻性：大模型公司往往缺乏真实场景数据，而硬件公司缺乏顶尖算法能力，二者的结合将加速 AI 在智能汽车、机器人等物理终端的落地，为行业树立了新的竞争壁垒。

飞捷科思完成近亿元Pre-A1轮融资 |【经纬低调新闻】 - 具身智能的爆发离不开基础设施。飞捷科思获得经纬创投领投，其自研的新一代物理仿真引擎，能够通过合成数据大幅降低机器人本体的训练成本。这就像是给机器人行业提供了“核反应堆”，解决了真实数据匮乏的痛点。随着这类底层工具的成熟，我们有理由相信，未来几年具身智能将从实验室演示走向规模化商用。

芯片硬科技与产业落地

清华女博士造芯7年，冲刺106亿港股IPO，华为海思17年老将加盟 - 爱芯元智冲刺港股“中国边缘AI芯片第一股”，这则新闻展示了半导体行业的硬核实力。作为国产智驾 SoC 出货量第二的企业，其创始人仇肖莘带领团队在视觉端侧 AI 芯片领域拿下了全球第一的市场份额。更引人注目的是华为海思 17 年老将孙微风的加入，这预示着公司将在车载高端市场进一步发力。在当前国际环境下，这种拥有自研 NPU、AI-ISP 核心技术并能实现大规模商业落地的芯片公司，是国家科技自主可控的重要支柱。

医疗 AI 与工具效能

复旦中山医院联合阿里达摩院用AI检测喉癌、下咽癌转移，准确性远超人类专家 - 在医疗这一高风险领域，AI 再次证明了其价值。复旦中山医院与达摩院合作的 DeepENE 模型，在淋巴结转移检测上的准确率远超人类专家，尤其是在早期微小病变的识别上。这不仅是技术的胜利，更是对患者生存质量的直接贡献。随着此类 AI 逐渐整合进临床流程，医生将从繁琐的阅片中解脱出来，专注于治疗方案的设计，标志着“AI + 医疗”正在进入深水区。

How We Made Variable Inspections 87 Times Faster for Unreal Engine in Rider - 除了宏大的 AI 叙事，工程效率的提升同样令人振奋。JetBrains 团队通过重写表达式求值器，将 Rider 中 Unreal Engine 变量的检查速度提升了 87 倍。这对游戏开发者来说是一个巨大的福音，大幅缩短了调试等待时间。它提醒我们，在追求 AI 变革的同时，底层工具的极致优化依然能带来生产力的质变。

工程文化与创业哲学

对话拓竹陶冶：我们一群工程师，一起造个朴素的硬核公司 - 在喧嚣的创投圈，拓竹的故事如同一股清流。一群来自大疆的工程师，用 22 个月的隐身开发，将 3D 打印机这个小众产品做到了世界第一。他们的成功不靠营销，而是靠解决“调机难”这一核心痛点，通过自研传感器和算法将工具变成了“机器人”。陶冶关于“信任是不可再生资源”、“不要瞎折腾”的管理哲学，对正在经历规模扩张的科技公司极具参考意义——回归产品本质，保持工程师文化，或许是穿越周期的最佳路径。

🔥 热门文章 (45 篇)

AI/ML经纬创投9.0

飞捷科思完成近亿元Pre-A1轮融资 |【经纬低调新闻】

飞捷科思完成近亿元Pre-A1轮融资，由经纬创投联合领投，旨在加速自研物理引擎及具身智能生态的发展。

2026-01-26 04:17

AI/ML创业邦9.0

超50亿融资！38岁姚班天才，又有了新身份

38岁姚班天才印奇出任阶跃星辰董事长，同时执掌该大模型公司与千里科技，完成超50亿B+轮融资，构建“AI大脑+执行终端”的产业布局。

2026-01-26 04:06

AI/ML百度Geek说9.0

刷新 Google AlphaEvolve 进化结果，百度开源 Agent 开发框架 LoongFlow

百度百舸团队开源了旨在实现“专家级思考”的智能体开发框架LoongFlow，该框架通过PES范式和混合进化记忆系统，显著提升了AI解决长程复杂推理任务的效率，并在数学和MLE-bench评测中刷新了SOTA纪录。

2026-01-26 10:05

产品设计晚点LatePost9.0

对话拓竹陶冶：我们一群工程师，一起造个朴素的硬核公司

本文深入采访了拓竹创始人陶冶，讲述一群顶级工程师如何凭借对产品和技术的极致追求，将3D打印机从冷门难用的设备做到世界第一，并分享了他们构建朴素硬核工程师文化的底层逻辑与管理哲学。

2026-01-26 02:06

AI/ML腾讯科技9.0

阶跃星辰官宣印奇任董事长，B+轮融资50亿

AI大模型公司阶跃星辰宣布印奇出任董事长，并完成50亿元B+轮融资，旨在打造全球顶尖基座模型及推进终端Agent落地。

2026-01-26 01:10

AI/ML量子位9.0

那个用半成品刷爆SOTA的Qwen3超大杯推理版，现在正式上线

阿里千问正式发布万亿参数模型Qwen3-Max-Thinking，凭借自适应工具调用和测试时扩展技术刷新全球SOTA，性能超越GPT-5.2-Thinking等顶尖闭源模型。

2026-01-26 15:40

工具效率The JetBrains Blog9.0

How We Made Variable Inspections 87 Times Faster for Unreal Engine in Rider

JetBrains 通过重写表达式求值器，解决了 Rider 在调试 Unreal Engine 时使用 LLDB 支持 Natvis 的性能和维护难题，实现了变量检查速度最高提升 87 倍并大幅降低内存占用。

2026-01-26 13:08

AI/ML美团技术团队9.0

美团 EvoCUA 刷新开源 SOTA，会用电脑还会持续进化的智能体！

美团技术团队开源了 EvoCUA 模型，通过构建可验证数据合成引擎与十万级并发交互沙盒，将训练范式转变为“经验进化学习”，在 OSWorld 榜单上刷新了开源 SOTA 记录。

2026-01-26 00:00

AI/ML量子位9.0

复旦中山医院联合阿里达摩院用AI检测喉癌、下咽癌转移，准确性远超人类专家

复旦中山医院与阿里达摩院合作研发的AI模型在喉癌和下咽癌转移检测中表现优异，准确率显著超越人类专家，相关论文发表于顶级期刊《放射学》。

2026-01-26 09:35

AI/ML量子位9.0

清华女博士造芯7年，冲刺106亿港股IPO，华为海思17年老将加盟

清华女博士仇肖莘创立的爱芯元智冲刺港股IPO，成为中国边缘AI芯片第一股，华为海思前老将孙微风加盟。

2026-01-26 08:24

AI/ML51CTO技术栈9.0

Yann LeCun新动向：加入逻辑智能！新公司AMI Labs官宣核心路线：几年内构建真正理解物理世界的系统；曝离职原因：工业界已经被LLM洗脑了

图灵奖得主Yann LeCun创立新公司AMI Labs，致力于构建基于世界模型的AI系统以理解物理世界，并批评当前工业界过度沉迷LLM范式。

2026-01-26 07:04

AI/ML十字路口Crossing8.0

阶跃的一次重要“阶跃”：超 50 亿元 B+ 轮融资，印奇正式出任董事长

文章分析了阶跃星辰完成超50亿元B+轮融资及印奇出任董事长的战略意义，探讨了其从纯模型竞争向“AI+终端”软硬件一体化方向转型的路径。

2026-01-26 10:03

数据库dbaplus社群8.0

不改SQL性能提升5倍！小红书MySQL内核秒杀能力升级实践

小红书通过在MySQL自研内核中实现“合并秒杀”方案，将热点行更新速度提升5倍至1.5W/s+，在不修改业务SQL的前提下解决了高并发下的库存扣减瓶颈。

2026-01-25 23:15

AI/ML人人都是产品经理8.0

别再迷信Prompt了，这才是Agent的真正战场

文章指出随着大模型推理能力的提升，Prompt Engineering在Agent开发中的权重已大幅下降，核心竞争转向工作流编排、记忆管理和自动化评估等系统工程能力。

2026-01-25 23:46

产品设计人人都是产品经理8.0

AI项目能跑起来的前提，是先把AI降级

文章指出AI项目落地的关键在于将AI降级，优先梳理业务流程与数据治理，通过真实招聘案例阐述了如何构建可控的数据闭环来发挥AI价值。

2026-01-25 23:46

AI/ML强少来了8.0

有意思小周刊No.163（2026.01.26）：AI_Coding 长文分享：如何真正把工具用起来，从原理到实践

该周刊精选了淘宝订单体验优化、AI编程工具深度实践、多端复用架构及大模型安全测试等技术文章，重点涵盖了从AI工具底层原理到上下文工程实战及安全对抗测试的系统性内容。

2026-01-26 00:30

AI/ML阿里云开发者8.0

RTP-LLM 在相关性大模型中的推理优化最佳实践

文章分享了淘宝搜索场景下基于RTP-LLM框架进行大模型推理优化的实践，详细介绍了Proxy负载均衡、批次内KV-Cache复用及MoE Kernel动态调优等关键技术，成功在严苛时延下落地了3.5B MoE模型。

2026-01-26 00:31

其他前端早读课8.0

【早阅】@Addy Osmani：在 Google 工作 14 年得到的 21 条经验

Google 资深工程师 Addy Osmani 分享了 14 年工作生涯中总结的 21 条经验，涵盖了从用户思维、技术选择、团队协作到个人成长的多个维度，强调了软技能和工程思维在职业发展中的重要性。

2026-01-26 01:02

AI/ML阶跃星辰8.0

印奇十答：技术路径、公司发展及 AI 产业判断

印奇阐述阶跃星辰与千里科技的战略协同，强调以基础模型为核心，通过AI与车、手机等终端的结合探索具身智能及商业化闭环。

2026-01-26 01:04

其他晚点LatePost8.0

在喧嚣中，看见另一种造车逻辑

文章分析了极氪汽车在 CES 展会的表现及其背后的造车逻辑，强调其凭借吉利技术积淀、全球化研发和“笨功夫”在高端市场取得突破。

2026-01-26 02:06

AI/MLHugging Face8.0

使用 Hugging Face 轻松构建并共享 ROCm 内核

文章介绍了如何使用 Hugging Face 的 kernel-builder 和 kernels 库，将针对 AMD GPU 优化的自定义 ROCm 内核（以 GEMM 为例）构建、集成到 PyTorch 中并发布到社区。

2026-01-26 03:09

AI/ML网易科技8.0

印奇再上牌桌，阶跃融资50亿，中国AGI战局进入“老兵对决”

文章报道了印奇出任阶跃星辰董事长及公司完成超50亿B+轮融资的行业动态，分析了中国AGI领域的战局变化及印奇从AI 1.0到AI 2.0的创业转型。

2026-01-26 03:11

AI/ML印记中文8.0

AI 周刊 #068 - Clawdbot：个人 7 X 24 AI 助手，智谱开源 GLM-4.7-Flash

本期 AI 周刊重点介绍了 Clawdbot 开源助手、智谱 GLM-4.7-Flash 模型以及多项 Claude Code 与 RAG 技术的最佳实践，汇总了最新的 AI 开发工具与深度分析文章。

2026-01-26 03:37

其他暗涌Waves8.0

何愚：三年后再吃5元一碗的牛肉面，深入县域才能保持体感丨2025尾声

黑蚁资本何愚通过重返县域市场的田野调研，分析了中国县域消费者的心理变化、消费模式及商业机会，揭示了在宏观环境变化下县域市场的韧性与潜力。

2026-01-26 04:03

后端架构Founder Park8.0

网易云音乐前 CTO 曹偲：代码越来越不重要，好的架构才是软件工程核心

文章采访了网易云音乐前 CTO 曹偲，探讨 AI 时代下代码重要性的下降及架构核心地位的提升，并介绍了其 AI 架构师产品 Toco AI 如何通过工程化和确定性解决软件复杂性问题。

2026-01-26 04:05

AI/ML机器之心8.0

关于多模态大模型Token压缩技术进展，看这一篇就够了

本文系统综述了多模态大模型（MLLM）中的Token压缩技术，基于压缩位置将其分类并探讨了不同场景下的策略选择指南。

2026-01-26 04:05

AI/ML机器之心8.0

DeepSeek-R1推理智能从哪儿来？谷歌新研究：模型内心多个角色吵翻了

谷歌与芝加哥大学研究发现，大模型推理能力的提升并非仅源于计算步数增加，而是来自内部模拟的「思维社会」结构，即通过多角色对话和观点冲突来探索解空间。

2026-01-26 04:05

工具效率少数派8.0

这么近那么美：周末单日往返欧洲旅游的探索报告

作者详细分享了从伦敦出发进行欧洲单日往返旅行的实践经验，涵盖城市选择、机票攻略、行程规划及精力管理，并深入反思了高频短途旅行对心理和生活状态的影响。

2026-01-26 04:16

AI/ML腾讯科技8.0

AI会带来经济爆发，但引线很长｜Hao好聊论文

文章基于斯坦福经济学家Charles I. Jones的最新论文，探讨了AI对经济增长的长期影响，提出尽管AI潜力巨大，但受限于经济系统中的「薄弱环节」，经济爆发将是跨越数十年的渐进过程。

2026-01-26 04:24

AI/ML新智元8.0

OpenAI不Open！7年功勋老将投奔宿敌，实验室沦为API代工厂

文章报道了OpenAI研究副总裁Jerry Tworek离职一事，分析其出走原因在于公司商业化倾向压制了硬核科研，并探讨了OpenAI面临Scaling Laws边际递减及转型为API代工厂的行业困境。

2026-01-26 05:06

AI/ML量子位8.0

具身智能迎来“统考卷”：上海交通大学发布大规模开源测评集GM-100，致力推动行业标准化

上海交通大学发布了具身智能大规模开源测评集GM-100，包含100个具体任务及13,000条操作轨迹数据，旨在推动行业标准化。

2026-01-26 06:29

AI/ML量子位8.0

“开源版贾维斯”一夜席卷硅谷！Mac mini因它卖爆

文章介绍了由退休亿万富翁Peter Steinberger开发的开源AI助理Clawdbot，该工具能像“贾维斯”一样通过聊天软件调用本地系统权限处理复杂任务，引发了Mac mini的爆单。

2026-01-26 06:36

云计算AI前线8.0

Token洪流的转向：当AI Agent成为Token消耗的主宰，什么样的推理服务基础设施才是刚需

文章深入分析了AI Agent时代Token消耗模式的转变，提出了基于拓扑感知、KVCache为中心的推理基础设施五大核心需求，并介绍了AI Serving Stack开源架构的解决方案。

2026-01-26 07:17

AI/MLAI前线8.0

奥特曼小号泄密：OpenAI代码工作100%交给Codex！工程师才揭底Codex“大脑”运行逻辑，碾压Claude架构？

文章详细揭秘了 OpenAI Codex 的智能体循环核心架构及其上下文管理机制，并介绍了如何利用 PostgreSQL 单主库搭配50个只读副本支撑8亿用户的技术实践。

2026-01-26 07:17

AI/ML大淘宝技术8.0

如何设计一个AI Agent系统

本文从工程视角系统阐述了如何基于大模型设计、实现和落地可控可用的AI Agent系统，涵盖了软件范式演进、核心架构组件及关键工程技术。

2026-01-26 08:51

AI/ML深网腾讯新闻8.0

百度没有退路 | 深网

文章深度分析了百度在2026年面临的业务困境与转型战略，阐述了搜索广告收入下滑背景下，百度通过组织架构调整、全栈AI布局及芯片上市押注AI未来的决绝。

2026-01-26 09:08

工具效率MiniMax 稀宇科技8.0

MiniMax M2.1 × Clawdbot ：打造开源 AI 助手，构建超级智能体工作流

文章介绍了开源项目 Clawdbot 如何结合 MiniMax M2.1 模型构建高效的“超级智能体”工作流，通过具体的用例展示了其在自动化任务处理、多平台集成及低成本高效率方面的优势。

2026-01-26 09:18

AI/MLCSDN8.0

对外卖Copilot，对内用Claude？微软内部正在悄悄换“编程大脑”

文章报道了微软在内部工程团队及非技术岗位大规模引入 Anthropic 的 Claude Code，并与 GitHub Copilot 进行对比测试，暗示微软正寻求 AI 编程能力的多元化，不再仅依赖 OpenAI。

2026-01-26 09:58

其他CSDN8.0

硬核！程序员爆肝6个月从零手搓486主板，画原理图、焊芯片全搞定，Linux、DOOM、Win3.1都跑起来了

程序员 Maniek86 历时6个月从零设计并自制了 Intel 486 架构主板 M8SBC-486，成功运行 Linux、DOS 及 DOOM 等经典游戏，并将全部源码与设计文件开源。

2026-01-26 09:58

AI/MLAI科技大本营8.0

用人类脑电波教 AI 开车，这位清华 90 后学者直言隐式信号里藏着 AGI 的关键 | 万有引力

清华大学助理教授龚江涛分享了其团队在 NeurIPS 2025 发表的研究成果 E³AD，通过采集人类驾驶员的脑电波（EEG）来增强端到端自动驾驶模型的风险预判能力。

2026-01-26 10:00

工具效率得物技术8.0

AI编程实践：从Claude Code实践到团队协作的优化思考｜得物技术

文章基于得物技术团队的Claude Code实践，探讨了如何通过结构化对话流、Plan模式及子代理协作构建人机协作的新型开发范式，旨在解决传统开发中的上下文切换与知识传递痛点。

2026-01-26 10:30

AI/ML量子位8.0

瑞幸背后的芯片，藏不住了

文章报道了国产通用GPU公司天数智芯发布彤央系列边端算力产品，并披露了其对标英伟达的架构路线图及商业落地情况。

2026-01-26 11:38

其他创业邦8.0

三位清华博士同学毕业即创业，十年苦研CAR-T创新药，收获10亿大单

文章讲述了清华博士团队十年深耕CAR-T技术，从实验室创业到拿下10亿大单并冲刺科创板的历程，分析了其技术布局与商业策略。

2026-01-26 11:52

AI/MLDatawhale8.0

信息量很大！印奇出任阶跃星辰董事长的首次深度访谈

本文是印奇出任阶跃星辰董事长后的深度访谈，阐述了他对AI 2.0时代的战略思考，分析了大模型竞争的残酷性及商业模式选择。

2026-01-26 15:27

AI/ML量子位8.0

Skills刚火，就有零Skill的Agent来了…

文章介绍了云玦科技提出的“原位自进化”Agent框架，该Agent能在推理阶段自主生成并复用工具，无需人类预设，在多项高难评测中表现优异并已开源。

2026-01-26 15:36

⚡ 快速浏览

创业邦6.0