人形机器人全栈开源，GPT-5.2攻克数学猜想

2026-01-19

✍️ 主编按语

今日技术焦点：当 AI 学会“做数学”与“造身体”，硬件与算力的边界正在重塑

今天的科技圈弥漫着一股“底层重构”的兴奋感。从基础软件架构的极致优化，到 AI 在数学推理领域的里程碑式突破，再到人形机器人彻底开源的工业化尝试，我们看到的不再是单一技术的单点突进，而是系统级工程的全面爆发。尤其是 AI 正在从“聊天玩具”进化为严谨的“数学家”和实体的“工程师”，这预示着 2026 年的技术竞争将进入深水区。

AI 突破：从数学证明到模型记忆的重构

45年数论猜想被GPT-5.2 Pro独立完成证明，陶哲轩：没犯任何错误

GPT-5.2 Pro 独立证明了困扰数学界 45 年的埃尔德什猜想，并经菲尔兹奖得主陶哲轩验证“未犯任何错误”。这不仅是一个技术胜利，更是一个信号：AI 已经具备了处理严密逻辑和深层抽象的能力。虽然陶哲轩冷静地指出了幸存者偏差，提醒我们 AI 在埃尔德什问题上的真实成功率仅为 1%-2%，但这 1% 的含金量足以证明大模型正在突破“语言概率拟合”的天花板，向真正的逻辑推理迈进。这将对未来的自动定理证明和科学计算产生深远影响。

谷歌刚掀了模型记忆的桌子，英伟达又革了注意力的命｜Hao好聊论文

如果说 GPT-5.2 是在智力上的突破，那英伟达的这篇论文则是在算力架构上的“造反”。谷歌的 Nested Learning 还在探索如何让模型在推理时更新记忆，而英伟达提出的 TTT-E2E（Test-Time Training）则更激进：直接用“学习”替代“记忆”。它不再通过昂贵的 KV Cache 存储上下文，而是通过端到端的梯度更新，将信息直接“刻进”神经元的权重里。这种“把记忆当学习”的范式，彻底打破了 Transformer 的二次方复杂度诅咒，让 128K 长上下文的推理延迟不再随长度增加而飙升。这对于需要处理超长文本的 Agent 应用来说，无疑是架构级别的重大利好。

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

同样是为了解决超长上下文问题，MIT 选择了另一条“软件定义”的道路。他们提出的 RLM（递归语言模型）不需要修改模型架构，而是给模型配备了一个 Python 交互环境。模型像程序员一样，通过编写代码、递归调用、变量存储来处理千万级 Token 的超长文本。这种“外包”思路巧妙地绕过了物理上下文窗口的限制，虽然在极端复杂度下成本会升高，但它为现有的闭源模型提供了一种即插即用的超长文本解决方案，大幅降低了落地门槛。

效果&性能双突破！快手 OneSug 端到端生成式框架入选 AAAI 2026

在工业界，生成式 AI 正在重构传统的搜广推架构。快手提出的 OneSug 框架，颠覆了传统的“召回-粗排-精排”级联模式，用统一的生成式模型直接输出查询建议。这种端到端的思路不仅消除了各阶段目标不一致的弊端，更将在线推理耗时降低了 43.2%。这表明，生成式 AI 的战火已经从 Chatbot 烧到了更核心的商业推荐系统，未来谁能更好地用大模型“读懂”用户意图，谁就能在电商转化率上占据制高点。

硬件与基础架构：开源机器人与数据库内核进化

哈工大系闯出人形机器人黑马：成立不到一年，全栈开源3m/s原型机，小米商汤都投了

人形机器人赛道迎来了一颗“开源炸弹”。成立不到一年的“萝博派对”将一款能达到 3m/s 跑步速度的原型机全栈开源，连硬件图纸、EBOM 清单和避坑指南都毫无保留。这种“全裸式”开源，直击行业痛点——长期以来，人形机器人开发受困于高昂的硬件门槛和碎片化的工程经验。通过将 Know-how 沉淀为公共基础设施，他们试图把行业从“各自为战”的重复造轮子中拉出来，专注于场景落地。这标志着具身智能正从极客的炫技玩具，迈向标准化、规模化的产业新阶段。

小红书MySQL内核秒杀能力重磅再升级

在电商大促的场景下，数据库的性能就是生命线。小红书通过对 MySQL 内核的深改造，实现了“合并秒杀”方案，将热点行更新性能提升了 5 倍以上。其核心思想是将多个事务的 Update 合并为一个事务提交，通过 Leader-Follower 模式在缓存中聚合扣减。这种对传统数据库事务模型的激进修改，证明了在特定极端场景下，通用数据库的内核定制化依然能挖掘出巨大的性能红利。对于高并发业务的开发者来说，这无疑是一个极具参考价值的实战案例。

估值翻倍破150亿美元：AI数据库新贵ClickHouse融资4亿美元，挑战Snowflake与Databricks

老牌列式数据库 ClickHouse 在 AI 时代焕发了第二春。新一轮融资估值翻倍至 150 亿美元，其核心逻辑在于“实时分析”成为了 AI 应用的刚需。无论是智能体的实时反馈，还是海量日志的分析处理，都需要 ClickHouse 这种高效的底层支撑。收购 Langfuse 进一步补齐了 AI 输出安全的能力，这说明单纯的存储已不够，未来的数据库竞争将是“存储+分析+AI 安全”的综合较量。

行业动态：资本在“禁忌”中下注

速递｜红杉资本“覆盖赛道”押注Anthropic，新一轮融资目标约250亿美元，预计最快今年IPO

红杉资本打破风投界“不投直接竞对”的禁忌，在已经投资 OpenAI 和 xAI 的情况下，又要领投 Anthropic。这种“下注全桌”的策略，与其说是看好某一家，不如说是为了对冲 AGI（通用人工智能）路径的不确定性。随着 Anthropic 估值飙升至 3500 亿美元，AI 基础设施的军备竞赛已经进入白热化。对于创业者而言，这意味着巨头圈地尚未结束，但在夹缝中寻找差异化应用窗口期正在迅速缩短。

纵观今日要闻，无论是 AI 的数学证明、推理架构的革新，还是机器人硬件的开源，都在指向同一个趋势：技术的“黑盒”正在被打开，工程化和标准化的能力成为竞争高地。未来的赢家，不仅要有最聪明的模型，更要有最高效的工程实现。

🔥 热门文章 (47 篇)

AI/ML腾讯科技9.0

谷歌刚掀了模型记忆的桌子，英伟达又革了注意力的命｜Hao好聊论文

文章解读了英伟达提出的端到端测试时训练（TTT-E2E）技术，主张以模型参数更新替代传统注意力机制的记忆缓存，旨在解决长上下文处理中的内存与延迟瓶颈。

2026-01-19 13:42

数据库小红书技术REDtech9.0

小红书MySQL内核秒杀能力重磅再升级

小红书数据库团队针对电商高并发秒杀场景，自研MySQL内核“合并秒杀”方案，通过事务合并与锁优化将热点行更新性能提升5倍以上，同时实现了对业务和生态组件的无感知透明升级。

2026-01-19 10:04

AI/MLZ Potentials9.0

速递｜红杉资本“覆盖赛道”押注Anthropic，新一轮融资目标约250亿美元，预计最快今年IPO

红杉资本打破风投禁忌，计划重仓投资OpenAI竞争对手Anthropic，此举旨在覆盖AGI赛道，且Anthropic最快可能于今年IPO。

2026-01-19 03:00

数据库Z Potentials9.0

速递｜估值翻倍破150亿美元：AI数据库新贵ClickHouse融资4亿美元，挑战Snowflake与Databricks

AI数据库公司ClickHouse获4亿美元融资，估值翻倍至150亿美元，正通过收购Langfuse加强AI安全性，并挑战Snowflake与Databricks。

2026-01-19 03:00

AI/ML量子位9.0

哈工大系闯出人形机器人黑马：成立不到一年，全栈开源3m/s原型机，小米商汤都投了

哈工大系团队萝博派对宣布全栈开源其高速双足人形机器人“萝博头原型机”，并公布硬件图纸、算法代码及工程Know-how，旨在降低行业开发门槛并推动具身智能落地。

2026-01-19 09:09

AI/ML量子位9.0

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

MIT发布新研究，通过无需改变模型架构的递归推理技术，解锁大模型千万级上下文处理能力。

2026-01-19 03:59

AI/ML快手技术9.0

效果&性能双突破！快手 OneSug 端到端生成式框架入选 AAAI 2026

快手提出的端到端生成式查询推荐框架 OneSug 入选 AAAI 2026，该框架统一了召回、粗排和精排阶段，在电商搜索场景中显著提升了效果指标并降低了推理延迟。

2026-01-19 04:19

AI/ML量子位9.0

45年数论猜想被GPT-5.2 Pro独立完成证明，陶哲轩：没犯任何错误

文章报道了GPT-5.2 Pro独立完成45年数论猜想证明的突破，并引用陶哲轩的评价证实其准确性。

2026-01-19 08:29

AI/ML创业邦8.0

星动纪元创始人陈建宇：要实现万亿级市场，核心是打造上限更高、更通用的机器人

星动纪元创始人陈建宇阐述了打造通用人形机器人的路径，强调具身模型的三次进化及软硬一体全栈自研的重要性，并分享了在工业和服务场景的商业化落地实践。

2026-01-19 10:38

云计算CSDN8.0

寻找“代码诗人”与“破壁者”：2025鲲鹏金奖项目背后的青年图谱

本文回顾了2025年鲲鹏创新大赛金奖项目，通过高校与企业的典型案例，展示了中国计算产业在异构计算、底层安全和云基础设施等领域的创新应用与生态演进。

2026-01-19 06:31

AI/ML大模型智能8.0

别搞混了！RewardModel≠Critic：PPO中的双重评估机制解析

文章深入解析了PPO训练中Reward Model（裁判）与Critic Model（教练）的区别，阐明了Critic在解决信用分配问题和降低方差方面的不可替代性。

2026-01-18 17:27

AI/MLZ Potentials8.0

深度｜OpenAI产品经理谈Codex爆发式增长背后的AI协作：实现AGI级生产力的真正瓶颈是人类的打字速度！

文章通过访谈OpenAI Codex产品负责人，揭示了Codex爆发式增长背后的产品策略，即从云端异步转向本地IDE集成，并探讨了未来AI Agent的主动性协作模式及人机交互的物理瓶颈。

2026-01-19 03:00

AI/ML智东西8.0

硅谷AI大佬迁徙图谱：32人易职，有人反复横跳，苹果最伤

文章复盘了2025年硅谷AI人才大战，详细统计了Meta、OpenAI、苹果等巨头间32位高管的流动情况，分析了各公司的战略调整与布局。

2026-01-19 15:03

AI/ML百度Geek说8.0

了解你的 AI 编码伙伴：Coding Agent核心机制解析

本文系统解析了 Coding Agent 的核心工作机制，包括身份定义、工具调用及环境感知等模块，并探讨了上下文管理与成本控制等生产环境关键技术。

2026-01-19 10:06

AI/ML人人都是产品经理8.0

为什么不少AI问答助手，员工问过一次就不再用了？

文章剖析了企业AI问答助手落地失败的核心原因，指出不应让AI承担业务判断、知识治理和风险承诺责任，上线前需明确应用边界。

2026-01-18 23:45

数据库dbaplus社群8.0

40+SQL优化高频误区：不懂底层原理，难怪越改越慢

文章系统总结了SQL优化中40+个高频误区，涵盖索引设计、查询写法、数据库配置、事务锁及运维等维度，强调需跳出“局部最优”陷阱，结合底层原理进行全链路性能优化。

2026-01-18 23:16

AI/ML印记中文8.0

AI 周刊 #067 - Claude Cowork 来袭；Vercel 开源 JSON Render 让 AI 实时生成 UI

本期 AI 周刊涵盖了 Claude Cowork、Vercel JSON Render 等前沿 AI 工具发布，以及 AI Agent 最佳实践、多智能体架构教程和行业现状深度思考。

2026-01-19 04:54

AI/MLCSDN8.0

从 DeepMind 到投身具身智能，王佳楠：算法最终还是要服务真实世界｜万有引力

前 DeepMind 研究员、星尘智能副总裁王佳楠深度剖析具身智能的发展路径，探讨快慢系统架构、数据瓶颈及世界模型的实际应用价值。

2026-01-19 06:31

AI/ML创业邦8.0

Anthropic刚发布了一份「AI抢饭碗报告」：学历越高越「被抢」

文章深入解读了Anthropic发布的AI经济指数报告，揭示了AI对高学历、高复杂度工作的替代效应及人机协作新模式，并探讨了技术鸿沟与职场去技能化风险。

2026-01-19 03:29

AI/ML魔搭ModelScope社区8.0

从对话到Agent：大模型工具调用能力的量化评测

文章介绍了 EvalScope 框架在评测大模型工具调用能力上的应用，重点量化评估“是否触发调用”与“参数准确性”两大维度。

2026-01-19 12:46

AI/MLAI科技评论8.0

用第一性原理超越AlphaFold：告别蛋白质工程的「碰运气」时代

文章介绍了华南理工大学杨晓锋教授关于利用第一性原理和AI技术重塑蛋白质设计与制造的观点，重点探讨了从“内推”向“外推”的技术范式转变及高通量制造闭环的构建。

2026-01-19 06:08

AI/MLFounder Park8.0

对话阶跃AI：做桌面 Agent，要比 Claude Cowork 往前一步

文章深度访谈了阶跃AI桌面伙伴的产品负责人，探讨了本地桌面Agent的产品定位、与Claude Cowork的差异、通过「妙计」和「主动服务」解决用户认知及渗透难题的思考，以及模型能力与产品体验的平衡。

2026-01-19 09:59

AI/MLInfoQ 中文8.0

拒绝传统 Router“瞎指挥”，多智能体如何实现智能任务分配？

腾讯云开源了基于Reasoning-centric的4B参数智能路由模型TCAR，旨在解决传统Router在企业多Agent系统中无法应对跨域、冲突及模糊任务分配的问题。

2026-01-19 07:04

AI/ML极客公园8.0

字节扣子 2.0 发布，我们深挖了它这两年的生长真相

文章复盘了字节跳动扣子产品两年的发展历程，剖析了其从对话Bot到工作流，再到定位为“职场AI+Vibe Coding”的战略转型与底层逻辑。

2026-01-19 10:04

前端开发CSDN8.0

告别IE 10，十年等待，jQuery 4.0终于发布！

文章详细介绍了jQuery 4.0.0正式版的发布，核心在于移除IE支持、迁移至ES Modules、清理废弃API及强化安全性。

2026-01-19 06:31

其他AI前线8.0

最烦做演讲！黄仁勋曝英伟达养了61个CEO、从不炒犯错员工：CEO是最脆弱群体

英伟达CEO黄仁勋在访谈中分享了其独特的“61位CEO”管理哲学、对犯错包容的企业文化，以及对未来AI计算机发展模式和工作岗位变革的深度见解。

2026-01-19 08:26

AI/ML硅星人Pro8.0

语境才是真正的护城河

文章提出在模型商品化的背景下，真正决定AI产品竞争力的不再是模型本身，而是无法下载的“语境”积累；通过结构化业务知识、用户洞察和历史经验，构建独特的语境库，才能形成真正的技术护城河。

2026-01-19 01:53

AI/ML量子位8.0

全球首个负载100斤的真实持续干活机器人，来自银河通用

银河通用发布全球首个负载50公斤的全自主工业级重载具身智能机器人Galbot S1，并已在宁德时代等核心产线投入应用，标志着具身智能正式迈入工业重载时代。

2026-01-19 02:04

数据库架构师之路8.0

MySQL，InnoDB快照读，在RR和RC下有何差异？（第10讲，超硬核）

文章详细解析了MySQL InnoDB引擎在不同隔离级别（RC和RR）下快照读的差异，通过多个具体案例说明了Read View的生成时机及其对事务读取数据的影响。

2026-01-19 12:03

其他笔记侠8.0

何帆开年演讲：这，是年轻人的红利！

文章基于2025年的宏观背景，提出“颜值革命”是反内卷的新思路，强调年轻人通过审美力定义潮流，并论证了各行业利用审美力重构商业逻辑的可能性。

2026-01-19 13:30

AI/ML乌鸦智能说8.0

复盘50+个实战案例，终于找到了AI产品落地的关键

文章基于两位资深AI专家对50+实战案例的复盘，指出AI产品落地的核心在于理解其“非确定性”，并提出放弃一步到位的幻想，转向“渐进式自主”的产品哲学。

2026-01-19 11:02

工具效率花叔8.0

那个写出20万+阅读的写作Skill，我用扣子免费公开了

文章详细介绍了如何利用扣子（Coze）的“技能”功能，将个人专业的写作方法论和历史数据转化为可复用的AI技能，实现了从Prompt工程到专业技能封装的转变。

2026-01-19 03:33

AI/ML51CTO技术栈8.0

这家西方开源大模型公司，开源出了DeepSeek-V3背后的架构！头部模型表现都差不多了，Mistral CEO自曝如何赚钱

Mistral AI CEO Arthur Mensch 接受采访，指出大模型正因技术同质化而走向商品化，并阐述了通过开源战略和企业定制化服务盈利的逻辑。

2026-01-19 07:59

AI/ML硅谷1018.0

探展CES 2026车企：“读懂”世界，Physical AI的“GPT时刻”

文章基于CES 2026现场，深入探讨了Physical AI如何重塑汽车产业，分析了英伟达、高通等巨头的布局，并以吉利为例详细拆解了车企通过AI、算力、卫星等构建全栈生态的野心。

2026-01-19 03:38

AI/MLDatawhale8.0

死了么？还没！听我们说说Eigent产品背后的故事

文章讲述了Eigent产品团队从CAMEL框架出发，经历多次技术探索与方向调整，最终推出桌面端多智能体协作产品Eigent的历程与思考。

2026-01-19 14:56

前端开发前端早读课8.0

【第3643期】从零理解富文本编辑器：现代编辑器的核心原理与实现思路

文章深入剖析了现代富文本编辑器的底层设计原理，详细阐述了文档模型、选区模型、事务处理及渲染机制等核心概念，并对比了浏览器原生能力的局限性。

2026-01-19 01:03

AI/MLInfoQ 中文8.0

Claude Code 之父的自白：非科班、辍学，却要革程序员的命

Claude Code 创建者 Boris Cherny 回顾从 Meta 到 Anthropic 的心路历程，探讨大模型如何重塑软件工程及工程师角色的转型。

2026-01-19 07:04

AI/ML量子位8.0

李飞飞的World Labs联手光轮智能，具身智能进入评测驱动时代！

李飞飞的World Labs与光轮智能达成合作，结合世界模型与仿真基础设施，共同解决具身智能领域的规模化评测难题，标志着行业进入评测驱动时代。

2026-01-19 04:22

AI/MLAI前线8.0

不到百万级，看不见 MCP 的真实问题：创始人亲述这疯狂的一年

MCP 联合创作者 David Soria Parrra 回顾了协议从“桌面玩具”演进为行业事实标准的疯狂一年，深度解析了在规模化、认证机制及与巨头协作中面临的取舍与技术挑战。

2026-01-19 08:26

AI/MLInfoQ 中文8.0

FACTS 基准测试套件问世，用于评估大型语言模型的事实准确性

FACTS团队与Kaggle联合发布了FACTS基准测试套件，通过参数化、搜索、多模态及Grounding v2四个维度系统评估大模型的事实准确性。

2026-01-19 07:04

工具效率The JetBrains Blog8.0

Platform Debugger Architecture Redesign for Remote Development in 2026.1

IntelliJ Platform 在 2026.1 版本重构了调试器架构以支持远程开发，将前端渲染与后端会话分离，介绍了受影响的 API 及插件迁移步骤。

2026-01-19 11:15

DevOps得物技术8.0

Galaxy比数平台功能介绍及实现原理｜得物技术

文章介绍了得物技术团队自研的Galaxy比数平台，旨在解决海量数据迁移场景下的高效比对与精准定位难题，详细阐述了基于Union分组与哈希聚合的实现原理及调度优化策略。

2026-01-19 10:30

AI/ML晚点LatePost8.0

对话自变量王潜：错过图灵奖，要做具身界的 OpenAI

本文是对自变量机器人创始人王潜的深度访谈，讲述了他从错过图灵奖级研究到投身具身智能创业的历程，以及对端到端模型和数据质量的独到见解。

2026-01-19 02:05

AI/ML极客公园8.0

中国互联网大厂的 AI 时代船票争夺战已经开始了

文章分析了字节跳动、阿里巴巴、腾讯三大互联网巨头在AI时代的竞争格局，指出AI时代的“船票”由模型能力、基础设施和入口三部分构成，并评价了各家在“三位一体”战略上的进展与挑战。

2026-01-19 06:05

AI/ML机器之心8.0

租了8张H100，他成功复现了DeepSeek的mHC，结果比官方报告更炸裂

FlowMode工程师成功复现了DeepSeek的mHC架构，通过实验验证了该方案在防止信号爆炸方面的卓越稳定性，并在17亿参数规模下发现比原始报告更严重的信号放大问题。

2026-01-19 08:51

AI/ML腾讯技术工程8.0

有手就行，教你从0到1快速手搓搭建个GUI Agent

文章详细介绍了如何利用Gemini 3 Flash大模型和LangGraph框架，从零开始快速搭建一个具备屏幕理解和自动操作能力的PC GUI Agent。

2026-01-19 09:37

工具效率向阳乔木推荐看8.0

手把手教你用Coze Skills，附赠自己的私藏Skills和AI信息源

本文详细介绍了如何利用字节跳动Coze平台的可视化界面创建和使用AI Skills，以实现复杂任务的自动化封装，并分享了实用的AI信息源抓取技能。

2026-01-19 04:14

⚡ 快速浏览

创业邦6.0