奔跑的高达

人形机器人全栈开源,GPT-5.2攻克数学猜想

2026-01-19

✍️ 主编按语

今日技术焦点:当 AI 学会“做数学”与“造身体”,硬件与算力的边界正在重塑

今天的科技圈弥漫着一股“底层重构”的兴奋感。从基础软件架构的极致优化,到 AI 在数学推理领域的里程碑式突破,再到人形机器人彻底开源的工业化尝试,我们看到的不再是单一技术的单点突进,而是系统级工程的全面爆发。尤其是 AI 正在从“聊天玩具”进化为严谨的“数学家”和实体的“工程师”,这预示着 2026 年的技术竞争将进入深水区。

AI 突破:从数学证明到模型记忆的重构

45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误

GPT-5.2 Pro 独立证明了困扰数学界 45 年的埃尔德什猜想,并经菲尔兹奖得主陶哲轩验证“未犯任何错误”。这不仅是一个技术胜利,更是一个信号:AI 已经具备了处理严密逻辑和深层抽象的能力。虽然陶哲轩冷静地指出了幸存者偏差,提醒我们 AI 在埃尔德什问题上的真实成功率仅为 1%-2%,但这 1% 的含金量足以证明大模型正在突破“语言概率拟合”的天花板,向真正的逻辑推理迈进。这将对未来的自动定理证明和科学计算产生深远影响。

谷歌刚掀了模型记忆的桌子,英伟达又革了注意力的命|Hao好聊论文

如果说 GPT-5.2 是在智力上的突破,那英伟达的这篇论文则是在算力架构上的“造反”。谷歌的 Nested Learning 还在探索如何让模型在推理时更新记忆,而英伟达提出的 TTT-E2E(Test-Time Training)则更激进:直接用“学习”替代“记忆”。它不再通过昂贵的 KV Cache 存储上下文,而是通过端到端的梯度更新,将信息直接“刻进”神经元的权重里。这种“把记忆当学习”的范式,彻底打破了 Transformer 的二次方复杂度诅咒,让 128K 长上下文的推理延迟不再随长度增加而飙升。这对于需要处理超长文本的 Agent 应用来说,无疑是架构级别的重大利好。

真·开外挂!MIT新研究:架构0改动,让大模型解锁千万级上下文

同样是为了解决超长上下文问题,MIT 选择了另一条“软件定义”的道路。他们提出的 RLM(递归语言模型)不需要修改模型架构,而是给模型配备了一个 Python 交互环境。模型像程序员一样,通过编写代码、递归调用、变量存储来处理千万级 Token 的超长文本。这种“外包”思路巧妙地绕过了物理上下文窗口的限制,虽然在极端复杂度下成本会升高,但它为现有的闭源模型提供了一种即插即用的超长文本解决方案,大幅降低了落地门槛。

效果&性能双突破!快手 OneSug 端到端生成式框架入选 AAAI 2026

在工业界,生成式 AI 正在重构传统的搜广推架构。快手提出的 OneSug 框架,颠覆了传统的“召回-粗排-精排”级联模式,用统一的生成式模型直接输出查询建议。这种端到端的思路不仅消除了各阶段目标不一致的弊端,更将在线推理耗时降低了 43.2%。这表明,生成式 AI 的战火已经从 Chatbot 烧到了更核心的商业推荐系统,未来谁能更好地用大模型“读懂”用户意图,谁就能在电商转化率上占据制高点。

硬件与基础架构:开源机器人与数据库内核进化

哈工大系闯出人形机器人黑马:成立不到一年,全栈开源3m/s原型机,小米商汤都投了

人形机器人赛道迎来了一颗“开源炸弹”。成立不到一年的“萝博派对”将一款能达到 3m/s 跑步速度的原型机全栈开源,连硬件图纸、EBOM 清单和避坑指南都毫无保留。这种“全裸式”开源,直击行业痛点——长期以来,人形机器人开发受困于高昂的硬件门槛和碎片化的工程经验。通过将 Know-how 沉淀为公共基础设施,他们试图把行业从“各自为战”的重复造轮子中拉出来,专注于场景落地。这标志着具身智能正从极客的炫技玩具,迈向标准化、规模化的产业新阶段。

小红书MySQL内核秒杀能力重磅再升级

在电商大促的场景下,数据库的性能就是生命线。小红书通过对 MySQL 内核的深改造,实现了“合并秒杀”方案,将热点行更新性能提升了 5 倍以上。其核心思想是将多个事务的 Update 合并为一个事务提交,通过 Leader-Follower 模式在缓存中聚合扣减。这种对传统数据库事务模型的激进修改,证明了在特定极端场景下,通用数据库的内核定制化依然能挖掘出巨大的性能红利。对于高并发业务的开发者来说,这无疑是一个极具参考价值的实战案例。

估值翻倍破150亿美元:AI数据库新贵ClickHouse融资4亿美元,挑战Snowflake与Databricks

老牌列式数据库 ClickHouse 在 AI 时代焕发了第二春。新一轮融资估值翻倍至 150 亿美元,其核心逻辑在于“实时分析”成为了 AI 应用的刚需。无论是智能体的实时反馈,还是海量日志的分析处理,都需要 ClickHouse 这种高效的底层支撑。收购 Langfuse 进一步补齐了 AI 输出安全的能力,这说明单纯的存储已不够,未来的数据库竞争将是“存储+分析+AI 安全”的综合较量。

行业动态:资本在“禁忌”中下注

速递|红杉资本“覆盖赛道”押注Anthropic,新一轮融资目标约250亿美元,预计最快今年IPO

红杉资本打破风投界“不投直接竞对”的禁忌,在已经投资 OpenAI 和 xAI 的情况下,又要领投 Anthropic。这种“下注全桌”的策略,与其说是看好某一家,不如说是为了对冲 AGI(通用人工智能)路径的不确定性。随着 Anthropic 估值飙升至 3500 亿美元,AI 基础设施的军备竞赛已经进入白热化。对于创业者而言,这意味着巨头圈地尚未结束,但在夹缝中寻找差异化应用窗口期正在迅速缩短。

纵观今日要闻,无论是 AI 的数学证明、推理架构的革新,还是机器人硬件的开源,都在指向同一个趋势:技术的“黑盒”正在被打开,工程化和标准化的能力成为竞争高地。未来的赢家,不仅要有最聪明的模型,更要有最高效的工程实现。

🔥 热门文章 (47 篇)

数据库小红书技术REDtech9.0

小红书MySQL内核秒杀能力重磅再升级

小红书数据库团队针对电商高并发秒杀场景,自研MySQL内核“合并秒杀”方案,通过事务合并与锁优化将热点行更新性能提升5倍以上,同时实现了对业务和生态组件的无感知透明升级。

AI/MLFounder Park8.0

对话阶跃AI:做桌面 Agent,要比 Claude Cowork 往前一步

文章深度访谈了阶跃AI桌面伙伴的产品负责人,探讨了本地桌面Agent的产品定位、与Claude Cowork的差异、通过「妙计」和「主动服务」解决用户认知及渗透难题的思考,以及模型能力与产品体验的平衡。

AI/ML硅星人Pro8.0

语境才是真正的护城河

文章提出在模型商品化的背景下,真正决定AI产品竞争力的不再是模型本身,而是无法下载的“语境”积累;通过结构化业务知识、用户洞察和历史经验,构建独特的语境库,才能形成真正的技术护城河。

其他笔记侠8.0

何帆开年演讲:这,是年轻人的红利!

文章基于2025年的宏观背景,提出“颜值革命”是反内卷的新思路,强调年轻人通过审美力定义潮流,并论证了各行业利用审美力重构商业逻辑的可能性。

DevOps得物技术8.0

Galaxy比数平台功能介绍及实现原理|得物技术

文章介绍了得物技术团队自研的Galaxy比数平台,旨在解决海量数据迁移场景下的高效比对与精准定位难题,详细阐述了基于Union分组与哈希聚合的实现原理及调度优化策略。

AI/ML极客公园8.0

中国互联网大厂的 AI 时代船票争夺战已经开始了

文章分析了字节跳动、阿里巴巴、腾讯三大互联网巨头在AI时代的竞争格局,指出AI时代的“船票”由模型能力、基础设施和入口三部分构成,并评价了各家在“三位一体”战略上的进展与挑战。

快速浏览

创业邦6.0

苹果低下了高傲的头颅

文章分析了苹果与谷歌达成AI合作的商业逻辑,指出这是一场互惠互利的临时同盟:苹果借此弥补AI短板和研发时间,谷歌则借此获取高端生态入口和数据。