奔跑的高达

技术日报

2026-03-31

✍️ 主编按语

{
  "title": "GPT-5攻克数学难题,大模型商业逻辑迎来巨变",
  "content": "# AI重塑科研与商业:从攻克30年数学难题到MaaS盈利范式确立\n\n今天的科技圈被两股力量撕裂又重组:一边是AI在纯科学领域展现出的「神之直觉」,88岁的算法泰斗高德纳都被Claude与GPT联手填平了30年的数学大坑;另一边则是商业模式的剧烈分化,智谱用财报证明技术溢价远比价格战有效,而Anthropic则演示了AI如何像真正的工程师团队一样独立交付软件。与此同时,前端在Pretext的带领下试图摆脱CSS的束缚,英伟达和Kimi则在底层架构上疯狂内卷。这是一个智能外挂与工程进化并存的疯狂时代。\n\n### AI科学突破与范式转移\n\n[88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=1&sn=f3cce03507f65193fa24814d2839dbdd)\n\n这绝对是AI科研史上的高光时刻。困扰数学界30年的「哈密顿分解」难题,被Claude 4.6和GPT-5.4以多智能体协作的方式彻底攻破。更令人咋舌的是,GPT-5.4直接输出了一篇14页、无需任何修改的LaTeX格式论文。这不仅是算力的胜利,更是「AI Agent工作流」的胜利——人类负责定义问题边界和验证审美,AI负责在无限搜索空间中填补深渊。这意味着未来的数学家,其核心竞争力将不再是计算,而是提出问题的直觉和设计系统的能力。\n\n[Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)](https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488299&idx=2&sn=312689891b6e96e8d6169ed7b3485538)\n\n杨植麟在论坛上重新定义了「规模化」的内涵。他认为未来的效率提升不只靠堆算力,更在于「Agent集群」的协作能力。通过让100个Agent并行处理复杂任务,执行时间不再随复杂度指数增长,而是保持平稳。这种将人类组织结构映射到硅基智能的思路,或许是通往AGI的一条务实路径。此外,他提到的「注意力残差」架构,也是对十年前ResNet思想的跨时空致敬,证明了基础技术的回溯与重构依然是创新的源泉。\n\n### 工程化与商业落地\n\n[6小时,200美元,0人类代码:Anthropic把AI编程推过了临界点](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=2&sn=ff2ada2e398e6b4992bfa5b62ece53e1)\n\n如果说写代码是AI的「生成力」,那么能交付项目就是AI的「工程力」。Anthropic的实验表明,单打独斗的AI只能产出「AI Slop」(样子货),而通过Planner、Generator和Evaluator的多智能体分工,AI团队可以像真正的软件公司一样,经历10轮迭代、自我纠错并最终交付。这标志着AI编程从「玩具阶段」迈入了「工业阶段」——生产关系的升级远比生产力提升更让人不安。\n\n[智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了](https://www.qbitai.com/2026/03/394135.html)\n\n在行业深陷价格战泥潭时,智谱的财报是一份清醒剂。全年营收7.24亿元,逆势涨价83%后调用量不降反升,证明在ToB领域,效果永远比价格敏感。智谱提出的「Token架构力(TAC)」概念极具前瞻性:未来的竞争不是比谁更便宜,而是比谁能帮客户把智能转化为经济价值。这也印证了技术公司的终极护城河,依然是不可替代的智能上限。\n\n### 架构进化与底层提速\n\n[不加算力,只改一个算法:Muon在万亿MoE模型中最高2倍加速](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=2&sn=dc80269b56b462cf512c3754b935ba2)\n\n普林斯顿和纽约大学团队提出的Gram Newton-Schulz算法,给万亿参数模型的训练打了一针强心剂。通过在更小的Gram矩阵上进行迭代,并利用对称矩阵优化,该算法在不牺牲精度的情况下,将优化器耗时降低了40-50%。在硬件成本高企的今天,这种「算法级提效」比单纯堆GPU更具战略意义,也为MoE架构的进一步普及铺平了道路。\n\n[The Batch: 932 | 开源速度怪兽](https://mp.weixin.qq.com/s?__biz=MzIxNzI0ODE4Nw==&mid=2247498261&idx=1&sn=c6250382392ea92e95d636328c88b4ee)\n\n英伟达发布的Nemotron 3 Super 120B-A12B,不仅开源了权重,更展示了软硬件协同的极致。Mamba-2、Transformer与MoE的混合架构,配合NVFP4低精度训练,使其在生成速度上达到了惊人的442 token/秒。英伟达这招「开源换生态」的棋局深远:用最适配自家GPU的模型,牢牢锁定开发者在Cuda体系内,对抗中国开源模型和华为昇腾生态的潜在威胁。\n\n### 前端与量子计算的跨越\n\n[前端大神 Cheng Lou 开源新项目Pretext ,获两千万人围观!前端要进入“无 CSS 时代”了](https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247616028&idx=1&sn=e3a95a0ce95fe37e7e90d5f675dd9f35)\n\n前端圈沸腾了。Cheng Lou的Pretext项目试图彻底解放文本排版,完全绕过DOM,用暴力计算在用户代码层实现精确布局。这不仅是性能的500倍提升,更是开发哲学的转变——从「浏览器告诉我长什么样」到「我告诉它该怎么长」。在AI生成内容日益复杂的今天,这种对像素级的控制力,或许是下一代高动态UI的入场券。\n\n[1毫秒级,最快的人体动作捕捉服!开源715万帧数据集| CVPR'26](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=3&sn=4fbd3b99df554b9013485c5e8ccbe9ae)\n\n厦门大学与上科大团队研发的FlashCap,将动作捕捉的帧率推向了1000Hz的毫秒级。通过闪烁LED和事件相机的巧妙结合,他们在低成本下解决了高速运动中的插值失真问题。这不仅对体育竞技分析意义重大,更为具身智能机器人提供了宝贵的高频动态数据基石——要让机器人像人一样运动,首先得看清人类运动的每一毫秒。\n\n### 评估、资本与新风口\n\n[ICLR 2026 | 大模型当裁判也「翻车」?北大清华联合多校提出TrustJudge](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=3&sn=ce5e133b7ab1863f3b633b1af0764d11)\n\n当LLM-as-a-Judge成为行业标准时,裁判本身的公正性却成了大问题。北大清华团队发现,现有模型在评分和成对比较中存在高达23%的不一致性,甚至出现「A>B>C>A」的逻辑循环。TrustJudge通过利用模型内部完整的概率分布而非离散分数,大幅降低了这种「晕轮效应」。这提醒我们,在追求模型能力的同时,评估体系的基准刻度也需要重新校准。\n\n[玻色量子完成10亿元B轮融资,“十五五”规划专用量子计算机赛道唯一代表!](https://www.qbitai.com/2026/03/393856.html)\n\n量子计算正在从实验室走向产业化。玻色量子完成10亿元融资,标志着「专用量子计算机」路线获得了资本的强背书。与通用量子计算相比,专用路线在特定场景(如组合优化、AI加速)更具落地可行性。玻

🔥 热门文章 (44 篇)

AI/ML月之暗面 Kimi9.0

Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)

Kimi 创始人杨植麟在2026中关村论坛发表演讲,阐述了大模型发展的核心在于规模化定律,并从 Token 效率、上下文长度及 Agent 集群三个维度提出提升效率的方法,同时开源了 K2.5 模型及注意力残差架构。

AI/MLDeeplearningAI9.0

The Batch: 932 | 开源速度怪兽

英伟达发布了具有竞争力的开源大语言模型Nemotron 3 Super 120B-A12B,采用Mamba-2与Transformer混合架构及多token预测技术,在速度与长上下文处理上表现优异,旨在巩固其AI生态壁垒。

AI/ML大模型智能8.0

一篇大模型Agents工作流优化最新综述

文章解读了RPI与IBM联合发布的LLM Agents工作流优化综述,提出了Agentic Computation Graph (ACG)统一框架,系统阐述了从静态模板搜索到动态运行时适应的优化方法分类及评估标准。

AI/ML阿里云开发者8.0

CoPaw深度解析:源码架构和功能实践

文章详细解析了通义实验室开源的CoPaw桌面Agent工具的技术架构,重点阐述了Agent Skills标准以及CoPaw的模块化设计和部署实践。

AI/ML腾讯云开发者8.0

Harness Engineering 来了,SDD 还有意义吗?

文章深入探讨了 Harness Engineering 与规范驱动开发(SDD)的关系,指出两者是互补而非竞争关系,强调在 AI 时代构建高质量的规范体系对于 Agent 可靠工作至关重要。

AI/ML数字生命卡兹克8.0

如何在AI时代,找回你被埋没的创造力。

文章分析了AI时代人们面对工具感到迷茫的根本原因是创造力的被遗忘,并提出了六个具体步骤(寻找痛点、缩小范围、快速原型、跨领域连接、留白思考、关注自我)来帮助读者重拾创造本能。

工具效率深思圈8.0

获 4000 万美元融资:AI 生产力悖论的破局者

文章分析了 Highlight AI 获得 4000 万美元融资的案例,探讨了当前企业面临的“AI 生产力悖论”,即 AI 工具虽增加内容产出却未提升实际效率。Highlight AI 旨在通过构建“共享智能层”来解决工具间的协调瓶颈,实现人类与 AI Agent 的无缝协作。

AI/ML腾讯科技8.0

不好意思,机器人无法仅靠视觉理解世界

文章是生数科技创始人朱军的访谈录,深入探讨了以“视频”为核心路径的世界模型技术路线,分析了其与3D仿真等路径的差异,并展望了未来在机器人及通用智能体领域的落地前景。

AI/ML极客公园8.0

AI 加速,短剧比想象中更短命

文章深入分析了AI技术如何通过重构成本结构和生产逻辑,加速了真人短剧行业的洗牌与衰落,并推动了AI短剧的崛起。

AI/ML奇舞精选8.0

Harness Engineering 来了,SDD 还有意义吗?

文章探讨了在 AI 时代,规范驱动开发(SDD)与新兴的 Harness Engineering 之间的关系,论证了 Spec 体系作为 AI Agent 工作的核心 Scaffolding 的重要性,指出两者是互补而非竞争关系。

AI/MLDatawhale8.0

刚刚,Claude Code源码泄漏了!

文章报道了 Claude Code 的源代码通过 npm 注册表泄露的消息,并提供了下载链接及代码结构初步分析。

AI/MLMartin Fowler8.0

Encoding Team Standards

文章探讨了如何将团队的隐性标准转化为可执行的AI指令,以解决不同开发人员在使用AI工具时产出不一致的问题。

快速浏览

白鲸出海6.0

游戏手柄出海,一年营收近10亿

文章分析了中国游戏手柄品牌 GameSir(小鸡快跑)如何通过产品创新、生态合作及本地化营销实现年营收近10亿的出海成功路径。

Spring Blog6.0

This Week in Spring - March 31st, 2026

这是一篇Spring生态的周报,汇总了包括Spring Boot 4、Spring AI 2.0及Spring Modulith在内的多个版本发布和安全修复,并分享了相关的技术视频和文章资源。