技术日报

2026-03-31

✍️ 主编按语

{
  "title": "GPT-5攻克数学难题，大模型商业逻辑迎来巨变",
  "content": "# AI重塑科研与商业：从攻克30年数学难题到MaaS盈利范式确立\n\n今天的科技圈被两股力量撕裂又重组：一边是AI在纯科学领域展现出的「神之直觉」，88岁的算法泰斗高德纳都被Claude与GPT联手填平了30年的数学大坑；另一边则是商业模式的剧烈分化，智谱用财报证明技术溢价远比价格战有效，而Anthropic则演示了AI如何像真正的工程师团队一样独立交付软件。与此同时，前端在Pretext的带领下试图摆脱CSS的束缚，英伟达和Kimi则在底层架构上疯狂内卷。这是一个智能外挂与工程进化并存的疯狂时代。\n\n### AI科学突破与范式转移\n\n[88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=1&sn=f3cce03507f65193fa24814d2839dbdd)\n\n这绝对是AI科研史上的高光时刻。困扰数学界30年的「哈密顿分解」难题，被Claude 4.6和GPT-5.4以多智能体协作的方式彻底攻破。更令人咋舌的是，GPT-5.4直接输出了一篇14页、无需任何修改的LaTeX格式论文。这不仅是算力的胜利，更是「AI Agent工作流」的胜利——人类负责定义问题边界和验证审美，AI负责在无限搜索空间中填补深渊。这意味着未来的数学家，其核心竞争力将不再是计算，而是提出问题的直觉和设计系统的能力。\n\n[Kimi 杨植麟「2026 中关村论坛」演讲全文（附视频）](https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488299&idx=2&sn=312689891b6e96e8d6169ed7b3485538)\n\n杨植麟在论坛上重新定义了「规模化」的内涵。他认为未来的效率提升不只靠堆算力，更在于「Agent集群」的协作能力。通过让100个Agent并行处理复杂任务，执行时间不再随复杂度指数增长，而是保持平稳。这种将人类组织结构映射到硅基智能的思路，或许是通往AGI的一条务实路径。此外，他提到的「注意力残差」架构，也是对十年前ResNet思想的跨时空致敬，证明了基础技术的回溯与重构依然是创新的源泉。\n\n### 工程化与商业落地\n\n[6小时，200美元，0人类代码：Anthropic把AI编程推过了临界点](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=2&sn=ff2ada2e398e6b4992bfa5b62ece53e1)\n\n如果说写代码是AI的「生成力」，那么能交付项目就是AI的「工程力」。Anthropic的实验表明，单打独斗的AI只能产出「AI Slop」（样子货），而通过Planner、Generator和Evaluator的多智能体分工，AI团队可以像真正的软件公司一样，经历10轮迭代、自我纠错并最终交付。这标志着AI编程从「玩具阶段」迈入了「工业阶段」——生产关系的升级远比生产力提升更让人不安。\n\n[智谱上市后首份财报：超7.24亿元！国内收入最高大模型公司，MaaS发力了](https://www.qbitai.com/2026/03/394135.html)\n\n在行业深陷价格战泥潭时，智谱的财报是一份清醒剂。全年营收7.24亿元，逆势涨价83%后调用量不降反升，证明在ToB领域，效果永远比价格敏感。智谱提出的「Token架构力（TAC）」概念极具前瞻性：未来的竞争不是比谁更便宜，而是比谁能帮客户把智能转化为经济价值。这也印证了技术公司的终极护城河，依然是不可替代的智能上限。\n\n### 架构进化与底层提速\n\n[不加算力，只改一个算法：Muon在万亿MoE模型中最高2倍加速](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=2&sn=dc80269b56b462cf512c3754b935ba2)\n\n普林斯顿和纽约大学团队提出的Gram Newton-Schulz算法，给万亿参数模型的训练打了一针强心剂。通过在更小的Gram矩阵上进行迭代，并利用对称矩阵优化，该算法在不牺牲精度的情况下，将优化器耗时降低了40-50%。在硬件成本高企的今天，这种「算法级提效」比单纯堆GPU更具战略意义，也为MoE架构的进一步普及铺平了道路。\n\n[The Batch： 932 ｜ 开源速度怪兽](https://mp.weixin.qq.com/s?__biz=MzIxNzI0ODE4Nw==&mid=2247498261&idx=1&sn=c6250382392ea92e95d636328c88b4ee)\n\n英伟达发布的Nemotron 3 Super 120B-A12B，不仅开源了权重，更展示了软硬件协同的极致。Mamba-2、Transformer与MoE的混合架构，配合NVFP4低精度训练，使其在生成速度上达到了惊人的442 token/秒。英伟达这招「开源换生态」的棋局深远：用最适配自家GPU的模型，牢牢锁定开发者在Cuda体系内，对抗中国开源模型和华为昇腾生态的潜在威胁。\n\n### 前端与量子计算的跨越\n\n[前端大神 Cheng Lou 开源新项目Pretext ，获两千万人围观！前端要进入“无 CSS 时代”了](https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247616028&idx=1&sn=e3a95a0ce95fe37e7e90d5f675dd9f35)\n\n前端圈沸腾了。Cheng Lou的Pretext项目试图彻底解放文本排版，完全绕过DOM，用暴力计算在用户代码层实现精确布局。这不仅是性能的500倍提升，更是开发哲学的转变——从「浏览器告诉我长什么样」到「我告诉它该怎么长」。在AI生成内容日益复杂的今天，这种对像素级的控制力，或许是下一代高动态UI的入场券。\n\n[1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=3&sn=4fbd3b99df554b9013485c5e8ccbe9ae)\n\n厦门大学与上科大团队研发的FlashCap，将动作捕捉的帧率推向了1000Hz的毫秒级。通过闪烁LED和事件相机的巧妙结合，他们在低成本下解决了高速运动中的插值失真问题。这不仅对体育竞技分析意义重大，更为具身智能机器人提供了宝贵的高频动态数据基石——要让机器人像人一样运动，首先得看清人类运动的每一毫秒。\n\n### 评估、资本与新风口\n\n[ICLR 2026 | 大模型当裁判也「翻车」？北大清华联合多校提出TrustJudge](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=3&sn=ce5e133b7ab1863f3b633b1af0764d11)\n\n当LLM-as-a-Judge成为行业标准时，裁判本身的公正性却成了大问题。北大清华团队发现，现有模型在评分和成对比较中存在高达23%的不一致性，甚至出现「A>B>C>A」的逻辑循环。TrustJudge通过利用模型内部完整的概率分布而非离散分数，大幅降低了这种「晕轮效应」。这提醒我们，在追求模型能力的同时，评估体系的基准刻度也需要重新校准。\n\n[玻色量子完成10亿元B轮融资，“十五五”规划专用量子计算机赛道唯一代表！](https://www.qbitai.com/2026/03/393856.html)\n\n量子计算正在从实验室走向产业化。玻色量子完成10亿元融资，标志着「专用量子计算机」路线获得了资本的强背书。与通用量子计算相比，专用路线在特定场景（如组合优化、AI加速）更具落地可行性。玻

🔥 热门文章 (44 篇)

AI/ML新智元10.0

88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改

88岁算法高德纳利用Claude 4.6与GPT-5.4等AI模型，成功攻克了悬置30年的“哈密顿分解”数学难题，AI独立产出了通过Lean形式化验证的14页论文。

2026-03-31 04:32

AI/ML新智元9.0

6小时，200美元，0人类代码：Anthropic把AI编程推过了临界点

Anthropic通过多智能体协作架构（Planner、Generator、Evaluator），让Claude在无人类干预下耗时6小时、花费200美元成功交付了完整的软件项目，标志着AI编程从代码生成向项目交付的质变。

2026-03-31 04:32

AI/ML新智元9.0

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

厦门大学与上海科技大学联合提出全球首个1毫秒级人体动作捕捉系统FlashCap，结合闪烁LED与事件相机实现1000Hz捕捉，并开源715万帧数据集及ResPose模型。

2026-03-31 04:32

AI/ML量子位9.0

公司注册10天，估值逾10亿美元！理想智驾大牛刷出具身创投新热度

理想前智驾负责人郎咸朋与阿里前副总裁任庚联手创办具身智能公司昆仑行，公司成立10天估值即超10亿美元，完成三轮融资跻身独角兽。

2026-03-31 15:25

移动开发极客公园9.0

深夜更新，国行 Apple 智能这次真的来了（附上手实测

文章报道了国行 Apple 智能在 iOS 26.4 下的深夜上线与实测情况，涵盖了更新条件、模型供应商猜测及视觉智能等新功能。

2026-03-30 18:27

AI/ML月之暗面 Kimi9.0

Kimi 杨植麟「2026 中关村论坛」演讲全文（附视频）

Kimi 创始人杨植麟在2026中关村论坛发表演讲，阐述了大模型发展的核心在于规模化定律，并从 Token 效率、上下文长度及 Agent 集群三个维度提出提升效率的方法，同时开源了 K2.5 模型及注意力残差架构。

2026-03-31 12:20

AI/ML量子位9.0

智谱上市后首份财报：超7.24亿元！国内收入最高大模型公司，MaaS发力了

文章分析了智谱AI上市后的首份财报，指出其通过逆势涨价和技术驱动实现了营收与毛利率的双增长，验证了MaaS商业模式的可行性。

2026-03-31 12:08

前端开发夕小瑶科技说9.0

前端大神 Cheng Lou 开源新项目Pretext ，获两千万人围观！前端要进入“无 CSS 时代”了

前端大神 Cheng Lou 开源了纯 TypeScript 编写的高性能文本测量引擎 Pretext，宣称性能比传统 DOM 测量快 500 倍，解决了 AI 时代下的文本布局瓶颈。

2026-03-31 07:57

AI/ML机器之心9.0

不加算力，只改一个算法：Muon在万亿MoE模型中最高2倍加速

普林斯顿与纽约大学研究者提出 Gram Newton-Schulz 算法，通过将迭代转移到更小的 Gram 矩阵并优化对称矩阵计算，在不增加算力的情况下，将万亿参数 MoE 模型的优化器步骤速度最高提升 2 倍。

2026-03-31 05:36

AI/ML机器之心9.0

ICLR 2026 | 大模型当裁判也「翻车」？北大清华联合多校提出TrustJudge，让LLM评估更值得信赖

北大清华等多校联合提出TrustJudge框架，通过利用模型内部的完整概率分布而非离散分数，解决大模型作为评估者时存在的不一致性问题。

2026-03-31 05:36

云计算量子位9.0

玻色量子完成10亿元B轮融资，“十五五”规划专用量子计算机赛道唯一代表！

玻色量子完成10亿元B轮融资，成为“十五五”规划专用量子计算机赛道唯一代表，并发布千比特专用量子计算机。

2026-03-31 05:05

AI/MLDeeplearningAI9.0

The Batch： 932 ｜开源速度怪兽

英伟达发布了具有竞争力的开源大语言模型Nemotron 3 Super 120B-A12B，采用Mamba-2与Transformer混合架构及多token预测技术，在速度与长上下文处理上表现优异，旨在巩固其AI生态壁垒。

2026-03-31 04:45

AI/MLAWS Machine Learning Blog8.0

Can your governance keep pace with your AI ambitions? AI risk intelligence in the agentic era

文章介绍了AWS推出的AI风险智能（AIRI）解决方案，旨在通过自动化、连续的治理框架，解决Agentic AI时代非确定性系统带来的安全和合规挑战。

2026-03-31 15:36

AI/ML大模型智能8.0

一篇大模型Agents工作流优化最新综述

文章解读了RPI与IBM联合发布的LLM Agents工作流优化综述，提出了Agentic Computation Graph (ACG)统一框架，系统阐述了从静态模板搜索到动态运行时适应的优化方法分类及评估标准。

2026-03-30 16:01

产品设计晚点LatePost8.0

永不停歇的效率工厂：字节造红果，平台改造影视业

本文深入分析了字节跳动旗下红果短剧如何通过免费模式、算法推荐和工业化流程重塑影视制作生态，并探讨了AI技术对该行业的最新冲击。

2026-03-30 16:22

AI/ML阿里云开发者8.0

CoPaw深度解析：源码架构和功能实践

文章详细解析了通义实验室开源的CoPaw桌面Agent工具的技术架构，重点阐述了Agent Skills标准以及CoPaw的模块化设计和部署实践。

2026-03-31 00:30

AI/ML腾讯云开发者8.0

Harness Engineering 来了，SDD 还有意义吗？

文章深入探讨了 Harness Engineering 与规范驱动开发（SDD）的关系，指出两者是互补而非竞争关系，强调在 AI 时代构建高质量的规范体系对于 Agent 可靠工作至关重要。

2026-03-31 00:46

前端开发前端早读课8.0

【第3678期】JavaScript 解析 VIN 码：三种方案全面对比

文章详细对比了三种在JavaScript中解析VIN码的方案，包括离线方案@cardog/corgi、在线Cardog API及原生NHTSA API，并提供了代码示例与性能基准测试。

2026-03-31 01:05

AI/ML硅星人Pro8.0

当AI需要一台自己的电脑，一个万亿市场可能爆发

文章探讨了AI Agent普及背景下可能催生的“AI专用电脑”这一新硬件品类，分析了从软件定义到硬件承接的市场机遇及联想等厂商的布局。

2026-03-31 01:42

AI/ML数字生命卡兹克8.0

如何在AI时代，找回你被埋没的创造力。

文章分析了AI时代人们面对工具感到迷茫的根本原因是创造力的被遗忘，并提出了六个具体步骤（寻找痛点、缩小范围、快速原型、跨领域连接、留白思考、关注自我）来帮助读者重拾创造本能。

2026-03-31 02:09

AI/ML智东西8.0

阿里最强全模态模型登场！实测看懂50分钟《老友记》，全球评测215项SOTA

阿里发布新一代全模态大模型Qwen3.5-Omni，支持音视频原生理解与生成，在215项评测中取得SOTA，并具备低延迟实时交互及方言支持能力。

2026-03-31 03:10

工具效率深思圈8.0

获 4000 万美元融资：AI 生产力悖论的破局者

文章分析了 Highlight AI 获得 4000 万美元融资的案例，探讨了当前企业面临的“AI 生产力悖论”，即 AI 工具虽增加内容产出却未提升实际效率。Highlight AI 旨在通过构建“共享智能层”来解决工具间的协调瓶颈，实现人类与 AI Agent 的无缝协作。

2026-03-31 03:11

前端开发哔哩哔哩技术8.0

从特效 SDK 到 AI 动效平台：Neon Vibe Motion 的技术演进之路

文章介绍了B站开源的 Neon Vibe Motion 平台，阐述了从传统特效 SDK 向基于 LLM 的可编程动效生成的技术演进路径，重点解析了代码生成范式、渲染引擎架构及质量控制机制。

2026-03-31 04:05

工具效率少数派8.0

安装了 Raycast 效率却没提升？这份教程带你 59 分钟就上手

这是一份系统性的 Raycast 使用教程，旨在帮助初学者和进阶用户通过 32 篇文章构建完整的知识体系，解决功能配置与日常效率提升的痛点。

2026-03-31 04:11

安全AI前线8.0

谷歌曾说“不是秘密”的东西，Gemini时代成了提款机：三人创业团队48小时濒临破产

文章揭露了谷歌Gemini API设计缺陷导致开发者因API密钥被盗面临巨额账单的风险，分析了历史API密钥在新架构下的权限升级问题及缺乏风控机制的现状。

2026-03-31 04:42

后端架构InfoQ 中文8.0

Rust 的独特之处不只内存安全：来自自主机器人的启示

文章深入探讨了 Rust 除了内存安全之外的独特优势，通过自主机器人领域的实例，阐述了如何利用所有权、借用、生命周期和枚举等特性在编译时构建健壮的软件。

2026-03-31 05:31

云计算InfoQ 中文8.0

OpenClaw 火了之后，企业真正缺的不是更聪明的龙虾，而是一套上岗体系

文章基于阿里云“虾友会”活动，探讨了AI Agent从演示工具走向企业级“数字员工”的关键，指出企业更关注Agent的上岗体系、安全治理及基础设施构建。

2026-03-31 05:31

AI/ML机器之心8.0

京东卷出新高度！硬刚「复杂指令」长时长、自由态数字人直播终于丝滑了

京东发布JoyStreamer系列数字人模型，通过双教师DMD后训练和动态CFG调制策略，实现了长时长、自由态、实时互动的高保真数字人生成，已在电商直播场景大规模应用。

2026-03-31 05:36

AI/ML腾讯科技8.0

不好意思，机器人无法仅靠视觉理解世界

文章是生数科技创始人朱军的访谈录，深入探讨了以“视频”为核心路径的世界模型技术路线，分析了其与3D仿真等路径的差异，并展望了未来在机器人及通用智能体领域的落地前景。

2026-03-31 06:07

工具效率夕小瑶科技说8.0

Claude code产品负责人分享15条隐藏功能，建议收藏

文章梳理了Claude Code产品负责人分享的15条内部使用技巧，涵盖远程控制、自动化循环、视觉验证、并行开发及多个实用命令。

2026-03-31 07:57

AI/ML量子位8.0

实测拿215项SOTA的Qwen3.5-Omni：摄像头一开，AI给我现场讲论文、撸代码

文章介绍了Qwen3.5-Omni全模态模型的发布与实测情况，重点展示了其在视频拆解、实时视频会议辅助编程及论文解读方面的能力。

2026-03-31 08:22

AI/ML量子位8.0

智能体收入暴增68%！这家港股AI公司靠「关系」驯服企业龙虾

文章以海致科技财报为切入点，深入分析了其利用“图模融合”架构（AtlasGraph）解决企业级AI落地中的安全、记忆与复杂任务管理难题，验证了ToB AI基础设施的商业价值。

2026-03-31 08:33

AI/ML极客公园8.0

AI 加速，短剧比想象中更短命

文章深入分析了AI技术如何通过重构成本结构和生产逻辑，加速了真人短剧行业的洗牌与衰落，并推动了AI短剧的崛起。

2026-03-31 09:08

安全CSDN8.0

1次操作莫名背上10.6万元账单、Gemini API密钥被盗、项目濒临崩溃！独立开发者无奈：10分钟就删除旧密钥，Google账单却延迟30小时

文章讲述了独立开发者因 Google 旧版 API 密钥默认配置不安全及 Gemini API 的权限自动扩展机制，导致 API 密钥被盗刷产生巨额账单的经历，揭示了平台设计缺陷与计费延迟带来的风险。

2026-03-31 09:17

后端架构CSDN8.0

硬撑15年、仅1台服务器、8GB内存：他用一堆“淘汰” 技术，让50+万人敲下人生第一条Linux命令！

文章讲述了在线Linux学习平台Webminal在单台8GB服务器上运行15年、服务50万用户的传奇故事，探讨了在技术迭代中坚持实用主义与开源精神的价值。

2026-03-31 09:17

AI/ML通义大模型8.0

CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化

文章介绍了 CoPaw 1.0 的正式发布，详细阐述了其定制小模型 CoPaw-Flash、分层安全防御机制、多智能体协同工作区优化以及升级的记忆管理功能。

2026-03-31 09:35

AI/ML百度Geek说8.0

昆仑芯大规模 LLM 推理优化，实现秒级扩缩容

文章介绍了昆仑芯针对大规模LLM推理冷启动耗时长的问题，通过权重传输优化、编译缓存复用及Lazy CUDA Graph等技术，实现了秒级扩缩容和99%的启动速度提升。

2026-03-31 10:05

AI/ML奇舞精选8.0

Harness Engineering 来了，SDD 还有意义吗？

文章探讨了在 AI 时代，规范驱动开发（SDD）与新兴的 Harness Engineering 之间的关系，论证了 Spec 体系作为 AI Agent 工作的核心 Scaffolding 的重要性，指出两者是互补而非竞争关系。

2026-03-31 10:05

AI/ML量子位8.0

刚刚，TRAE SOLO上线独立端：已经不满足写代码，还要跨界干活！

TRAE发布PC端和Web端独立应用，通过Code和MTC（More Than Coding）模式将AI能力从编程扩展至产品、运营、数据分析等全产研流程，旨在打破岗位壁垒实现跨界协作。

2026-03-31 10:18

AI/ML腾讯科技8.0

大模型第一股交卷：3000亿市值和三个关键变量

文章通过分析智谱AI上市首份财报，验证其“AGI商业价值”公式的兑现情况，揭示其收入高增长但毛利下降、亏损扩大的现状，并指出2026年面临的三个关键变量。

2026-03-31 10:58

AI/MLDatawhale8.0

刚刚，Claude Code源码泄漏了！

文章报道了 Claude Code 的源代码通过 npm 注册表泄露的消息，并提供了下载链接及代码结构初步分析。

2026-03-31 11:27

AI/ML魔搭ModelScope社区8.0

CoPaw 1.0 发布：定制小模型、安全机制与多智能体全面进化

CoPaw 1.0 正式发布，通过定制小模型、分层安全机制、多智能体协同及记忆管理四大升级，旨在打造真正可控、稳定的本地化个人智能助理。

2026-03-31 11:31

其他晚点LatePost8.0

拼多多造牌：首期 150 亿、上百产业带、一个新挑战

拼多多成立“新拼姆”公司首期注资150亿，依托Temu全球渠道和产业带资源转向自营品牌模式，旨在应对关税压力并解决中国制造无品牌溢价的结构性难题。

2026-03-31 13:12

AI/MLMartin Fowler8.0

Encoding Team Standards

文章探讨了如何将团队的隐性标准转化为可执行的AI指令，以解决不同开发人员在使用AI工具时产出不一致的问题。

2026-03-31 15:20

⚡ 快速浏览

白鲸出海6.0