88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改
88岁算法高德纳利用Claude 4.6与GPT-5.4等AI模型,成功攻克了悬置30年的“哈密顿分解”数学难题,AI独立产出了通过Lean形式化验证的14页论文。
{
"title": "GPT-5攻克数学难题,大模型商业逻辑迎来巨变",
"content": "# AI重塑科研与商业:从攻克30年数学难题到MaaS盈利范式确立\n\n今天的科技圈被两股力量撕裂又重组:一边是AI在纯科学领域展现出的「神之直觉」,88岁的算法泰斗高德纳都被Claude与GPT联手填平了30年的数学大坑;另一边则是商业模式的剧烈分化,智谱用财报证明技术溢价远比价格战有效,而Anthropic则演示了AI如何像真正的工程师团队一样独立交付软件。与此同时,前端在Pretext的带领下试图摆脱CSS的束缚,英伟达和Kimi则在底层架构上疯狂内卷。这是一个智能外挂与工程进化并存的疯狂时代。\n\n### AI科学突破与范式转移\n\n[88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=1&sn=f3cce03507f65193fa24814d2839dbdd)\n\n这绝对是AI科研史上的高光时刻。困扰数学界30年的「哈密顿分解」难题,被Claude 4.6和GPT-5.4以多智能体协作的方式彻底攻破。更令人咋舌的是,GPT-5.4直接输出了一篇14页、无需任何修改的LaTeX格式论文。这不仅是算力的胜利,更是「AI Agent工作流」的胜利——人类负责定义问题边界和验证审美,AI负责在无限搜索空间中填补深渊。这意味着未来的数学家,其核心竞争力将不再是计算,而是提出问题的直觉和设计系统的能力。\n\n[Kimi 杨植麟「2026 中关村论坛」演讲全文(附视频)](https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488299&idx=2&sn=312689891b6e96e8d6169ed7b3485538)\n\n杨植麟在论坛上重新定义了「规模化」的内涵。他认为未来的效率提升不只靠堆算力,更在于「Agent集群」的协作能力。通过让100个Agent并行处理复杂任务,执行时间不再随复杂度指数增长,而是保持平稳。这种将人类组织结构映射到硅基智能的思路,或许是通往AGI的一条务实路径。此外,他提到的「注意力残差」架构,也是对十年前ResNet思想的跨时空致敬,证明了基础技术的回溯与重构依然是创新的源泉。\n\n### 工程化与商业落地\n\n[6小时,200美元,0人类代码:Anthropic把AI编程推过了临界点](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=2&sn=ff2ada2e398e6b4992bfa5b62ece53e1)\n\n如果说写代码是AI的「生成力」,那么能交付项目就是AI的「工程力」。Anthropic的实验表明,单打独斗的AI只能产出「AI Slop」(样子货),而通过Planner、Generator和Evaluator的多智能体分工,AI团队可以像真正的软件公司一样,经历10轮迭代、自我纠错并最终交付。这标志着AI编程从「玩具阶段」迈入了「工业阶段」——生产关系的升级远比生产力提升更让人不安。\n\n[智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了](https://www.qbitai.com/2026/03/394135.html)\n\n在行业深陷价格战泥潭时,智谱的财报是一份清醒剂。全年营收7.24亿元,逆势涨价83%后调用量不降反升,证明在ToB领域,效果永远比价格敏感。智谱提出的「Token架构力(TAC)」概念极具前瞻性:未来的竞争不是比谁更便宜,而是比谁能帮客户把智能转化为经济价值。这也印证了技术公司的终极护城河,依然是不可替代的智能上限。\n\n### 架构进化与底层提速\n\n[不加算力,只改一个算法:Muon在万亿MoE模型中最高2倍加速](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=2&sn=dc80269b56b462cf512c3754b935ba2)\n\n普林斯顿和纽约大学团队提出的Gram Newton-Schulz算法,给万亿参数模型的训练打了一针强心剂。通过在更小的Gram矩阵上进行迭代,并利用对称矩阵优化,该算法在不牺牲精度的情况下,将优化器耗时降低了40-50%。在硬件成本高企的今天,这种「算法级提效」比单纯堆GPU更具战略意义,也为MoE架构的进一步普及铺平了道路。\n\n[The Batch: 932 | 开源速度怪兽](https://mp.weixin.qq.com/s?__biz=MzIxNzI0ODE4Nw==&mid=2247498261&idx=1&sn=c6250382392ea92e95d636328c88b4ee)\n\n英伟达发布的Nemotron 3 Super 120B-A12B,不仅开源了权重,更展示了软硬件协同的极致。Mamba-2、Transformer与MoE的混合架构,配合NVFP4低精度训练,使其在生成速度上达到了惊人的442 token/秒。英伟达这招「开源换生态」的棋局深远:用最适配自家GPU的模型,牢牢锁定开发者在Cuda体系内,对抗中国开源模型和华为昇腾生态的潜在威胁。\n\n### 前端与量子计算的跨越\n\n[前端大神 Cheng Lou 开源新项目Pretext ,获两千万人围观!前端要进入“无 CSS 时代”了](https://mp.weixin.qq.com/s?__biz=MzIwNzc2NTk0NQ==&mid=2247616028&idx=1&sn=e3a95a0ce95fe37e7e90d5f675dd9f35)\n\n前端圈沸腾了。Cheng Lou的Pretext项目试图彻底解放文本排版,完全绕过DOM,用暴力计算在用户代码层实现精确布局。这不仅是性能的500倍提升,更是开发哲学的转变——从「浏览器告诉我长什么样」到「我告诉它该怎么长」。在AI生成内容日益复杂的今天,这种对像素级的控制力,或许是下一代高动态UI的入场券。\n\n[1毫秒级,最快的人体动作捕捉服!开源715万帧数据集| CVPR'26](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652687949&idx=3&sn=4fbd3b99df554b9013485c5e8ccbe9ae)\n\n厦门大学与上科大团队研发的FlashCap,将动作捕捉的帧率推向了1000Hz的毫秒级。通过闪烁LED和事件相机的巧妙结合,他们在低成本下解决了高速运动中的插值失真问题。这不仅对体育竞技分析意义重大,更为具身智能机器人提供了宝贵的高频动态数据基石——要让机器人像人一样运动,首先得看清人类运动的每一毫秒。\n\n### 评估、资本与新风口\n\n[ICLR 2026 | 大模型当裁判也「翻车」?北大清华联合多校提出TrustJudge](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651024827&idx=3&sn=ce5e133b7ab1863f3b633b1af0764d11)\n\n当LLM-as-a-Judge成为行业标准时,裁判本身的公正性却成了大问题。北大清华团队发现,现有模型在评分和成对比较中存在高达23%的不一致性,甚至出现「A>B>C>A」的逻辑循环。TrustJudge通过利用模型内部完整的概率分布而非离散分数,大幅降低了这种「晕轮效应」。这提醒我们,在追求模型能力的同时,评估体系的基准刻度也需要重新校准。\n\n[玻色量子完成10亿元B轮融资,“十五五”规划专用量子计算机赛道唯一代表!](https://www.qbitai.com/2026/03/393856.html)\n\n量子计算正在从实验室走向产业化。玻色量子完成10亿元融资,标志着「专用量子计算机」路线获得了资本的强背书。与通用量子计算相比,专用路线在特定场景(如组合优化、AI加速)更具落地可行性。玻
88岁算法高德纳利用Claude 4.6与GPT-5.4等AI模型,成功攻克了悬置30年的“哈密顿分解”数学难题,AI独立产出了通过Lean形式化验证的14页论文。
Anthropic通过多智能体协作架构(Planner、Generator、Evaluator),让Claude在无人类干预下耗时6小时、花费200美元成功交付了完整的软件项目,标志着AI编程从代码生成向项目交付的质变。
厦门大学与上海科技大学联合提出全球首个1毫秒级人体动作捕捉系统FlashCap,结合闪烁LED与事件相机实现1000Hz捕捉,并开源715万帧数据集及ResPose模型。
理想前智驾负责人郎咸朋与阿里前副总裁任庚联手创办具身智能公司昆仑行,公司成立10天估值即超10亿美元,完成三轮融资跻身独角兽。
文章报道了国行 Apple 智能在 iOS 26.4 下的深夜上线与实测情况,涵盖了更新条件、模型供应商猜测及视觉智能等新功能。
Kimi 创始人杨植麟在2026中关村论坛发表演讲,阐述了大模型发展的核心在于规模化定律,并从 Token 效率、上下文长度及 Agent 集群三个维度提出提升效率的方法,同时开源了 K2.5 模型及注意力残差架构。
文章分析了智谱AI上市后的首份财报,指出其通过逆势涨价和技术驱动实现了营收与毛利率的双增长,验证了MaaS商业模式的可行性。
前端大神 Cheng Lou 开源了纯 TypeScript 编写的高性能文本测量引擎 Pretext,宣称性能比传统 DOM 测量快 500 倍,解决了 AI 时代下的文本布局瓶颈。
普林斯顿与纽约大学研究者提出 Gram Newton-Schulz 算法,通过将迭代转移到更小的 Gram 矩阵并优化对称矩阵计算,在不增加算力的情况下,将万亿参数 MoE 模型的优化器步骤速度最高提升 2 倍。
北大清华等多校联合提出TrustJudge框架,通过利用模型内部的完整概率分布而非离散分数,解决大模型作为评估者时存在的不一致性问题。
英伟达发布了具有竞争力的开源大语言模型Nemotron 3 Super 120B-A12B,采用Mamba-2与Transformer混合架构及多token预测技术,在速度与长上下文处理上表现优异,旨在巩固其AI生态壁垒。
文章介绍了AWS推出的AI风险智能(AIRI)解决方案,旨在通过自动化、连续的治理框架,解决Agentic AI时代非确定性系统带来的安全和合规挑战。
文章解读了RPI与IBM联合发布的LLM Agents工作流优化综述,提出了Agentic Computation Graph (ACG)统一框架,系统阐述了从静态模板搜索到动态运行时适应的优化方法分类及评估标准。
本文深入分析了字节跳动旗下红果短剧如何通过免费模式、算法推荐和工业化流程重塑影视制作生态,并探讨了AI技术对该行业的最新冲击。
文章详细解析了通义实验室开源的CoPaw桌面Agent工具的技术架构,重点阐述了Agent Skills标准以及CoPaw的模块化设计和部署实践。
文章深入探讨了 Harness Engineering 与规范驱动开发(SDD)的关系,指出两者是互补而非竞争关系,强调在 AI 时代构建高质量的规范体系对于 Agent 可靠工作至关重要。
文章详细对比了三种在JavaScript中解析VIN码的方案,包括离线方案@cardog/corgi、在线Cardog API及原生NHTSA API,并提供了代码示例与性能基准测试。
文章探讨了AI Agent普及背景下可能催生的“AI专用电脑”这一新硬件品类,分析了从软件定义到硬件承接的市场机遇及联想等厂商的布局。
文章分析了AI时代人们面对工具感到迷茫的根本原因是创造力的被遗忘,并提出了六个具体步骤(寻找痛点、缩小范围、快速原型、跨领域连接、留白思考、关注自我)来帮助读者重拾创造本能。
阿里发布新一代全模态大模型Qwen3.5-Omni,支持音视频原生理解与生成,在215项评测中取得SOTA,并具备低延迟实时交互及方言支持能力。
文章分析了 Highlight AI 获得 4000 万美元融资的案例,探讨了当前企业面临的“AI 生产力悖论”,即 AI 工具虽增加内容产出却未提升实际效率。Highlight AI 旨在通过构建“共享智能层”来解决工具间的协调瓶颈,实现人类与 AI Agent 的无缝协作。
文章介绍了B站开源的 Neon Vibe Motion 平台,阐述了从传统特效 SDK 向基于 LLM 的可编程动效生成的技术演进路径,重点解析了代码生成范式、渲染引擎架构及质量控制机制。
这是一份系统性的 Raycast 使用教程,旨在帮助初学者和进阶用户通过 32 篇文章构建完整的知识体系,解决功能配置与日常效率提升的痛点。
文章揭露了谷歌Gemini API设计缺陷导致开发者因API密钥被盗面临巨额账单的风险,分析了历史API密钥在新架构下的权限升级问题及缺乏风控机制的现状。
文章深入探讨了 Rust 除了内存安全之外的独特优势,通过自主机器人领域的实例,阐述了如何利用所有权、借用、生命周期和枚举等特性在编译时构建健壮的软件。
文章基于阿里云“虾友会”活动,探讨了AI Agent从演示工具走向企业级“数字员工”的关键,指出企业更关注Agent的上岗体系、安全治理及基础设施构建。
京东发布JoyStreamer系列数字人模型,通过双教师DMD后训练和动态CFG调制策略,实现了长时长、自由态、实时互动的高保真数字人生成,已在电商直播场景大规模应用。
文章是生数科技创始人朱军的访谈录,深入探讨了以“视频”为核心路径的世界模型技术路线,分析了其与3D仿真等路径的差异,并展望了未来在机器人及通用智能体领域的落地前景。
文章梳理了Claude Code产品负责人分享的15条内部使用技巧,涵盖远程控制、自动化循环、视觉验证、并行开发及多个实用命令。
文章介绍了Qwen3.5-Omni全模态模型的发布与实测情况,重点展示了其在视频拆解、实时视频会议辅助编程及论文解读方面的能力。
文章以海致科技财报为切入点,深入分析了其利用“图模融合”架构(AtlasGraph)解决企业级AI落地中的安全、记忆与复杂任务管理难题,验证了ToB AI基础设施的商业价值。
文章讲述了独立开发者因 Google 旧版 API 密钥默认配置不安全及 Gemini API 的权限自动扩展机制,导致 API 密钥被盗刷产生巨额账单的经历,揭示了平台设计缺陷与计费延迟带来的风险。
文章讲述了在线Linux学习平台Webminal在单台8GB服务器上运行15年、服务50万用户的传奇故事,探讨了在技术迭代中坚持实用主义与开源精神的价值。
文章介绍了 CoPaw 1.0 的正式发布,详细阐述了其定制小模型 CoPaw-Flash、分层安全防御机制、多智能体协同工作区优化以及升级的记忆管理功能。
文章介绍了昆仑芯针对大规模LLM推理冷启动耗时长的问题,通过权重传输优化、编译缓存复用及Lazy CUDA Graph等技术,实现了秒级扩缩容和99%的启动速度提升。
文章探讨了在 AI 时代,规范驱动开发(SDD)与新兴的 Harness Engineering 之间的关系,论证了 Spec 体系作为 AI Agent 工作的核心 Scaffolding 的重要性,指出两者是互补而非竞争关系。
TRAE发布PC端和Web端独立应用,通过Code和MTC(More Than Coding)模式将AI能力从编程扩展至产品、运营、数据分析等全产研流程,旨在打破岗位壁垒实现跨界协作。
文章通过分析智谱AI上市首份财报,验证其“AGI商业价值”公式的兑现情况,揭示其收入高增长但毛利下降、亏损扩大的现状,并指出2026年面临的三个关键变量。
CoPaw 1.0 正式发布,通过定制小模型、分层安全机制、多智能体协同及记忆管理四大升级,旨在打造真正可控、稳定的本地化个人智能助理。
拼多多成立“新拼姆”公司首期注资150亿,依托Temu全球渠道和产业带资源转向自营品牌模式,旨在应对关税压力并解决中国制造无品牌溢价的结构性难题。
本文汇总了近期科技圈的重要新闻,包括苹果国行AI意外上线、DeepSeek服务恢复、小米AI人才招聘、爱奇艺拟在港上市及数码新品发布等内容。
文章记录了吴晓波春季增长大课在宁波的举办情况,通过导师分享与学员案例,探讨了中国企业在旧红利退潮与三大周期叠加背景下如何寻找新的增长逻辑。
这是一篇涵盖AI大模型、企业投融资、智能硬件及消费电子等多个领域的科技早报,汇总了华为、小米、苹果等公司的最新动态及行业数据。
太极立方数字体验空间入选2025联合国教科文组织示范案例,该项目利用动作捕捉、生成式视觉渲染等技术,将太极拳转化为沉浸式交互体验。
这是一篇Kotlin生态的月度汇总文章,涵盖了Kotlin 2.3.20版本发布、基金会资助项目获得者名单以及KotlinConf'26会议的相关访谈和日程安排。
文章汇总了近期汽车交通行业资讯,包括萝卜快跑迪拜商业化运营、动力电池溯源平台启动、特斯拉Cybercab高管离职等动态。
文章汇总了苹果OLED iMac排期、韩国AI预算计划、上海AI实验室AGI4S计划及特斯拉TERAFAB项目等智能制造领域的最新行业新闻。
本文汇集了近期AI领域的行业快讯,涵盖小米AI人才招聘、Claude用户增长、达摩院医疗AI合作及爱奇艺影视制作智能体上线等动态。
文章报道了截至2026年3月,xAI包括最后一位联合创始人Ross Nordeen在内的11位创始团队成员已全部离职,分析了马斯克管理风格与AI研究特性的冲突及公司面临的挑战。
文章介绍了 MuleRun 平台,该平台通过配备独立虚拟环境的 AI 数字员工,实现从被动响应到主动执行的业务流程变革。
文章介绍了在波兰担任欧盟理事会主席国期间,如何利用 ElevenLabs 的 AI 语音技术实现部长级会议的大规模配音和实时翻译。
文章汇总介绍了包括北航团队发布的InCoder-32B在内的6个AI相关技术项目,涵盖基座模型、框架工具及数据集,属于常规的技术新闻资讯。
RoboParty宣布完成2000万美元天使轮融资,经纬创投领投,资金将用于推动人形机器人本体、运控及开源生态建设。
这是一篇Spring生态的周报,汇总了包括Spring Boot 4、Spring AI 2.0及Spring Modulith在内的多个版本发布和安全修复,并分享了相关的技术视频和文章资源。