奔跑的高达

国产AI芯片获10亿融资,Claude破解30年数学悬案

2026-03-09

✍️ 主编按语

AI 硬件与科研的双重突破,智能体重构开发范式

今天的科技圈充满了“范式转移”的味道。从国产 AI 芯片试图通过架构革新打破英伟达的垄断,到 Claude 令图灵奖得主震惊的数学推理能力,AI 正在向更深层的逻辑和更底层的硬件渗透。同时,无论是前端的框架重构,还是代码评审的智能化,都在告诉我们:软件开发的生产力革命已经不再局限于简单的 Copilot,而是向着全链路、自主化的智能体演进。

AI 架构与推理突破

独家|聚焦大模型推理,水下AI芯片公司斩获10亿元Pre-A轮融资

在英伟达主导的算力时代,中国创业者试图通过“换道超车”寻找新出路。昉擎科技由前华为麒麟、寒武纪核心高管梁军领衔,提出了一套全球首创的“上下文相关与无关解耦”分布式架构。这不仅仅是又一款 GPU,而是对 Transformer 模型计算本质的重构。它将 Attention 和 FNN 分离处理,不仅在理论上解决了“Memory为中心”的效率痛点,更在端侧描绘了一个“家庭 AI 计算中心”的未来蓝图。这种从系统视角而非单芯片性能出发的思路,或许正是国产算力突围的关键。

88岁图灵奖得主,用Claude一小时破解30年数学悬案

如果还有人对 AI 的逻辑推理能力持怀疑态度,高德纳的经历无疑是最好的回应。这位计算机科学界的传奇人物,见证了 Claude 仅用一小时、31 次探索,就解决了他困扰数周甚至追溯到 30 年前的图论难题。更令人震撼的是,Claude 并非靠暴力搜索,而是展示了类似人类的“纤维分解”、“蛇形构造”等结构化思维。这标志着 AI 已经从简单的概率预测,进化到了能够进行严谨数学发现的新阶段,这种“自动演绎”能力对科学研究的潜在影响不可估量。

模型演进与科研智能

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式,递归似然比梯度优化器赋能扩散模型后训练

扩散模型的微调长期面临着内存开销大与梯度不稳定的矛盾。北京大学彭一杰团队提出的 RLR 优化器,巧妙地引入了“半阶梯度估计”概念,通过重构扩散链的计算图,在有限的 GPU 内存下实现了无偏且低方差的梯度更新。这一成果不仅在 ICLR 2026 上斩获 Oral,更在 Text2Image 和 Text2Video 任务上全面超越了 SOTA。对于开发者而言,这意味着在微调 Stable Diffusion 等大模型时,不再需要在高昂的硬件成本和模型崩溃的风险之间做痛苦抉择。

一个模型,搞定所有音频生成任务!多项基准SOTA | ICLR'26

音频生成领域长期存在模型碎片化的问题。港科大团队推出的 AudioX,试图用统一的 Diffusion Transformer 架构打通音效、音乐、视频配音等任务边界。除了性能上的 SOTA,更值得关注的是其构建的 700 万样本细粒度数据集 IF-caps,以及发现的“跨模态正则化效应”——高质量的文本标注竟然能反向提升视频到音频的生成质量。这种“一专多能”且具备可控生成能力的统一模型,预示着多模态生成正在从专用工具走向通用基础设施。

AI真能做研究吗?UniPat AI开源UniScientist,用30B小模型给出肯定答案|甲子光年

“会写论文”不等于“会做科研”。UniScientist 的核心贡献在于将科学研究形式化为一个“假设-证据-验证”的动态闭环系统。令人惊讶的是,一个仅 30B 参数的小模型,在多项科研基准上匹敌甚至超越了参数量大一个数量级的顶尖闭源模型。这证明了真正的科研智能不单纯依赖参数规模,而在于能否构建可验证、可复现的推理流程。对于科学界来说,这或许是 AI 从“文献整理员”转变为“研究合伙人”的重要转折点。

开发范式的智能化重构

采纳率从7.9%到54%:快手智能Code Review的三阶进化

快手的实践为“AI 如何真正融入企业研发流程”提供了一份教科书级的答卷。从早期的纯 LLM 启发式,到引入知识引擎和确定性规则,再到最新的 Agentic 自主决策,快手的智能 CR 系统将采纳率从 7.9% 提升至 54%。这一跃升背后的关键在于:承认 LLM 的局限性,通过规则库和 BadCase 拦截机制构建信任,再利用 Agent 处理复杂场景。这启示我们,企业级 AI 落地不能迷信模型的万能,而必须结合工程化手段,构建“确定性”与“创造性”融合的系统。

Cloudflare:我们如何用 AI 在一周内重构 Next.js

Cloudflare 工程师仅用一周时间、约 1100 美元的 Token 费用,就基于 Vite 重新实现了一个兼容 Next.js API 的框架 vinext。这不仅是一次技术上的炫技,更揭示了软件开发模式的深层变革:当 AI 能够理解复杂的架构规范并编写高质量代码时,传统的“为了人类理解而设计的层层抽象”可能变得不再必要。AI 不需要中间层来降低复杂度,它只需要契约和目标。这或许预示着未来的软件栈将更加扁平,许多“胶水代码”和中间框架将逐渐消亡。

安全与新赛道

从向量里逆向出原始文本和模型来源

向量一直被认为是脱敏的安全屏障,但 Jina AI 的两项研究无情地打破了这一幻想。他们仅凭 80 万参数的小模型就能以 87% 的准确率识别向量来源,甚至能通过掩码扩散模型从向量中逆向还原出 81% 的原始文本。这对于隐私保护和数据安全是一个巨大的警示:向量并不是不可逆的哈希,而是一个信息密度极高的压缩表示。未来,向量数据库的安全性将成为必须要正视的显性问题。

独家 | 华为前高管刘武龙创立具身公司贝塔无限,已完成近亿元种子轮融资

具身智能赛道依然火热,但焦点正从炫技转向产品化。由华为前高管刘武龙创立的贝塔无限,瞄准了万亿消费级机器人市场。团队背景深厚,融合了华为智能驾驶的工程经验与字节跳动的 C 端个性化技术。他们试图解决当前具身智能缺乏“个性”和“自主做事能力”的痛点。这表明,具身智能的竞争下半场,将不再是简单的算法比拼,而是如何打造具备高情商、能适应复杂家庭场景的量产级产品。

🔥 热门文章 (44 篇)

AI/MLJina AI9.0

从向量里逆向出原始文本和模型来源

Jina AI 公布了两项突破性研究,通过仅80万参数的小模型实现了87%准确率的Embedding模型溯源,以及利用掩码扩散模型实现了81%准确率的从向量逆向还原文本。

前端开发InfoQ 中文9.0

Cloudflare:我们如何用 AI 在一周内重构 Next.js

Cloudflare 工程师利用 AI 在一周内基于 Vite 从零重构了 Next.js(项目名为 vinext),实现了构建速度提升和部署优化,展示了 AI 辅助大规模软件开发的巨大潜力。

AI/ML量子位9.0

88岁图灵奖得主,用Claude一小时破解30年数学悬案

88岁图灵奖得主高德纳发文表示,Claude Opus 4.6仅用一小时便破解了他困扰30年的三维图论数学悬案,不仅展现了非暴力搜索的结构性思路,更令他对生成式AI的逻辑推理能力脱帽致敬。

DevOps快手技术9.0

采纳率从7.9%到54%:快手智能Code Review的三阶进化

文章深入剖析了快手智能代码审查系统从纯LLM启发式到知识引擎驱动,再到Agentic自主决策的三代架构演进,通过构建上下文引擎与沉淀确定性规则,成功将评论采纳率从7.9%提升至54%,解决了AI幻觉与信任危机。

AI/MLLangChain Blog8.0

How we built LangChain’s GTM Agent

文章详细介绍了 LangChain 如何构建 GTM Agent,利用 Deep Agents 自动化销售流程、个性化邮件撰写及账户情报分析,显著提升了转化率并节省了销售团队时间。

AI/ML印记中文8.0

AI 周刊 #074 - GPT-5.4 发布,Gemini 3.1 Flash Lite 上线

本期 AI 周刊汇总了 OpenAI GPT-5.4、Google Gemini 3.1 Flash Lite 等前沿模型动态,以及 Claude 技能创作器、阿里 OpenSandbox 等实用工具与教程,涵盖了 AI 行业重大更新与技术实践分享。

AI/ML数字生命卡兹克8.0

第一个能在手机上跑的小龙虾来了,它的名字,叫miclaw。

文章深度体验并评测了小米推出的首个手机端系统级AI Agent产品“Xiaomi miclaw”,展示了其调用短信、笔记、米家智能家居等系统级能力的高效性,分析了手机端Agent作为生活管家与电脑端生产力工具的本质差异。

AI/ML机器之心8.0

3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘

文章介绍了BOSS直聘南北阁实验室发布的3B小模型Nanbeige4.1-3B,该模型通过创新的SFT与RL训练策略,在通用问答、复杂推理、代码编写及深度搜索等核心指标上实现了“以小博大”,显著超越同规模及参数量大10倍以上的竞品模型。

AI/MLInfoQ 中文8.0

Cursor 经历生死存亡

文章分析了AI编程工具Cursor在营收翻倍背景下面临的“生死存亡”危机,探讨其从代码编辑器向智能体转型的挑战与应对,以及企业级市场与开发者社区之间的体感落差。

AI/ML百度Geek说8.0

打造高效易用的Agent Skill

文章深入解析了 Agent Skill 的设计原理与编写实践,阐述了如何通过结构化知识包解决 Agent 缺乏私域经验的痛点,并提供了从设计到评测的完整方法论。

AI/ML腾讯科技8.0

20000月薪养得起“龙虾”吗?五个值得关注的误读

文章针对近期爆火的开源AI智能体框架OpenClaw,从部署差异、权限风险、模型成本、产品成熟度及用户适用性五个维度进行了深度剖析,旨在纠正大众对该技术的误读并提供客观的使用建议。

AI/ML奇舞精选8.0

如何为智能体推理引入外部决策步骤

文章介绍了在智能体推理流程中引入显式外部决策步骤的设计理念,通过结构化数据契约和可控的暂停/恢复机制,解决了内部推理在处理模糊参数或复杂约束时的局限性。

快速浏览

有机大橘子6.0

美国那边也越来越多人意识到:不要再给人写软件了,要写给 Agent 写。 Karpathy:一切软件,都将为 Agent 重写 这跟我上个月的文章宣言完全相同,但做了更深入的讲解,非常推荐一起阅读 互联网已死,Agent 永生 另外这篇文章也正式突破10w+读者,也是 Agent橘公众号创建以来的第一次长文突破10w+,还是在不依赖推荐算法的情况下。(图文早就突破到50w了,但是推荐算法非常神经) 总之,很多非共识正在急剧变为共识,加速吧,Agent!

文章探讨了 Andrej Karpathy 提出的观点,即未来软件的开发模式将转变为面向 AI Agent 的开发,并引用了相关高热度文章作为佐证。

腾讯研究院6.0

中国动画电影为什么会成功?

文章分析了2025年中国动画电影在票房和口碑上的成功经验,探讨了其反映的大众文化需求变迁,并为电影行业发展提供了建议。