国产AI芯片获10亿融资，Claude破解30年数学悬案

2026-03-09

✍️ 主编按语

AI 硬件与科研的双重突破，智能体重构开发范式

今天的科技圈充满了“范式转移”的味道。从国产 AI 芯片试图通过架构革新打破英伟达的垄断，到 Claude 令图灵奖得主震惊的数学推理能力，AI 正在向更深层的逻辑和更底层的硬件渗透。同时，无论是前端的框架重构，还是代码评审的智能化，都在告诉我们：软件开发的生产力革命已经不再局限于简单的 Copilot，而是向着全链路、自主化的智能体演进。

AI 架构与推理突破

独家｜聚焦大模型推理，水下AI芯片公司斩获10亿元Pre-A轮融资

在英伟达主导的算力时代，中国创业者试图通过“换道超车”寻找新出路。昉擎科技由前华为麒麟、寒武纪核心高管梁军领衔，提出了一套全球首创的“上下文相关与无关解耦”分布式架构。这不仅仅是又一款 GPU，而是对 Transformer 模型计算本质的重构。它将 Attention 和 FNN 分离处理，不仅在理论上解决了“Memory为中心”的效率痛点，更在端侧描绘了一个“家庭 AI 计算中心”的未来蓝图。这种从系统视角而非单芯片性能出发的思路，或许正是国产算力突围的关键。

88岁图灵奖得主，用Claude一小时破解30年数学悬案

如果还有人对 AI 的逻辑推理能力持怀疑态度，高德纳的经历无疑是最好的回应。这位计算机科学界的传奇人物，见证了 Claude 仅用一小时、31 次探索，就解决了他困扰数周甚至追溯到 30 年前的图论难题。更令人震撼的是，Claude 并非靠暴力搜索，而是展示了类似人类的“纤维分解”、“蛇形构造”等结构化思维。这标志着 AI 已经从简单的概率预测，进化到了能够进行严谨数学发现的新阶段，这种“自动演绎”能力对科学研究的潜在影响不可估量。

模型演进与科研智能

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式，递归似然比梯度优化器赋能扩散模型后训练

扩散模型的微调长期面临着内存开销大与梯度不稳定的矛盾。北京大学彭一杰团队提出的 RLR 优化器，巧妙地引入了“半阶梯度估计”概念，通过重构扩散链的计算图，在有限的 GPU 内存下实现了无偏且低方差的梯度更新。这一成果不仅在 ICLR 2026 上斩获 Oral，更在 Text2Image 和 Text2Video 任务上全面超越了 SOTA。对于开发者而言，这意味着在微调 Stable Diffusion 等大模型时，不再需要在高昂的硬件成本和模型崩溃的风险之间做痛苦抉择。

一个模型，搞定所有音频生成任务！多项基准SOTA | ICLR'26

音频生成领域长期存在模型碎片化的问题。港科大团队推出的 AudioX，试图用统一的 Diffusion Transformer 架构打通音效、音乐、视频配音等任务边界。除了性能上的 SOTA，更值得关注的是其构建的 700 万样本细粒度数据集 IF-caps，以及发现的“跨模态正则化效应”——高质量的文本标注竟然能反向提升视频到音频的生成质量。这种“一专多能”且具备可控生成能力的统一模型，预示着多模态生成正在从专用工具走向通用基础设施。

AI真能做研究吗？UniPat AI开源UniScientist，用30B小模型给出肯定答案｜甲子光年

“会写论文”不等于“会做科研”。UniScientist 的核心贡献在于将科学研究形式化为一个“假设-证据-验证”的动态闭环系统。令人惊讶的是，一个仅 30B 参数的小模型，在多项科研基准上匹敌甚至超越了参数量大一个数量级的顶尖闭源模型。这证明了真正的科研智能不单纯依赖参数规模，而在于能否构建可验证、可复现的推理流程。对于科学界来说，这或许是 AI 从“文献整理员”转变为“研究合伙人”的重要转折点。

开发范式的智能化重构

采纳率从7.9%到54%：快手智能Code Review的三阶进化

快手的实践为“AI 如何真正融入企业研发流程”提供了一份教科书级的答卷。从早期的纯 LLM 启发式，到引入知识引擎和确定性规则，再到最新的 Agentic 自主决策，快手的智能 CR 系统将采纳率从 7.9% 提升至 54%。这一跃升背后的关键在于：承认 LLM 的局限性，通过规则库和 BadCase 拦截机制构建信任，再利用 Agent 处理复杂场景。这启示我们，企业级 AI 落地不能迷信模型的万能，而必须结合工程化手段，构建“确定性”与“创造性”融合的系统。

Cloudflare：我们如何用 AI 在一周内重构 Next.js

Cloudflare 工程师仅用一周时间、约 1100 美元的 Token 费用，就基于 Vite 重新实现了一个兼容 Next.js API 的框架 vinext。这不仅是一次技术上的炫技，更揭示了软件开发模式的深层变革：当 AI 能够理解复杂的架构规范并编写高质量代码时，传统的“为了人类理解而设计的层层抽象”可能变得不再必要。AI 不需要中间层来降低复杂度，它只需要契约和目标。这或许预示着未来的软件栈将更加扁平，许多“胶水代码”和中间框架将逐渐消亡。

安全与新赛道

从向量里逆向出原始文本和模型来源

向量一直被认为是脱敏的安全屏障，但 Jina AI 的两项研究无情地打破了这一幻想。他们仅凭 80 万参数的小模型就能以 87% 的准确率识别向量来源，甚至能通过掩码扩散模型从向量中逆向还原出 81% 的原始文本。这对于隐私保护和数据安全是一个巨大的警示：向量并不是不可逆的哈希，而是一个信息密度极高的压缩表示。未来，向量数据库的安全性将成为必须要正视的显性问题。

独家 | 华为前高管刘武龙创立具身公司贝塔无限，已完成近亿元种子轮融资

具身智能赛道依然火热，但焦点正从炫技转向产品化。由华为前高管刘武龙创立的贝塔无限，瞄准了万亿消费级机器人市场。团队背景深厚，融合了华为智能驾驶的工程经验与字节跳动的 C 端个性化技术。他们试图解决当前具身智能缺乏“个性”和“自主做事能力”的痛点。这表明，具身智能的竞争下半场，将不再是简单的算法比拼，而是如何打造具备高情商、能适应复杂家庭场景的量产级产品。

🔥 热门文章 (44 篇)

AI/MLJina AI9.0

从向量里逆向出原始文本和模型来源

Jina AI 公布了两项突破性研究，通过仅80万参数的小模型实现了87%准确率的Embedding模型溯源，以及利用掩码扩散模型实现了81%准确率的从向量逆向还原文本。

2026-03-09 08:26

AI/ML机器之心9.0

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式，递归似然比梯度优化器赋能扩散模型后训练

北大彭一杰团队提出递归似然比（RLR）优化器，通过半阶梯度估计范式解决扩散模型后训练中的内存与梯度权衡难题，在图像和视频生成任务上全面超越SOTA。

2026-03-09 03:56

AI/MLZ Potentials9.0

独家｜聚焦大模型推理，水下AI芯片公司斩获10亿元Pre-A轮融资

上海昉擎科技完成10亿元Pre-A轮融资，由华为及寒武纪前技术高管梁军领衔，推出全球首创的“上下文相关/无关解耦”分布式计算架构，旨在突破大模型推理瓶颈并重塑端侧AI生态。

2026-03-09 01:04

前端开发InfoQ 中文9.0

Cloudflare：我们如何用 AI 在一周内重构 Next.js

Cloudflare 工程师利用 AI 在一周内基于 Vite 从零重构了 Next.js（项目名为 vinext），实现了构建速度提升和部署优化，展示了 AI 辅助大规模软件开发的巨大潜力。

2026-03-09 08:12

AI/ML甲子光年9.0

AI真能做研究吗？UniPat AI开源UniScientist，用30B小模型给出肯定答案｜甲子光年

UniPat AI开源了30B参数的UniScientist模型，通过形式化科研流程与高质量数据构建，实现了自主假设、验证与推导的科研闭环，在多项评测中超越顶尖闭源模型。

2026-03-09 07:04

AI/ML新智元9.0

一个模型，搞定所有音频生成任务！多项基准SOTA | ICLR'26

港科大团队提出统一音频生成模型AudioX，利用DiT架构和多模态自适应融合模块，实现从文本、视频等多种模态生成高质量音效与音乐，并在多项基准测试中达到SOTA。

2026-03-09 05:16

AI/ML量子位9.0

88岁图灵奖得主，用Claude一小时破解30年数学悬案

88岁图灵奖得主高德纳发文表示，Claude Opus 4.6仅用一小时便破解了他困扰30年的三维图论数学悬案，不仅展现了非暴力搜索的结构性思路，更令他对生成式AI的逻辑推理能力脱帽致敬。

2026-03-09 04:49

DevOps快手技术9.0

采纳率从7.9%到54%：快手智能Code Review的三阶进化

文章深入剖析了快手智能代码审查系统从纯LLM启发式到知识引擎驱动，再到Agentic自主决策的三代架构演进，通过构建上下文引擎与沉淀确定性规则，成功将评论采纳率从7.9%提升至54%，解决了AI幻觉与信任危机。

2026-03-09 04:34

AI/MLAI科技评论9.0

独家 | 华为前高管刘武龙创立具身公司贝塔无限，已完成近亿元种子轮融资

华为前高管刘武龙创立具身智能公司贝塔无限，已完成近亿元种子轮融资，瞄准万亿消费级机器人市场。

2026-03-09 10:03

AI/MLLangChain Blog8.0

How we built LangChain’s GTM Agent

文章详细介绍了 LangChain 如何构建 GTM Agent，利用 Deep Agents 自动化销售流程、个性化邮件撰写及账户情报分析，显著提升了转化率并节省了销售团队时间。

2026-03-09 15:30

其他强少来了8.0

有意思小周刊No.164（2026.03.09）：从工具提效到范式变革，我们还缺什么？

这是一期内容丰富的技术周刊，涵盖了分布式库存扣减、大模型评测、Open WebUI拆解、AI编程思考及货拉拉待办中心架构等深度技术文章，并推荐了Paper、Cordys CRM等前沿设计开发工具。

2026-03-09 00:30

DevOps阿里云开发者8.0

给“氛围编程”系上安全带：阿里集团 AI 代码评审实践与 Benchmark 开源

文章分享了阿里集团历时一年半的AI代码评审实践，阐述了Agent架构如何实现深度问题发现，并介绍了开源的多语言代码评审基准数据集AACR-Bench。

2026-03-09 00:31

产品设计Clip设计夹8.0

不用来回切PS了！这7款Figma插件，守住你的设计节奏

文章介绍了7款能增强Figma图片处理和特效能力的插件，旨在帮助设计师减少切换Photoshop的频率，提升工作流效率。

2026-03-09 00:41

前端开发前端早读课8.0

【第3665期】WebMCP：让每个网站都能与智能代理互动的新标准

文章介绍了一种全新的 Web 标准 WebMCP，旨在让网站通过 JavaScript 函数直接为 AI 代理提供可调用的结构化工具，以提升交互效率与安全性。

2026-03-09 01:01

AI/MLAI寒武纪8.0

当大家还在养龙虾时，Andrej Karpathy可能已经构建出了AGI原型

文章介绍了Andrej Karpathy的autoresearch项目升级构想，通过异步多Agent协作机制模拟科研社区，被业界视为潜在的AGI原型。

2026-03-09 01:35

AI/ML印记中文8.0

AI 周刊 #074 - GPT-5.4 发布，Gemini 3.1 Flash Lite 上线

本期 AI 周刊汇总了 OpenAI GPT-5.4、Google Gemini 3.1 Flash Lite 等前沿模型动态，以及 Claude 技能创作器、阿里 OpenSandbox 等实用工具与教程，涵盖了 AI 行业重大更新与技术实践分享。

2026-03-09 01:53

AI/ML数字生命卡兹克8.0

第一个能在手机上跑的小龙虾来了，它的名字，叫miclaw。

文章深度体验并评测了小米推出的首个手机端系统级AI Agent产品“Xiaomi miclaw”，展示了其调用短信、笔记、米家智能家居等系统级能力的高效性，分析了手机端Agent作为生活管家与电脑端生产力工具的本质差异。

2026-03-09 02:07

工具效率经纬创投8.0

很多朋友龙虾装完第一周，为何依旧很难用起来？ |【经纬低调分享】

文章分析了用户安装AI Agent后难以产生生产力的深层原因，指出认知局限、缺乏目标设定和工作流梳理是核心卡点，并提出了从端到端思维到养成AI思维反射的破局路径。

2026-03-09 03:50

AI/ML机器之心8.0

3B打32B？海外病毒式传播的小模型，竟然来自BOSS直聘

文章介绍了BOSS直聘南北阁实验室发布的3B小模型Nanbeige4.1-3B，该模型通过创新的SFT与RL训练策略，在通用问答、复杂推理、代码编写及深度搜索等核心指标上实现了“以小博大”，显著超越同规模及参数量大10倍以上的竞品模型。

2026-03-09 03:56

移动开发少数派8.0

日系手机的终局：没有「悲情英雄」……

文章深度评测了富士通 Arrows N 手机，以此为契机复盘了日系手机厂商（特别是富士通/FCNT）从辉煌走向没落直至被收购的历史教训。

2026-03-09 04:11

AI/ML量子位8.0

龙虾最大痛点被官方插件升级！对话永不忘记，GPT和Gemini最强模型都可接入

OpenClaw发布2026.3.7测试版，重点引入可插拔上下文引擎以解决对话记忆丢失问题，并接入GPT-5.4等最新模型。

2026-03-09 05:02

AI/ML新智元8.0

马斯克惊叹，首个赛博果蝇活了！多行为大脑完整上传，自主驱动数字躯壳

文章报道了 Eon Systems 公司将果蝇的完整大脑（12.5 万神经元）数字化并接入物理引擎，首次实现了无需预设脚本、完全由生物大脑自主驱动的数字躯壳多行为模拟。

2026-03-09 05:16

AI/ML51CTO技术栈8.0

“龙虾”突放大招！第一批“养龙虾”的极客实测：本地Agent迈向生产级！即便重启Mac Mini，也能秒接之前对话！开发者可自定义记忆

文章详细解析了OpenClaw 2026.3.7版本的三大核心更新，重点阐述了通过插件化ContextEngine实现自定义记忆管理、跨平台持久化路由以及Docker镜像瘦身，标志着本地Agent正迈向生产级应用。

2026-03-09 05:34

AI/ML夕小瑶科技说8.0

GPT-5.4 到底变强了多少？三大核心能力+电脑操控Codex上手实测！

文章通过实测对比了GPT-5.4与竞品的性能，重点展示了其在知识工作、计算机操控及编程任务上的表现与局限性。

2026-03-09 06:55

AI/ML赛博禅心8.0

UniPat AI 造了批数据，让 Qwen 的 3B 激活小模型，单项超过 GPT-5.4

UniPat AI 开源了科研 Agent 模型 UniScientist，通过高质量人机协作数据在特定科研榜单上超越 GPT-5.4，展示了数据工程在小模型专业化中的核心作用。

2026-03-09 07:44

AI/ML量子位8.0

卡帕西开源Agent自进化训练框架，5分钟一轮实验，48h内揽星9.5k

Andrej Karpathy开源了仅630行代码的AI自进化训练框架AutoResearch，通过5分钟一轮的自动化实验循环，让智能体自主修改代码并优化模型。

2026-03-09 07:46

AI/MLInfoQ 中文8.0

Cursor 经历生死存亡

文章分析了AI编程工具Cursor在营收翻倍背景下面临的“生死存亡”危机，探讨其从代码编辑器向智能体转型的挑战与应对，以及企业级市场与开发者社区之间的体感落差。

2026-03-09 08:12

AI/MLAI科技大本营8.0

杰瑞米·霍华德最新对话：Vibe Coding 就像在拉老虎机，AI 正在剥夺人类获得“直觉”的权利

深度学习先驱 Jeremy Howard 严厉批判 Vibe Coding，认为其像老虎机一样剥夺了人类建立代码直觉的权利，并指出 LLM 仅为插值与角色扮演，真正的风险是技术被巨头垄断。

2026-03-09 08:33

AI/ML晚点LatePost8.0

对话诺因李银川：华为出身的天才科学家，想用合成数据造家务机器人

本文是对华为诺亚前科学家李银川的专访，探讨了他创立的具身智能公司诺因智能如何利用合成数据技术路线，致力于研发面向家庭场景的L3级家务机器人。

2026-03-09 09:18

其他晚点LatePost8.0

对话零跑朱江明：如果只看到性价比，那就太低估零跑了

文章通过对话零跑汽车创始人朱江明，深入剖析了零跑通过全域自研、垂直整合和极致成本控制实现规模增长的战略逻辑，以及其“汽车电子化”的行业预判。

2026-03-09 09:18

AI/ML腾讯技术工程8.0

玩转OpenClaw，你需要了解的：核心架构、运作原理、Agent部署步骤

文章深入介绍了OpenClaw多Agent框架的核心架构、运作原理及具体部署步骤，涵盖了源码分析、通信机制及安全风险考量。

2026-03-09 09:27

AI/ML小红书技术REDtech8.0

30B参数超越GPT-5！REDSearcher让「深度搜索Agent」做到低成本可扩展！

文章介绍了REDSearcher团队提出的低成本可扩展Agent训练框架，该框架通过图论定义任务复杂度并合成数据，使30B参数模型在深度搜索任务上超越GPT-5等闭源模型。

2026-03-09 10:01

AI/ML百度Geek说8.0

打造高效易用的Agent Skill

文章深入解析了 Agent Skill 的设计原理与编写实践，阐述了如何通过结构化知识包解决 Agent 缺乏私域经验的痛点，并提供了从设计到评测的完整方法论。

2026-03-09 10:03

AI/ML字节跳动技术团队8.0

OpenViking x OpenClaw：开箱即用解决 Agent 的长期记忆困局

文章介绍了开源项目 OpenViking，通过创新的文件系统式记忆架构，解决了 AI Agent 在长程任务中的记忆遗忘和 Token 成本激增问题，并提供了实验数据与集成方案。

2026-03-09 10:05

AI/ML腾讯科技8.0

20000月薪养得起“龙虾”吗？五个值得关注的误读

文章针对近期爆火的开源AI智能体框架OpenClaw，从部署差异、权限风险、模型成本、产品成熟度及用户适用性五个维度进行了深度剖析，旨在纠正大众对该技术的误读并提供客观的使用建议。

2026-03-09 10:05

云计算字节跳动技术团队8.0

Vibe Coding 一键部署——火山引擎推出 Supabase，驱动Agent 应用快速上线

火山引擎推出火山 Supabase，这是一款全链路 Serverless 的 BaaS 产品，旨在为 AI Agent 开发者提供兼容开源生态且具备高性价比和强安全性的后端解决方案。

2026-03-09 10:05

DevOps得物技术8.0

搜索 C++ 引擎回归能力建设：从自测到工程化准出｜得物技术

文章介绍了得物技术团队针对搜索 C++ 引擎构建的回归能力工程化体系，通过统一流量录制、可归因 DIFF 测试及一键压测，将回归测试集成至发布流水线作为硬性准出标准，实现了从依赖人工到系统化治理的升级。

2026-03-09 10:31

AI/ML奇舞精选8.0

如何为智能体推理引入外部决策步骤

文章介绍了在智能体推理流程中引入显式外部决策步骤的设计理念，通过结构化数据契约和可控的暂停/恢复机制，解决了内部推理在处理模糊参数或复杂约束时的局限性。

2026-03-09 10:32

AI/MLFounder Park8.0

OpenAI 黑客松冠军、英伟达 CES 幕后，都在用同一个 3D 工具

文章介绍了3D生成工具Hyper3D Rodin在OpenAI黑客松冠军项目StoryWorld及英伟达CES主题演讲制作中的应用，强调了其高质量、可编辑及能直接接入生产管线的优势。

2026-03-09 10:39

AI/ML量子位8.0

首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖

无问智科发布业界首个物理AI数据基座平台“无垠”，通过虚实融合技术解决机器人高质量数据稀缺问题，并开源万小时数据以推动行业生态发展。

2026-03-09 10:46

工具效率The JetBrains Blog8.0

Air Launches as Public Preview – A New Wave of Dev Tooling Built on 26 Years of Experience

JetBrains 推出了名为 Air 的公共预览版，这是一个基于其 26 年 IDE 经验构建的智能体开发环境，旨在解决当前 AI 编码工具碎片化问题，支持多代理并发与无缝切换。

2026-03-09 13:02

工具效率The JetBrains Blog8.0

Junie CLI, the LLM-agnostic coding agent, is now in Beta

JetBrains 推出独立 AI 编程代理 Junie CLI，支持多模型、可在终端及 CI/CD 中使用，并采用 BYOK 定价模式。

2026-03-09 13:26

AI/MLDatawhale8.0

我搭了一套国产的小龙虾方案，成本可控，还能 24小时自动干活

文章详细介绍了一套基于 nanobot、豆包大模型 2.0 和 Claude Code 的国产 AI 自动化编程方案，实现了 24 小时无人值守的全栈开发与任务调度，成本低且效果显著。

2026-03-09 14:02

数据库dbaplus社群8.0

为啥会这样？！MySQL并行复制竟然比单线程慢？

文章通过分析一个MySQL 8.0从库复制延迟的反常案例，揭示了在特定业务场景下，并行复制因GAP锁冲突导致性能不如单线程的根本原因。

2026-03-08 23:15

⚡ 快速浏览

极客公园6.0

美国那边也越来越多人意识到：不要再给人写软件了，要写给 Agent 写。 Karpathy：一切软件，都将为 Agent 重写这跟我上个月的文章宣言完全相同，但做了更深入的讲解，非常推荐一起阅读互联网已死，Agent 永生另外这篇文章也正式突破10w+读者，也是 Agent橘公众号创建以来的第一次长文突破10w+，还是在不依赖推荐算法的情况下。（图文早就突破到50w了，但是推荐算法非常神经）总之，很多非共识正在急剧变为共识，加速吧，Agent！

文章探讨了 Andrej Karpathy 提出的观点，即未来软件的开发模式将转变为面向 AI Agent 的开发，并引用了相关高热度文章作为佐证。

MiniMax 稀宇科技6.0