开源格局重塑，AI智能体迈入自我进化时代

2026-03-30

✍️ 主编按语

开源格局重塑，AI智能体迈入自我进化时代

今天的文章展现了一个正在发生剧烈转折的AI世界：一方面，美国开源AI的代表性旗帜倒下，中国力量在全球开源代码与OCR领域全面崛起；另一方面，AI智能体（Agent）正在从简单的工具调用走向复杂的自我进化与技能合成。从YC的创业风向到黄仁勋的硬核访谈，我们看到的不仅是技术的迭代，更是整个产业基础设施的重构。

AI风向与产业重构

YC Demo Day（W26）现场复盘：Make Something Agents Want

作为硅谷创业的风向标，YC的Demo Day向来是观察未来趋势的最佳窗口。本届最核心的变化在于叙事从“Make Something People Want”转变为“Make Something Agents Want”。这标志着AI创业的红利期已从面向人的C端应用，转向了为智能体服务的B2B基础设施。无论是AI Infra的占比激增，还是对物理世界机器人的押注，都说明了一个事实：纯软件的AI竞赛已入尾声，下一个十年属于能够驱动物理世界、并为智能体经济提供支撑的“硬科技”。

英伟达早不靠GPU躺赢！黄仁勋终极预判：10亿程序员时代将至，AI智能彻底廉价

黄仁勋在GTC后的深度访谈中，展现了他作为系统级架构师的终极思考。他提出“每瓦每秒产出的Token数”将成为新的竞争指标，并大胆预测未来程序员规模将扩展至10亿级。这并非简单的“取代人类”，而是通过智能体将编程门槛拉低，让每个人都能用自然语言指挥计算机。更重要的是，他强调了“协同设计”的重要性——从芯片到系统，必须作为一个整体来优化，这正是英伟达从一家芯片公司进化为“AI工厂”供应商的核心护城河。

中国开源与硬核突破

美国开源AI最后的旗帜，也倒了

Ai2（艾伦人工智能研究所）核心团队集体离职并加入微软，这标志着美国开源大模型领域的一座重要灯塔熄灭。资金困境是非营利机构在闭源巨头军备竞赛面前的必然宿命。这对比之下，中国开源模型正凭借更强的性能、更开放的姿态（如完全开源权重与训练流程）占据主导。这不仅是技术的胜利，更是开源经济学的胜利——只有具备商业造血能力或国家战略支持的体系，才能在算力昂贵的AGI时代生存。

InCoder-32B开源：320亿参数工业代码基座，保住通用代码能力，工业代码全线领先

北航团队发布的InCoder-32B展示了一条差异化的突围路径：不做通用大模型的陪跑，而是深耕工业代码这一垂直深水区。通过四套生产级仿真环境（芯片设计、GPU内核、嵌入式、3D建模）验证生成的代码，解决了通用模型在Verilog、CUDA等工业语言上的“幻觉”问题。这证明了在通用模型之上，叠加经过真实执行验证的高质量垂类数据，是构建专用基座模型的最优解，对芯片、航天等关键领域的国产化替代意义非凡。

全球OCR新王来自中国开源！GitHub狂揽73300+Star

PaddleOCR登顶GitHub OCR项目榜首，终结了谷歌Tesseract长达数十年的统治。这不仅是Star数的超越，更是技术代际的胜利。基于大模型技术底座，PaddleOCR解决了“异形框定位”等传统难题，并推出了5M参数即可媲美大模型的PP-OCRv5。在数据日益成为大模型核心资产的今天，OCR作为连接物理世界与数字世界的“眼睛”，其战略价值被重估。中国开源项目在这一基础赛道的领跑，意味着我们正在掌握数据入口的主导权。

Agentic Engineering与科学智能

认知重建之后，步入Agentic Engineering的工程革命

如果说Karpathy提出的“Agentic Engineering”是概念雏形，那么这篇4万字的实战记录就是其工程落地的教科书。作者从“一个AGENTS.md文件”出发，在实践中摸索出了一套包含22个Agent、27个Skill的完整体系。核心洞察在于：Agent的“接口”不是代码定义，而是上下文窗口中的信息组合。通过“文档即记忆”和“最小约束”原则，解决了一个困扰业界的难题——如何让AI在真实业务中可靠地协作，而不是仅仅作为聊天机器人存在。

什么时候Agent能自己写skill？｜Hao好聊趋势

Agent能否像人类一样，从失败中总结经验并自动封装成Skill？这是通往AGI的关键一步。文章梳理了从EXIF（探索驱动）、EvoSkill（失败驱动）到CASCADE（需求驱动）的最新学术进展，指出Agent自我发现技能的三条路径均已走通。更深层的问题在于Skill的组合与进化——目前的Agent在处理简单技能时尚可，一旦进入嵌套组合，错误率便会指数级上升。如何实现Skill的递归进化与自动化组合，将是下一阶段研究的核心。

上海AI实验室发布“AGI4S珠穆朗玛计划”，构建中国科学智能创新中枢

当大多数目光聚焦于商业应用时，上海AI实验室的“珠穆朗玛计划”将AI的疆域推向了科学发现的无人区。通过构建“算力-数据-自主实验”一体化的基础设施，该计划旨在用AI重构科研生产力。这种“通专融合”的路径，不仅是为了验证物理定理，更是为了解决新药研发、材料科学等领域的周期难题。这是一场举国之力的科研基础设施升级，AI不再仅仅是辅助工具，而是成为了科学家攀登高峰的“脚手架”和“氧气”。

🔥 热门文章 (49 篇)

AI/MLInfoQ 中文9.0

英伟达早不靠GPU躺赢！黄仁勋终极预判：10亿程序员时代将至，AI智能彻底廉价

本文深入记录了黄仁勋关于NVIDIA战略转型、AI未来四条扩展定律及十亿程序员时代的深度思考，揭示了其从芯片设计向系统级工程演进的底层逻辑。

2026-03-30 07:56

AI/ML量子位9.0

上海AI实验室发布“AGI4S珠穆朗玛计划”，构建中国科学智能创新中枢

上海AI实验室发布“AGI4S珠穆朗玛计划”，通过构建算力、数据、模型一体化的基础设施及全周期孵化体系，旨在打造中国科学智能创新中枢，助力全球科研突破。

2026-03-30 07:24

AI/ML硅星人Pro9.0

YC Demo Day（W26）现场复盘：Make Something Agents Want

文章复盘了YC W26 Demo Day，指出创业风向已从「Make Something People Want」转向「Make Something Agents Want」，重点押注AI Infra、Industrials及Agent金融基础设施，而非简单的ToC应用或人力替代。

2026-03-30 03:11

AI/ML腾讯科技9.0

什么时候Agent能自己写skill？｜Hao好聊趋势

文章深入分析了AI Agent技能（Skill）的自主发现、封装组合及持续进化机制，结合最新学术研究探讨了Agent如何通过代码实现能力的可积累与可复用。

2026-03-30 14:03

AI/MLZ Potentials9.0

速递｜前DeepMind创立，物理世界模型Physical Intelligence，估值四个月内翻倍至110亿美元

由前DeepMind研究人员创立的机器人初创公司Physical Intelligence正在寻求约10亿美元新融资，估值飙升至110亿美元，旨在构建驱动机器人的通用物理世界视觉-语言大模型。

2026-03-30 02:53

AI/ML魔搭ModelScope社区9.0

InCoder-32B开源：320亿参数工业代码基座，保住通用代码能力，工业代码全线领先

北航团队联合多家机构开源32B参数工业代码大模型InCoder-32B，利用250万条真实工业执行验证数据，在芯片设计、GPU内核优化等领域性能领先且保持通用能力。

2026-03-30 11:43

AI/ML量子位9.0

全球OCR新王来自中国开源！GitHub狂揽73300+Star

文章报道了百度PaddleOCR超越谷歌Tesseract登顶GitHub全球OCR项目榜首，并详细解析了其基于文心大模型的技术突破及行业影响。

2026-03-30 14:15

AI/ML腾讯技术工程9.0

认知重建之后，步入Agentic Engineering的工程革命

文章记录了作者从“氛围编程”到构建“Agentic Engineering”体系的深度实践，阐述了如何通过22个Agent、27个Skill的实战落地，解决AI辅助开发中的状态管理、知识沉淀与协同问题。

2026-03-30 09:37

AI/ML量子位9.0

美国开源AI最后的旗帜，也倒了

美国著名非营利AI研究机构Ai2因资金压力削减开源模型项目，核心团队集体跳槽微软，标志着美国开源AI面临重大挫折。

2026-03-30 08:47

云计算AWS Architecture Blog8.0

How Aigen transformed agricultural robotics for sustainable farming with Amazon SageMaker AI

文章详细介绍了农业机器人公司 Aigen 如何利用 Amazon SageMaker AI 和 AWS 云原生架构，克服本地基础设施瓶颈，实现机器学习流程的现代化与规模化。

2026-03-30 15:36

AI/ML人人都是产品经理8.0

26年AI产品经理为什么必须掌握Harness Engineering？

文章提出了2026年AI产品经理应掌握的Harness Engineering（驾驭工程）概念，主张通过构建约束环境、自动化验证和反馈闭环，将AI应用从依赖Prompt的“玩具”升级为工业级可靠系统，推动PM从质检员转型为系统架构师。

2026-03-29 23:46

产品设计人人都是产品经理8.0

当AI替你思考：产品经理正在失去什么？

文章探讨了AI作为工具如何潜移默化地导致产品经理丧失需求洞察、结构化思维和独立判断力等核心竞争力，并提出保持“驾驭者”地位的具体建议。

2026-03-29 23:46

产品设计体验进阶8.0

只因1个很蠢的原因，B端Demo无人预约

文章通过一个林业B端网站的真实案例，分析了因忽视“用户目标”导致Demo预约转化率低的问题，并展示了修改文案和流程后转化率激增的成果。

2026-03-30 00:20

AI/ML阿里云开发者8.0

学习笔记：从 Agent 到 Skills — AI 智能体架构的范式转变

文章深入探讨了从单体 Agent 到模块化 Skills 的架构范式转变，通过真实项目案例详细解析了 MCP、Skills 及 OpenClaw 的实战应用与目录结构。

2026-03-30 00:31

AI/ML歸藏的AI工具箱8.0

为什么一夜之间大家都在做 CLI？

文章分析了为何各大厂商纷纷转向开发 CLI 工具，指出 CLI 正被重新发明为 AI 的万能插件，其整合了协议、执行能力和说明书，是目前 AI 能力分发最高效的方式。

2026-03-30 00:31

AI/ML深思圈8.0

一周1300多个PR，揭秘Stripe内部AI工程最佳实践

文章深入分析了Stripe内部自研的AI编码系统Minions，揭示了如何通过自动化工具将编码成本降至接近零，并探讨了从“编写代码”向“管理AI写代码”的工程范式转变。

2026-03-30 00:38

前端开发前端充电宝8.0

困扰前端20年，这个地狱级难题终于解决了，一天暴涨 10k Star！

文章介绍了名为 Pretext 的 TypeScript 文本布局引擎，它通过 Canvas 和 Intl.Segmenter 实现文本高度和换行的纯计算，解决了困扰前端多年的 DOM 性能抖动问题。

2026-03-30 00:46

AI/ML前端早读课8.0

【早说】用Karpathy的自动研究法，让Claude技能全自动进化

本文介绍了基于 Andrej Karpathy 的“自动研究”理念，利用 AI 代理自动循环测试并打磨 Claude 技能提示词的方法，实现了落地页文案通过率从 56% 到 92% 的全自动提升。

2026-03-30 01:03

AI/ML机器之心8.0

ICLR 2026 | 让多模态模型学会主动说话：主动交互从训练到评估的完整方案

文章介绍了针对视频多模态模型主动交互能力的完整解决方案，包括首个评估基准 ProactiveVideoQA 和基于强化学习的训练模型 MMDuet2，旨在解决模型自主决定何时回复的问题。

2026-03-30 01:34

AI/ML机器之心8.0

Echo：预测智能的一小步，通往通用智能的一大步

UniPat AI 发布了 Echo 预测智能系统，通过动态评测引擎和 Train-on-Future 范式训练的 EchoZ-1.0 模型，在多项基准测试中超越人类预测者及 GPT-5.2 等顶级模型。

2026-03-30 01:34

工具效率数字生命卡兹克8.0

分享6个我觉得应该必装的Skills。

文章精选并评测了6个实用的Claude AI Skills插件，涵盖前端设计、办公文档处理、联网搜索、防止摆烂及记忆管理，旨在通过精简的工具集提升AI代理的使用效率和产出质量。

2026-03-30 02:09

AI/ML硅星人Pro8.0

两看相厌：Agent 和传统软件，都觉得对方是屎山

文章探讨了AI Agent与传统软件之间的“两看相厌”现象，分析了双方互不兼容的根源及不对称性，并预测了“双栖软件”作为中间层的未来机会。

2026-03-30 03:11

AI/ML赛博禅心8.0

一个预测未来的模型，它赚到钱了

文章介绍了 UniPat AI 的 ECHO 系统及其 EchoZ-1.0 模型，该模型通过创新的 Train-on-Future 范式评价推理过程而非结果，在预测市场取得高胜率并盈利。

2026-03-30 03:13

AI/ML量子位8.0

60%用户还在乱养虾！9位大神亮招：有人多赚一笔钱，有人多睡1小时｜量子位沙龙

文章记录了一场关于AI智能体“养虾”的实战沙龙，分享了从个人生活自动化、法律辅助到情感陪伴等多个领域的Agent应用案例及调教心法。

2026-03-30 03:49

AI/ML印记中文8.0

AI 周刊 #077 - Claude 支持直接控制电脑，Codex 推出 Plugins，产品经理AI时代如何干活

本周刊汇总了 Claude 电脑操控能力、Codex 插件系统等前沿动态，并深入探讨了 AI 时代产品经理的工作流转型与 Agentic Engineering 工程实践。

2026-03-30 04:03

工具效率向阳乔木推荐看8.0

我的飞书被AI“接管”了：一行命令干完一天的活！

文章介绍了飞书开源的CLI工具，它将飞书的协作能力封装成命令，使AI Agent能够通过自然语言直接操作飞书，实现文档查找、多维表格创建、日程管理等工作流自动化。

2026-03-30 04:20

其他经纬创投8.0

19岁雨天追车3小时只为上电视，张雪用20年冲成了世界冠军 |【经纬低调分享】

文章讲述了张雪从19岁辍学少年为上电视死缠烂打记者，到20年后带领中国车队在世界摩托车锦标赛夺冠的励志故事。

2026-03-30 04:42

工具效率花叔8.0

Claude Code创始人分享了他最新的15条CC使用技巧！

文章详细介绍了Claude Code创始人Boris Cherny分享的15条最新使用技巧，涵盖移动端控制、自动化循环、大规模并行处理等前沿功能，展示了AI编程工具向高自主性和多端协同演进的趋势。

2026-03-30 04:44

工具效率AI寒武纪8.0

Claude Code之父独家分享：15个最喜欢、但经常被忽略的CC功能

Claude Code之父Boris Cherny分享了15个高频使用但常被忽略的功能，涵盖多端同步、自动化任务、Web开发调试及并行工作流等实用技巧。

2026-03-30 05:30

其他甲子光年8.0

HPC迎来AI大考，鲲鹏如何为开发者“减负”？｜甲子光年

文章探讨了在AI4S趋势下，鲲鹏处理器通过软硬协同的HPCKit等工具栈降低开发复杂度，并结合AlphaFold2等案例展示了CPU在混合计算负载中的性能潜力。

2026-03-30 05:44

AI/ML大淘宝技术8.0

从 Vibe Coding 到范式编程：用 Spec 打造淘系交易的 AI 领域专家

文章提出了从“Vibe Coding”向“范式编程”演进的技术路径，通过构建结构化规范驱动AI生成符合淘系交易领域标准的企业级代码。

2026-03-30 07:37

AI/MLAI科技评论8.0

夏中谱去向悬念落地，「地平线」+「理想汽车」齐聚无界动力

前理想智驾端到端负责人夏中谱正式加入通用具身智能公司无界动力任联合创始人兼联席CTO，与地平线前高管张玉峰组成强强联手的技术与商业团队。

2026-03-30 07:41

AI/MLInfoQ 中文8.0

通义实验室推出CoPaw，更适合打工人的国产龙虾来了

文章深度测评了通义实验室推出的CoPaw个人AI助理，展示其在自动化办公、知识库搭建等场景的应用，并解析了其底层架构与安全机制。

2026-03-30 07:56

AI/MLInfoQ 中文8.0

告别“语义黑盒”：当 Agent 走进生产环境，我们如何驯服它的“不可预测”？

文章探讨了在 Agent 走向生产环境时，如何通过构建全链路语义观测体系和评估工程来解决其固有的不确定性，从而实现系统的可观测、可诊断与可干预。

2026-03-30 07:56

AI/ML量子位8.0

预测这件事，人类越犹豫，这个大模型越有优势

文章介绍了UniPat AI发布的Echo预测系统及其模型EchoZ-1.0，该系统通过动态评测引擎和Train-on-Future范式解决了预测模型验证难的问题，在多项测试中超越了人类市场和其他顶尖模型。

2026-03-30 08:34

安全字节跳动技术团队8.0

PrivLLM 协变混淆：隐私保护的 LLM 推理高效实现

字节跳动安全研究团队提出名为PrivLLM的协变混淆技术，通过同步混淆数据与模型参数，在保证推理效率（仅增加10%延时）和准确性（损失<3%）的同时，有效防御LLM推理过程中的隐私泄露风险。

2026-03-30 09:02

AI/MLAI科技大本营8.0

杨立昆公开“手撕”Meta 内部环境：“LLM 吸光了房间里的空气”，物理世界才是 AGI 的终局

杨立昆在对话中深入剖析了LLM路线的局限性，提出AI应通过JEPA架构学习物理抽象和世界模型，而非单纯的生成式重建，并透露因资源分配问题离开Meta创立AMI Labs。

2026-03-30 09:08

其他深网腾讯新闻8.0

毛利超苹果：宇树IPO背后，对手或许是车企 | 深网

文章深度剖析了宇树科技在递交科创板IPO招股书背景下的业绩表现、商业化落地困境及未来面临的竞争格局，指出其虽实现高毛利和盈利，但仍需补齐“大脑”短板并应对车企的跨界竞争。

2026-03-30 09:17

AI/ML腾讯研究院8.0

AI不会撒谎，但会转述谎言

文章深入探讨了生成式引擎优化（GEO）如何通过制造虚假信息操控AI搜索结果，揭示了AI时代“概率真相”的风险，并分析了认知模式转变带来的信任危机。

2026-03-30 09:51

AI/ML阿里研究院8.0

产业之声 | 智能体重构软件产业：中国能否借此完成“路径跃迁”

文章分析了AI智能体对中美软件产业带来的差异化冲击，指出中国可利用数字化“历史欠账”和工程师规模优势，在隐性知识沉淀与基础设施重构中实现路径跃迁。

2026-03-30 09:57

后端架构百度Geek说8.0

我用 Go 重写了一个 OpenClaw 框架：这就是 GoClaw

文章介绍了作者用 Go 语言重写 OpenClaw 框架的实践成果 GoClaw，探讨如何通过 Go 的工程特性解决 AI Agent 在长期运行中的稳定性、部署和可观测性问题。

2026-03-30 10:02

前端开发奇舞精选8.0

当网站开始为 Agent 提供接口，Web 的交互边界正在改变｜从 WebMCP 看网页如何从“界面”走向“能力入口”

文章通过分析 Chrome 的 WebMCP，探讨了网页从仅面向人类的 GUI 界面，向同时面向 Agent 暴露可调用能力的“能力入口”转变的趋势。

2026-03-30 10:03

AI/MLFounder Park8.0

三大模态模型全部登顶后，昆仑万维正式披露了 2026 年 AGI 战略

昆仑万维正式披露 2026 年 AGI 战略，提出「3+1」生态架构，并详细解读了 SkyReels V4、Matrix-Game 3.0、Mureka V9 三大 SOTA 模型的技术突破与应用场景。

2026-03-30 10:13

工具效率The JetBrains Blog8.0

ReSharper 2026.1: Built-in Performance Monitoring, Expansion to VS Code, and Faster Everyday Workflows

ReSharper 2026.1 发布，引入了内置运行时性能监控工具，并首次将其 C# 工具扩展至 VS Code，同时显著提升了 IDE 响应速度和 C++ 支持。

2026-03-30 10:47

AI/ML山行AI8.0

今天 GitHub Trending 变天了：AI Agent、Claude Code 和语音 AI 为何一起冲上最前排？

文章分析了 GitHub Trending 当日热门项目，指出 AI 开发工作流爆发，Claude Code 生态成形，语音 AI 与 Agent 工程化成为关键趋势。

2026-03-30 11:15

其他笔记侠8.0

周其仁：调研了几年，我找出了3条出路

经济学家周其仁基于实地调研，提出中国企业破局的15字生存铁律：细处求精益、宽处谋布局、高处争独到，并强调以客户为中心是寻路的底层逻辑。

2026-03-30 13:31

AI/MLDatawhale8.0

成为真正的AI Native Coder，一个研究生实践6个月的思考！

文章探讨了程序员如何从传统的编码模式向AI Native Coder转变，提出了从Vibe Coding到基于文件的AI Coding，再到规范驱动开发（SDD）的三阶段进化路径，并强调了规范作为团队资产的重要性。

2026-03-30 14:20

AI/ML量子位8.0

阿里发布Qwen3.5-Omni，多模态能力超越Gemini-3.1 Pro

阿里发布Qwen3.5-Omni模型，多模态能力超越Gemini-3.1 Pro且成本极低，展现了极高的性价比。

2026-03-30 14:21

数据库dbaplus社群8.0

MySQL里藏着一个会自己长大的文件，90%的DBA都忽略了

文章深入分析了MySQL中ibtmp1临时表空间文件无限膨胀导致磁盘爆满的原因，并提供了设置文件大小限制和优化低效SQL的解决方案。

2026-03-29 23:16

⚡ 快速浏览

少数派6.0