奔跑的高达

开源格局重塑,AI智能体迈入自我进化时代

2026-03-30

✍️ 主编按语

开源格局重塑,AI智能体迈入自我进化时代

今天的文章展现了一个正在发生剧烈转折的AI世界:一方面,美国开源AI的代表性旗帜倒下,中国力量在全球开源代码与OCR领域全面崛起;另一方面,AI智能体(Agent)正在从简单的工具调用走向复杂的自我进化与技能合成。从YC的创业风向到黄仁勋的硬核访谈,我们看到的不仅是技术的迭代,更是整个产业基础设施的重构。

AI风向与产业重构

YC Demo Day(W26)现场复盘:Make Something Agents Want

作为硅谷创业的风向标,YC的Demo Day向来是观察未来趋势的最佳窗口。本届最核心的变化在于叙事从“Make Something People Want”转变为“Make Something Agents Want”。这标志着AI创业的红利期已从面向人的C端应用,转向了为智能体服务的B2B基础设施。无论是AI Infra的占比激增,还是对物理世界机器人的押注,都说明了一个事实:纯软件的AI竞赛已入尾声,下一个十年属于能够驱动物理世界、并为智能体经济提供支撑的“硬科技”。

英伟达早不靠GPU躺赢!黄仁勋终极预判:10亿程序员时代将至,AI智能彻底廉价

黄仁勋在GTC后的深度访谈中,展现了他作为系统级架构师的终极思考。他提出“每瓦每秒产出的Token数”将成为新的竞争指标,并大胆预测未来程序员规模将扩展至10亿级。这并非简单的“取代人类”,而是通过智能体将编程门槛拉低,让每个人都能用自然语言指挥计算机。更重要的是,他强调了“协同设计”的重要性——从芯片到系统,必须作为一个整体来优化,这正是英伟达从一家芯片公司进化为“AI工厂”供应商的核心护城河。

中国开源与硬核突破

美国开源AI最后的旗帜,也倒了

Ai2(艾伦人工智能研究所)核心团队集体离职并加入微软,这标志着美国开源大模型领域的一座重要灯塔熄灭。资金困境是非营利机构在闭源巨头军备竞赛面前的必然宿命。这对比之下,中国开源模型正凭借更强的性能、更开放的姿态(如完全开源权重与训练流程)占据主导。这不仅是技术的胜利,更是开源经济学的胜利——只有具备商业造血能力或国家战略支持的体系,才能在算力昂贵的AGI时代生存。

InCoder-32B开源:320亿参数工业代码基座,保住通用代码能力,工业代码全线领先

北航团队发布的InCoder-32B展示了一条差异化的突围路径:不做通用大模型的陪跑,而是深耕工业代码这一垂直深水区。通过四套生产级仿真环境(芯片设计、GPU内核、嵌入式、3D建模)验证生成的代码,解决了通用模型在Verilog、CUDA等工业语言上的“幻觉”问题。这证明了在通用模型之上,叠加经过真实执行验证的高质量垂类数据,是构建专用基座模型的最优解,对芯片、航天等关键领域的国产化替代意义非凡。

全球OCR新王来自中国开源!GitHub狂揽73300+Star

PaddleOCR登顶GitHub OCR项目榜首,终结了谷歌Tesseract长达数十年的统治。这不仅是Star数的超越,更是技术代际的胜利。基于大模型技术底座,PaddleOCR解决了“异形框定位”等传统难题,并推出了5M参数即可媲美大模型的PP-OCRv5。在数据日益成为大模型核心资产的今天,OCR作为连接物理世界与数字世界的“眼睛”,其战略价值被重估。中国开源项目在这一基础赛道的领跑,意味着我们正在掌握数据入口的主导权。

Agentic Engineering与科学智能

认知重建之后,步入Agentic Engineering的工程革命

如果说Karpathy提出的“Agentic Engineering”是概念雏形,那么这篇4万字的实战记录就是其工程落地的教科书。作者从“一个AGENTS.md文件”出发,在实践中摸索出了一套包含22个Agent、27个Skill的完整体系。核心洞察在于:Agent的“接口”不是代码定义,而是上下文窗口中的信息组合。通过“文档即记忆”和“最小约束”原则,解决了一个困扰业界的难题——如何让AI在真实业务中可靠地协作,而不是仅仅作为聊天机器人存在。

什么时候Agent能自己写skill?|Hao好聊趋势

Agent能否像人类一样,从失败中总结经验并自动封装成Skill?这是通往AGI的关键一步。文章梳理了从EXIF(探索驱动)、EvoSkill(失败驱动)到CASCADE(需求驱动)的最新学术进展,指出Agent自我发现技能的三条路径均已走通。更深层的问题在于Skill的组合与进化——目前的Agent在处理简单技能时尚可,一旦进入嵌套组合,错误率便会指数级上升。如何实现Skill的递归进化与自动化组合,将是下一阶段研究的核心。

上海AI实验室发布“AGI4S珠穆朗玛计划”,构建中国科学智能创新中枢

当大多数目光聚焦于商业应用时,上海AI实验室的“珠穆朗玛计划”将AI的疆域推向了科学发现的无人区。通过构建“算力-数据-自主实验”一体化的基础设施,该计划旨在用AI重构科研生产力。这种“通专融合”的路径,不仅是为了验证物理定理,更是为了解决新药研发、材料科学等领域的周期难题。这是一场举国之力的科研基础设施升级,AI不再仅仅是辅助工具,而是成为了科学家攀登高峰的“脚手架”和“氧气”。

🔥 热门文章 (49 篇)

AI/ML硅星人Pro9.0

YC Demo Day(W26)现场复盘:Make Something Agents Want

文章复盘了YC W26 Demo Day,指出创业风向已从「Make Something People Want」转向「Make Something Agents Want」,重点押注AI Infra、Industrials及Agent金融基础设施,而非简单的ToC应用或人力替代。

AI/ML腾讯科技9.0

什么时候Agent能自己写skill?|Hao好聊趋势

文章深入分析了AI Agent技能(Skill)的自主发现、封装组合及持续进化机制,结合最新学术研究探讨了Agent如何通过代码实现能力的可积累与可复用。

AI/ML腾讯技术工程9.0

认知重建之后,步入Agentic Engineering的工程革命

文章记录了作者从“氛围编程”到构建“Agentic Engineering”体系的深度实践,阐述了如何通过22个Agent、27个Skill的实战落地,解决AI辅助开发中的状态管理、知识沉淀与协同问题。

AI/ML量子位9.0

美国开源AI最后的旗帜,也倒了

美国著名非营利AI研究机构Ai2因资金压力削减开源模型项目,核心团队集体跳槽微软,标志着美国开源AI面临重大挫折。

AI/ML人人都是产品经理8.0

26年AI产品经理为什么必须掌握Harness Engineering?

文章提出了2026年AI产品经理应掌握的Harness Engineering(驾驭工程)概念,主张通过构建约束环境、自动化验证和反馈闭环,将AI应用从依赖Prompt的“玩具”升级为工业级可靠系统,推动PM从质检员转型为系统架构师。

产品设计人人都是产品经理8.0

当AI替你思考:产品经理正在失去什么?

文章探讨了AI作为工具如何潜移默化地导致产品经理丧失需求洞察、结构化思维和独立判断力等核心竞争力,并提出保持“驾驭者”地位的具体建议。

产品设计体验进阶8.0

只因1个很蠢的原因,B端Demo无人预约

文章通过一个林业B端网站的真实案例,分析了因忽视“用户目标”导致Demo预约转化率低的问题,并展示了修改文案和流程后转化率激增的成果。

AI/ML歸藏的AI工具箱8.0

为什么一夜之间大家都在做 CLI?

文章分析了为何各大厂商纷纷转向开发 CLI 工具,指出 CLI 正被重新发明为 AI 的万能插件,其整合了协议、执行能力和说明书,是目前 AI 能力分发最高效的方式。

AI/ML深思圈8.0

一周1300多个PR,揭秘Stripe内部AI工程最佳实践

文章深入分析了Stripe内部自研的AI编码系统Minions,揭示了如何通过自动化工具将编码成本降至接近零,并探讨了从“编写代码”向“管理AI写代码”的工程范式转变。

工具效率数字生命卡兹克8.0

分享6个我觉得应该必装的Skills。

文章精选并评测了6个实用的Claude AI Skills插件,涵盖前端设计、办公文档处理、联网搜索、防止摆烂及记忆管理,旨在通过精简的工具集提升AI代理的使用效率和产出质量。

AI/ML赛博禅心8.0

一个预测未来的模型,它赚到钱了

文章介绍了 UniPat AI 的 ECHO 系统及其 EchoZ-1.0 模型,该模型通过创新的 Train-on-Future 范式评价推理过程而非结果,在预测市场取得高胜率并盈利。

工具效率花叔8.0

Claude Code创始人分享了他最新的15条CC使用技巧!

文章详细介绍了Claude Code创始人Boris Cherny分享的15条最新使用技巧,涵盖移动端控制、自动化循环、大规模并行处理等前沿功能,展示了AI编程工具向高自主性和多端协同演进的趋势。

AI/ML量子位8.0

预测这件事,人类越犹豫,这个大模型越有优势

文章介绍了UniPat AI发布的Echo预测系统及其模型EchoZ-1.0,该系统通过动态评测引擎和Train-on-Future范式解决了预测模型验证难的问题,在多项测试中超越了人类市场和其他顶尖模型。

安全字节跳动技术团队8.0

PrivLLM 协变混淆:隐私保护的 LLM 推理高效实现

字节跳动安全研究团队提出名为PrivLLM的协变混淆技术,通过同步混淆数据与模型参数,在保证推理效率(仅增加10%延时)和准确性(损失<3%)的同时,有效防御LLM推理过程中的隐私泄露风险。

其他深网腾讯新闻8.0

毛利超苹果:宇树IPO背后,对手或许是车企 | 深网

文章深度剖析了宇树科技在递交科创板IPO招股书背景下的业绩表现、商业化落地困境及未来面临的竞争格局,指出其虽实现高毛利和盈利,但仍需补齐“大脑”短板并应对车企的跨界竞争。

AI/ML腾讯研究院8.0

AI不会撒谎,但会转述谎言

文章深入探讨了生成式引擎优化(GEO)如何通过制造虚假信息操控AI搜索结果,揭示了AI时代“概率真相”的风险,并分析了认知模式转变带来的信任危机。

其他笔记侠8.0

周其仁:调研了几年,我找出了3条出路

经济学家周其仁基于实地调研,提出中国企业破局的15字生存铁律:细处求精益、宽处谋布局、高处争独到,并强调以客户为中心是寻路的底层逻辑。

快速浏览

The JetBrains Blog6.0

What’s New in RustRover 2026.1

文章介绍了 RustRover 2026.1 版本的主要更新,包括集成 cargo-nextest、新增调用层次结构、增强 AI 代理支持以及代码分析改进等功能,旨在提升 Rust 团队的开发效率。

谷歌开发者6.0

为 PC 及付费游戏打造更广阔的舞台

Google 宣布升级 Google Play 生态系统,通过引入 PC 专区、支持 PC 游戏直接购买及“一次购买,多端畅玩”等策略,加大对 PC 及付费游戏的支持力度。