技术日报

2026-05-12

✍️ 主编按语

{
  "title": "数据流架构对决英伟达，国产AI Agent落地激战",
  "content": "### AI 落地与架构：从云端理论到端侧实践\n\n[Agent Skill规范、构建与设计模式](https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247559942&idx=1&sn=08953bb9fff5a3594e80a381157c5c11) - 阿里云这篇深度长文不仅是对 Anthropic 官方规范的中文解读，更是一份 AI 原生时代的软件工程指南。它揭示了 Skill 生态的演进：从最初的单纯 Prompt，进化为具备三层渐进式加载机制（L1 元数据、L2 指令、L3 资源）的标准化系统。这解决了长期困扰 Agent 落地的上下文膨胀问题，使得单个 Agent 可低成本挂载 20+ Skills。文章对 Skill-Creator 开发流程的拆解极具实战价值，特别是引入了“像做机器学习一样做 Prompt Engineering”的工程化思维。对开发者而言，这意味着 AI 应用开发正在从“手艺活”走向可度量、可迭代的标准化流程，是构建高质量 AI Agent 的必读之作。\n\n[QCon 北京 2026 | 把自动化测试当 AI Coding 来做：小红书 GUI Agent 实战回顾](https://mp.weixin.qq.com/s?__biz=Mzg4OTc2MzczNg==&mid=2247495245&idx=1&sn=b9a041f238016c2727189ef80b9b07f) - 小红书这篇分享堪称 GUI Agent 领域的“教科书级”实战复盘，完美诠释了“工程化让 AI 落地”的真谛。他们没有盲目崇拜纯视觉模型，而是创造性地提出了“双 Agent 协作”架构：用昂贵的主 Agent 负责业务逻辑和代码生成（Codings），用轻量的视觉子 Agent 专注于原子级的 UI 元素定位。这种“贵贱搭配”不仅将单步定位成本压缩了 10-30 倍，还通过固化脚本让回归测试成本逼近零 Token。更精彩的是，他们通过构建“操作图谱”将 GUI Agent 从“看图猜操作”升级为“按已知路径验证”，有效压制了幻觉。这对所有试图将 Agent 引入复杂业务场景的团队都是一记警钟：在真实生产环境中，极致的成本控制和严谨的工程架构，比单纯追求模型参数更关键。\n\n### 底层硬核：算力与芯片的革命\n\n[对谈理想 CTO 谢炎：AI 时代需要新的计算架构，我想在汽车上试出来](https://mp.weixin.qq.com/s?__biz=MzU3Mjk1OTQ0Ng==&mid=2247535935&idx=2&sn=5a5ea21bda6e78d9c8dec2aaf026bba4) - 在英伟达几乎垄断 AI 算力的当下，理想 CTO 谢炎的选择显得尤为悲壮且具有前瞻性。他力排众议，放弃了主流的 GPGPU 路径，押注 70 年代提出但从未大规模商用的“数据流架构”。这并非为了炫技，而是为了解决 AI 时代海量数据搬运带来的效率损耗。理想马赫 M100 芯片实测有效算力达到英伟达 Thor-U 的 3 倍，证明了去中心化、数据驱动计算在特定场景下的巨大潜力。谢炎的核心观点尤为振聋发聩：随着 AI 逐渐取代人类成为编程主力，CUDA 这类“拐杖”的重要性将降低，而推理效率将成为决胜关键。这不仅是一家车企的技术突围，更是中国芯片产业跳出“跟随战略”、尝试定义下一代计算机架构的重要尝试。\n\n[去掉 VAE 之后，商汤用 8B 参数重新定义了开源生图的上限](https://mp.weixin.qq.com/s?__biz=MzA5ODEzMjIyMA==&mid=2247734685&idx=1&sn=82f93d6dedfec41817c44dcb548c3ceb) - 商汤 SenseNova U1 的开源，是对多模态领域长期“两条腿走路”（理解与生成分离）范式的一次重大挑战。其 NEO-unify 架构最激进之处在于彻底摒弃了 VAE（变分自编码器），直接在像素层面进行端到端的建模。这看似是“复古”，实则是对信息损耗的宣战——VAE 的压缩过程本质上是有损的。商汤通过原生的混合 Transformer 主干，让语言与视觉信息在同一个表征空间里共同参与每一层计算，实现了从“模态集成”到“原生统一”的跨越。8B 的体量在多项基准测试中达到 SOTA，甚至超越了一些大型闭源模型，证明了架构创新比单纯堆砌参数更有价值。对于行业而言，这意味着多模态模型的竞争正在从“算力军备竞赛”转向“架构设计竞赛”，更高效、更统一的模型将成为新宠。\n\n[AI芯片独角兽Cerebras上调IPO规模，拟融资48亿美元、超额认购20倍](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247515626&idx=3&sn=f261099403c07f9ed029320c42769527) - Cerebras 的 IPO 备受瞩目，不仅因为其高达 48 亿美元的融资规模，更因为它是挑战英伟达霸权的代表性力量。这家以巨型 WSE 芯片著称的公司，正在寻求 344 亿美元的估值，且 OpenAI 持有大量认股权证。这一现象背后，是市场对于“非 CUDA”算力解决方案的极度渴望。在 AI 需求爆炸的当下，任何能提供更高性价比算力的方案，都会获得资本的狂热追捧。这也印证了理想 CTO 谢炎的观点：单一架构的统治力正在松动，多样化的专用架构迎来了前所未有的发展窗口期。\n\n### 资本与生态：AI 商业化的加速跑\n\n[速递｜OpenAI砸45亿美元成立AI部署公司，收购咨询公司Tomoro，布局企业AI](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247515626&idx=2&sn=a9824c4e45c898d5ba29a0337c5ea27d) - OpenAI 收购咨询公司 Tomoro 并成立合资企业的举动，标志着 AI 巨头的竞争已从“模型层”下沉至“服务层”。单纯拥有强大的 GPT 模型已不足以征服企业市场，如何帮助企业将 AI 软件真正部署并产生价值，成为了新的护城河。OpenAI 联手 TPG、Brookfield 等私募巨头，投入巨资组建“服务型军队”，本质上是在解决 AI 落地的“最后一公里”问题。这暗示着 AI 行业的商业逻辑正在发生变化：技术不再是唯一的变现途径，能够提供深度行业咨询和定制化部署的能力，将成为未来的核心竞争力。\n\n[估值200亿美元！可灵AI被曝剥离快手单独融资](https://www.qbitai.com/2026/05/416056.html) - 快手拟分拆可灵 AI 并寻求 200 亿美元估值的消息，不仅是一个资本故事，更是大厂拆分 AI 资产以释放价值的标志性事件。可灵 ARR 已达 5 亿美元，且在海外市场表现强劲，证明了“垂直领域的 AI 应用”可以独立存活并盈利。更重要的是，这一分拆行为本身反映了中国 AI 估值体系正在重构——从单纯的“对标 OpenAI 1%-2%”，转向基于具体业务现金流的市场化定价。对于开发者来说，这意味着 AI 创业不再只有“做基座大模型”这一条独木桥，视频生成、办公提效等垂直赛道完全有机会孕育出下一个巨头。\n\n### 安全与科研：不容忽视的基石\n\n[High-Severity Security Issue Affecting TeamCity On-Premises (CVE-2026-44413)](https://blog.jetbrains.com/teamcity/2026/05/cve-2026-44413/) - JetBrains TeamCity 曝出的高危漏洞 CVE-2026-44413 提醒我们，在 AI 飞速发展的同时，传统基础设施的安全防线依然至关重要。该漏洞允许认证用户暴露 API，这意味着攻击者一旦突破外层防线，便能利用合法权限进行横向渗透。对于 DevOps 团队而言，这不仅是打补丁的问题，更是一次审视 CI/CD 流程安全性的契机。在构建自动化 Agent 测试（如小红书案例）时，必须考虑工具链本身的安全边界，否则智能化带来的可能不是效率提升，而是风险敞口的指数级扩大。\n\n[Advancing AI for materials with MatterSim: experimental synthesis

🔥 热门文章 (42 篇)

AI/MLZ Potentials9.0

速递｜AI芯片独角兽Cerebras上调IPO规模，拟融资48亿美元、超额认购20倍

AI芯片独角兽Cerebras大幅上调IPO规模，拟融资48亿美元，估值达344亿美元，并获得20倍超额认购，成为今年美国最大传统IPO。

2026-05-12 03:06

AI/ML阿里云开发者9.0

Agent Skill规范、构建与设计模式

文章深度解析了 Anthropic 提出的 Agent Skill 规范标准，详细阐述了三层渐进式加载机制及 Skill-Creator 的工程化开发范式，旨在为 AI Agent 构建结构化、可复用的行为技能。

2026-05-12 00:31

AI/ML晚点LatePost9.0

对谈理想 CTO 谢炎：AI 时代需要新的计算架构，我想在汽车上试出来

理想汽车 CTO 谢炎详解了自研智驾芯片“马赫 M100”的决策过程与技术路线，阐述了为何放弃传统 GPGPU 而选择数据流架构，以及如何通过软硬协同实现 AI 时代计算架构的创新。

2026-05-12 11:21

AI/MLAI科技评论9.0

去掉 VAE 之后，商汤用 8B 参数重新定义了开源生图的上限

商汤发布开源多模态模型 SenseNova U1，基于 NEO-unify 架构摒弃 VAE，实现了多模态理解与生成的原生统一，在 8B 参数量下达到 SOTA 水平并支持商用。

2026-05-12 10:01

安全The JetBrains Blog9.0

High-Severity Security Issue Affecting TeamCity On-Premises (CVE-2026-44413) – Update to 2026.1 Now

JetBrains 公布 TeamCity On-Premises 存在高危认证后漏洞 CVE-2026-44413，攻击者可借此暴露部分 API，官方已发布 2026.1 版本修复并提供了安全补丁插件。

2026-05-11 16:14

AI/ML小红书技术REDtech9.0

QCon 北京 2026 | 把自动化测试当 AI Coding 来做：小红书 GUI Agent 实战回顾

本文回顾了小红书在 QCon 北京 2026 的分享，详细介绍了其 GUI Agent 在自动化测试中的工程落地实践，包括分层架构设计、双模型协作策略及成本优化手段。

2026-05-12 10:01

AI/MLMicrosoft Research Blog9.0

Advancing AI for materials with MatterSim: experimental synthesis, faster simulation, and multi-task models

Microsoft Research 发布了 MatterSim 的重大更新，包括通过实验验证的高性能热导体材料（TaP）预测、加速的 v1 模型推理，以及能够模拟复杂多物理现象的多任务基础模型 MatterSim-MT。

2026-05-12 13:00

AI/ML量子位9.0

估值200亿美元！可灵AI被曝剥离快手单独融资

文章报道了快手计划分拆视频生成模型可灵AI并进行独立融资的消息，目标估值高达200亿美元，并计划明年启动IPO，这标志着AI视频生成赛道商业化价值的重估。

2026-05-12 06:06

AI/MLZ Potentials9.0

速递｜OpenAI砸45亿美元成立AI部署公司，收购咨询公司Tomoro，布局企业AI

OpenAI宣布收购咨询公司Tomoro并成立合资企业，联合多家私募股权公司注资45亿美元，旨在加速AI软件在企业中的部署与应用。

2026-05-12 03:06

其他晚点LatePost9.0

晚点独家丨拼多多千亿 “新拼姆” 计划：百人团队、大牌工厂、Temu 变重

拼多多宣布启动千亿“新拼姆”计划，通过自营品牌模式深入供应链，旨在解决Temu面临的品质信任与关税合规问题，推动平台从极致低价向中端品质转型。

2026-05-12 11:21

AI/ML腾讯研究院8.0

首次付费是AI消费爆发的引爆点 | T-ask调研

基于2026年腾讯研究院T-ask调研数据，分析了AI大模型的普及现状、付费转化机制以及软硬件消费的联动效应，指出首次付费和高频使用是激活AI消费的关键。

2026-05-12 08:41

DevOpsThe JetBrains Blog8.0

TeamCity 2026.1: CLI, MCP for AI Agents, Pipelines Enhancements, and More

JetBrains 发布 TeamCity 2026.1 版本，引入了 TeamCity CLI、MCP 支持、Pipelines 增强（如 Kotlin DSL 支持和依赖管理）以及 SAML 身份验证集成，并修复了一个严重的安全漏洞。

2026-05-12 08:59

其他硅谷1018.0

20年内CAR-T治愈癌症？与刘诚博士聊聊癌症治疗的底层哲学

文章通过对话刘诚博士，深度解析了CAR-T疗法的底层哲学、技术演进（从体外到体内）、面临的挑战及中国在该领域的竞争优势。

2026-05-12 09:01

其他Martin Fowler8.0

What is Code

文章重新定义了代码的价值，认为随着 LLM 使编写指令变得廉价，代码的核心价值在于构建领域概念模型和共享词汇。

2026-05-12 13:30

AI/ML腾讯云开发者8.0

拆完Hermes源码，我发现Agent的"自我进化"根本不需要训练模型

文章深度拆解了 Hermes Agent 源码，揭示其通过 Prompt Engineering 与文件持久化实现 Agent 自我进化的机制，并与 OpenClaw 进行了详细对比。

2026-05-12 00:46

前端开发前端早读课8.0

【第3696期】Github：差异对比行的性能攀登之路

GitHub 团队通过精简 React 组件树、引入 O(1) 数据访问模式及窗口虚拟化技术，成功将大型 Pull Request 差异对比页面的渲染性能和内存占用优化了数倍。

2026-05-12 01:02

AI/ML真格基金8.0

歸藏：从 Prompt 到 Harness，上下文就是一切

本文是对开发者“歸藏”的访谈，深入探讨了从 Prompt Engineering 到 Harness（模型外一切工具与流程）的范式转变，以及如何利用上下文控制实现非程序员的高效开发。

2026-05-12 01:03

AI/ML乌鸦智能说8.0

200亿的可灵，90亿的快手主站，一定有一个是错的？

文章分析了中国AI资产在资本市场的系统性重估，指出快手可灵200亿美元估值与主站业务的反差，并对比了中美AI核心资产的估值差距正在缩小。

2026-05-12 11:01

AI/MLMicrosoft Research Blog8.0

SocialReasoning-Bench: Measuring whether AI agents act in users’ best interests

微软研究院发布了SocialReasoning-Bench基准，用于评估AI代理在日历协调和市场谈判等社交情境中代表用户利益进行推理和谈判的能力。

2026-05-11 17:19

AI/MLAI科技评论8.0

AI 会笑吗？BIGAI & 上交大团队：多模态大模型是否真的能 get 到视频笑点｜ACL 2026

上海交通大学与BIGAI团队发布v-HUB基准测试，评估多模态大模型在无对白短视频中的幽默理解能力，揭示当前模型在视觉听觉融合与笑点推理上仍与人类存在显著差距。

2026-05-12 10:01

AI/ML笔记侠8.0

75%管理者踩坑，别急着上AI！先看这3点

文章分析了企业盲目部署AI智能体的现状与误区，提出了“智能体三大机遇圈”模型及从定义到部署的详细实操建议，旨在帮助企业规避风险、实现有效落地。

2026-05-12 13:30

AI/ML数字生命卡兹克8.0

分享5个Claude Code + 飞书的超实用Agent办公玩法。

文章分享了5个将Claude Code与飞书CLI结合的Agent实战案例，展示了如何通过自动化工具实现会议知识库构建、工作复盘、业务流程自动化、协同画板生成及自动报销审批。

2026-05-12 02:08

工具效率硅星人Pro8.0

大厂让程序员卷 AI，4 个月烧掉全年预算，CTO 懵了

文章通过 Uber 的案例揭示了 AI 编程工具在企业中普及后导致的预算失控问题，探讨了当 AI 工具极度易用时，企业如何面对从“推广使用”到“控制用量”的管理挑战。

2026-05-12 02:35

AI/MLAI科技评论8.0

CVPR 2026 视频模型趋势梳理：不止生成下一帧，更要理解下一步

文章梳理了CVPR 2026视频模型趋势，指出重心已从视觉质量转向对时间、空间和物理规律的建模能力，涵盖运动控制、高效表征及真实场景应用等方向。

2026-05-12 10:01

AI/ML硅星人Pro8.0

对话小宿科技：搜索比推理便宜10倍，但90%的人不知道

文章对话小宿科技CEO杜知恒，探讨了AI Agent时代如何通过将搜索与推理解耦、优化数据输入质量和选择合适模型来大幅降低Token成本。

2026-05-12 02:35

AI/MLZ Potentials8.0

Z Potentials｜腾讯T15与Adobe科学家联手：大厂在做“打印机”，我们做AI视频的灵魂

本文访谈了由腾讯T15与Adobe科学家创立的Anijam团队，阐述了其为何选择以动画为切入点、利用Multi-Agent架构构建AI视频工具的产品逻辑，并分享了对底层模型与Agent关系的深度技术见解。

2026-05-12 03:06

AI/ML腾讯科技8.0

暴跌漩涡中，软件选择主动被大模型“吞噬”

文章分析了在AI Agent兴起背景下，软件行业如何通过重构为Agent可调用的Skill和Plugin来应对变革，探讨了这一新分发逻辑下的商业模式与生态未来。

2026-05-12 03:26

云计算AWS Architecture Blog8.0

Choosing between single or multiple organizations in AWS Organizations

文章深入分析了企业在采用AWS时选择单一组织还是多组织架构的决策标准，对比了两者在治理、成本、隔离性及运营效率方面的利弊。

2026-05-11 18:56

云计算AWS Architecture Blog8.0

Building hybrid multi-tenant architecture for stateful services on AWS

文章介绍了一种基于AWS的混合多租户架构，通过分层设计、Route 53加权路由和共享AWS PrivateLink连接，解决了大规模有状态服务在租户隔离与运营效率之间的平衡问题。

2026-05-12 13:26

其他经纬创投8.0

AI正在杀死“传统公司”？|【经纬低调出品】

文章基于硅谷热门观点，探讨在AI技术红利被抹平、产品极易被复制的背景下，公司独特的组织形态成为不可复制的核心护城河。

2026-05-12 04:13

AI/ML魔搭ModelScope社区8.0

蚂蚁·安诊儿医疗大模型：6.1B激活即登顶三大医疗榜单，魔搭在线体验已开放

文章介绍了蚂蚁集团与浙江省卫健委联合发布的全球首个开源千亿级医疗大模型“蚂蚁·安诊儿”，该模型采用MoE架构，在多项权威医疗评测中位居前列。

2026-05-12 12:54

后端架构海外独角兽8.0

Supabase：百亿美元估值，vibe coding 的默认后端？

文章深入分析了 Supabase 如何凭借 PostgreSQL 生态优势成为 Vibe Coding 和 AI Agent 时代的默认后端，并探讨了其在 Agent-first、Scalability 和企业级能力上的产品布局与未来挑战。

2026-05-12 12:02

工具效率CSDN8.0

“氛围编程让一切看起来很廉价，我要回归手写编码了！”

文章作者记录了完全依赖AI（氛围编程）开发Kubernetes TUI工具的失败实验，揭示了AI虽然能快速生成代码，但无法替代架构设计。

2026-05-12 09:44

AI/MLAI前线8.0

ChatGPT那一套要过时了？翁荔实测创业首个模型，回合制AI被“原生实时交互”秒了

OpenAI前高管创立的Thinking Machines发布了首个原生实时交互模型TML-Interaction-Small，通过全双工架构和微回合设计，打破了传统AI的“回合制”限制，实现了毫秒级的自然多模态交互。

2026-05-12 05:05

AI/ML甲子光年8.0

地瓜机器人携手虚时科技，补上具身智能的仿真数据“黑洞”｜甲子光年

文章介绍了虚时科技与地瓜机器人联合发布的AnySceneGen平台，该平台利用Code-to-Space技术解决了具身智能训练中仿真空间数据供给的规模化难题。

2026-05-12 05:48

数据库Founder Park8.0

Agent Infra 实践复盘：Kimi 如何搭建 Agent 背后的 Database 服务

PingCAP 联合创始人黄东旭复盘了 TiDB Cloud 为 Kimi Agent 建站服务的支持细节，探讨了面向海量长尾租户的 Agent 数据库架构设计，强调通过虚拟化、统一技术栈和极致弹性来实现低成本、高并发的交付。

2026-05-12 11:56

其他Web3天空之城8.0

李录：我们时代的全球价值投资 | 在北大光华管理学院的演讲2024-12-07 | 全文图解

李录在北大光华的演讲中提出中国正处于“2.5文明”状态，深入分析了跨越中等收入陷阱所需的信用体系与资本市场改革，并重申了价值投资的六大核心信条。

2026-05-12 06:36

AI/ML智东西8.0

帮乔布斯造iPhone的公司，成了AI基建的“救世主”

文章讲述了拥有175年历史的玻璃巨头康宁，凭借在光通信领域的长期积累，成功抓住生成式AI爆发带来的数据中心建设机遇，通过获得英伟达和Meta的巨额订单，实现了从传统玻璃厂商向AI基建核心供应商的转型与市值飞升。

2026-05-12 11:28

AI/ML智东西8.0

奥尔特曼遭美国政府调查！

美国众议院及多州总检察长调查OpenAI CEO奥尔特曼，指控其利用公司资源为个人持股公司Helion谋利，涉及利益冲突。

2026-05-12 11:28

AI/ML量子位8.0

龙虾退烧后，荣耀给它造了一个宇宙

文章深入测评了荣耀发布的“YOYO Claw 小龙虾宇宙”，分析了其如何通过整合 OpenClaw 框架降低 AI Agent 使用门槛，并探讨了手机厂商在端侧 AI 与 Agent 路线上的布局与行业趋势。

2026-05-12 07:17

工具效率花叔8.0

Claude Code发布Agent View，多任务流的ADHD患者有救了

文章深入解析了Claude Code发布的Agent View功能，阐述其通过可视化面板和git worktree隔离机制解决多Agent并行任务中的人类注意力管理与代码冲突问题。

2026-05-12 07:20

AI/ML量子位8.0

AI第一金主黄仁勋：日均花掉20亿

文章深度分析了英伟达及其CEO黄仁勋在AI领域的巨额投资布局，揭示了其日均花费20亿、全方位覆盖从模型到硬件产业链的策略，以及通过资本绑定以巩固自身生态位的商业逻辑。

2026-05-12 08:03

⚡ 快速浏览

白鲸出海6.0