速递|Anthropic承诺五年向谷歌云支出2000亿美元,占谷歌收入积压40%以上
Anthropic承诺五年向谷歌云支出2000亿美元,占据了谷歌云收入积压的40%以上,揭示了OpenAI和Anthropic两家AI巨头正成为亚马逊、谷歌等云服务商未来收入的核心驱动力。
{
"title": "AI 代码率飙至90%,马斯克解散xAI租算力给Anthropic",
"content": "今天的科技圈仿佛被按下了加速键,从AI工程的范式跃迁到算力版图的剧烈重构,每一个信号都在暗示我们:从\"模型竞赛\"到\"生产力落地\"的转折已成定局。无论是Harness Engineering将AI代码率提升至90%的实战,还是马斯克将xAI算力租给对手Anthropic的惊人反转,亦或是AWS让AI学会花钱的AgentCore支付体系,都指向了一个核心趋势——AI正在从被动的\"对话者\"进化为具备自主执行能力的\"智能体\",而支撑这一进化的,是工程化体系的完善与底层算力资源的疯狂博弈。\n\n### AI 工程化:从 Prompt 到 Harness 的范式跃迁\n\n[Harness Engineering:耗时一周,我是如何将应用的AI Coding率提升至90%的](https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247559842&idx=1&sn=71ee08bf0421ad2f1aa4dd7a58901c5f) - 这篇文章可能是近期最具实战价值的AI工程指南。它提出的 Harness Engineering 概念,标志着AI开发从 \"Prompt Engineering\" 和 \"Context Engineering\" 迈入了第三阶段:系统化的约束工程。作者通过构建包含规则、技能、知识和变更管理的完整 Harness 体系,成功将AI代码率从不到25%提升至90%。这不仅是数字的胜利,更是开发模式的革命——它证明了在复杂的企业级代码库中,依靠裸用模型是行不通的,必须建立像 Spec-Driven Development 这样严格的外部约束和反馈回路。对于开发者而言,这意味着核心竞争力正在从\"写代码\"向\"设计Agent的工作环境\"转移。\n\n[十年老技术开发的 AI Agent 探索之路](https://mp.weixin.qq.com/s?__biz=MjM5ODYwMjI2MA==&mid=2649801477&idx=1&sn=b4b4e51cf60abaa7bc00cc667ccca247) - 作为一名资深开发者,这篇文章用极其诚恳的笔触记录了从 \"Vibe Coding\" 的翻车到构建 \"24h 打工人\" 系统的完整心路历程。作者提出了一个反直觉但至关重要的观点:\"脚手架 > 模型\"。相比于追逐最新的模型,构建基于 SDD(Spec-Driven Development)的流程、Observability 可观测性以及共享状态机制,才是实现稳定、可复现 Agent 系统的关键。特别是关于 \"Task-Driven\" 到 \"Goal-Driven\" 的认知跃迁,指出了未来 Agent 进化的方向:不仅是执行任务,更是能在有限约束下自主推进目标。这是对所有沉迷于调优 Prompt 的开发者的一记警钟。\n\n### 算力与产业格局:马斯克的 \"以退为进\"\n\n[刚刚,马斯克官宣xAI解散,22万张GPU算力租给Anthropic](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651031726&idx=1&sn=e6eca005d102e4a279d9b460dfa0d35d) - 这可能是硅谷今年最魔幻的商业剧情。马斯克解散 xAI 并将其并入 SpaceX,同时将 xAI 曾经引以为傲的 Colossus 1 超算集群(22万张GPU)全部租给死对头 Anthropic。这表面上是马斯克的一出 \"大义灭亲\",实则是极其精明的算力资本运作:Colossus 1 对正在建设 Colossus 2 的 xAI 来说已是 \"旧产能\",租出去不仅能补贴新集群建设,还能绑定 Anthropic 探索太空算力。这也侧面印证了 Anthropic 目前在 AI 编码领域的统治力——其用户需求已把算力 \"挤爆\",不得不斥巨资甚至涉足太空计算来扩容。这场交易重塑了 AI 基础设施的竞争逻辑:谁能掌握最低成本的能源和算力,谁才是最终的赢家。\n\n[嘘,Claude正在「做梦」!睡一觉疯狂进化,一夜暴涨6倍战力](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652698250&idx=2&sn=55071d7c98d04b893a5907ebbfcaafb1) - Anthropic 的这次更新非常 \"科幻\",他们为 Agent 加入了类似人类 REM 睡眠的 \"Dreaming\" 功能。Agent 在工作间隙会自动回顾历史会话,合并重复记忆,挖掘宏观规律,从而实现自我进化。配合 Outcomes 评分官和多 Agent 编排,Anthropic 成功将任务完成率提升了 6 倍。这不仅是工程技巧的胜利,更揭示了 AI 进化的新路径:通过模拟生物的睡眠机制来处理长期记忆和熵增。对于行业来说,这意味着 Agent 的 \"智商\" 将不再仅取决于预训练,更取决于运行时的 \"反刍\" 能力。\n\n### 模型与架构:开源与闭源的激烈交锋\n\n[The Batch: 954 | Kimi K2.6 挑战开源权重模型领先者](https://mp.weixin.qq.com/s?__biz=MzIxNzI0ODE4Nw==&mid=2247498555&idx=1&sn=a74928f1fc52a12e2d6338638f928d2ea) - Moonshot AI 发布的 Kimi K2.6 拥有 1 万亿参数,在多项基准测试中领先于其他开源权重模型,直逼顶级闭源模型。其最大的亮点在于超长的 \"规划-编写-测试-调试\" 循环能力,能够实例化数百个子智能体协同工作,并且幻觉率显著降低。这标志着开源模型在 \"Agent 能力\" 上正在迅速补齐短板,不再仅仅是 \"对话\" 工具,而是具备了处理复杂、长周期任务的潜力。对于开发者而言,Kimi K2.6 提供了一个不依赖闭源生态的高性能 Agent 基座选择。\n\n[SenseNova U1开源:原生统一多模态理解与生成,8B参数达到同量级SOTA](https://mp.weixin.qq.com/s?__biz=Mzk3NTc1NTU0Mw==&mid=2247508021&idx=1&sn=693c940676560eb20a362e085f9f9291) - 商汤开源的 SenseNova U1 展示了 \"以小博大\" 的极致。基于 NEO-unify 架构,它摒弃了传统的视觉编码器和 VAE,在统一表征空间中实现了多模态的理解与生成。8B 参数的模型在多项指标上达到了同量级 SOTA,甚至支持业内首个连续性图文交错输出。这种 \"原生统一\" 的设计思路,解决了多模态模型中信息传递损耗的痛点,为 Agent 在视觉推理和连续创作任务中的应用提供了更高效的底座。\n\n### 智能体经济与基础设施:AI 开始 \"花钱\" 了\n\n[Agents that transact: Introducing Amazon Bedrock AgentCore payments, built with Coinbase and Stripe](https://aws.amazon.com/blogs/machine-learning/agents-that-transact-introducing-amazon-bedrock-agentcore-payments-built-with-coinbase-and-stripe/) - AWS 这一步棋下得极具前瞻性。通过与 Coinbase 和 Stripe 合作,Bedrock AgentCore 新增了支付功能,让 AI Agent 能够自主调用钱包,为付费的 API、数据或内容进行微支付。这是 \"Agent Economy\"(智能体经济)的基础设施雏形。当 Agent 能够自主决策并完成交易时,它就从单纯的 \"助手\" 升级为了 \"经济参与者\"。这对开发者意味着未来的商业模式将发生剧变:服务将以 \" fractions of a cent per call \" 的粒度被 AI 消费,你需要构建的是 Agent 能 \"买得起\" 且 \"找得到\" 的服务接口。\n\n[DeepSeek-V4的并行策略和计算通信遮掩](https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=2650451776&idx=1&sn=1f26acd28191e26ecf77c4415634a4dd) - 在硬件受限于 H800 和 IB 网络的背景下,DeepSeek-V4 展示了极致的工程美学。通过创新的 DualPipe 和 Waved-EP 技术,他们在 MoE 模型训练中实现了计算与通信的完美遮掩,解决了 EP 跨节点通信的瓶颈。这篇文章揭示了 AI 训练的一个残酷真相:当算力硬件无法无限堆砌时,算法层面的并行策略和 Kernel 级别的优化就成了决定性因素。这对于基础设施工程师来说是必读的\"避坑
Anthropic承诺五年向谷歌云支出2000亿美元,占据了谷歌云收入积压的40%以上,揭示了OpenAI和Anthropic两家AI巨头正成为亚马逊、谷歌等云服务商未来收入的核心驱动力。
Genesis AI发布首个机器人基础模型GENE-26.5,通过全栈技术自研(硬件、控制、模型、仿真),实现单手打蛋、解魔方等复杂操作的自主运行,展示了具身智能领域的重大突破。
无问芯穹完成超7亿元融资,资金将用于夯实多元异构技术、强化软硬协同优势及构建自主进化的AI基础设施,旨在成为中国Token经济的枢纽。
文章详细介绍了 Moonshot AI 发布的万亿参数模型 Kimi K2.6,该模型在开源权重中性能领先,具备长时间自主编程和多智能体协同能力,但在推理能力上仍略逊于顶级闭源模型。
商汤发布并开源基于NEO-unify架构的原生统一多模态大模型SenseNova U1,以8B参数实现SOTA性能,支持连续图文创作及复杂信息图生成。
文章深入解析了DeepSeek-V4在分布式训练中的并行策略,特别是针对MoE模型的EP策略优化,以及通过DualPipe和Waved-EP实现计算与通信遮掩的工程细节。
文章提出了 Harness Engineering 概念,通过构建规则体系、上下文架构和专业化 Agent,成功将存量 Java 应用的 AI 编码率从 25% 提升至 90%,为解决企业级复杂代码库中的 AI 应用难题提供了系统性方法论。
Anthropic在开发者大会上发布了托管智能体三件套:Dreaming(类似REM睡眠的自我进化机制)、Outcomes(自动评分官)和多智能体编排,使AI任务完成率最高暴涨6倍。
一位十年老开发者从实践出发,深度剖析 AI Agent 开发中从手动管理到自动化系统的演进,提出 SDD(规格驱动开发)和治理优于模型的核心观点。
AWS 发布 Amazon Bedrock AgentCore 支付功能预览版,与 Coinbase 和 Stripe 合作,使 AI 智能体能够自主进行微支付以访问 API 和数据,并内置了治理与安全机制。
文章报道了马斯克官宣解散 xAI 并将其整合进 SpaceX 成立 SpaceXAI 的重大行业新闻,同时宣布将 Colossus 超级算力集群租给 Anthropic 以提升其 AI 模型能力。
小米AI实验室开源了覆盖646种语言的多语言语音克隆TTS模型OmniVoice,该模型采用极简架构并利用LLM加持,在低资源语种上表现卓越且具备跨语言克隆能力。
文章报道了马斯克解散xAI并将22万张GPU算力转租给Anthropic的重大行业变动,分析了这一战略重组背后的商业博弈与算力战争。
文章报道了Anthropic因用户量激增与SpaceX达成合作,租用其Colossus 1数据中心22万张GPU以缓解算力短缺,并展望了太空算力的未来发展趋势及中国在相关领域的进展。
文章从哲学、技术和经济维度深度剖析了AGI的现状与悖论,指出按人类标准AGI可能已存在,但因架构约束和商业利益,真正自主的AGI永远不会被允许出现。
文章深入评测了荣耀发布的基于 OpenClaw 的 YOYO Claw 小龙虾宇宙生态,分析了其在 PC、平板、手机三端的落地表现及端侧协同能力,探讨了硬件厂商如何解决 AI Agent 落地门槛、成本与隐私问题。
文章分析了在AI Agent时代MacBook的选购策略,指出单核性能对云端AI工具至关重要,并推荐高内存的MacBook Air或无屏Mac Mini以节省成本。
文章通过徐文浩的访谈指出,Vibe Coding 虽然加速了开发,但也导致技术债务在短时间内极速累积,核心问题已从单纯的编码转变为如何对 AI 生成的代码进行有效治理和 Harness 管理。
文章针对千万级订单超时取消场景,剖析了数据库轮询的弊端,并详细讲解了Redis ZSet、消息队列及时间轮等多种进阶解法及可靠性保障机制。
文章提出了AI视频工具已进入第三阶段「画布原生Agent」的观点,分析了AI从黑盒工具向透明协作伙伴的范式转变,并以RHTV为例介绍了通过生态整合与节点可视化实现创作可控性的新路径。
文章评测了开源端侧GUI模型Mano-P 4B与推理框架Cider的组合,展示了其在本地实现App自动化操作、降低Token消耗及保障数据隐私方面的实际效果与应用潜力。
文章详细介绍了字节跳动 TRAE SOLO 移动端的全平台互通能力,演示了通过手机调用技能、集成飞书及配置第三方模型等多种实际应用场景。
本文介绍如何利用 Claude 托管代理构建 GitHub 仓库审查工具,通过将基础设施和运行时管理交给平台,让开发者专注于提示词和行为定义。
Meta FAIR联合斯坦福等机构发布了新基准ProgramBench,测试模型能否从零重建真实软件系统,结果Claude、GPT、Gemini等一线模型均为0%完成率,揭示了AI缺乏工程智能和全局系统规划能力的核心瓶颈。
TACO 是一个无需训练、即插即用的终端智能体自进化观测压缩框架,通过动态学习和沉淀压缩规则,有效过滤低价值终端输出并保留关键线索,从而提升长程任务的成功率和 Token 效率。
本期周刊重磅发布 Remix 3 Beta,宣布转型为不再依赖 React 的 Web 优先全栈框架,并涵盖 Node.js 26.0 发布、Bun 移植讨论及 Anime.js 更新等前沿资讯。
文章深度测评了千问电脑版的“千问语音输入法”,展示了其通过“智能语音输入”和“智能语音指令”实现从“语音转文字”到“语音指令Agent”的交互变革,显著提升办公效率。
xAI 将 Colossus 1 数据中心的 22 万张 GPU 出租给 Anthropic,同时 xAI 将被解散并入 SpaceX;双方各取所需,分别解决了服务过载和资产变现的问题。
文章介绍了分层Agentic RAG系统Protocol-H,通过Supervisor-Worker拓扑和Reflective Retry机制解决传统RAG在处理多模态数据时的局限,实现了具备自主纠错能力的企业级多模态推理。
文章详细介绍了京东零售AIGC百亿素材供给的落地实践,提出了“艺术、技术、算术”三大核心哲学,并构建了Oxygen Vision系统以解决电商场景下的生成控制、成本与效率问题。
Anthropic宣布使用SpaceX的22万块GPU解决算力瓶颈,提升Claude服务速率,同时探讨了Gary Marcus对GPU过剩的警告及企业级AI应用的未来。
CNCF 警告 Kubernetes 仅能保障基础设施健康,无法理解或控制 LLM 行为,企业需引入 AI 特定的应用层控制机制以应对新威胁模型。
文章分析了 CopilotKit 完成 2700 万美元融资的背景,深入探讨了其提出的 AG-UI 协议和 Generative UI 概念,以及如何通过开放标准解决 AI Agent 与应用交互割裂的问题。
浙大与哈佛联合开源了UniGeo框架,通过在表示、架构和损失函数三层全链路注入统一几何引导,结合视频模型的连续视角先验,解决了现有相机可控编辑中的几何漂移和结构退化问题。
文章介绍了明略科技开源的端侧 GUI Agent 模型 Mano-P 及其推理加速框架 Cider,展示了如何在 Mac 本地实现高效的视觉化电脑操作,兼顾隐私与性能。
本文讲述了北大校友、前VC赵万荣创业利用AI Agent重构旅游行业交付全流程,通过100% AI化工作流实现人效数量级提升,旨在解决传统旅游业无法规模化的痛点。
文章提出了“高亮复杂度”的概念,解释了代码风格如何影响IDE的物理资源消耗,并提供了具体的代码编写建议以提升编辑器的响应速度和能效。
文章分析了存算一体技术被纳入“十五五”规划的背景与意义,通过对话亿铸科技CEO,探讨了该技术在解决AI算力瓶颈中的价值,以及在通用性、软件生态兼容和工程落地方面面临的挑战。
文章讲述了Dreamova创始人阿班基于字节、快手、小红书的经验,利用AI技术打造下一代“体验式生活方式平台”,让用户从“围观”转向“体验”生活方式。
OpenAI联合五大科技巨头开源了新型超算网络协议MRC,通过多平面网络、自适应包喷射和SRv6源路由机制,解决了大规模GPU集群训练中的网络拥塞和故障恢复难题。
文章探讨了脉得智能如何利用AI技术突破甲状腺超声诊断瓶颈,通过对接病理金标准实现高准确率,并分析医保打通后“按例付费”商业模式对AI医疗商业化的关键意义。
文章指出大模型市场正分化为“前沿层准入经济”和“工作层通缩经济”,认为未来真正的稀缺资源不是Token价格,而是顶级模型的访问与控制权。
泡泡玛特创始人王宁回顾2025年爆火背后的挑战,探讨了从团队到组织的转型、全球化标准对齐的阵痛,以及IP运营中克制与长期主义的平衡。
文章介绍了如何在AWS SageMaker上利用可验证奖励的强化学习(RLVR)和GRPO算法来微调Qwen模型,以解决传统强化学习中的奖励信号不可靠问题。
文章报道了马斯克将22万张GPU资源卖给Claude使用,导致后者付费用户使用限额翻倍且速度提升,并提及双方合作建设太空算力。
AI语音公司ElevenLabs宣布其年化经常性收入(ARR)从去年底的3.5亿美元增长至5亿美元,并在新融资中获得了NVIDIA、贝莱德等机构的参投。
牧原实验室杨林项目组发布招聘信息,招聘AI大模型(生命科学交叉方向)和合成生物学(生物制造方向)的研究人员,聚焦AI辅助合成生物开发研究。
文章汇总了近期科技圈的多条重要资讯,涵盖了月之暗面大额融资、字节跳动发布全模态模型、苹果加码AI研发、三星退出中国家电市场以及星空卫视停播等热点事件。
文章汇总了近期科技界的重要快讯,包括三星退出中国家电市场、微软Edge安全漏洞争议、Apple就Siri延期诉讼达成和解等。
文章总结了Kotlin生态系统导师计划(KEMP)试点项目的成果,公布了优胜者及其在BitChat等项目中的贡献,并分享了从80份申请中筛选出的参与经验和反馈。
JetBrains 宣布启动 MPS 2026.1 早期访问计划(EAP),引入了对 JDK 25、Kotlin 2.3 的支持及多项编辑器和构建语言的改进。
文章主要介绍2026 XCOPS广州站智能运维年会的数据库议题,涵盖SQL Agent落地实践、Elasticsearch向量搜索、大型金融数据库改造及AI驱动的智能运维等内容。