奔跑的高达

技术日报

2026-05-06

✍️ 主编按语

{
  "title": "DeepSeek-V4 架构解密,Kimi 估值飙至200亿",
  "content": "今天的技术圈充满了工程奇迹与资本狂热。DeepSeek-V4 揭开了 Waved-EP 的神秘面纱,用极致的计算通信遮掩证明了“力大砖飞”背后的艺术;AMD 苏姿丰则用财报重新定义了 AI 基础设施的版图,宣告智能体时代 CPU 的强势回归。与此同时,Kimi 估值半年翻四倍,Luma 以小博大杀入全球图像生成前三,开源界也迎来了 Mistral Medium 3.5 与国产 Private AI 方案的双重爆发。这是一场从底层算力到应用落地的全面突围。\n\n### 算力架构与系统工程\n\n[DeepSeek-V4的并行策略和计算通信遮掩](https://mp.weixin.qq.com/s?__biz=MzU3NjE4NjQ4MA==&mid=2247556287&idx=2&sn=8906fa81a15f620b219c18921e027266)\n\n这篇深度技术长文堪称教科书级别的分布式系统优化案例。DeepSeek-V4 核心创新在于 Waved-EP,它将 Expert 计算与通信在 Kernel 级别进行了“波浪式”融合,解决了 DualPipe 在小 Batch(如 RL 或推理)场景下遮掩失效的痛点。更令人深思的是其对 ZeRO-1 的坚持与 TP 的舍弃——在海量 IB 通信压力下,DeepSeek 宁可牺牲部分显存优化也要为 EP 让路,这种在通信墙、计算墙与显存墙之间寻找微妙平衡的工程哲学,比单纯的模型架构创新更具实战指导意义。\n\n[深度首发|AMD 财报电话会全解析:股价暴涨 16%,苏姿丰讲透英伟达之外的 AI 算力第二战场](https://mp.weixin.qq.com/s?__biz=MzIxODUzNTg2MA==&mid=2247491874&idx=1&sn=aa3bbbb50a8c995b464273f6ce2ab540)\n\nAMD 的这波财报不仅是数字的胜利,更是战略的胜利。苏姿丰敏锐地捕捉到了“智能体 AI”带来的结构性机遇,直接将服务器 CPU 的 TAM 预测翻倍至 1200 亿美元。她指出,随着智能体推理规模的扩大,CPU 早已不只是 GPU 的附庸,其在编排、数据处理上的需求正推动 CPU:GPU 配比从 1:8 向 1:1 甚至更高演变。这意味着,未来的 AI 战场将不再只是 GPU 的独角戏,CPU 正在夺回其作为“算力大脑”的重要席位。\n\n### 模型进化与应用爆发\n\n[刚刚,GPT-5.5 Instant全员免费!数亿人的ChatGPT变了](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652697811&idx=1&sn=ef19b8efc229b6a016508efb19c3186c)\n\nGPT-5.5 Instant 的全面免费上线,标志着 AI 正从“尝鲜玩具”彻底转向“基础设施”。除了幻觉率下降 52% 和数学能力飙升外,最关键的进化在于“记忆来源”和极致的简洁性——它开始主动调用你的历史记录和文件,不再是一问一答的陌生人,而是真正懂你的私人助理。这种“个性化”的全面接管,意味着未来 AI 产品的竞争壁垒将不再是模型参数量,而是其对用户上下文的理解深度与整合能力。\n\n[香蕉和GPT Image之外的第3条路:华人15人团队造出AI生图黑马](https://www.qbitai.com/2026/05/413264.html)\n\n在 OpenAI 和 Google 垄断的图像生成赛道,Luma AI 展现了惊人的“以小博大”能力。Uni-1.1 之所以能杀入全球前三,关键在于其打破了“推理”与“生成”的界限,用统一的 Transformer 架构同时解决构图逻辑与像素渲染。这种“脑手合一”的设计,让品牌方在广告本地化、电商素材生成中获得了前所未有的可控性。对于开发者而言,这释放了一个明确信号:单纯的画质提升已见顶,具备逻辑推理能力的“可控制生成”才是下一代生产力工具的核心。\n\n[Mistral Medium 3.5开源:一套权重搞定编码、推理和指令遵循,4块GPU即可部署](https://mp.weixin.qq.com/s?__biz=Mzk3NTc1NTU0Mw==&mid=2247507991&idx=1&sn=a70135f3a5abadfea2b995099eaa6328)\n\nMistral 此次发布的 Medium 3.5 堪称“性价比之王”。它将此前独立的指令遵循、推理和编码三条模型线合并为一个 128B 的稠密模型,并在 SWE-Bench Verified 上拿下 77.6% 的高分。更关键的是,它将部署门槛拉低至 4 块 GPU 即可运行,且支持商业使用。这种“All-in-One”的思路极大简化了开发者的运维复杂度,可能会成为私有化部署和企业级应用的新基座。\n\n### 企业级 AI 与商业化\n\n[Salesforce前CEO再创业,Sierra瞄准企业AI市场,估值150亿美元](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247515514&idx=4&sn=1297153e8de06aa1ff4293e7cd3a3c7b)\n\nSierra 的估值飙升至 150 亿美元,揭示了企业级 AI 市场的巨大潜力。由 Salesforce 前联创布雷特·泰勒领衔,Sierra 不再满足于简单的客服对话,而是推出了“智能体即服务”工具 Ghostwriter,旨在用 AI 重构整个企业软件的操作流程。优步 CTO 的证言颇具代表性:10% 的代码已由 AI 生成,原本需一年的项目现在半年即可完成。这表明,企业对 AI 的投入已从“试水”转向“深水区”,谁能真正解决复杂的业务流自动化,谁就能拿下这一波万亿级市场。\n\n[Anthropic与OpenAI同日宣布:分别成立AI合资公司,聚焦企业AI服务](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247515514&idx=3&sn=7f22094cddfdeea9cbaa78088d1e33ad)\n\nOpenAI 和 Anthropic 在同一天宣布成立企业合资公司,且投资者群体零重叠,这绝非巧合。这标志着大模型厂商的竞争已从单纯的技术参数比拼,升级为资本生态的圈地运动。通过引入黑石、高盛等金融巨头的资金,这些合资企业获得了向其投资组合公司优先销售 AI 服务的渠道。这种“资本+技术”的深度绑定,预示着企业级 AI 服务的销售模式将发生根本性变革,未来的 AI 战争不仅是云厂商的战争,更是金融资本的战争。\n\n[晚点独家丨月之暗面将完成 20 亿美元新融资,估值破 200 亿美元](https://mp.weixin.qq.com/s?__biz=MzU3Mjk1OTQ0Ng==&mid=2247535778&idx=1&sn=2d92043af14464982b73f0b1947640d4)\n\nKimi 的估值在半年内狂翻 4 倍至 200 亿美元, ARR 突破 2 亿美元,这一成绩单堪称中国大模型创业公司的“触底反弹”样本。杨植麟团队的战略转向——从 C 端投放转向技术 SOTA,特别是对标 OpenAI o1 的推理模型和 Agent 能力的深耕,显然赢得了资本市场的认可。更值得注意的是 Kimi 在开源社区的技术影响力,如 MuonClip 和 Attention Residuals 等成果的输出,证明了其不仅是应用层面的玩家,更具备深厚的底层技术造血能力。\n\n### 开源生态与本地化探索\n\n[国产双开源:让Mac成为你的私人AI工作站](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651031464&idx=1&sn=9c345be57f7ae7a14ff081ab1296ce50)\n\n明略科技开源的 Cider 和 Mano-P,为 Apple Silicon 生态注入了一剂强心针。Cider 通过 W8A8 量化与 Kernel 融合,激活了 MLX 框架下未被利用的 INT8 硬件算力,将推理速度提升了近一倍;而 Mano-P 则

🔥 热门文章 (57 篇)

AI/ML机器之心9.0

国产双开源:让Mac成为你的私人AI工作站

明略科技开源了两个项目:推理加速框架 Cider 和 GUI 智能体 Mano-P,前者通过 W8A8/W4A8 量化大幅提升 Mac 端侧推理速度,后者让 AI 能纯视觉操作图形界面,共同推动 Private AI 的落地。

AI/ML大模型智能9.0

DeepSeek-V4的并行策略和计算通信遮掩

文章深度解析了DeepSeek-V4的并行策略与Waved-EP计算通信遮掩技术,阐述了如何在受限的IB网络和H800硬件条件下,通过DualPipe和Waved-EP极致优化MFU和吞吐。

后端架构Martin Fowler8.0

Bliki: Mythical Man Month

文章回顾了Fred Brooks的经典著作《人月神话》,重点探讨了沟通成本导致的“布鲁克斯法则”以及系统设计中“概念完整性”的核心价值。

AI/MLMartin Fowler8.0

Fragments: May 5

文章汇总了关于AI辅助编程的最新工具与思考,探讨了Lattice框架、本地模型的可行性以及AI对软件工程内部质量的影响。

其他李继刚8.0

理解

文章借用侯世达的观点,将“理解”比作脑海中由横向相似度和纵向抽象度构成的“云”,并以此视角重新解读了费曼技巧等学习原则。

其他创业邦8.0

被AI抢走工作的人,在忙什么?

文章通过采访投资分析师、程序员、设计师和翻译员等五位职场人,真实记录了AI技术如何具体冲击不同行业的工作模式、薪酬结构及职业生存状态。

前端开发vivo互联网技术8.0

下一代图片格式 AVIF 在 vivo 社区的落地实践

文章分享了 vivo 社区在 WebP 基础上落地 AVIF 图片格式的实践经验,通过 CDN 边缘缓存与服务端异步转码方案,在保证画质的前提下实现图片体积进一步降低 20%+。

快速浏览

浮之静6.0

在喧嚣深处,沉默地醒来

文章探讨了在充满外部评价和欲望的社会中,如何通过自我觉察和内在重建,找回真实的自我与生活的主动权。