GTC定调物理AI，宇树冲刺IPO，阿里千问登顶全球前五

2026-03-20

✍️ 主编按语

GTC定调物理AI，宇树冲刺IPO，阿里千问登顶全球前五

今天科技圈的重磅消息主要集中在英伟达 GTC 大会带来的产业风向转变。从黄仁勋断言“物理AI时代已来”，到国内宇树科技冲刺“具身智能第一股”，再到阿里千问力压群雄登顶全球榜单，我们可以清晰地看到一条主线：AI 正在从云端的语言模型，加速下沉到物理世界的机器人和企业级系统中。与此同时，谷歌用 AI 重塑设计工具的举措，也再次警示了传统软件行业面临的颠覆性挑战。

AI 进化与架构

黄仁勋对话 10 位开源 AI 掌门人：未来算力将向后训练倾斜，OpenClaw 开启了现代计算机的新想象｜GTC 2026

这场圆桌不仅是开源模型的胜利宣言，更是一次对 AI 产业结构的重新定义。黄仁勋提出的“系统模型的组合”极具前瞻性，它打破了模型作为单一产品的神话。对于开发者和企业而言，这意味着未来的核心竞争力不再是拥有最强的模型，而是构建“Harness Engineering”——即如何编排模型、工具和 Agent。OpenClaw 被高频提及，标志着 AI 正从“回答问题”向“执行任务”的范式转移，企业级 Agent 的落地难点也将从“能力”转向“治理与控制”。

Qwen3.5-Max预览版首度亮相，阿里千问登顶中国最强模型

阿里千问此次在 LMArena 的登顶，不仅是分数的胜利，更标志着中国大模型在通用能力上已具备与 GPT、Claude 正面硬刚的实力。Qwen3.5-Max-Preview 超越 GPT-5.4 和 Claude 4.5，证明了在数学、编码等硬核能力上的突破。这对行业的影响是深远的：开发者不再迷信海外模型，企业级应用有了更安全、合规且高性能的国产选择。全球前五的排名，也预示着“中美双雄”格局的彻底固化。

杨植麟在英伟达 2026 GTC 大会演讲现场

虽然篇幅简短，但杨植麟透露的 Kimi K2.5 技术路线图信息量巨大。“Token 效率、长上下文、智能体集群”这三个关键词，精准切中了当前大模型落地的痛点。特别是“智能体集群”的概念，暗示了单一模型打天下的时代即将结束，未来将是多智能体协作、通过长上下文记忆来解决复杂任务的形态。这为 Agent 的工程化落地提供了明确的技术指引。

Token 命名困境：当信息论闯入语言学

这是一篇极具哲学深度的技术好文，它跳出了翻译的表象，从信息论和认知结构层面剖析了 Token 的本质。文章指出 Token 不是“词”或“令牌”，而是信息压缩的产物和向量空间中的“关系位”。这种认知对于理解大模型至关重要：开发者不应执着于字面翻译，而应理解其在注意力机制中的动态表征。这种底层的认知升级，往往能带来对模型行为更本质的洞察。

物理AI与机器人

黄仁勋：每一家工业企业都将成为机器人公司！连发物理AI全家桶

如果说 GTC 的圆桌讨论的是 AI 的“灵魂”，那这场发布就是为 AI 配上了强健的“身体”。NVIDIA 发布的 Cosmos 3、GR00T N2 以及 IGX Thor 平台，构建了从数据生成、仿真训练到边缘推理的完整闭环。这对于机器人行业是史诗级的利好，因为它降低了从仿真到现实的迁移门槛。正如黄仁勋所言，每一家工业企业都将成为机器人公司，物理 AI 正在将昂贵的定制化机器人，转变为可大规模部署的通用智能设备。

宇树首度披露招股书：2025 年净利润 6 亿，募资 42 亿重点投入「机器人大脑」

在宇树的招股书中，最让人惊讶的不是技术，而是盈利能力。2025 年预计 6 亿元净利润、60% 的毛利率，打破了“人形机器人只烧钱”的魔咒。更重要的是，其 42 亿募资中近一半投向“机器人大脑”，这说明行业竞争焦点已从硬件制造转向模型算法。宇树的成功证明，只有掌握软硬件全栈自研能力，才能在具身智能的红海中建立起真正的商业护城河。

探索 GPU 加速向量检索：NVDIA Cagra 在微信大规模推荐系统中的应用实践

腾讯这篇技术实践是 AI 基础设施优化的教科书级案例。将 CPU 上的 HNSW 迁移到 GPU 上的 Cagra，不仅是硬件的替换，更是算法架构的重组。文中提到的“Batch 聚合”和“CPU/GPU 协同”优化思路，对于任何需要处理高并发检索的开发者都有极高的参考价值。它揭示了后端架构演进的一个方向：在海量数据和高吞吐场景下，GPU 加速已不再是选项，而是必选项。

行业动态与生态

雷军：新一代SU7正式上市，小米AI最新进展，以及多款重磅新品

小米发布会最大的亮点其实不在车，而在其自研的大模型 Xiaomi MiMo-V2-Pro。雷军宣布其在 PinchBench 排名全球第三，并在 OpenRouter 上调用量登顶，这标志着国产大模型已经开始在 Agent 落地实战中展现出优势。小米将“人车家全生态”与大模型深度结合的路径，展示了消费电子巨头如何利用硬件入口优势，为 AI 找到比单纯的 API 调用更广阔的应用场景。

60亿美元出售沐瞳尘埃落定，字节游戏“变小”

字节出售沐瞳，绝非简单的业务裁撤，而是一次战略资源的重新配置。在 AI 成为绝对优先级的背景下，字节选择回笼资金、剥离重资产的游戏业务，聚焦于高杠杆的 AI 技术研发。这也给行业提了个醒：在未来几年的资源争夺战中，不具备核心 AI 技术壁垒的业务线，随时可能成为牺牲品。

AI屠刀下一站“Vibe设计”！谷歌一个产品把合作伙伴Figma干崩了

谷歌推出的 Stitch 及其“Vibe Design”功能，是对传统设计软件的一次降维打击。它不仅提升了效率，更通过语音交互改变了设计的交互逻辑。Figma 股价的暴跌，市场反应的是对巨头生态整合能力的恐惧。对于 SaaS 创业者来说，这是一个警钟：如果你的产品壁垒仅仅是“好用”，在 AI 时代极易被巨头用更先进的交互范式和生态优势瞬间抹平。

🔥 热门文章 (55 篇)

AI/MLAI科技大本营9.0

黄仁勋对话 10 位开源 AI 掌门人：未来算力将向后训练倾斜，OpenClaw 开启了现代计算机的新想象｜GTC 2026

本文详细回顾了黄仁勋与10位开源AI掌门人在GTC 2026的圆桌对话，深入探讨了从单一模型向复合系统转变、OpenClaw作为现代计算机雏形的崛起，以及未来算力向后训练倾斜的行业趋势。

2026-03-20 00:53

AI/ML腾讯技术工程9.0

探索 GPU 加速向量检索：NVDIA Cagra 在微信大规模推荐系统中的应用实践

本文分享了微信推荐系统将 NVIDIA Cagra GPU 图索引大规模落地的工程实践，通过架构演进和深度优化解决了高并发场景下的性能与成本瓶颈。

2026-03-20 09:37

AI/ML浮之静9.0

Token 命名困境：当信息论闯入语言学

文章从信息论、机器学习和中国古典哲学三个维度深入探讨了“Token”一词的翻译困境与技术本质，指出Token源于压缩算法而非语言学，并论证了直接保留原词的必要性。

2026-03-19 22:00

其他小米技术9.0

雷军：新一代SU7正式上市，小米AI最新进展，以及多款重磅新品

文章详细介绍了新一代小米SU7汽车的正式发布，涵盖其在设计、动力、底盘、智能座舱及辅助驾驶等方面的全面升级，并公布了售价及购车权益。

2026-03-20 01:52

其他创业邦9.0

60亿美元出售沐瞳尘埃落定，字节游戏“变小”

字节跳动以超60亿美元将沐瞳科技出售给沙特Savvy Games Group，标志着字节收缩游戏业务全面转向AI赛道。

2026-03-20 11:20

AI/ML量子位9.0

Qwen3.5-Max预览版首度亮相，阿里千问登顶中国最强模型

阿里发布Qwen3.5-Max预览版，模型表现优异，位列全球前五并登顶中国最强模型。

2026-03-20 02:11

AI/ML极客公园9.0

宇树首度披露招股书：2025 年净利润 6 亿，募资 42 亿重点投入「机器人大脑」

宇树科技披露招股书冲刺科创板，2025年前三季度营收超10亿元，扣非净利润4.31亿元，人形机器人收入首次反超四足机器人，并计划募资42亿元重点投入具身智能大模型研发。

2026-03-20 11:02

AI/ML真格基金9.0

杨植麟在英伟达 2026 GTC 大会演讲现场

月之暗面创始人杨植麟在英伟达2026 GTC大会上披露了Kimi K2.5的技术路线图，提出了以Token效率、长上下文和智能体集群为核心的Scaling策略。

2026-03-20 01:04

AI/ML量子位9.0

黄仁勋：每一家工业企业都将成为机器人公司！连发物理AI全家桶

英伟达CEO黄仁勋发布涵盖通用机器人模型GROOT、仿真平台Omniverse等在内的全套物理AI基础设施，并预言每一家工业企业都将成为机器人公司。

2026-03-20 00:52

产品设计量子位9.0

AI屠刀下一站“Vibe设计”！谷歌一个产品把合作伙伴Figma干崩了

谷歌发布支持Vibe Design的AI设计工具Stitch，通过语音交互和无画布设计挑战Figma地位，导致后者股价大跌。文章分析了Stitch的核心功能及谷歌利用生态优势对传统SaaS软件行业的冲击。

2026-03-20 07:40

后端架构美团技术团队8.0

美团 BI 在指标平台和分析引擎上的探索和实践

本文详细介绍了美团构建的以指标平台为核心的新一代BI架构，重点阐述了自动语义和增强计算两大核心能力，以解决传统BI在数据口径混乱、查询性能差及灵活分析方面的挑战。

2026-03-20 00:00

AI/MLAI前线8.0

Cursor自研新模型反超Opus 4.6，价格还“打一折”！网友实测：只有它写完应用能一次跑通

Cursor 发布自研第二代编程大模型 Composer 2.0，在 Terminal-Bench 2.0 等基准测试中表现反超 Claude Opus 4.6，且价格降低 90%，并分析了 Cursor 面临 IDE 边缘化风险的自救策略。

2026-03-20 07:48

AI/ML赛博禅心8.0

暗壳 AI：物理空间设计，需要自己的 Lovart

文章介绍了空间设计 AI 产品「暗壳」，通过将行业经验与供应链数据工程化封装，旨在解决从创意到物理落地的精准对接问题。

2026-03-20 11:41

AI/ML十字路口Crossing8.0

我们用 MiniMax M2.7 改造了「十字路口」的整套内容工作流

文章分享了使用 MiniMax M2.7 模型改造内容工作流的实战案例，展示了模型在开发Chrome插件、处理播客下载及短视频分发等复杂任务中的表现。

2026-03-20 07:47

AI/ML腾讯科技8.0

中国AI工程师派五只龙虾去调查“龙虾之父”，带回1343条证据

本文通过分析OpenClaw创始人Peter的1343条推文，揭示了其以AI为核心的极致工作范式、将事故转化为传播技巧的运营策略，以及项目背后的文化符号构建。

2026-03-20 00:13

AI/ML极客公园8.0

实时交互 AI 技术基建，Soul 打出了王牌

文章深入分析了 Soul AI Lab 开源的多模态实时交互模型（如 SoulX-LiveAct），探讨了其在解决数字人长时稳定性与低延迟推理方面的技术突破，以及 Soul 布局 AI 社交生态的战略意图。

2026-03-20 07:32

AI/ML山行AI8.0

Google Cloud 总结：每位 ADK 开发者都该知道的 5 种 Agent Skill 设计模式

文章介绍了GoogleCloud总结的5种AgentSkill设计模式（ToolWrapper、Generator、Reviewer、Inversion、Pipeline），旨在帮助开发者通过结构化设计替代冗长的系统提示词，提升Agent的可维护性和可控性。

2026-03-20 11:28

AI/ML笔记侠8.0

凯文·凯利：AI 时代，不会被替代的人，都有这个特质

凯文·凯利预测AI将从大语言模型向空间智能演进，指出智能眼镜将成为下一代核心交互终端，并强调人类在人机协同中应承担“激发者”与“负责人”的角色。

2026-03-20 13:42

AI/MLFounder Park8.0

Claude Cowork 负责人：别再给 AI 配工具了，给它一台电脑

Anthropic产品负责人Felix Rieseberg深度解析Claude Cowork设计理念，主张通过虚拟机（VM）给予AI完整的电脑环境而非单一工具，以解决Agent的安全与执行瓶颈。

2026-03-20 12:09

后端架构dbaplus社群8.0

数据延迟降低了8倍！携程T+1到分钟级的近实时湖仓建设实践

携程分享了基于 Flink CDC 和 Apache Paimon 的近实时湖仓建设实践，详细阐述了“共享 Source、独立 Sink”的两阶段 CDC 入湖架构及多项引擎优化，成功将数据延迟从 T+1 降低至分钟级，实现了流批一体与降本增效。

2026-03-19 23:15

AI/ML阿里云开发者8.0

企业级 Agent 多智能体架构与选型指南 -- 来自1000+行业应用实践积累

文章基于1000+企业实践，详细解析了AgentScope与Spring AI Alibaba支持的多智能体架构模式（如Pipeline、Routing、Supervisor等），并提供了针对不同业务场景的架构选型指南与最佳实践。

2026-03-20 00:31

AI/ML阿里技术8.0

别让格式杀死思想：Logics-Parsing V2定义文档解析新边界

阿里发布了端到端多模态文档解析模型Logics-Parsing V2，支持复杂版面、公式、乐谱及思维导图等内容的结构化还原，并在多项评测中取得SOTA成绩。

2026-03-20 00:32

AI/ML创业邦8.0

黄仁勋即中本聪

文章通过对比中本聪与黄仁勋，指出两者在定义算力转化为价值的规则上具有同构性，并深入剖析了AI推理时代的Token经济学本质。

2026-03-20 11:20

AI/ML字节跳动技术团队8.0

OpenViking 实战教程：搭建多仓库代码语义检索系统，赋能 AI 助手 & OpenClaw 记忆插件 2.0 升级

文章介绍了如何使用 OpenViking 搭建多仓库代码语义检索系统，通过实测数据展示了其在 AI 代码问答效果和成本上的显著优势，并提供了详细的部署与集成指南。

2026-03-20 10:33

其他随机小分队8.0

AI时代全球化的共识与非共识｜Global NEXT 2026回顾（下）

文章回顾了Global NEXT 2026大会，分析了AI时代全球化创业的共识（如SaaS+AI）与非共识，探讨了资本头部虹吸下的生存策略，并提出了“守住确定性，搏不确定性”的创业路径。

2026-03-20 01:01

AI/ML前端早读课8.0

【第3673期】OpenAI Codex 最佳实践

文章系统介绍了如何将 OpenAI Codex 作为可持续优化的团队伙伴，从提示词编写、AGENTS.md 规范沉淀、MCP 集成到技能封装与自动化，全方位提升 AI 编程效率。

2026-03-20 01:02

AI/ML快手技术8.0

AI x 大前端性能稳定性：快手亿级DAU下的智能诊断实践

文章介绍了快手在亿级DAU背景下，利用“柯南AI”平台将专家经验转化为组织能力，通过智能Agent架构实现大前端性能稳定性问题的自动化根因排障与应急处置，显著提升了研发效率。

2026-03-20 10:27

后端架构印记中文8.0

Node 中文周刊 #218 - Node 核心「禁 AI 代码」请愿与虚拟文件系统 node:vfs 解析

本期周报重点讨论了 Node.js 核心社区关于禁止 AI 生成代码的请愿与争议，深入解析了虚拟文件系统 node:vfs 的技术方向，同时涵盖了 Worker Threads 实战、Edge.js 沙箱运行时及 Next.js 16.2 发布等前沿资讯。

2026-03-20 01:14

AI/MLAI科技评论8.0

浙大&腾讯打破图像编辑「规模-质量」魔咒：1000万数据+统一验证框架，让开源模型追上闭源SOTA | CVPR 2026

浙江大学与腾讯联合发布UnicEdit-10M数据集及UnicBench评估基准，通过后校验专家模型解决了图像编辑中规模与质量的矛盾，帮助开源模型缩小与闭源SOTA的差距。

2026-03-20 10:12

AI/ML硅星人Pro8.0

OpenClaw不重要，重要的是它以后跑在哪里

文章以OpenClaw热潮为切入点，分析了AI Agent如何从独立的框架转向集成在飞书等办公平台中的“智能伙伴”，探讨了IM成为自然语言时代命令行的趋势及平台在权限和上下文方面的优势。

2026-03-20 01:38

AI/ML硅星人Pro8.0

同样的模型，为什么大佬做出来的游戏比你的好十条街？｜对话 TapTap 制造负责人姜黎

文章通过实测和对话 TapTap 制造负责人，探讨了在模型能力趋同的背景下，垂直领域数据和经验如何成为 AI 游戏开发的核心竞争力。

2026-03-20 01:38

工具效率数字生命卡兹克8.0

分享10个你可能不知道的Claude Code隐藏命令。

文章分享了10个Claude Code的隐藏命令和实用技巧，旨在帮助开发者提升使用体验和编码效率，涵盖了上下文管理、模型切换、代码审查及远程控制等功能。

2026-03-20 02:09

AI/MLAI科技评论8.0

我们用「西游取经团」实测 MiniMax M2.7 ，发现 AI 已经进化成这样了？

文章通过构建“西游取经团”多角色协作系统，对 MiniMax M2.7 模型进行了端到端的真实场景实测，展示了其在复杂任务拆解、工具调用及主动协作方面的能力突破。

2026-03-20 10:12

AI/ML量子位8.0

龙虾也能当导演了！LibTV解锁全自动拍片，一句话从剧本干到成片

LiblibAI发布一站式AI视频创作产品LibTV，主打无限画布节点工作流与OpenClaw全自动Agent双模式，实现从剧本到成片的高效创作。

2026-03-20 09:49

工具效率LangChain Blog8.0

Introducing LangSmith Fleet

LangSmith 推出了 Fleet 企业级工作空间，旨在解决从构建单一 Agent 到管理大规模 Agent 舰队时面临的身份认证、权限控制和可观测性挑战。

2026-03-19 16:49

AI/ML腾讯技术工程8.0

英伟达GPU全系列硬核科普手册：一文读懂NVIDIA芯片的定位、规格与应用场景

这是一份英伟达GPU全系列的硬核科普手册，覆盖从消费级到数据中心的所有主流产品线，详细解读了架构演进、命名规则及核心参数。

2026-03-20 09:37

AI/ML人人都是产品经理8.0

AI 不会杀死软件，但会杀死一大批“软件生意”

文章阐述了AI智能体（Agent）将颠覆传统SaaS按功能收费的模式，未来软件竞争将转向上下文记忆、数据调用权和行动代理权，软件将从“工具”转变为“服务交付结果”。

2026-03-19 23:46

产品设计人人都是产品经理8.0

当每个人都能想出100个产品idea，更重要的是什么？

在AI时代，生成产品idea变得极其廉价且过剩，真正的挑战在于如何在海量噪音中保持判断力，通过聚焦真实问题和快速验证来构建业务壁垒。

2026-03-19 23:46

移动开发谷歌开发者8.0

突破手机边界 | JioHotstar 如何针对折叠屏与平板设备优化用户体验

文章介绍了流媒体平台 JioHotstar 如何遵循 Google 指南，利用 Material 3 Adaptive 库和 WindowSizeClass 优化其在折叠屏与平板设备上的大屏体验及桌面模式。

2026-03-20 09:34

AI/MLAWS Machine Learning Blog8.0

Use RAG for video generation using Amazon Bedrock and Amazon Nova Reel

文章介绍了一种结合检索增强生成（RAG）与 Amazon Nova Reel 的视频生成方案（VRAG），通过检索参考图像来增强生成视频的可控性和定制化。

2026-03-19 16:45

AI/ML量子位8.0

Cursor自研模型反超Opus 4.6！价格脚踝斩，氛围编程沸腾了

Cursor发布了自研编程模型Composer 2，凭借一种新的“自我总结”强化学习方法，在性能超越Claude Opus 4.6的同时，将价格降至“脚踝斩”水平。

2026-03-20 04:09

AI/MLAINLP8.0

PRDBench：Code Agent 评测范式，正在被重写

文章介绍了上海交通大学等团队提出的 PRDBench，这是一个基于产品需求文档（PRD）的项目级 Code Agent 评测基准，旨在解决现有评测体系滞后于模型软件工程能力的问题。

2026-03-20 04:25

AI/ML晚点LatePost8.0

晚点独家丨地平线敲定征程 7 目标算力，舱驾一体产品命名 “星空”

文章独家披露了地平线下一代智驾芯片征程7的算力目标及舱驾一体产品“星空”的进展，并分析了智驾芯片行业的算力竞争与技术演进趋势。

2026-03-20 08:14

移动开发InfoQ 中文8.0

Grab 工程实践：将 LRU 升级为 TLRU，Android 图片缓存节省 50MB+

Grab 工程师通过将 Android 图片缓存从 LRU 升级为 TLRU（时间感知最近最少使用），引入 TTL 和容量阈值参数，成功在不降低缓存命中率的前提下为用户平均节省 50MB+ 存储空间。

2026-03-20 08:07

云计算InfoQ 中文8.0

从云原生到 AI 原生：模型引发的新一代基础设施构建

本文回顾了基础设施从虚拟化、云原生到 AI 原生的演进历程，提出了“模型成为新的数据库”的核心观点，并探讨了以模型为中心构建新一代基础设施及通智一体化的未来趋势。

2026-03-20 08:07

移动开发少数派8.0

当手机不再需要卡槽：智能手机 eSIM 在海内外的艰难「破冰」

本文全景式梳理了 eSIM 在智能手机上的发展脉络，解析了国行机型破冰试水的现状及双 eSIM 等核心技术差异，并对比了苹果、三星及华米 OV 等品牌在海外市场的硬件支持情况。

2026-03-20 04:30

AI/ML51CTO技术栈8.0

2张A800，让大模型跑1亿上下文！陈天桥旗下团队联合北大狠作：直接把记忆写进注意力机制！记忆和推理完美解耦了！网友：优雅！RAG真完了

盛大Evermind团队与北大发表MSA论文，通过将记忆稀疏检索写入注意力机制，实现仅用2张A800显卡支持1亿Token上下文推理，性能大幅超越传统RAG和长文本模型。

2026-03-20 04:34

AI/ML花叔8.0

1条16秒AI视频赚了18万？？？我也想试试！

文章深入测评了AI视频生成工具Pexo，展示了其通过Agent（如龙虾Aki、Claude Code）进行自然语言交互、自动调用SOTA模型生成视频的能力，并探讨了去GUI化、面向Agent的未来交互趋势。

2026-03-19 23:58

工具效率机器之心8.0

搞不懂Skills？看看Claude Code内部工程师们是怎么玩的

本文编译自Anthropic工程师的博客，详细介绍了Claude Code中Skills功能的实战经验，包括九大应用分类、制作技巧及分发管理策略。

2026-03-20 05:00

AI/ML机器之心8.0

ICLR 2026 | 机器人不够聪明？VLMgineer让大模型自己「发明工具」，从设计到使用全自动

文章介绍了宾夕法尼亚大学提出的VLMgineer框架，利用视觉语言模型（VLM）结合进化搜索，让机器人能够从零开始自主设计并使用工具，有效解决了复杂控制难题。

2026-03-20 05:00

AI/ML机器之心8.0

登顶全球权威榜单！浙大创业团队百卡打造开源实时世界模型，视频秒变可交互4D世界

浙大创业团队影溯发布并开源了3D世界模型InSpatio-World，该模型登顶WorldScore-Dynamic榜单，以百卡级训练成本和单卡实时推理能力，实现了从视频生成到可交互4D物理仿真的技术突破。

2026-03-20 05:00

AI/ML量子位8.0

前荣耀AI实验室主任带队：用“超级大脑”接管农场，24小时不打烊

文章介绍了浙江丘沃智能推出的AlphaFarm系统，该系统利用AgriLLM大模型和IDRCO进化引擎，实现了从感知到执行的农业无人化自主决策，旨在解决农业劳动力短缺问题。

2026-03-20 05:37

AI/ML甲子光年8.0

卡奥斯奔赴港交所，工业AI开启新征途｜甲子光年

文章以卡奥斯赴港交所IPO为切入点，深度分析了工业AI从技术探索迈向规模化应用与盈利的商业路径，探讨了工业智能体在复杂生产场景中的落地价值。

2026-03-20 06:35

AI/ML腾讯科技8.0

马斯克转发Kimi论文引起硅谷大讨论，Attention下一个战场是什么？

文章深入分析了AI界关于解决Transformer深层模型“深度诅咒”的最新研究，对比了字节跳动MoDA与Kimi Attention Residuals两种不同技术路径，指出架构优化正从序列维度转向深度维度。

2026-03-20 07:06

后端架构InfoQ 中文8.0

360 如何用 AutoMQ 解决千亿级 Kafka 冷读难题

文章详述了 360 如何通过采用 AutoMQ 的存算分离架构解决千亿级 Kafka 集群的冷读性能瓶颈与运维难题，实现了写入性能与冷读隔离，并显著降低了硬件成本。

2026-03-20 08:07

⚡ 快速浏览

极客公园6.0