华为高管加盟MiniMax，清华破解缩放定律之谜

2026-03-21

✍️ 主编按语

头条聚焦：高管流动背后的全球化野心

今天的技术圈可谓精彩纷呈，既有重磅的人事变动预示着AI出海的新风向，也有底层理论的重大突破重新定义了大模型的进化规则，更有面向工业落地的硬核代码模型横空出世。从商业战道的排兵布阵，到学术界的深度思考，再到工程界的精密制造，这三件事勾勒出了AI技术从“炫技”走向“实干”的清晰路径。

行业动态

独家｜华为云新加坡总经理胡维琦将加入MiniMax，或向贠烨祎汇报

MiniMax 迎来了一位重量级的“实干家”。原华为云高管胡维琦的加盟，绝不仅仅是简单的 C 端人事变动，这更像是 MiniMax 在完成 IPO 后，吹响全球化 B 端业务冲锋号的集结令。胡维琦在华为 20 年的经历，横跨运营商到云计算，尤其擅长海外本地化生态建设，这正是目前大模型公司从“卷参数”转向“卷落地”最稀缺的能力。对于 MiniMax 而言，拥有胡维琦这样深谙云基建与 B 端市场的老将，意味着其海外业务将不再局限于模型的输出，而是能深入到企业的数字化转型肌理中，与云厂商在更多维度展开竞争与合作。这也释放了一个明确信号：AI 创业的下半场，是拥有深厚产业资源与全球化视野的“老兵”的战场。

前沿探索

ICLR 2026 | 清华提出交叉熵分解：“误差熵”才是大模型规模定律真正的驱动项

如果说 MiniMax 的新闻是关于“如何落地”，那么清华这篇 ICLR 2026 的论文则在探讨“模型为何进化”。研究人员通过数学分解，将困扰业界的交叉熵规模定律失效之谜解开了——原来真正驱动模型智能的“幽灵”是“误差熵”。这一发现极具洞察力：它指出了大模型参数增长的本质是在提升对正确答案的“排序能力”，而非单纯降低预测概率的置信度。这不仅解释了为什么超大规模模型会出现“性能瓶颈”，更为未来的训练指明了更精准的方向。对于开发者和研究者来说，这意味着我们以后可以少花冤枉钱在不相关的指标上，直接瞄准“误差熵”进行优化，这或许是下一代高效大模型诞生的理论基石。

工程实践

InCoder-32B：北航发布首个面向工业代码的代码基座模型

从理论到实践，代码大模型在工业场景的“水土不服”一直是个痛点。北航发布的 InCoder-32B 则给出了一份令人惊喜的答卷。不同于仅在 HumanEval 等通用榜单刷分的模型，InCoder-32B 敢于向芯片设计、GPU 内核优化、嵌入式系统等“硬骨头”挑战。其最核心的贡献在于重建了真实的工业仿真环境，利用真实工具链生成了 250 万条经过执行验证的训练数据。这意味着模型是在“真枪实弹”的环境中学会了如何避免硬件违规，而不仅仅是学会了代码语法。当现有的通用模型还在犯 CUDA 参数超限这种低级错误时，InCoder-32B 已经能够理解并遵守硬件约束，这对于推动 AI 进入芯片、嵌入式等严肃工业领域具有里程碑式的意义，也让我们看到了垂直化、场景化代码模型的巨大潜力。

🔥 热门文章 (24 篇)

AI/MLAI科技评论9.0

独家｜华为云新加坡总经理胡维琦将加入MiniMax，或向贠烨祎汇报

华为云新加坡总经理胡维琦将加入MiniMax，负责B端业务及中国区市场，这标志着MiniMax正大力强化其海外及商业化布局。

2026-03-21 00:04

AI/ML机器之心9.0

ICLR 2026 | 清华提出交叉熵分解：“误差熵”才是大模型规模定律真正的驱动项

清华大学研究团队提出交叉熵分解方法，发现只有误差熵真正遵循幂律缩放，揭示了误差熵才是大模型规模定律的真正驱动项。

2026-03-21 05:01

AI/MLAINLP9.0

InCoder-32B：北航发布首个面向工业代码的代码基座模型

北航团队发布了首个面向工业代码场景的32B参数基座模型InCoder-32B，通过重建工业仿真环境生产高质量训练数据，在芯片设计、GPU优化等多个工业基准上表现优异。

2026-03-21 10:31

其他刘润8.0

两会之后的2026，我们的钱要从哪里来？

文章基于香帅老师的观点，分析了2026年宏观经济与财富逻辑的关键拐点，指出从旧秩序向“智能化”与“岛链化”主导的新世界转变。

2026-03-21 03:18

AI/ML量子位8.0

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

北京大学彭宇新团队提出分类感知表征对齐方法（TARA），通过将生成式大模型与生物基础模型对齐，有效注入类别树先验知识，解决了多模态大模型在分层视觉识别中的同层判别性差、跨层一致性差及新类泛化性差等难题。

2026-03-21 09:48

AI/MLDatawhale8.0

给龙虾装一个专属技能包！试试这个场景

文章介绍了如何利用OpenCode工具从零手搓一个Agent Skill，通过接入DeepWiki创建专门的“代码仓库百晓通”以解决开源项目代码阅读困难的问题。

2026-03-21 15:03

工具效率阿真Irene8.0

新手小白也能写出好用Skill，保姆级教程和SKill分享。

文章深入浅出地讲解了如何编写自定义AI Skill（技能），提供了一套结构化的方法论和一个可交互的“Skill构建器”工具，帮助新手通过访谈形式快速生成高质量的AI技能配置。

2026-03-21 08:56

AI/ML大模型智能8.0

GenTalk真知论坛学术分享第18期|吴超逸@上海交通大学：医疗智能体系统的构建与演进之路

文章介绍了上海交通大学吴超逸关于医疗智能体系统的构建与演进路径，涵盖了从单一模型到多模态智能体系统的跨越，重点分享了发表于Nature正刊的罕见病诊断智能体DeepRare及未来交互式虚拟环境的进化范式。

2026-03-20 16:02

AI/ML花叔8.0

马斯克再次站台Kimi，扒掉了Cursor 500亿估值的底裤

文章揭露了Cursor声称自研的Composer 2模型实则基于月之暗面Kimi K2.5，并深入分析了AI产品公司在巨头模型竞争下的生存困境。

2026-03-21 04:32

其他腾讯科技8.0

“AI泡沫”没有苹果的事儿？

文章深入分析了苹果在AI领域的“隐形”战略，指出苹果虽在技术上落后，但凭借App Store分发渠道和Mac Mini等硬件优势，正通过收取佣金和提供算力设备成为AI变现的赢家。

2026-03-21 04:49

AI/ML赛博禅心8.0

始末｜Cursor 爆火的自研模型，是 Kimi K2.5，创始人说「下次会改」

文章揭露了 Cursor 新发布的 Composer 2 模型实则是基于 Moonshot AI 的开源模型 Kimi K2.5 进行训练，且未在初始声明中注明来源，引发了关于开源协议合规性与“自研”定义的广泛讨论。

2026-03-21 04:56

其他刘润8.0

残酷的真相：勤劳能创造财富，但勤劳者，未必能分到财富

文章通过公式推导和案例分析，阐述了财富来源于劳动、生产率和效用，指出勤劳只能创造财富，而拥有稀缺性才能掌握财富分配权。

2026-03-21 03:18

AI/ML逛逛GitHub8.0

这个爆火又被删掉的 GitHub 项目，告诉你 AI 会影响哪些工作？

文章基于 Karpathy 的 AI 职业暴露度项目及其中文克隆版，分析了不同职业受 AI 影响的程度，指出高薪白领工作数字化程度最高，同时强调暴露度高不代表职业会消失，而是工作方式将发生改变。

2026-03-21 07:05

AI/MLAI寒武纪8.0

最新！Karpathy万字深度长访：我焦虑到AI成瘾，所有可验证的领域，终将属于机器

本文记录了Andrej Karpathy关于AI智能体深度应用的访谈，详细阐述了他从手写代码转向“传达意志”的工作流变革，并提出了AutoResearch等自动化构想。

2026-03-21 06:15

其他创业邦8.0

中国汽车出海，为什么从造船开始？

文章深入分析了中国汽车出口激增背景下，车企面临的海运“卡脖子”问题，以及从“租船”转向“自造船”的战略布局和产业影响。

2026-03-21 14:58

AI/ML51CTO技术栈8.0

刚火不到24小时，Cursor的 Composer2就被曝抄袭Kimi K2.5！Cursor紧急回应！网友炸锅：原来Cursor一直有“中文血统”！

文章揭露Cursor新发布的Composer 2模型被证实是基于国产Kimi K2.5模型微调而成，却对外宣称全自研，引发了关于开源协议合规性与AI营销泡沫的广泛讨论。

2026-03-21 01:24

云计算Hugging Face8.0

在 Hugging Face Hub 上引入 Storage Buckets

Hugging Face Hub 推出基于 Xet 的 Storage Buckets，为机器学习流程中的中间文件（如 checkpoints、日志）提供类似 S3 的可变对象存储，并通过数据去重和预热技术提升效率与降低成本。

2026-03-21 02:05

AI/MLInfoQ 中文8.0

Cursor 新模型被指就是Kimi K2.5，联创回应：确实是，下次我们会说清楚

Cursor发布新模型Composer 2被指基于月之暗面Kimi K2.5，经联创回应确认并澄清为授权合作下的持续预训练与强化学习成果。

2026-03-21 02:12

AI/MLAI前线8.0

面壁智能发布 EdgeClaw 智能体框架，主打安全和省钱

面壁智能联合多方发布端云协同智能体框架 EdgeClaw，通过三级安全协同与性价比感知机制，解决数据泄露与 Token 成本过高问题。

2026-03-21 05:31

AI/ML量子位8.0

对话越疆刘培超：春晚隐藏具身选手，却是百亿市值大玩家

本文是对越疆科技创始人刘培超的专访，回顾了公司从协作机器人到具身智能的转型历程，并深入探讨了“一脑多体”技术路线、商业化落地挑战及行业竞争格局。

2026-03-21 02:42

AI/ML硅星人Pro8.0

OpenAI突然宣布"三合一"：浏览器+编程+ChatGPT合并，内部承认过去一年走错了

文章分析OpenAI在2026年宣布将ChatGPT、Codex和Atlas浏览器合并为桌面超级应用，标志着其战略从分散扩张转向聚焦核心，以应对Anthropic的竞争。

2026-03-21 03:12

AI/ML创业邦8.0

35岁魔咒失效，中年人逆袭掌权AI革命？

文章分析了本轮AI革命中中年创业者占据主导地位的现象，指出这是由于资金门槛高、需要工程积累、资本偏好确定性以及监管环境变化等多重因素共同作用的结果。

2026-03-21 01:08

AI/MLAINLP8.0

Attention之后，Kimi终于对Transformer的残差连接动手了！附论文英中对照版

文章分析了Kimi提出的《Attention Residuals》论文，探讨如何将Transformer架构中的残差连接从固定累加改进为基于内容的动态深度路由机制。

2026-03-21 10:31

AI/ML机器之心8.0

画质革命还是AI整容？DLSS 5引爆全网争议，老黄亲自下场论战

英伟达发布基于生成式AI的DLSS 5技术，试图通过实时神经渲染提升游戏画质，却因引发“AI整容”般的审美同质化争议而遭到玩家质疑，黄仁勋对此回应称该技术高度可控且尊重艺术风格。

2026-03-21 05:01

⚡ 快速浏览

刘小排r6.0