独家|华为云新加坡总经理胡维琦将加入MiniMax,或向贠烨祎汇报
华为云新加坡总经理胡维琦将加入MiniMax,负责B端业务及中国区市场,这标志着MiniMax正大力强化其海外及商业化布局。
今天的技术圈可谓精彩纷呈,既有重磅的人事变动预示着AI出海的新风向,也有底层理论的重大突破重新定义了大模型的进化规则,更有面向工业落地的硬核代码模型横空出世。从商业战道的排兵布阵,到学术界的深度思考,再到工程界的精密制造,这三件事勾勒出了AI技术从“炫技”走向“实干”的清晰路径。
独家|华为云新加坡总经理胡维琦将加入MiniMax,或向贠烨祎汇报
MiniMax 迎来了一位重量级的“实干家”。原华为云高管胡维琦的加盟,绝不仅仅是简单的 C 端人事变动,这更像是 MiniMax 在完成 IPO 后,吹响全球化 B 端业务冲锋号的集结令。胡维琦在华为 20 年的经历,横跨运营商到云计算,尤其擅长海外本地化生态建设,这正是目前大模型公司从“卷参数”转向“卷落地”最稀缺的能力。对于 MiniMax 而言,拥有胡维琦这样深谙云基建与 B 端市场的老将,意味着其海外业务将不再局限于模型的输出,而是能深入到企业的数字化转型肌理中,与云厂商在更多维度展开竞争与合作。这也释放了一个明确信号:AI 创业的下半场,是拥有深厚产业资源与全球化视野的“老兵”的战场。
ICLR 2026 | 清华提出交叉熵分解:“误差熵”才是大模型规模定律真正的驱动项
如果说 MiniMax 的新闻是关于“如何落地”,那么清华这篇 ICLR 2026 的论文则在探讨“模型为何进化”。研究人员通过数学分解,将困扰业界的交叉熵规模定律失效之谜解开了——原来真正驱动模型智能的“幽灵”是“误差熵”。这一发现极具洞察力:它指出了大模型参数增长的本质是在提升对正确答案的“排序能力”,而非单纯降低预测概率的置信度。这不仅解释了为什么超大规模模型会出现“性能瓶颈”,更为未来的训练指明了更精准的方向。对于开发者和研究者来说,这意味着我们以后可以少花冤枉钱在不相关的指标上,直接瞄准“误差熵”进行优化,这或许是下一代高效大模型诞生的理论基石。
InCoder-32B:北航发布首个面向工业代码的代码基座模型
从理论到实践,代码大模型在工业场景的“水土不服”一直是个痛点。北航发布的 InCoder-32B 则给出了一份令人惊喜的答卷。不同于仅在 HumanEval 等通用榜单刷分的模型,InCoder-32B 敢于向芯片设计、GPU 内核优化、嵌入式系统等“硬骨头”挑战。其最核心的贡献在于重建了真实的工业仿真环境,利用真实工具链生成了 250 万条经过执行验证的训练数据。这意味着模型是在“真枪实弹”的环境中学会了如何避免硬件违规,而不仅仅是学会了代码语法。当现有的通用模型还在犯 CUDA 参数超限这种低级错误时,InCoder-32B 已经能够理解并遵守硬件约束,这对于推动 AI 进入芯片、嵌入式等严肃工业领域具有里程碑式的意义,也让我们看到了垂直化、场景化代码模型的巨大潜力。
华为云新加坡总经理胡维琦将加入MiniMax,负责B端业务及中国区市场,这标志着MiniMax正大力强化其海外及商业化布局。
清华大学研究团队提出交叉熵分解方法,发现只有误差熵真正遵循幂律缩放,揭示了误差熵才是大模型规模定律的真正驱动项。
北航团队发布了首个面向工业代码场景的32B参数基座模型InCoder-32B,通过重建工业仿真环境生产高质量训练数据,在芯片设计、GPU优化等多个工业基准上表现优异。
北京大学彭宇新团队提出分类感知表征对齐方法(TARA),通过将生成式大模型与生物基础模型对齐,有效注入类别树先验知识,解决了多模态大模型在分层视觉识别中的同层判别性差、跨层一致性差及新类泛化性差等难题。
文章介绍了如何利用OpenCode工具从零手搓一个Agent Skill,通过接入DeepWiki创建专门的“代码仓库百晓通”以解决开源项目代码阅读困难的问题。
文章深入浅出地讲解了如何编写自定义AI Skill(技能),提供了一套结构化的方法论和一个可交互的“Skill构建器”工具,帮助新手通过访谈形式快速生成高质量的AI技能配置。
文章介绍了上海交通大学吴超逸关于医疗智能体系统的构建与演进路径,涵盖了从单一模型到多模态智能体系统的跨越,重点分享了发表于Nature正刊的罕见病诊断智能体DeepRare及未来交互式虚拟环境的进化范式。
文章揭露了Cursor声称自研的Composer 2模型实则基于月之暗面Kimi K2.5,并深入分析了AI产品公司在巨头模型竞争下的生存困境。
文章深入分析了苹果在AI领域的“隐形”战略,指出苹果虽在技术上落后,但凭借App Store分发渠道和Mac Mini等硬件优势,正通过收取佣金和提供算力设备成为AI变现的赢家。
文章揭露了 Cursor 新发布的 Composer 2 模型实则是基于 Moonshot AI 的开源模型 Kimi K2.5 进行训练,且未在初始声明中注明来源,引发了关于开源协议合规性与“自研”定义的广泛讨论。
文章基于 Karpathy 的 AI 职业暴露度项目及其中文克隆版,分析了不同职业受 AI 影响的程度,指出高薪白领工作数字化程度最高,同时强调暴露度高不代表职业会消失,而是工作方式将发生改变。
本文记录了Andrej Karpathy关于AI智能体深度应用的访谈,详细阐述了他从手写代码转向“传达意志”的工作流变革,并提出了AutoResearch等自动化构想。
文章揭露Cursor新发布的Composer 2模型被证实是基于国产Kimi K2.5模型微调而成,却对外宣称全自研,引发了关于开源协议合规性与AI营销泡沫的广泛讨论。
Hugging Face Hub 推出基于 Xet 的 Storage Buckets,为机器学习流程中的中间文件(如 checkpoints、日志)提供类似 S3 的可变对象存储,并通过数据去重和预热技术提升效率与降低成本。
Cursor发布新模型Composer 2被指基于月之暗面Kimi K2.5,经联创回应确认并澄清为授权合作下的持续预训练与强化学习成果。
面壁智能联合多方发布端云协同智能体框架 EdgeClaw,通过三级安全协同与性价比感知机制,解决数据泄露与 Token 成本过高问题。
本文是对越疆科技创始人刘培超的专访,回顾了公司从协作机器人到具身智能的转型历程,并深入探讨了“一脑多体”技术路线、商业化落地挑战及行业竞争格局。
文章分析OpenAI在2026年宣布将ChatGPT、Codex和Atlas浏览器合并为桌面超级应用,标志着其战略从分散扩张转向聚焦核心,以应对Anthropic的竞争。
文章分析了本轮AI革命中中年创业者占据主导地位的现象,指出这是由于资金门槛高、需要工程积累、资本偏好确定性以及监管环境变化等多重因素共同作用的结果。
文章分析了Kimi提出的《Attention Residuals》论文,探讨如何将Transformer架构中的残差连接从固定累加改进为基于内容的动态深度路由机制。
英伟达发布基于生成式AI的DLSS 5技术,试图通过实时神经渲染提升游戏画质,却因引发“AI整容”般的审美同质化争议而遭到玩家质疑,黄仁勋对此回应称该技术高度可控且尊重艺术风格。
文章揭露AI编程工具Cursor所谓的自研模型Composer 2实则基于月之暗面Kimi模型微调,且涉嫌违反开源协议未注明来源,讽刺硅谷公司套壳行为的双标现象。
北京大学智能学院钟亦武老师发布招生信息,长期招收多模态推理及具身智能方向的实习生和博士研究生,介绍了导师背景及研究重点。
文章介绍了 BVP 评选出的 50 家 Physical AI 前沿企业,重点提及了真格基金被投企业 Nuro 和 Dyna Robotics 的技术进展。
这是一篇涵盖科技、汽车及投融资领域的行业新闻早报,报道了马斯克推特赔偿案、OpenAI产品整合、贝索斯AI基金等热点事件。