Kimi K2.5 震撼开源，具身智能与太空算力大爆发

2026-01-28

✍️ 主编按语

今天的技术圈堪称“诸神之战”，Kimi K2.5 的发布让我们看到了“视觉+代码”融合的极致形态，而蚂蚁灵波与国星宇航则将战火从算法层烧到了物理世界的具身智能与外太空。从 Agent 集群的协作进化到真实机器人的万小时训练，再到卫星在轨部署大模型，我们正在见证 AI 从“数字大脑”向“物理实体”和“太空基建”的惊人跨越。

AI 模型与 Agent 进化

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力 - 这不仅仅是一个模型的更新，更是交互逻辑的重塑。K2.5 最大的亮点在于打破了语言的界限，实现了“视觉即代码”。你能通过录屏让 AI 复现特效，也能通过截图圈选直接修改网页布局，这种“所见即所得”的能力极大地降低了编程门槛。更重要的是，其引入的“Agent Swarm”智能体集群技术，标志着 AI 从单兵作战走向了多兵种协同，能像人类团队一样分配任务、并行处理复杂流程，这对提升生产力工具的上限具有里程碑意义。

录屏扒代码、截图改网页！Kimi K2.5把「视觉x代码」玩明白了 - 作为上述模型的实测视角，这篇文章生动展示了 K2.5 在前端开发和办公场景的统治力。它能精准识别模糊图片中的设计意图，甚至具备设计审美，生成的代码不再是机械的堆砌，而是带有灵魂的动效。对于开发者而言，这意味着未来编程的核心将不再是敲击键盘，而是审美与逻辑的决策；对于普通用户，这或许是“人人都是产品经理”时代的真正开端。

10亿红包后，我们打算开源这个800亿的模型 - 腾讯混元在图像生成领域的动作同样迅猛。开源的 HunyuanImage 3.0 图生图模型基于 800 亿参数的混合专家架构，其核心在于“先思考，后编辑”的工作流。不同于简单的像素修改，模型会先分析图像内容和用户意图，再进行推理执行。这种思维链的引入，解决了 AI 编辑“改了对了但不懂为什么”的尴尬，使其在 LMArena 榜单上杀入全球前列。对创作者来说，这意味着更精准的控制力，AI 正在从“画笔”进化为“设计师助理”。

具身智能与物理世界

蚂蚁灵波开源具身大模型LingBot-VLA，让机器人“看的更清楚做的更明白” - 蚂蚁灵波此次开源的 LingBot-VLA，用 20000 小时的真实世界数据，狠狠打了“仿真数据派”的脸。在具身智能领域，真实数据的 Scaling Law 首次得到系统性验证：数据越多，性能越强且未饱和。其跨本体泛化能力尤为惊艳，同一个“大脑”能驱动不同构型的机器人，这为行业解决硬件碎片化难题提供了一把“万能钥匙”。

蚂蚁具身智能明牌了：做大脑，和宇树们错位竞争 - 这篇文章深度剖析了蚂蚁的战略意图：不造身体，只造大脑。通过与多家机器人厂商合作，LingBot-VLA 在 GM-100 评测中全面超越英伟达 GR00T 和 π0.5。这种软硬解耦的思路非常明智，它让算法公司专注于通用智能基座，而让硬件厂商专注于机械结构。这预示着未来机器人产业将出现类似“Wintel”式的分工，蚂蚁正试图抢占那个“Intel”的位置。

AAAI 2026 Oral | SplatSSC：解耦深度引导的高斯泼溅，开启单目语义场景补全高效新范式 - 机器人要想“看”懂世界，离不开高效的 3D 场景理解。SplatSSC 提出的解耦深度引导高斯泼溅技术，巧妙地解决了传统方法中计算冗余和“漂浮物”伪影的问题。它利用几何先验精准引导，仅用少量基元就能高质量重构场景。对于自动驾驶和具身机器人来说，这意味着更低的算力消耗和更精准的环境感知，是通往“持久性世界模型”的关键技术基石。

垂直领域与前沿探索

AAAI 2026｜基于思维链与强化学习的可解释多模态广告审核护栏 - 快手 BLM-Guard 框架针对多模态协同欺骗这一顽疾给出了教科书式的解决方案。通过引入模拟人类审核员的思维链和动态策略对齐的强化学习，模型不仅“判得准”，还能“说得清”。在监管日益严格的今天，这种可解释性至关重要——它不仅能拦截违规，还能告诉商家“为什么违规”，为合规整改提供了依据，是 AI 治理落地的典范。

UniRG: Scaling medical imaging report generation with multimodal reinforcement learning - 微软研究院的 UniRG 再次证明了强化学习在垂直领域的巨大潜力。不同于传统模型“为了写报告而写报告”，UniRG 直接优化临床准确性和一致性指标，使其在跨机构、跨人种的测试中依然保持 SOTA 性能。对于医疗资源紧缺的地区，这不仅仅是提效工具，更是拉平医疗诊断水准的普惠技术，展现了 AI 作为“第二医生”的可靠性。

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题 - TTT-Discover 提出的“测试时训练”概念极具颠覆性。它不再满足于让 AI 在测试时进行搜索尝试，而是让 AI 在解决具体问题的过程中“持续学习自己”。这种“边做边学”的能力，让其在 GPU 内核优化和数学问题上超越了人类专家。这或许预示着未来科学发现的新范式：AI 不再只是检索工具，而是能实时进化、自我迭代的“虚拟科学家”。

基础设施新边疆

中国团队引领太空算力：首次太空在轨部署通用大模型，发2800颗卫星服务数亿硅基智能体 - 当地球上的算力面临能耗和土地瓶颈时，国星宇航将目光投向了星辰大海。计划发射的 2800 颗卫星将构建一张“太空算力网”，不仅支持推理，甚至能进行在轨训练。与 Starcloud 的技术验证不同，中国团队实现了大模型的在轨 OTA 部署。这不仅关乎全球覆盖的低延迟服务（如自动驾驶），更是为了未来数亿硅基智能体准备的“云端大脑”。太空算力，已成为大国 AI 竞争的新高地。

🔥 热门文章 (46 篇)

AI/MLMicrosoft Research Blog9.0

UniRG: Scaling medical imaging report generation with multimodal reinforcement learning

微软研究院发布了UniRG框架，利用强化学习结合临床奖励信号优化医疗影像报告生成模型，在跨机构泛化、纵向报告生成及诊断准确性上达到SOTA水平。

2026-01-27 17:00

AI/ML量子位9.0

中国团队引领太空算力：首次太空在轨部署通用大模型，发2800颗卫星服务数亿硅基智能体

中国团队首次实现在轨部署通用大模型，并计划通过发射2800颗卫星构建太空算力网络，旨在服务数亿硅基智能体，标志着全球AI竞争进入太空领域。

2026-01-28 12:08

AI/ML腾讯混元9.0

10亿红包后，我们打算开源这个800亿的模型

腾讯混元团队正式开源了图生图模型HunyuanImage 3.0-Instruct，该模型采用800亿参数MoE架构，凭借强大的推理和“先思考后编辑”能力位列LMArena全球图像编辑榜单第七。

2026-01-28 07:52

AI/ML机器之心9.0

AAAI 2026 Oral | SplatSSC：解耦深度引导的高斯泼溅，开启单目语义场景补全高效新范式

文章介绍了AAAI 2026 Oral论文SplatSSC，该研究通过深度引导策略与解耦聚合机制，解决了单目3D语义场景补全中基元初始化盲目和异常伪影两大瓶颈，实现了在更低算力消耗下的SOTA性能。

2026-01-28 04:56

AI/ML量子位9.0

录屏扒代码、截图改网页！Kimi K2.5把「视觉x代码」玩明白了

文章详细评测了Moonshot AI最新模型Kimi K2.5，重点介绍了其通过视觉能力实现录屏扒代码和截图改网页，以及利用智能体集群大幅提升效率的技术突破。

2026-01-28 00:37

AI/ML快手技术9.0

AAAI 2026｜基于思维链与强化学习的可解释多模态广告审核护栏

快手提出BLM-Guard可解释多模态广告审核框架，结合思维链与强化学习技术解决隐蔽违规识别与策略漂移问题，相关成果入选AAAI 2026。

2026-01-28 10:01

AI/ML量子位9.0

蚂蚁具身智能明牌了：做大脑，和宇树们错位竞争

蚂蚁灵波开源了基于20000小时真实世界数据的具身智能基座模型LingBot-VLA，首次在真实场景验证了VLA的Scaling Law，并提出了“做大脑、不造机器人”的错位竞争路径。

2026-01-28 11:08

AI/ML魔搭ModelScope社区9.0

Kimi 发布并开源 K2.5 模型，带来全新视觉理解、代码和 Agent 集群能力

月之暗面发布并开源 Kimi K2.5 模型，该模型在代码、视觉理解及通用智能任务上达到开源 SOTA 水平，并首次引入了 Agent 集群能力，同时推出了 Kimi Code 编程工具。

2026-01-27 16:15

AI/ML机器之心9.0

比人类专家快2倍，斯坦福联合英伟达发布TTT-Discover：用「测试时强化学习」攻克科学难题

斯坦福与英伟达联合提出TTT-Discover方法，通过在测试时进行强化学习让LLM持续训练，成功在数学、GPU优化等领域击败人类专家及AlphaEvolve。

2026-01-28 04:56

AI/ML量子位9.0

蚂蚁灵波开源具身大模型LingBot-VLA，让机器人“看的更清楚做的更明白”

蚂蚁集团联合星海图与松灵机器人开源具身大模型LingBot-VLA，并在多机型上完成真机验证，提升了机器人的视觉感知与执行能力。

2026-01-28 02:21

AI/ML十字路口Crossing8.0

从Pi0.5，再到LingBot-VLA：一条具身智能的路正在成型

文章分析了蚂蚁灵波开源的LingBot-VLA具身智能大模型，探讨了其在通用性及跨硬件任务上的表现，并对比了开源路线与闭环路线的行业现状。

2026-01-28 03:38

其他暗涌Waves8.0

一名“回购顾问”的自白丨入局

文章讲述了一位资深律师转型为“回购顾问”，通过谈判和结构化设计，帮助背负巨额回购责任的创业者在资本清算期实现“体面退场”与风险隔离。

2026-01-28 04:03

AI/ML哔哩哔哩技术8.0

视频生成推理加速实践：基于 torch.compile 的整图编译优化

本文分享了基于 torch.compile 对视频生成模型进行整图编译优化的实践经验，详细阐述了消除 Graph Break 的策略，最终实现了显著的推理加速效果。

2026-01-28 04:03

AI/ML51CTO技术栈8.0

奥特曼：OpenAI会持续招程序员，内部已实现近乎无限运行智能体；幼儿园应远离AI；曝内部两条模型优化曲线；已准备好让AI看遍自己网上生活

文章记录了Sam Altman在OpenAI研讨会上的问答，深入探讨了AGI发展路径、未来软件形态、模型成本与速度优化、Agent现状及对创业者的建议。

2026-01-28 04:06

工具效率少数派8.0

别跟 Office 较劲了，这就是你身边的新晋专家

文章深度评测了 Kimi K2.5 模型在 Excel、Word、PPT 和 PDF 办公场景中的 Agent 能力，验证了其通过代码执行生成专业文档的实战效果。

2026-01-28 04:16

AI/ML浮之静8.0

初识 Moltbot（原名 Clawdbot）

文章深入解析了开源混合代理框架 Moltbot（原名 Clawdbot）的架构设计、技术理念及安全风险，探讨了本地优先的 AI 助理如何重塑个人服务器与工作流。

2026-01-28 10:46

AI/ML极客公园8.0

Clawdbot 爆火以后，这条硬件赛道成了最大受益者

文章探讨了爆火的 Clawdbot 与 AI NAS 赛道的内在联系，分析了 AI NAS 如何作为本地化超级助手成为下一个硬件风口，以及当前面临的模型适配和市场挑战。

2026-01-28 10:05

AI/ML阿里云开发者8.0

模型训练篇｜多阶段ToolRL打造更可靠的AI导购助手

文章详细介绍了在租赁导购场景下，如何通过从多Agent架构演进为“One-Model+Tool-Use”，并利用两阶段强化学习（Rule based + LLM-as-Judge）提升模型工具调用准确性与响应速度的技术实践。

2026-01-28 00:31

工具效率The JetBrains Blog8.0

ACP Agent Registry Is Live: Find and Connect AI Coding Agents in Your JetBrains IDE

JetBrains 与 Zed 合作推出了 ACP Agent Registry，允许开发者在 IDE 中直接浏览、安装和切换符合 ACP 标准的 AI 编码代理，旨在消除供应商锁定并提供无缝的开发体验。

2026-01-28 14:56

AI/MLDatawhale8.0

DeepSeek今年的两个重大更新，一篇详细的总结来了！

文章详细总结了DeepSeek发布的OCR 2模型及其mHC架构创新，前者通过因果推理模拟人类视觉，后者通过几何约束优化深度网络连接。

2026-01-28 14:49

工具效率The JetBrains Blog8.0

Spring Data JDBC Made Easy with IntelliJ IDEA

本文介绍了IntelliJ IDEA 2025.3版本新增的对Spring Data JDBC的一流支持，包括数据库反向工程、迁移脚本生成、实体同步及代码补全等功能，旨在提升开发效率。

2026-01-28 09:59

AI/ML大淘宝技术8.0

Agentic Coding场景下基于职责分离的上下文管理思路分享

文章提出了一种基于“职责分离”思想的Agent上下文管理思路，将工具调用解耦为行为与影响，并通过结构化上下文和动态管理策略，有效缓解了长上下文导致的模型注意力稀释与性能退化问题。

2026-01-28 08:38

AI/ML量子位8.0

黄仁勋预言落地，物理AI开年第一枪竟是中国公司打响

文章深入分析了文远知行发布的通用仿真模型WeRide GENESIS，阐述了其通过构建高拟真虚拟世界实现数据闭环，连接物理AI与生成AI的技术路径。

2026-01-28 08:28

AI/ML量子位8.0

腾讯混元图像3.0图生图开源，LMArena跻身全球第一梯队，开源最强

腾讯宣布混元图像3.0图生图模型开源，并在LMArena排行榜中跻身全球第一梯队，被视为目前开源领域最强的图像生成模型之一。

2026-01-28 08:23

工具效率前端早读课8.0

【第3649期】把 AI 当同事用：Rules、Commands、Skills 的清晰分工

文章系统梳理了 AI 编程工具中 Rules、Commands、Skills 和 Agents 的概念边界与使用场景，提出通过技能的“渐进式加载”机制来优化上下文管理，从而提升 AI 编程的效率与协作性。

2026-01-28 01:03

AI/MLFounder Park8.0

BAI、高瓴领投，ThetaWave李文轩：我们想成为下一代年轻人默认的知识获取入口

文章专访了 ThetaWave AI 创始人李文轩，讲述了该产品如何通过 AI 聚焦知识输入场景，实现百万美元 ARR 并找到 PMF 的创业历程及增长策略。

2026-01-28 08:02

AI/ML数字生命卡兹克8.0

保姆级Clawdbot教程来了，但我还是想劝大家悠着点。

文章详细介绍了本地AI Agent Clawdbot（现名Moltbot）的功能特性、部署教程及飞书接入方法，并针对其高权限带来的安全隐患提供了重要警示。

2026-01-28 01:29

AI/MLAWS Machine Learning Blog8.0

Build reliable Agentic AI solution with Amazon Bedrock: Learn from Pushpay’s journey on GenAI evaluation

文章分享了Pushpay利用Amazon Bedrock构建Agentic AI搜索功能的实践，重点介绍了如何通过自定义GenAI评估框架和领域级指标分析将模型准确率提升至95%。

2026-01-27 17:39

AI/ML大模型智能8.0

强化学习最难的不是算法，是写环境！

文章通过作者在多智能体强化学习中的实践经历，深刻剖析了环境设计（建模、状态空间、奖励机制）在强化学习落地中的核心难点和重要性。

2026-01-27 16:02

AI/ML网易科技8.0

它是神，也是毒！Clawdbot改名卷入千万诈骗，更让你的电脑“裸奔”

文章深度拆解了明星AI项目Clawdbot（现名Moltbot）因商标侵权被迫改名引发的黑客诈骗、千万美元资金盘及严重的安全漏洞事件，揭示了AI智能体在高速发展下的安全隐患与品牌保护危机。

2026-01-28 02:34

后端架构Spring Blog8.0

Anthropic Agent Skills Support in Spring AI

文章详细介绍了Spring AI如何集成Anthropic的Agent Skills API，实现Claude模型对Excel、PPT等文档的直接生成能力，并提供了自定义技能和生产环境实现的最佳实践。

2026-01-28 00:00

其他晚点LatePost8.0

对话鸣鸣很忙晏周：千亿零食王国的诞生、合并与远征

这是一篇对鸣鸣很忙董事长晏周的深度专访，详细复盘了零食很忙与赵一鸣零食的合并过程，以及企业如何通过重新定义零食和极致性价比实现万店规模扩张的商业逻辑。

2026-01-28 02:57

AI/ML腾讯技术工程8.0

一夜爆火，Clawdbot是否才是真正的AI入口产品？

文章详细介绍了开源AI项目Clawdbot（现名Moltbot），它通过本地优先架构和MCP协议，将AI从对话框转变为拥有执行能力的“数字员工”，并提供了保姆级部署教程。

2026-01-28 03:01

AI/ML逛逛GitHub8.0

Kimi 玩了把大的，Agent 团战的时代要来了。

文章评测了 Kimi 最新开源的 K2.5 模型，重点展示了其在多模态视觉编程、Agent 集群协作以及 Office 深度优化方面的核心能力。

2026-01-28 07:14

其他硅谷1018.0

算法选中的“绿色黄金”：深聊抹茶全球爆火背后的商业逆袭史

文章深度复盘了抹茶在全球爆火的商业逆袭史，剖析了算法营销、健康概念与供应链博弈背后的市场逻辑，并探讨了其作为生意的可持续性。

2026-01-28 07:12

后端架构InfoQ 中文8.0

从局部最优到全局跃迁：关于企业“智慧运营中枢”模式的构建与实践思考

文章阐述了企业数智化转型的演进路径，提出基于企业架构构建“智慧运营中枢”模式，通过运营、生产与保障平面的协同实现业务赋能，并结合AI大模型重塑业务价值链。

2026-01-28 06:48

AI/ML魔搭ModelScope社区8.0

Z Image标准版来了！专为微调而生的全能基座，兼顾真实与艺术！

Z-Image团队发布了标准版非蒸馏图像生成模型，该模型采用S3-DiT架构，兼顾高生成质量与艺术风格，专为微调和二次开发优化。

2026-01-27 16:15

AI/ML硅星人Pro8.0

OpenAI 的最强对手，离「AI Windows」又近了一步

Anthropic上线MCP协议，让Claude能深度集成Figma、GitHub等外部工具，推动AI从“聊天机器人”向“智能体平台”演进，意在争夺AI时代操作系统的定义权。

2026-01-28 03:11

AI/ML刘小排r8.0

Claude Code 浏览器自动化方案，怎么选？

文章对比分析了Claude Code环境下Agent Browser、DevTools MCP和Playwright MCP三种主流浏览器自动化方案的特点，并给出了针对不同场景的选择建议。

2026-01-27 16:00

AI/MLAWS Machine Learning Blog8.0

Build an intelligent contract management solution with Amazon Quick Suite and Bedrock AgentCore

文章介绍如何结合 Amazon Quick Suite 和 Amazon Bedrock AgentCore 构建智能合同管理解决方案，利用多智能体协作实现合同分析、风险评估和合规审查。

2026-01-27 16:28

AI/MLAINLP8.0

告别固定扫描：DeepSeek-OCR 2 用“视觉因果流”，重构多模态阅读方式

文章解析了DeepSeek-OCR 2如何通过引入'视觉因果流'机制，重构视觉编码范式，使模型从传统的固定空间扫描转变为基于语义的结构化阅读。

2026-01-28 03:28

DevOpsvivo互联网技术8.0

vivo GPU容器与 AI 训练平台探索与实践

文章分享了vivo在大规模GPU容器集群与AI训练平台的建设实践，详细阐述了通过自研GPU虚拟化、训推潮汐部署及容器RDMA网络等技术手段，解决稳定性与资源利用率挑战的经验。

2026-01-28 12:01

AI/ML量子位8.0

DeepSeek开源全新OCR模型！弃用CLIP改用Qwen轻量小模型，性能媲美Gemini-3 Pro

DeepSeek发布全新的OCR 2.0模型，通过引入基于Qwen2-0.5B的DeepEncoder V2替换CLIP，实现了视觉标记的智能因果重排，在性能上媲美Gemini-3 Pro并已全面开源。

2026-01-28 06:16

前端开发印记中文8.0

JavaScript 中文周刊 #221 - LibPDF：TypeScript 里的 PDF 解析与生成

这是一期JavaScript技术周刊，重点介绍了LibPDF PDF库、SolidJS作者对JS框架未来的分析，以及AI辅助编程和JS运行时开发等深度技术文章，并汇总了大量前端工具和生态更新。

2026-01-28 03:33

AI/ML机器之心8.0

万物皆可参考是种什么体验？Vidu Q2参考生Pro：特效、演技、细节全都要

文章介绍了 Vidu Q2 参考生 Pro 的发布，重点解析了其「万物可参考」的视频生成与精准编辑功能，通过实测展示了特效复刻、纹理迁移及元素修改的能力。

2026-01-28 04:56

AI/MLZ Potentials8.0

深度｜蚂蚁灵波上桌，不止“性能超越Pi 0.5”，更是具身智能新分工时代

文章深入分析了蚂蚁集团开源的具身大模型LingBot-VLA及其全链路工具链，指出其在性能上超越Pi0.5，并探讨了开源对打破行业全栈自研僵局、推动具身智能专业化分工的深远影响。

2026-01-28 03:36

⚡ 快速浏览

创业邦6.0