奔跑的高达

Kimi K2.5 震撼开源,具身智能与太空算力大爆发

2026-01-28

✍️ 主编按语

今天的技术圈堪称“诸神之战”,Kimi K2.5 的发布让我们看到了“视觉+代码”融合的极致形态,而蚂蚁灵波与国星宇航则将战火从算法层烧到了物理世界的具身智能与外太空。从 Agent 集群的协作进化到真实机器人的万小时训练,再到卫星在轨部署大模型,我们正在见证 AI 从“数字大脑”向“物理实体”和“太空基建”的惊人跨越。

AI 模型与 Agent 进化

Kimi 发布并开源 K2.5 模型,带来全新视觉理解、代码和 Agent 集群能力 - 这不仅仅是一个模型的更新,更是交互逻辑的重塑。K2.5 最大的亮点在于打破了语言的界限,实现了“视觉即代码”。你能通过录屏让 AI 复现特效,也能通过截图圈选直接修改网页布局,这种“所见即所得”的能力极大地降低了编程门槛。更重要的是,其引入的“Agent Swarm”智能体集群技术,标志着 AI 从单兵作战走向了多兵种协同,能像人类团队一样分配任务、并行处理复杂流程,这对提升生产力工具的上限具有里程碑意义。

录屏扒代码、截图改网页!Kimi K2.5把「视觉x代码」玩明白了 - 作为上述模型的实测视角,这篇文章生动展示了 K2.5 在前端开发和办公场景的统治力。它能精准识别模糊图片中的设计意图,甚至具备设计审美,生成的代码不再是机械的堆砌,而是带有灵魂的动效。对于开发者而言,这意味着未来编程的核心将不再是敲击键盘,而是审美与逻辑的决策;对于普通用户,这或许是“人人都是产品经理”时代的真正开端。

10亿红包后,我们打算开源这个800亿的模型 - 腾讯混元在图像生成领域的动作同样迅猛。开源的 HunyuanImage 3.0 图生图模型基于 800 亿参数的混合专家架构,其核心在于“先思考,后编辑”的工作流。不同于简单的像素修改,模型会先分析图像内容和用户意图,再进行推理执行。这种思维链的引入,解决了 AI 编辑“改了对了但不懂为什么”的尴尬,使其在 LMArena 榜单上杀入全球前列。对创作者来说,这意味着更精准的控制力,AI 正在从“画笔”进化为“设计师助理”。

具身智能与物理世界

蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白” - 蚂蚁灵波此次开源的 LingBot-VLA,用 20000 小时的真实世界数据,狠狠打了“仿真数据派”的脸。在具身智能领域,真实数据的 Scaling Law 首次得到系统性验证:数据越多,性能越强且未饱和。其跨本体泛化能力尤为惊艳,同一个“大脑”能驱动不同构型的机器人,这为行业解决硬件碎片化难题提供了一把“万能钥匙”。

蚂蚁具身智能明牌了:做大脑,和宇树们错位竞争 - 这篇文章深度剖析了蚂蚁的战略意图:不造身体,只造大脑。通过与多家机器人厂商合作,LingBot-VLA 在 GM-100 评测中全面超越英伟达 GR00T 和 π0.5。这种软硬解耦的思路非常明智,它让算法公司专注于通用智能基座,而让硬件厂商专注于机械结构。这预示着未来机器人产业将出现类似“Wintel”式的分工,蚂蚁正试图抢占那个“Intel”的位置。

AAAI 2026 Oral | SplatSSC:解耦深度引导的高斯泼溅,开启单目语义场景补全高效新范式 - 机器人要想“看”懂世界,离不开高效的 3D 场景理解。SplatSSC 提出的解耦深度引导高斯泼溅技术,巧妙地解决了传统方法中计算冗余和“漂浮物”伪影的问题。它利用几何先验精准引导,仅用少量基元就能高质量重构场景。对于自动驾驶和具身机器人来说,这意味着更低的算力消耗和更精准的环境感知,是通往“持久性世界模型”的关键技术基石。

垂直领域与前沿探索

AAAI 2026|基于思维链与强化学习的可解释多模态广告审核护栏 - 快手 BLM-Guard 框架针对多模态协同欺骗这一顽疾给出了教科书式的解决方案。通过引入模拟人类审核员的思维链和动态策略对齐的强化学习,模型不仅“判得准”,还能“说得清”。在监管日益严格的今天,这种可解释性至关重要——它不仅能拦截违规,还能告诉商家“为什么违规”,为合规整改提供了依据,是 AI 治理落地的典范。

UniRG: Scaling medical imaging report generation with multimodal reinforcement learning - 微软研究院的 UniRG 再次证明了强化学习在垂直领域的巨大潜力。不同于传统模型“为了写报告而写报告”,UniRG 直接优化临床准确性和一致性指标,使其在跨机构、跨人种的测试中依然保持 SOTA 性能。对于医疗资源紧缺的地区,这不仅仅是提效工具,更是拉平医疗诊断水准的普惠技术,展现了 AI 作为“第二医生”的可靠性。

比人类专家快2倍,斯坦福联合英伟达发布TTT-Discover:用「测试时强化学习」攻克科学难题 - TTT-Discover 提出的“测试时训练”概念极具颠覆性。它不再满足于让 AI 在测试时进行搜索尝试,而是让 AI 在解决具体问题的过程中“持续学习自己”。这种“边做边学”的能力,让其在 GPU 内核优化和数学问题上超越了人类专家。这或许预示着未来科学发现的新范式:AI 不再只是检索工具,而是能实时进化、自我迭代的“虚拟科学家”。

基础设施新边疆

中国团队引领太空算力:首次太空在轨部署通用大模型,发2800颗卫星服务数亿硅基智能体 - 当地球上的算力面临能耗和土地瓶颈时,国星宇航将目光投向了星辰大海。计划发射的 2800 颗卫星将构建一张“太空算力网”,不仅支持推理,甚至能进行在轨训练。与 Starcloud 的技术验证不同,中国团队实现了大模型的在轨 OTA 部署。这不仅关乎全球覆盖的低延迟服务(如自动驾驶),更是为了未来数亿硅基智能体准备的“云端大脑”。太空算力,已成为大国 AI 竞争的新高地。

🔥 热门文章 (46 篇)

AI/ML腾讯混元9.0

10亿红包后,我们打算开源这个800亿的模型

腾讯混元团队正式开源了图生图模型HunyuanImage 3.0-Instruct,该模型采用800亿参数MoE架构,凭借强大的推理和“先思考后编辑”能力位列LMArena全球图像编辑榜单第七。

其他暗涌Waves8.0

一名“回购顾问”的自白丨入局

文章讲述了一位资深律师转型为“回购顾问”,通过谈判和结构化设计,帮助背负巨额回购责任的创业者在资本清算期实现“体面退场”与风险隔离。

AI/ML浮之静8.0

初识 Moltbot(原名 Clawdbot)

文章深入解析了开源混合代理框架 Moltbot(原名 Clawdbot)的架构设计、技术理念及安全风险,探讨了本地优先的 AI 助理如何重塑个人服务器与工作流。

AI/ML阿里云开发者8.0

模型训练篇|多阶段ToolRL打造更可靠的AI导购助手

文章详细介绍了在租赁导购场景下,如何通过从多Agent架构演进为“One-Model+Tool-Use”,并利用两阶段强化学习(Rule based + LLM-as-Judge)提升模型工具调用准确性与响应速度的技术实践。

工具效率The JetBrains Blog8.0

Spring Data JDBC Made Easy with IntelliJ IDEA

本文介绍了IntelliJ IDEA 2025.3版本新增的对Spring Data JDBC的一流支持,包括数据库反向工程、迁移脚本生成、实体同步及代码补全等功能,旨在提升开发效率。

AI/ML大淘宝技术8.0

Agentic Coding场景下基于职责分离的上下文管理思路分享

文章提出了一种基于“职责分离”思想的Agent上下文管理思路,将工具调用解耦为行为与影响,并通过结构化上下文和动态管理策略,有效缓解了长上下文导致的模型注意力稀释与性能退化问题。

AI/ML大模型智能8.0

强化学习最难的不是算法,是写环境!

文章通过作者在多智能体强化学习中的实践经历,深刻剖析了环境设计(建模、状态空间、奖励机制)在强化学习落地中的核心难点和重要性。

后端架构Spring Blog8.0

Anthropic Agent Skills Support in Spring AI

文章详细介绍了Spring AI如何集成Anthropic的Agent Skills API,实现Claude模型对Excel、PPT等文档的直接生成能力,并提供了自定义技能和生产环境实现的最佳实践。

AI/ML刘小排r8.0

Claude Code 浏览器自动化方案,怎么选?

文章对比分析了Claude Code环境下Agent Browser、DevTools MCP和Playwright MCP三种主流浏览器自动化方案的特点,并给出了针对不同场景的选择建议。

DevOpsvivo互联网技术8.0

vivo GPU容器与 AI 训练平台探索与实践

文章分享了vivo在大规模GPU容器集群与AI训练平台的建设实践,详细阐述了通过自研GPU虚拟化、训推潮汐部署及容器RDMA网络等技术手段,解决稳定性与资源利用率挑战的经验。

快速浏览

深思圈6.0

湾区硅谷最新优质活动推荐

文章介绍了将于2026年3月在旧金山举办的 AI+ Renaissance 峰会,聚焦从多模态交互到 Agent 执行及企业级落地的系统工程实践。

The JetBrains Blog6.0

IntelliJ Scala Plugin in 2025

文章回顾了 JetBrains Scala 插件在 2025 年的主要更新,重点包括对 Scala 3 新特性的支持、X-Ray 模式改进及性能优化,并分享了 2025 年开发者生态系统调查数据。