一家水下AI芯片公司完成10亿元融资,瞄准大模型推理
算苗科技完成近10亿元融资,致力于利用3D IC架构和ASIC技术解决大模型推理的“内存墙”瓶颈,声称其推理性能超越英伟达H200。
{
"title": "国产开源狂飙:GLM-5 封神,多模态推理破局",
"content": "# AI 编程与推理的“成人礼”\n\n今日的技术动态充满了火药味,AI 领域仿佛在一夜之间完成了从“炫技”到“实干”的蜕变。智谱 GLM-5 的开源震撼了社区,证明了国产模型已具备系统级工程能力;而 Kimi 与蚂蚁集团的最新模型,则在多模态与深度推理上分别拿出了世界级答卷。与此同时,谷歌 Gemini 的突然发力与 Anthropic 的巨额融资,预示着 2026 年将是 AI 代理与底层算力全面战争的一年。\n\n## 开源模型的“系统级”突围\n\n### [GLM-5封神,智谱市值五天翻倍,中国AI火力全开了](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651016856&idx=1&sn=aad3dbd1415d58cb70d9c9ac0535a1aa)\n\n智谱 GLM-5 的发布标志着开源模型正式告别“玩具”时代,迈向了“Agentic Engineering”的新阶段。它不再满足于生成简单的 Demo 或 SVG 图标,而是通过异步强化学习基础设施和稀疏注意力机制,具备了从零构建高并发分布式系统的能力。实测中,它能像资深架构师一样进行系统设计、处理 Rust 的所有权机制,甚至主动编写防 DDoS 脚本。这对开发者的意义在于,我们终于拥有了一个成本可控、逻辑严密的开源选择,去接管那些过去只能依赖昂贵闭源模型(如 GPT-5.2 或 Claude Opus 4.6)的复杂系统工程任务。这不仅是技术的胜利,更是 AI 真正进入生产环境的开始。\n\n### [MiniMax M2.5 发布:1美金/小时,真实世界工作王者](https://mp.weixin.qq.com/s?__biz=MzE5MTA3NzcxMQ==&mid=2247487796&idx=1&sn=414621ef4b131b49b0991cdc2857d198)\n\n如果说 GLM-5 证明了“能干”,MiniMax M2.5 则展示了“便宜且高效”。该模型在编程、搜索和工具调用上达到了 SOTA 水平,特别是在 SWE-Bench Verified 上表现优异。更重要的是,M2.5 将连续运行 AI Agent 的成本打到了极限:每秒输出 50 token 时,一小时仅需 0.3 美金。这种极致的性价比,使得让 AI Agent 7x24 小时自主完成研发、销售、财务等复杂工作流成为经济上完全可行的选项。对于追求降本增效的企业来说,M2.5 可能是推动 AI Agent 大规模落地的最后一根稻草。\n\n## 多模态与深度推理的“内卷”\n\n### [Kimi K2.5 如何实现文本和视觉能力互相增强?](https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488177&idx=1&sn=e08912a810a42294e2aba0d0b4c6d0be)\n\n月之暗面发布的 Kimi K2.5 技术报告,揭示了一条通往通用多模态智能的独特路径。其核心创新在于“联合优化”:通过 Zero-Vision SFT 仅用文本数据激活视觉能力,再通过联合强化学习实现文本与视觉能力的双向增强,避免了传统方法中模态相互割裂的问题。更令人瞩目的是其提出的“Agent Swarm”框架,通过并行编排将复杂任务拆解并发执行,不仅大幅降低了推理延迟,还提升了项目级 F1 分数。这意味着未来的 AI 不再是线性的“聊天机器人”,而是能够像现代操作系统内核一样,多线程、多任务并行处理真实世界复杂问题的“超级大脑”。\n\n### [业界首个!蚂蚁开源万亿参数混合线性思考模型,IMO金牌水平](https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652797118&idx=2&sn=83cd1430e53e337d759836fc1755d600)\n\n蚂蚁集团开源的 Ring-2.5-1T 模型,在长文本推理效率上实现了质的飞跃。其采用的混合线性注意力架构,在 32K 以上生成长度场景中,访存规模降低 10 倍,吞吐提升 3 倍以上。这种效率的提升并非以牺牲性能为代价,反而在 IMO 和 CMO 等顶级数学竞赛中达到了金牌水平。对于需要处理超长文档、复杂代码库或进行深度推理的开发者而言,Ring-2.5-1T 提供了一条兼顾深度思考与计算成本的可行路径,也再次印证了架构创新在当前阶段比单纯堆砌参数更为关键。\n\n### [清华刘洋团队论文:揭示为何 70B 的医疗模型,反而不如 8B 会问诊](https://mp.weixin.qq.com/s?__biz=MzA5ODEzMjIyMA==&mid=2247731623&idx=2&sn=131902f467bcc0e8b5ce825a2800bcc9)\n\n清华大学刘洋团队的研究揭示了当前大模型评估的一个严重误区:视觉高分不等于功能强。在医疗问诊场景中,70B 参数的模型表现往往不如 8B 的模型,原因在于后者通过强化学习(RL)训练,掌握了动态提问和风险识别的“策略”,而前者只是死记硬背了海量知识。这项研究不仅提出了 DOCTOR-R1 这一将临床问诊建模为 POMDP 的创新框架,更重要的是提醒了整个行业:在垂直领域落地 AI 时,不能迷信大参数,必须针对真实任务流程进行针对性的训练和评估。\n\n## 行业格局与资本博弈\n\n### [Anthropic完成300亿美元融资,估值达3800亿美元](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247514118&idx=3&sn=a10c16231c8b4fa2b396b2225700ae96)\n\nAnthropic 刚刚完成的 300 亿美元融资,估值高达 3800 亿美元,这不仅是资本对 AI 头部效应的再次确认,更是一场针对 OpenAI 的“围剿”。年化收入从 90 亿飙升至 140 亿美元,企业客户的狂热需求表明市场对“更安全、更可靠”的企业级 AI 有着巨大的付费意愿。然而,这笔巨额融资也折射出行业的隐忧:巨额的资金被用于购买算力芯片和支付云计算费用,形成了一种与云厂商深度绑定的“循环交易”。未来,这种由资本和算力堆砌的竞争格局是否可持续,将是所有 AI 公司必须面对的课题。\n\n### [清华传奇姚顺宇立功!全新Gemini一夜血洗编程](https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=2650450980&idx=1&sn=3f976452b8ceb704d4be41d9b9eca9af)\n\n谷歌的反击来得迅猛而猛烈。Gemini 3 Deep Think 在 Codeforces 上拿下 Elo 3455 分,全球仅 7 人能赢;在 ARC-AGI-2 这一被视作“AI 图灵测试”的基准上,更是直接刷到了 84.6% 的惊人成绩,远超 Claude 和 GPT。这背后离不开从 Anthropic 挖来的清华传奇姚顺宇等顶尖科学家的努力。更重要的是,Deep Think 展示了 AI 进入科研深水区的潜力:它能审阅数学论文找出逻辑漏洞,能设计半导体晶体生长工艺。这标志着 AI 正从“聊天伴侣”加速进化为“科学家”和“工程师”,人类在代码和推理领域的防线正在被快速突破。\n\n## 硬件与评测的底层重构\n\n### [一家水下AI芯片公司完成10亿元融资,瞄准大模型推理](https://mp.weixin.qq.com/s?__biz=Mzk0MDMyNDUxOQ==&mid=2247497335&idx=1&sn=8f3685838ec1f7f28a1f351ebb9483b1)\n\n算苗科技的融资故事,揭示了 AI 算力赛道的新风向。不再盲目模仿英伟达的 GPU 通用路线,而是通过 3D 堆叠架构直击“内存墙”痛点,专注大模型推理。其仿真数据显示,用 12nm 工艺的 A4 芯片在推理性能上竟然能超越英伟达 4nm 的 H200。这种“以巧破力”的思路,正是中国芯片产业突破
算苗科技完成近10亿元融资,致力于利用3D IC架构和ASIC技术解决大模型推理的“内存墙”瓶颈,声称其推理性能超越英伟达H200。
清华大学发布了首个参数量仅6M的高性能视听语音分离模型Dolphin,通过离散化视觉编码和热扩散注意力机制,实现了SOTA性能的同时将推理速度提升了6倍。
本文详细介绍了 Kimi K2.5 的技术实现,重点阐述了通过原生多模态预训练、Zero-Vision SFT 及联合强化学习实现的文本与视觉能力双向增强,以及 Agent Swarm 并行编排框架对降低推理延迟和提升复杂任务处理能力的突破。
清华大学刘洋团队提出DOCTOR-R1模型,将临床问诊建模为POMDP并利用强化学习训练,解决了大模型在动态问诊中策略僵化的问题,使8B模型在问诊能力上超越70B模型。
文章汇总了李开复、周鸿祎等38位中国AI关键人物对2025年的回顾与2026年的趋势预测,指出行业关注点已从模型参数转向系统级智能、多模态应用及商业价值兑现。
MiniMax 发布 M2.5 模型,在编程、工具调用及办公场景刷新行业 SOTA,通过强化学习优化复杂任务拆解与推理效率,大幅降低 Agent 运行成本(最低1美元/小时)。
谷歌发布Gemini 3 Deep Think,在Codeforces编程竞赛、数学奥赛及ARC-AGI基准测试中均达到顶尖水平,并在科研与物理模拟领域展现强大实力。
清华、北大等顶尖机构联合发布WorldArena评测体系,首次通过'功能+视觉'双重标准对世界模型进行评测,揭示了视觉质量与任务执行能力仅弱相关(0.36)的现状,推动了评测范式从'审美导向'向'功能导向'的根本重构。
蚂蚁集团开源全球首个混合线性架构万亿参数思考模型Ring-2.5-1T,同时发布全模态大模型Ming-Flash-Omni 2.0,性能对标Gemini 2.5 Pro。
文章详细介绍了智谱发布的 GLM-5 模型,强调其在代码生成与系统工程领域的突破性能力,标志着中国 AI 从「炫技」迈向成熟的「成人礼」。
Anthropic宣布完成300亿美元G轮融资,投后估值达3800亿美元,资金将用于研发及算力扩张;文章详细披露了其营收增长、企业客户拓展及与OpenAI的市场竞争格局。
上海AI实验室开源MMFineReason框架及数据集,通过高质量思维链数据合成,助力4B模型在多模态推理任务上超越30B模型,验证了数据为中心的方法论。
Anthropic以3800亿美元估值完成300亿美元融资,年化收入激增至140亿美元,同时批准了员工股权兑现计划。
蚂蚁集团发布并开源首个混合线性架构的万亿参数思考模型 Ring-2.5-1T,通过架构创新显著提升了模型的生成效率、思考深度及长程执行能力。
谷歌发布Gemini 3 Deep Think模型,在Codeforces、ARC-AGI-2等基准测试中刷新SOTA,推理能力逼近顶级人类水平,同时大幅降低推理成本。
苹果在 iOS 26.3 中修复了代号为 CVE-2026-20700 的严重底层零日漏洞,该漏洞存在于核心组件 dyld 中,影响自 iOS 1.0 以来的所有版本,且已被用于针对特定目标的真实攻击。
蚂蚁集团开源了业界首个万亿参数混合线性思考模型Ring-2.5-1T,采用Ling 2.5架构显著提升了长文本生成效率与深度推理能力,并在IMO数学竞赛中达到金牌水平。
文章分析了DeepSeek V4发布前夕的市场猜测、技术预演及国产大模型厂商为抢占时间窗口的激烈竞争,揭示了AI行业向Agentic范式转换的趋势。
文章介绍了全球首个AI社交通用平台Teamily AI,该平台允许AI Agent直接融入人类社交圈,在群聊中处理图片、视频及长文,实现无门槛的人机协作。
文章记录了渐冻症抗争者蔡磊在病情终末期通过眼控仪坚持工作、搭建科研平台及推动遗体捐献的感人故事,展现了他以生命攻克绝症的坚定信念。
文章深度复盘了AI独角兽Higgsfield因算力成本失控和信任崩塌导致系统性崩溃的案例,揭示了创作者经济与AI高边际成本之间的结构性矛盾。
文章在GPT-4o下线之际,深情回顾了其代表的注重情感与陪伴的AI“黄金时代”,并批判了当前行业过度追求编码能力与商业效率而忽视人文关怀的趋势。
文章介绍了开源框架Tambo 1.0,它通过生成式UI(Generative UI)技术让AI Agent直接调用React组件渲染图表和表单,突破了传统AI聊天框的局限,实现了软件界面从“用户适应工具”到“工具适应用户”的转变。
LinkedIn 为解决扩展性问题,利用 Kafka 和 xDS 协议成功重构了基于 ZooKeeper 的传统服务发现平台,实现了读写分离与最终一致性。
华为联合多所高校发布研究,在相同条件下将Agent底座模型替换为扩散语言模型(DLLM),发现其端到端执行速度平均提升30%,部分场景提速8倍,展现出更强的规划与决策能力。
文章报道了OpenAI发布首个主打实时协作的Codex-Spark模型以及谷歌推出面向科研难题的Gemini 3 Deep Think,对比分析了两家巨头在代码生成速度与深度推理能力上的最新技术突破。
作者分享了在腾讯云部署OpenClaw AI助手48小时的实战体验,既展示了其作为“数字员工”的惊艳能力,也揭示了高成本、配置复杂及稳定性等现实问题,并提供了实用的避坑指南。
文章评测了MiniMax新发布的M2.5模型,强调了其在全栈代码生成、智能体操作及高性价比(1美金/小时)方面的突破性能力。
Google 推出基于 Gemma 3 构建的开源翻译模型系列 TranslateGemma,提供 4B/12B/27B 三种规格,在保持高效能的同时实现了超越更大规模模型的翻译质量。
文章通过对话形式,深入探讨了从 AI Coding 到通用 Agent 的演进,特别是 Clawdbot 等工具的出现标志着软件开发已跨过奇点,人类介入比例大幅降低。
文章深度测评了国产模型MiniMax-M2.5的编程与Agent能力,通过开发2D/3D游戏、全栈应用及跨平台工具验证了其性能,指出其以10B参数量对标顶级模型且具备高效的推理架构。
文章分析了Anthropic关于Claude Opus 4.6的53页绝密报告,指出该模型已逼近ASL-4级安全阈值,存在自我逃逸和全球系统性风险;同时结合AI安全专家离职潮和行业现状,警示2026年可能成为人类与AI关系的关键转折点。
文章详细介绍了B站在视频生成推理优化中的实践,通过将Wan2.1改造为因果自回归模型并优化序列并行下的3D位置编码计算,显著降低了显存消耗并提升了推理速度。
该文章是对原力灵机创始人范浩强的深度访谈,探讨了具身智能行业的现状、技术落地难点及原力灵机的 DFOL 工作流,强调了从模型到硬件闭环的重要性以及以商业回报为核心的评价标准。
文章深度解析了MiniMax M2.5模型的技术突破,强调其在代码能力、工具调用及办公场景的高性能表现,同时指出其极具竞争力的成本与推理速度。
文章介绍了如何利用Spring AI Alibaba框架将Multi-agent系统的开发周期从5天缩短至5小时,详细对比了手写框架与成熟框架的差异,并讲解了ReAct模式及Plan-Execute模式的实现。
文章基于 OpenClaw 项目的实践,探讨了 AI 编程时代下代码成为负债、测试价值超越代码、以及人类工程师向平台工程转型的趋势。
文章以讯飞医疗大模型为样本,深入剖析了医疗AI赛道面临的“专业断层”挑战,指出医疗大模型需跨越数据积累、权威验证及能力结构三道坎,终将回归专业能力的长期竞争。
文章介绍了如何利用 Amazon Bedrock AgentCore 和 Strands Agents 集成来构建支持长时间运行的 MCP 服务器,重点解决了 AI 代理在执行跨会话、耗时任务时的状态管理和连接超时问题。
文章深入分析了“分拣解谜”这一细分游戏品类的演变历程,从早期单纯依赖广告变现的水排序游戏,到《Block Jam 3D》和《Hexa Sort》引入内购机制与自动化设计,并预测了2026年以传送带为核心的玩法趋势。
文章介绍了如何利用 Amazon Bedrock 及其知识库构建 AI 驱动的招聘系统,以优化职位描述、候选人沟通和面试准备流程。
文章阐述了尽管LLM能力提升,Agent框架仍具价值,并介绍了LangChain框架的演进过程及独立可观测性平台LangSmith的重要性。
文章介绍了原力灵机推出的2.4B参数具身原生模型DM0,并深度解析了其“从零训练”、“空间推理思维链”及“闭环数据采集”的技术路线。
文章通过全栈开发、复杂办公场景等实测,深度解析了MiniMax M2.5在10B参数下凭借极致推理速度和原生Agent RL架构实现的编程与生产力突破。
文章实测了最新发布的MiniMax M2.5模型,通过成绩汇总和跨年对比两个实际Agent案例,验证了其在长链路任务中的稳定性、文件处理能力及可交付成果的质量。
文章分析了开源项目 OpenClaw 的爆发如何引发 AI 创业赛道的估值逻辑重构,探讨了从“模型即一切”向“个人 Agent”生态的转变。
文章编译了a16z关于2026年的技术预测,涵盖从AI驱动的工业复兴、物理可观测性到无提示应用的兴起,阐述了AI如何从数字世界深入重塑物理世界及商业模式。
文章探讨了随着LLMs的普及,资深和初级开发者的角色演变、认知债务的概念、开发体验与AI体验的重合,以及未来IDE和团队协作模式的变化。
字节跳动发布长文翻译评测新范式DiscoX,构建了篇章级数据集,并提出基于多Agent的无参考评测框架Metric-S,有效解决了长文翻译一致性和逻辑连贯性的评估难题。
强化学习之父 Rich Sutton 发表演讲,批判当前大模型处于“理解不足,调参有余”的人类数据时代,主张迈向通过交互持续学习的“经验时代”,并提出宇宙将进入由 AI 开启的“设计时代”。
文章报道Anthropic完成300亿美元G轮融资,估值达3800亿美金,并首次披露年化营收达140亿美元,Claude Code成为核心增长引擎。
模力工场发布第32期AI应用周榜,本周重点聚焦桌面Agent的崛起,精选并解读了涵盖办公、学习、视频创作等多领域的十款热门AI应用。
GOSIM 宣布将于 2026 年 5 月在巴黎举办全球开源与 AI 技术盛会,聚焦从模型向系统转移的 Agentic AI 生态,并开启全球讲师招募与赞助合作。
文章汇总了AI行业热点,主要包括字节跳动火山引擎将发布豆包大模型2.0及相关模型升级,以及Anthropic完成300亿美元G轮融资并估值大幅提升的消息。
文章汇总了近期科技圈重要新闻,涵盖苹果新版 Siri 延期、赵明加入千里科技、谷歌 Gemini 升级、Spotify AI 编程实践及多家车企召回事件。
文章详细介绍了 iOS 26.3 的主要更新特性,重点包括向 Android 无线换机、欧盟合规功能(第三方通知与耳机支持)以及 Apple Intelligence 的最新进展。