浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨CVPR’26
浙大团队联合多家机构提出CA-TTS框架,通过置信度驱动的强化学习解决多模态模型的“盲目自信”问题,实现了先校准感知后分配算力的高效推理,在多个基准上达到SOTA。
今日科技圈迎来一场关于“尺度”与“精度”的深度对话。一边是马斯克抛出足以让现有半导体产业颤抖的 TERAFAB 项目,试图以太空思维重构算力底座;另一边是浙大团队从微观入手,精准校正多模态模型的“盲目自信”,用 CA-TTS 框架重新定义推理效率。从星际文明的各种硬核畅想,到视觉逻辑的严谨校准,技术正在向着更宏大与更精细的两个维度极速狂奔。
刚刚,马斯克启动TERAFAB项目:万亿瓦算力工厂,瞄准太空 - 马斯克再次证明了他是那个最激进的物理限制突破者。TERAFAB 项目的核心不仅仅是年产 1 太瓦(TW)的算力目标,更是其对现有半导体供应链的降维打击。马斯克直指台积电等厂商扩产太慢,其规划的“超级晶圆厂”将实现从掩膜制造到封测的全闭环,这种极致的垂直整合旨在打造比世界快一个数量级的芯片迭代速度。更关键的是,他将算力战场直接拉到了太空——利用“永远晴天”的无限太阳能和天然散热优势,试图在两三年内让太空 AI 成本低于地面。这不仅是技术的升级,更是对地球资源约束的一次彻底逃离。
如果说马斯克的计划是将算力搬向无穷的太空,那么他对芯片产能的要求则是要在现有的基础上飙升 50 倍。这种近乎疯狂的扩张逻辑背后,是对能源获取方式的根本性重构。他通过卡尔达肖夫等级将人类的视野强行拉升:与其在地球上争夺有限的电力,不如直接去太阳系索取能源。当星舰每年将 1000 万吨物资送入轨道,当微型 AI 卫星如繁星般布满近地轨道,现有的地面数据中心恐将沦为上个时代的遗迹。这不仅是 SpaceX 和特斯拉的协同,更是人类试图从“行星文明”向“恒星际文明”跃迁的一次硬核尝试。
嫌台积电们跑得太慢,马斯克要把全球芯片产能飙升50倍,还将送上太空|演讲全文 - 在马斯克的宏大叙事中,我们看到了一个非常有趣的“技术反直觉”现象:太空部署 AI 的成本竟有望在两三年内低于地面。这背后的算账逻辑令人信服——太空中没有大气衰减、没有昼夜交替,太阳能效率是地面的 5 倍以上,且无需昂贵的电池储能和土地成本。这就引出了一个极具颠覆性的观点:随着入轨成本的指数级下降,算力中心“上天”可能不再是昂贵的探索,而是必然的经济选择。马斯克甚至已经开始规划更远的未来——在月球建立电磁质量发射器,利用月球无大气和低重力的环境,以更低的成本将算力扩展至拍瓦(PW)级别。这种将科幻小说《文明》系列中的富足社会变为现实的企图,让人不禁感叹,限制我们的或许真的只是物理学,而不是想象力。
当我们仰望星空思考算力的无限扩张时,地面的 AI 研究正在解决一个更为隐秘但致命的缺陷。
浙大团队破解多模态模型「盲目自信」:先校准置信度,再分配算力丨CVPR’26 - 浙大团队的这项研究,像一把手术刀精准切开了多模态大模型“外强中干”的病灶。他们发现,当输入图像加噪到几乎不可辨认时,模型的准确率断崖下跌,但置信度却纹丝不动。这种“感知钝化”现象说明,模型根本不知道自己“不知道”。针对这一问题,团队提出的 CA-TTS 框架并非简单的后处理,而是引入了 CDRL(置信度驱动的强化学习),强制模型在训练阶段建立对视觉退化的敏感性。这不仅仅是提升准确率,更是赋予了模型一种“自知之明”。
这项工作的真正价值在于它重构了推理阶段的资源分配逻辑。传统的 Test-Time Scaling 往往通过增加采样次数来碰运气,而 CA-TTS 则将校准后的置信度转化为调度信号:对不确定的问题启用反思机制,对确定的答案快速通过。这种“先感知后推理”的范式,使得算力的投入产出比大幅提升。在 Math-Vision 基准上,该方法将准确率从 23% 提升至 42.4%,更重要的是,其扩展斜率远超传统方法。这意味着,在算力昂贵的未来,让 AI“知道自己何时需要帮助”,比单纯堆砌参数要重要得多。
从马斯克的太空算力工厂到浙大的置信度校准,今日的资讯展示了一个技术演进的完整光谱:一端是追求极致的物理规模,试图突破能源和算力的天花板;另一端是追求极致的认知精度,试图修复 AI 逻辑的基础漏洞。二者看似背道而驰,实则殊途同归——它们都在试图解决当前 AI 发展的核心瓶颈:资源的有限性与智能的不可靠性。如果说 TERAFAB 是为了让 AI 拥有无限的“体力”,那么 CA-TTS 则是为了让 AI 拥有清醒的“大脑”。在这个算力即将爆发式增长的时代,如何让这些庞大的算力不仅仅是盲目地运算,而是精准地思考,或许才是下一个十年最关键的竞争点。
浙大团队联合多家机构提出CA-TTS框架,通过置信度驱动的强化学习解决多模态模型的“盲目自信”问题,实现了先校准感知后分配算力的高效推理,在多个基准上达到SOTA。
文章报道了马斯克启动TERAFAB项目的重大新闻,计划联合SpaceX、Tesla和xAI每年生产1太瓦算力,并将80%部署至太空,旨在利用无限太阳能和散热优势突破地面算力瓶颈。
马斯克宣布SpaceX与特斯拉联合推进TERAFAB项目,旨在实现年产一太瓦算力并将芯片送入太空,计划将全球芯片产能提升50倍。
文章通过7个真实场景演示了如何利用 Notion 的 Custom Agent 功能构建全自动工作流,将静态笔记转化为主动推进工作的“虚拟员工”,解决了信息整理和重复劳动的痛点。
文章分析了Cursor新模型Composer 2套壳Kimi K2.5引发的争议与合作反转,以及Kimi近期在技术架构、GTC大会和资本市场的连续高光表现,指出Kimi正逐步接替DeepSeek成为全球AI开源社区的新焦点。
本文记录了 Andrew Karpathy 关于 AI Agent、编程范式转变及未来软件组织的深度对谈,探讨了“一人独角兽”时代的到来、Agent 第一的设计原则以及人机协作的新模式。
文章以智谱CEO与得到联合创始人的对话形式,深度剖析了AI智能体从“对话”向“执行”的范式转变,探讨了AI Agent如何重塑工作方式及人机协作的未来。
本文是对话录,探讨了以 OpenClaw 为代表的 Coding Agent 如何改变软件开发与 SaaS 行业,并指出未来机会在于「AI 管 AI」的产品化
文章介绍了 Andrej Karpathy 开源的项目 autoresearch,该项目利用 AI Agent 自主进行深度学习研究,两天内完成数百次实验并显著提升模型性能,旨在颠覆传统的人工调参工作模式。
黄仁勋在GTC后接受专访,强调英伟达是加速计算公司而非单纯GPU厂商,提出Token是AI时代的新通货,并指出未来AI将走向GPU+LPU的混合架构与全栈协同竞争。
MIT博士团队通过在Transformer权重中硬编码WebAssembly解释器,使LLM无需外部工具即可内在执行任意代码,实现了指数级加速的计算能力。
中科院与港中文团队提出HiFi-Inpaint模型,通过显式注入高频特征与构建高质量数据集,解决了基于参考图像的Inpainting中细节丢失的难题,实现了高保真的人与商品图像生成。
文章深入探讨了AI智能体作为经济主体介入生产和消费后,如何通过降低交易成本导致公司形态解体,并引发价格机制失灵和算法合谋等经济学底层逻辑的重构。
华为诺亚方舟实验室提出了一种新的Masked Data训练范式,通过识别文本中的高信息密度区域并进行针对性Masking,解决了扩散语言模型传统均匀Masking导致的学习效率问题。
文章记录了YC合伙人对AI Agent经济的对谈,指出Agent正从辅助工具转变为独立决策者,并将形成与人类经济并行的Agent经济。
文章统计分析了2024年3月14日至3月20日全球投融资市场概况,重点介绍了地瓜机器人等大额融资事件及广合科技IPO情况。
文章分析了拉美电商平台美客多(Mercado Libre)积极招募中国卖家的背景、商业模式及面临的挑战,探讨了拉美市场作为跨境电商新蓝海的机遇与风险。
文章汇总了本周中国企业出海的重大动态,涵盖速卖通与YouTube合作、京东推出Joybuy、文远知行落地斯洛伐克等商业及技术拓展新闻,并收录了Kimi回应马斯克点赞等行业热点。
文章介绍了00后博士陈润禧创立溯脑科技,打造基于非侵入式脑机接口的智能助眠眼罩Tranoo Sleep,并利用深圳供应链优势主攻北美市场的创业故事。
该文章是中国互联网出海领域的周报,分析了全球AI应用市场格局、Meta裁员内幕、以及多款出海应用和游戏的最新数据与商业模式。
文章宣布了GenAICon 2026中国生成式AI大会的日程及最新嘉宾阵容,涵盖网易有道LobsterAI、上海AI实验室等嘉宾分享,并详细介绍了大模型记忆技术研讨会的参会专家与议题。
文章主要介绍2026全球开发者先锋大会(GDPS)在上海举办的情况,强调上海的AI应用场景及对开发者的支持政策,并详细列举了会议的各类活动、路演及体验环节。
这是一篇科技行业早报,涵盖了Cursor基于Kimi训练致歉、库克谈AI、OpenAI扩招及多家企业融资等热点资讯。
这是一篇涵盖AI行业巨头人事变动(如百度、腾讯)、企业裁员与职场争议(如网易、宇树)、以及新产品发布与技术争议(如Cursor、小米、乐天)的综合性周报。
这是一篇涵盖了月之暗面、库克、马斯克及雷军等多位科技巨头动态的行业资讯汇编,主要聚焦于AI领域的最新进展、商业争议及相关硬件产品的市场表现。
微信官方推出ClawBot插件,支持三步连接OpenClaw(龙虾)AI Agent,并介绍了腾讯云Lighthouse、WorkBuddy和QClaw三种接入方案。
文章介绍了如何安装原生 OpenClaw、配置大模型 API,并通过飞书中转,最终利用微信 ClawBot 插件将小龙虾接入微信的图文教程。
MiniMax 发布 MaxClaw 更新,支持多实例部署与沙箱升级,并开源了 PPT 制作、PDF 编辑等多种 AI Skills。
腾讯云发生人事与业务架构调整,云产品三部(AI相关)负责人吴运声转由CTO王慧星分管,部分算力训练业务划转至IaaS团队。