奔跑的高达

马斯克1GW超算霸榜,国产105B MoE硬核突围

2026-01-18

✍️ 主编按语

AI 算力军备赛白热化,视频生成迈入 4D 控制时代

今天的科技圈,可谓是“冰与火”的交响曲。一边是马斯克以疯狂执行力点燃全球首个吉瓦级超算,将 AI 算力竞赛推向了“城市级”能耗的新高度;另一边,国内首款全国产化千亿参数 MoE 模型的开源,展示了在算力受限环境下的极致工程优化。与此同时,视频生成技术正从“看热闹”转向“懂控制”,4D 几何控制让 AI 真正学会了运镜。这不仅是参数的堆叠,更是对物理世界模拟深度的质变。

算力争霸:进入吉瓦时代的暴力美学

马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训

xAI 的 Colossus 2 正式上线,标志着全球首个吉瓦级 AI 训练集群诞生。马斯克用“暴力美学”再次刷新了工程奇迹:仅用不到一年时间,打造了一个耗电量相当于一座大型核电站的算力怪兽,且计划在 4 月升级至 1.5GW。这不仅是为训练 6 万亿参数的 Grok 5 铺路,更是对 OpenAI“星际之门”计划的直接降维打击。在 AGI 的赛道上,马斯克证明了:当算力规模突破临界点,工程速度就是最强的护城河。然而,这种“大力出奇迹”的背后,是电力供应的巨大隐患,AI 发展正面临“算力易得,电力难求”的新瓶颈。

马斯克最大算力中心建成了:全球首个GW级超算集群,再创世界纪录

如果说前一篇文章侧重于技术参数,这篇则揭示了这场狂欢背后的社会代价。Colossus 2 的轰鸣声背后,是美国电网的痛苦呻吟。随着 13 个州、6700 万居民面临夏季停电风险,AI 巨头们的算力军备赛已经引发了严重的能源挤兑。这篇报道不仅是对马斯克执行力的赞叹,更是对 AI 基础设施可持续性的深刻拷问。未来的 AI 竞争,或许将不再仅仅取决于谁拥有更多的 GPU,而在于谁能搞定更稳定的核电站或更高效的能源解决方案。

模型进化:国产 MoE 的精细化突围

国内首个全国产化千亿参数细粒度 MoE:开源!

在马斯克疯狂堆砌硬件的同时,国内团队 TeleAI 展示了另一种路径——软件与架构的极致优化。TeleChat3-105B-A4.7-Thinking 作为首个全国产化训练的千亿参数细粒度 MoE 模型,其核心价值在于“精细控制”。通过 1 个共享专家加 192 个路由专家的架构,它将每次激活的参数控制在 4.7B,实现了高性能与低推理成本的平衡。这不仅是国产算力底座的一次胜利,更证明了在硬件受限的情况下,通过 MoE 架构的创新和训练方法的优化,依然能孵化出比肩国际顶尖水平的模型。对于开发者而言,这意味着更高效的部署可能性和更强的国产化工具链支持。

前沿探索:给视频生成装上“方向盘”

VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物

视频生成领域的痛点长期以来在于“不可控”,而 VerseCrafter 的出现试图解决这一核心顽疾。由复旦大学与腾讯团队提出的这一框架,创新性地引入了 4D 几何控制,将背景点云与物体 3D 高斯轨迹结合,实现了对运镜和物体运动的精准解耦。这意味着 AI 不再只是一个随机生成画面的“画师”,而变成了一个能听懂指令的“导演”。对于游戏开发和电影预演行业来说,这不仅是技术的突破,更是生产流程革新的开始。它打通了 2D 视频生成与 3D 物理世界的壁垒,为具身智能的模拟训练提供了更高质量的数据源。

总结

从吉瓦级超算的电力焦虑,到细粒度 MoE 的精打细算,再到视频模型的 4D 控制论,今天的资讯清晰地勾勒出了 AI 发展的两条主线:一条是拼命做大物理基础设施的“外卷”,另一条则是深耕模型架构与控制精度的“内功”。无论是哪种路径,2026 年的 AI 显然已经告别了单纯刷榜的时代,正朝着更深层的物理世界模拟和更严峻的能源约束管理迈进。

🔥 热门文章 (26 篇)

其他笔记侠8.0

下一个10年,商业的底层逻辑变了!

文章预测2026年将成为智能体电商元年,商业逻辑将从注意力经济转向意图经济,通过DeepDemand、DeepSupply等智能体实现A2A(Agent-to-Agent)交易,重塑买卖双方关系。

AI/ML腾讯科技8.0

Anthropic出手,补齐Agent短板|Hao好聊论文

文章深入分析了Anthropic发布的Advanced Tool Use套件如何解决MCP协议在工具调用交互模式上的缺失,通过Tool Search、Tool Use Examples和PTC三大方案修复了Agent在感知、决策、组装和执行阶段的短板。

产品设计人人都是产品经理8.0

别卷功能了,用户要的是“懂”

文章犀利剖析了AI时代C端APP的转型误区,指出单纯堆砌功能的“工具思维”注定失败,唯有具备“记忆能力”和“智慧跃迁能力”,从提供数据转向提供决策,才能真正留住用户。

AI/ML人人都是产品经理8.0

从 Prompt 到 Agent:AI 思维跃迁的核心逻辑

文章深度剖析了从传统Prompt思维向Agent思维的转变,通过逻辑规划、记忆机制和工具调用三大核心要素,阐述了如何构建高效的AI智能体架构。

AI/ML42章经8.0

All in AI 的第一个三年|42章经

文章是绿洲资本津剑对 AI 过去三年发展的深度复盘,涵盖了投资决策、对 AGI 与具身智能的认知演变,以及对个体在 AI 时代生存策略的思考。

AI/ML魔搭ModelScope社区8.0

魔搭社区模型速递(1.11-1.17)

魔搭社区本周新增模型与数据集速递,重点介绍了Step-Audio-R1.1、FLUX.2、LongCat-Flash-Thinking等前沿开源模型及其技术亮点。

其他李继刚8.0

for 学生:生物

文章提供了一个针对初高中生物学科的AI导师提示词,旨在通过第一性原理帮助学生深度理解生物概念并掌握答题技巧。

快速浏览

人人都是产品经理6.0

这样的人真的不适合做产品经理

文章剖析了五类不适合做产品经理的人群,强调产品经理职业具有较高门槛,需要具备独立思考、快速决策及高情商等核心能力。