马斯克1GW超算霸榜，国产105B MoE硬核突围

2026-01-18

✍️ 主编按语

AI 算力军备赛白热化，视频生成迈入 4D 控制时代

今天的科技圈，可谓是“冰与火”的交响曲。一边是马斯克以疯狂执行力点燃全球首个吉瓦级超算，将 AI 算力竞赛推向了“城市级”能耗的新高度；另一边，国内首款全国产化千亿参数 MoE 模型的开源，展示了在算力受限环境下的极致工程优化。与此同时，视频生成技术正从“看热闹”转向“懂控制”，4D 几何控制让 AI 真正学会了运镜。这不仅是参数的堆叠，更是对物理世界模拟深度的质变。

算力争霸：进入吉瓦时代的暴力美学

马斯克点火全球最大超算，首个1GW狂飙奇点！6万亿Grok 5在训

xAI 的 Colossus 2 正式上线，标志着全球首个吉瓦级 AI 训练集群诞生。马斯克用“暴力美学”再次刷新了工程奇迹：仅用不到一年时间，打造了一个耗电量相当于一座大型核电站的算力怪兽，且计划在 4 月升级至 1.5GW。这不仅是为训练 6 万亿参数的 Grok 5 铺路，更是对 OpenAI“星际之门”计划的直接降维打击。在 AGI 的赛道上，马斯克证明了：当算力规模突破临界点，工程速度就是最强的护城河。然而，这种“大力出奇迹”的背后，是电力供应的巨大隐患，AI 发展正面临“算力易得，电力难求”的新瓶颈。

马斯克最大算力中心建成了：全球首个GW级超算集群，再创世界纪录

如果说前一篇文章侧重于技术参数，这篇则揭示了这场狂欢背后的社会代价。Colossus 2 的轰鸣声背后，是美国电网的痛苦呻吟。随着 13 个州、6700 万居民面临夏季停电风险，AI 巨头们的算力军备赛已经引发了严重的能源挤兑。这篇报道不仅是对马斯克执行力的赞叹，更是对 AI 基础设施可持续性的深刻拷问。未来的 AI 竞争，或许将不再仅仅取决于谁拥有更多的 GPU，而在于谁能搞定更稳定的核电站或更高效的能源解决方案。

模型进化：国产 MoE 的精细化突围

国内首个全国产化千亿参数细粒度 MoE：开源！

在马斯克疯狂堆砌硬件的同时，国内团队 TeleAI 展示了另一种路径——软件与架构的极致优化。TeleChat3-105B-A4.7-Thinking 作为首个全国产化训练的千亿参数细粒度 MoE 模型，其核心价值在于“精细控制”。通过 1 个共享专家加 192 个路由专家的架构，它将每次激活的参数控制在 4.7B，实现了高性能与低推理成本的平衡。这不仅是国产算力底座的一次胜利，更证明了在硬件受限的情况下，通过 MoE 架构的创新和训练方法的优化，依然能孵化出比肩国际顶尖水平的模型。对于开发者而言，这意味着更高效的部署可能性和更强的国产化工具链支持。

前沿探索：给视频生成装上“方向盘”

VerseCrafter：给视频世界模型装上4D方向盘，精准运镜控物

视频生成领域的痛点长期以来在于“不可控”，而 VerseCrafter 的出现试图解决这一核心顽疾。由复旦大学与腾讯团队提出的这一框架，创新性地引入了 4D 几何控制，将背景点云与物体 3D 高斯轨迹结合，实现了对运镜和物体运动的精准解耦。这意味着 AI 不再只是一个随机生成画面的“画师”，而变成了一个能听懂指令的“导演”。对于游戏开发和电影预演行业来说，这不仅是技术的突破，更是生产流程革新的开始。它打通了 2D 视频生成与 3D 物理世界的壁垒，为具身智能的模拟训练提供了更高质量的数据源。

总结

从吉瓦级超算的电力焦虑，到细粒度 MoE 的精打细算，再到视频模型的 4D 控制论，今天的资讯清晰地勾勒出了 AI 发展的两条主线：一条是拼命做大物理基础设施的“外卷”，另一条则是深耕模型架构与控制精度的“内功”。无论是哪种路径，2026 年的 AI 显然已经告别了单纯刷榜的时代，正朝着更深层的物理世界模拟和更严峻的能源约束管理迈进。

🔥 热门文章 (26 篇)

AI/ML魔搭ModelScope社区9.0

国内首个全国产化千亿参数细粒度 MoE：开源！

文章介绍了中国电信TeleAI开源的国内首个全国产化千亿参数细粒度MoE大模型TeleChat3-105B-A4.7-Thinking，其在代码、推理等维度表现优异。

2026-01-18 09:45

AI/ML新智元9.0

马斯克点火全球最大超算，首个1GW狂飙奇点！6万亿Grok 5在训

马斯克宣布全球首个吉瓦级超算Colossus 2正式上线，配备55万块GPU，用于训练拥有6万亿参数的Grok 5，标志着AI算力竞赛进入新的白热化阶段。

2026-01-18 05:04

AI/ML机器之心9.0

VerseCrafter：给视频世界模型装上4D方向盘，精准运镜控物

文章介绍了复旦大学与腾讯团队联合推出的VerseCrafter，这是一种通过显式4D几何控制实现的动态逼真视频世界模型，能够精准控制运镜和多物体运动。

2026-01-18 04:01

AI/ML量子位9.0

马斯克最大算力中心建成了：全球首个GW级超算集群，再创世界纪录

马斯克的xAI正式投运Colossus 2超算中心，建成全球首个GW级超算集群，再次刷新世界算力纪录。

2026-01-18 05:15

其他笔记侠8.0

下一个10年，商业的底层逻辑变了！

文章预测2026年将成为智能体电商元年，商业逻辑将从注意力经济转向意图经济，通过DeepDemand、DeepSupply等智能体实现A2A（Agent-to-Agent）交易，重塑买卖双方关系。

2026-01-18 13:31

产品设计人人都是产品经理8.0

为什么不少AI问答助手，员工问过一次就不再用了？

文章深入剖析了企业内部AI问答助手项目失败的根源，指出将业务判断、知识治理和风险责任错误赋予AI是导致用户信任崩塌的核心原因。

2026-01-18 23:45

其他笔记侠8.0

创业是个铤而走险的道路决策，非走不可吗？

文章深度剖析了当下创业环境的残酷现实，指出创业是高风险、高门槛的决策，并非每个人都适合，提倡理性评估并肯定了不创业的价值。

2026-01-18 13:31

其他机器之心8.0

谷歌工程师抛出5个残酷问题：未来两年，软件工程还剩下什么？

文章基于谷歌工程师Addy Osmani的视角，深入探讨了AI对软件工程未来两年的五大冲击，包括初级岗位生存、技能演变、角色转变、通才与专才的选择及教育路径的重塑。

2026-01-18 04:01

AI/ML腾讯科技8.0

Anthropic出手，补齐Agent短板｜Hao好聊论文

文章深入分析了Anthropic发布的Advanced Tool Use套件如何解决MCP协议在工具调用交互模式上的缺失，通过Tool Search、Tool Use Examples和PTC三大方案修复了Agent在感知、决策、组装和执行阶段的短板。

2026-01-18 01:20

产品设计人人都是产品经理8.0

别卷功能了，用户要的是“懂”

文章犀利剖析了AI时代C端APP的转型误区，指出单纯堆砌功能的“工具思维”注定失败，唯有具备“记忆能力”和“智慧跃迁能力”，从提供数据转向提供决策，才能真正留住用户。

2026-01-18 23:45

其他刘润8.0

苦练基本功：12个商业模型，助你走出冬天

文章通过“商业进化图谱”解析了工业革命以来创造价值与传递价值的演进，并深入阐述了C2B、B2B、S2b等六种商业模式的核心逻辑与效率本质。

2026-01-18 03:18

DevOpsdbaplus社群8.0

本运维崩溃了！年底述职又被领导说没价值……

文章针对运维人员述职难、价值难以量化的问题，提供了一套包含受众分析、内容设计、语言转化等五个维度的系统化述职框架。

2026-01-18 00:02

AI/ML新智元8.0

图灵巨头反水！ICML新规血洗学术圈，学术散户只能「裸奔」

ICML 2026 推出颠覆性的作者自评级新政，利用博弈论和保序回归机制缓解投稿过载危机，但同时也引发了关于学术资源不均的争议。

2026-01-18 05:04

AI/ML51CTO技术栈8.0

xAI工程师自曝：跟马斯克打赌，能拿到一辆Cybertruck！内部同时推进二三十个方向，无限用Grok进行尝试；已不招AI研究员了，只招工程师！

本文通过xAI工程师的访谈，揭示了其内部极高的工程执行效率、扁平化管理及利用Colossus数据中心实现多方向并进的研发模式。

2026-01-18 06:17

AI/ML量子位8.0

机器人终于能用明白洗碗机了｜UC伯克利新研究

UC Berkeley团队提出“模块化遥操作+Choice Policy”创新方案，破解人形机器人全身协同与数据获取难题，成功在真实场景中完成洗碗机装载与擦白板任务。

2026-01-18 05:27

AI/ML人人都是产品经理8.0

从 Prompt 到 Agent：AI 思维跃迁的核心逻辑

文章深度剖析了从传统Prompt思维向Agent思维的转变，通过逻辑规划、记忆机制和工具调用三大核心要素，阐述了如何构建高效的AI智能体架构。

2026-01-18 02:02

AI/ML42章经8.0

All in AI 的第一个三年｜42章经

文章是绿洲资本津剑对 AI 过去三年发展的深度复盘，涵盖了投资决策、对 AGI 与具身智能的认知演变，以及对个体在 AI 时代生存策略的思考。

2026-01-18 13:31

数据库dbaplus社群8.0

40+SQL优化高频误区：不懂底层原理，难怪越改越慢

文章深入剖析了SQL优化中40+个常见误区，涵盖索引、查询、设计、事务锁及运维配置，强调需跳出“局部最优”陷阱，结合底层原理与业务场景进行全局性能优化。

2026-01-18 23:16

AI/ML量子位8.0

猎头黄仁勋的2025：高管从巨头挖，干活钟爱华人创业团队

文章详细梳理了英伟达在2025年通过挖角巨头高管和收购初创团队（特别是华人创业团队）来重塑人才结构，以构建软硬一体全栈平台并布局AI第二增长曲线的战略。

2026-01-18 05:19

AI/ML魔搭ModelScope社区8.0

魔搭社区模型速递（1.11-1.17）

魔搭社区本周新增模型与数据集速递，重点介绍了Step-Audio-R1.1、FLUX.2、LongCat-Flash-Thinking等前沿开源模型及其技术亮点。

2026-01-18 09:45

其他李继刚8.0

for 学生：生物

文章提供了一个针对初高中生物学科的AI导师提示词，旨在通过第一性原理帮助学生深度理解生物概念并掌握答题技巧。

2026-01-18 03:14

AI/MLAI前线8.0

智源发布 2026 十大 AI 技术趋势：世界模型成 AGI 共识方向

北京智源人工智能研究院发布《2026十大AI技术趋势》，预测AI将从数字世界迈向物理世界，重点阐述了世界模型、具身智能、多智能体系统等核心技术方向的演进及商业化落地。

2026-01-18 05:30

工具效率InfoQ 中文8.0

Agent 不是渐进升级，而是要“换代”了：Cursor 工程负责人放话未来三到六个月，行业将迎来大变局

Cursor工程负责人Jason Ginsberg深度剖析了编码Agent从补全到自主接管任务的演变，认为未来3-6个月行业将迎来“换代”式变革，并探讨了多Agent协同、自然交互及产品设计的未来趋势。

2026-01-18 02:16

产品设计Founder Park8.0

3 个月达成 5 亿平台播放量，Wispr Flow 分享如何做好红人营销

文章详细拆解了 Wispr Flow 如何在 3 个月内通过 80 人创作者团队实现 5 亿播放量的具体策略，包括招聘渠道、筛选标准及分层管理方法。

2026-01-18 04:41

AI/ML大模型智能8.0

别搞混了！RewardModel≠Critic：PPO中的双重评估机制解析

文章深入解析了PPO算法中Reward Model与Critic Model的区别，阐述了通过Critic进行价值估计以解决时序信用分配问题的必要性。

2026-01-18 17:27

AI/MLAI寒武纪8.0

Anthropic最新经济指数：AI让高学历任务提速12倍，但也可能让你的工作“降级”

Anthropic发布最新经济指数报告，通过引入“经济基元”分析AI对真实工作的影响，发现AI能显著加速高学历任务但可能导致部分职业技能降级。

2026-01-18 11:53

⚡ 快速浏览

创业邦6.0