国内首个全国产化千亿参数细粒度 MoE:开源!
文章介绍了中国电信TeleAI开源的国内首个全国产化千亿参数细粒度MoE大模型TeleChat3-105B-A4.7-Thinking,其在代码、推理等维度表现优异。
今天的科技圈,可谓是“冰与火”的交响曲。一边是马斯克以疯狂执行力点燃全球首个吉瓦级超算,将 AI 算力竞赛推向了“城市级”能耗的新高度;另一边,国内首款全国产化千亿参数 MoE 模型的开源,展示了在算力受限环境下的极致工程优化。与此同时,视频生成技术正从“看热闹”转向“懂控制”,4D 几何控制让 AI 真正学会了运镜。这不仅是参数的堆叠,更是对物理世界模拟深度的质变。
马斯克点火全球最大超算,首个1GW狂飙奇点!6万亿Grok 5在训
xAI 的 Colossus 2 正式上线,标志着全球首个吉瓦级 AI 训练集群诞生。马斯克用“暴力美学”再次刷新了工程奇迹:仅用不到一年时间,打造了一个耗电量相当于一座大型核电站的算力怪兽,且计划在 4 月升级至 1.5GW。这不仅是为训练 6 万亿参数的 Grok 5 铺路,更是对 OpenAI“星际之门”计划的直接降维打击。在 AGI 的赛道上,马斯克证明了:当算力规模突破临界点,工程速度就是最强的护城河。然而,这种“大力出奇迹”的背后,是电力供应的巨大隐患,AI 发展正面临“算力易得,电力难求”的新瓶颈。
马斯克最大算力中心建成了:全球首个GW级超算集群,再创世界纪录
如果说前一篇文章侧重于技术参数,这篇则揭示了这场狂欢背后的社会代价。Colossus 2 的轰鸣声背后,是美国电网的痛苦呻吟。随着 13 个州、6700 万居民面临夏季停电风险,AI 巨头们的算力军备赛已经引发了严重的能源挤兑。这篇报道不仅是对马斯克执行力的赞叹,更是对 AI 基础设施可持续性的深刻拷问。未来的 AI 竞争,或许将不再仅仅取决于谁拥有更多的 GPU,而在于谁能搞定更稳定的核电站或更高效的能源解决方案。
在马斯克疯狂堆砌硬件的同时,国内团队 TeleAI 展示了另一种路径——软件与架构的极致优化。TeleChat3-105B-A4.7-Thinking 作为首个全国产化训练的千亿参数细粒度 MoE 模型,其核心价值在于“精细控制”。通过 1 个共享专家加 192 个路由专家的架构,它将每次激活的参数控制在 4.7B,实现了高性能与低推理成本的平衡。这不仅是国产算力底座的一次胜利,更证明了在硬件受限的情况下,通过 MoE 架构的创新和训练方法的优化,依然能孵化出比肩国际顶尖水平的模型。对于开发者而言,这意味着更高效的部署可能性和更强的国产化工具链支持。
VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物
视频生成领域的痛点长期以来在于“不可控”,而 VerseCrafter 的出现试图解决这一核心顽疾。由复旦大学与腾讯团队提出的这一框架,创新性地引入了 4D 几何控制,将背景点云与物体 3D 高斯轨迹结合,实现了对运镜和物体运动的精准解耦。这意味着 AI 不再只是一个随机生成画面的“画师”,而变成了一个能听懂指令的“导演”。对于游戏开发和电影预演行业来说,这不仅是技术的突破,更是生产流程革新的开始。它打通了 2D 视频生成与 3D 物理世界的壁垒,为具身智能的模拟训练提供了更高质量的数据源。
从吉瓦级超算的电力焦虑,到细粒度 MoE 的精打细算,再到视频模型的 4D 控制论,今天的资讯清晰地勾勒出了 AI 发展的两条主线:一条是拼命做大物理基础设施的“外卷”,另一条则是深耕模型架构与控制精度的“内功”。无论是哪种路径,2026 年的 AI 显然已经告别了单纯刷榜的时代,正朝着更深层的物理世界模拟和更严峻的能源约束管理迈进。
文章介绍了中国电信TeleAI开源的国内首个全国产化千亿参数细粒度MoE大模型TeleChat3-105B-A4.7-Thinking,其在代码、推理等维度表现优异。
马斯克宣布全球首个吉瓦级超算Colossus 2正式上线,配备55万块GPU,用于训练拥有6万亿参数的Grok 5,标志着AI算力竞赛进入新的白热化阶段。
文章介绍了复旦大学与腾讯团队联合推出的VerseCrafter,这是一种通过显式4D几何控制实现的动态逼真视频世界模型,能够精准控制运镜和多物体运动。
文章预测2026年将成为智能体电商元年,商业逻辑将从注意力经济转向意图经济,通过DeepDemand、DeepSupply等智能体实现A2A(Agent-to-Agent)交易,重塑买卖双方关系。
文章深入剖析了企业内部AI问答助手项目失败的根源,指出将业务判断、知识治理和风险责任错误赋予AI是导致用户信任崩塌的核心原因。
文章基于谷歌工程师Addy Osmani的视角,深入探讨了AI对软件工程未来两年的五大冲击,包括初级岗位生存、技能演变、角色转变、通才与专才的选择及教育路径的重塑。
文章深入分析了Anthropic发布的Advanced Tool Use套件如何解决MCP协议在工具调用交互模式上的缺失,通过Tool Search、Tool Use Examples和PTC三大方案修复了Agent在感知、决策、组装和执行阶段的短板。
文章犀利剖析了AI时代C端APP的转型误区,指出单纯堆砌功能的“工具思维”注定失败,唯有具备“记忆能力”和“智慧跃迁能力”,从提供数据转向提供决策,才能真正留住用户。
ICML 2026 推出颠覆性的作者自评级新政,利用博弈论和保序回归机制缓解投稿过载危机,但同时也引发了关于学术资源不均的争议。
本文通过xAI工程师的访谈,揭示了其内部极高的工程执行效率、扁平化管理及利用Colossus数据中心实现多方向并进的研发模式。
UC Berkeley团队提出“模块化遥操作+Choice Policy”创新方案,破解人形机器人全身协同与数据获取难题,成功在真实场景中完成洗碗机装载与擦白板任务。
文章深度剖析了从传统Prompt思维向Agent思维的转变,通过逻辑规划、记忆机制和工具调用三大核心要素,阐述了如何构建高效的AI智能体架构。
文章是绿洲资本津剑对 AI 过去三年发展的深度复盘,涵盖了投资决策、对 AGI 与具身智能的认知演变,以及对个体在 AI 时代生存策略的思考。
文章深入剖析了SQL优化中40+个常见误区,涵盖索引、查询、设计、事务锁及运维配置,强调需跳出“局部最优”陷阱,结合底层原理与业务场景进行全局性能优化。
文章详细梳理了英伟达在2025年通过挖角巨头高管和收购初创团队(特别是华人创业团队)来重塑人才结构,以构建软硬一体全栈平台并布局AI第二增长曲线的战略。
魔搭社区本周新增模型与数据集速递,重点介绍了Step-Audio-R1.1、FLUX.2、LongCat-Flash-Thinking等前沿开源模型及其技术亮点。
北京智源人工智能研究院发布《2026十大AI技术趋势》,预测AI将从数字世界迈向物理世界,重点阐述了世界模型、具身智能、多智能体系统等核心技术方向的演进及商业化落地。
Cursor工程负责人Jason Ginsberg深度剖析了编码Agent从补全到自主接管任务的演变,认为未来3-6个月行业将迎来“换代”式变革,并探讨了多Agent协同、自然交互及产品设计的未来趋势。
文章详细拆解了 Wispr Flow 如何在 3 个月内通过 80 人创作者团队实现 5 亿播放量的具体策略,包括招聘渠道、筛选标准及分层管理方法。
文章深入解析了PPO算法中Reward Model与Critic Model的区别,阐述了通过Critic进行价值估计以解决时序信用分配问题的必要性。
Anthropic发布最新经济指数报告,通过引入“经济基元”分析AI对真实工作的影响,发现AI能显著加速高学历任务但可能导致部分职业技能降级。
本文汇总了近日AI行业的重要动态,包括马斯克的Colossus 2超级计算机投运及对OpenAI的诉讼、京东健康发布AI产品“知医”,以及OpenAI将在ChatGPT中测试广告以推动营收增长。
这是一篇涵盖AI、互联网及硬件领域的综合性科技周报,报道了AI涉黄案件判决、追觅科技CEO回应争议、OpenAI与马斯克的最新纠纷、以及文心一言5.0等大模型技术进展。
文章汇总了近期科技圈的重要新闻,涵盖马斯克起诉OpenAI、ChatGPT推出低价订阅、百度萝卜快跑出海、以及AI医疗和机器人技术进展等多个领域。
这是一篇涵盖1月9日至16日AI行业动态的周报,汇总了DeepSeek V4发布传闻、千问接入支付宝、Skild AI巨额融资等国内外热点事件及市场投融资数据。
这是一篇投融资周报,汇总了本周国内外一级市场的融资动态、IPO及并购事件,重点涵盖了Skild AI完成14亿美元融资及兆易创新上市等热门事件。
本文是白鲸出品的互联网出海行业周报,涵盖AI互动漫画、Craigslist反算法趋势、语言学习App及桌面CNC硬件等多个出海领域的最新动态与数据分析。
文章是一期开源日报,推荐了Twemoji、Nuclear、MapLibre GL、Robin和SpotiFLAC等五个不同领域的实用开源工具。