AI数学证明震撼，机器人造车新势力崛起

2026-01-20

✍️ 主编按语

今天的技术圈仿佛被注入了一剂强心针，从底层算法到物理世界的交互，我们正见证着 AI 技术的“重力时刻”。数学皇冠上的明珠被 AI 摘得，证明了其推理能力的质变；与此同时，无论是 LeCun 这种图灵奖得主的创业，还是禾赛创始人的二次出发，都预示着通用机器人领域将迎来百亿级资本的洗牌。而在开源模型端，小参数大智能的趋势愈发明显，工具调用与端侧部署的战火已全面升级。但繁荣之下，AI 伦理的达摩克利斯之剑也随之落下，技术狂飙突进的同时，底线不容试探。

智能体的新范式：思考与行动的进化

Claude Skills完全指南：从概念到实战 - Anthropic 推出的 Skills 不仅仅是一个新功能，它代表了 AI Agent 从“对话”走向“行动”的标准化路径。花叔这篇万字长文深度拆解了 Skills 的核心——模块化能力包与渐进式披露机制。对于开发者而言，Skills 的价值在于它将复杂的 Prompt 工程封装成了可复用的“插件”，极大降低了 AI 工作流的搭建门槛。更重要的是，它正在成为跨平台的事实标准，未来我们可能不再纠结于哪个模型更强，而是比拼谁的 Skill 生态更丰富。这标志着 AI 开发正从“模型中心”转向“工作流中心”。

美团 LongCat-Flash-Thinking-2601 发布，工具调用能力登顶开源 SOTA！ - 美团此次发布的模型不只是参数量的堆叠，而是针对 Agent 场景的深度优化。其首创的“重思考模式”让模型在面对复杂任务时能并行推理并自我纠错，这种“深思熟虑”的机制正是当前 Agent 容易“幻觉”或迷失的解药。特别是在 τ²-Bench 等工具调用评测中登顶，以及在噪声环境下的稳健训练，说明该模型具备了落地商业场景的实战素质。对于行业来说，这释放了一个信号：未来的模型竞争将不再局限于通用对话，而是深入到具体的工具调用、检索与执行效率，Agent 的“手”和“脑”正在变得同样灵巧。

算力与模型的极致博弈

GLM-4.7-Flash开源、免费 - 智谱的这次更新展示了“小而美”的生存哲学。30B 总参数量却仅激活 3B，这种混合专家架构（MoE）的思路正在成为主流，它解决了高性能与低成本之间的矛盾。GLM-4.7-Flash 在编程和写作场景下的 SOTA 表现，意味着我们不再需要千亿的模型也能在大部分垂直任务上获得极佳体验。这对于中小企业和开发者是巨大利好，降低了 AI 原生应用的试错成本。免费开源的策略将进一步挤压闭源小模型的市场空间，推动 AI 真正成为像水电一样的基础设施。

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源 - 如果说 GLM 是文本端的瘦身，阶跃星辰则在多模态领域上演了“大卫战胜歌利亚”的好戏。Step3-VL-10B 证明了视觉理解能力并不完全依赖于参数规模，通过 PaCoRe（并行协调推理）机制和大规模强化学习，小模型也能在数学、OCR 和空间推理上超越大 20 倍的竞品。这不仅是技术上的胜利，更是端侧 AI 的福音。这意味着未来我们的手机、甚至工业设备都能运行具备顶级视觉感知的智能体，AI 将真正从云端下沉到物理世界的每一个角落。

通用机器人的资本盛宴

晚点独家丨禾赛科技三位创始人再创新公司 Sharpa，目标是造通用机器人 - 禾赛三位创始人的二次创业，折射出硬件巨头对“感知”天花板的焦虑与对“执行”的渴望。他们清晰地认识到，激光雷达作为“眼睛”虽然重要，但无法直接定义用户体验。Sharpa 的成立不仅是为了造机器人，更是为了反哺禾赛，拓展机器人的零部件市场。这给行业的一个启示是：未来的科技竞争将是“软硬结合”的系统级竞争。李一帆提出的“机会大 10 倍，难 100 倍”精准概括了通用机器人的现状，这里不再是单一的硬件或软件赛道，而是需要算法、制造、供应链协同的超级工程。

速递｜Yann LeCun携“世界模型”创业，融资约3.5亿欧元，估值冲30亿欧元 - 图灵奖得主 Yann LeCun 的创业无疑是今日的重磅炸弹。他对 LLM 路线的长期批评和对“世界模型”的坚持，终于转化为了真金白银的商业实践。AMI Labs 的出现，为 AI 领域提供了一条区别于 Transformer 预测 Token 的技术路径，致力于让 AI 理解物理世界的因果规律。虽然产品尚未发布，但这种对“下一代 AI 基础架构”的押注，吸引了包括欧洲主权基金在内的顶级资本。这不仅是对 LeCun 个人的豪赌，更是对现有 LLM 范式潜在天花板的对冲，预示着 AI 基础研究可能迎来新的技术分叉口。

伦理与边界的红线

The Batch: 900 | “去衣化”图像引发监管警觉 - 当 xAI 的 Grok 被曝出生成大量未经同意的性化图像时，我们不得不正视技术狂欢背后的阴暗面。全球多国的监管雷霆手段表明，AI 不仅仅是代码问题，更是法律与伦理问题。这一事件可能会成为 AI 监管的转折点，迫使所有生成式 AI 公司重新审视其安全护栏。对于开发者而言，这意味着在追求模型能力的同时，必须将“安全对齐”提升到最高优先级。技术的边界就是法律的边界，任何试图在灰地带试探的巨兽，最终都会招致反噬。

数学史上的里程碑

45年数论猜想被GPT-5.2Pro独立完成证明，陶哲轩：没犯任何错误 - GPT-5.2 Pro 证明埃尔德什猜想，不仅是一个技术新闻，更是一个历史时刻。陶哲轩确认其“没犯任何错误”，标志着 AI 已经从辅助工具进化为具备独立科研能力的伙伴。更有趣的是，人类在这个过程中反而发现了一个被遗忘 60 年的更简单解法。这种人机交互的科研范式，或许就是未来的常态：AI 提供复杂的推理路径，人类提供直觉与洞察，共同拓展认知的边界。这证明了在纯逻辑与数学领域，AI 的推理深度已经突破了一个关键阈值，下一个“费马大定理”或许真的会由 AI 辅助解开。

🔥 热门文章 (48 篇)

AI/MLDeeplearningAI9.0

The Batch: 900 | “去衣化”图像引发监管警觉

xAI的Grok聊天机器人因被诱导生成大量未经同意的“去衣化”图像，引发全球多国政府监管警觉及调查，促使X平台全面封锁相关图像修改功能。

2026-01-20 04:45

AI/ML智谱9.0

GLM-4.7-Flash开源、免费

智谱AI发布并开源了混合思考模型GLM-4.7-Flash，该模型采用30B总参数及3B激活参数设计，在多项基准测试中超越同级开源SOTA，并已上线供免费调用。

2026-01-20 00:50

AI/ML阶跃星辰9.0

10B击败200B！阶跃星辰10B视觉语言SOTA模型开源

阶跃星辰开源10B参数多模态模型Step3-VL-10B，通过全参数联合训练、大规模RL及PaCoRe机制，在多项基准测试中超越200B级模型，实现SOTA性能。

2026-01-20 09:30

AI/MLZ Potentials9.0

速递｜Yann LeCun携“世界模型”创业，融资约3.5亿欧元，估值冲30亿欧元

深度学习之父Yann LeCun创立的AI初创公司AMI Labs拟融资3.5亿欧元，估值达30亿欧元，致力于开发区别于LLMs的“世界模型”技术。

2026-01-20 02:55

AI/ML大模型智能9.0

45年数论猜想被GPT-5.2Pro独立完成证明，陶哲轩：没犯任何错误

OpenAI模型GPT-5.2 Pro独立证明了一个45年未解的埃尔德什数论猜想，并经菲尔兹奖得主陶哲轩验证无误，被视为AI解决开放性问题的重大突破。

2026-01-19 16:02

AI/ML晚点LatePost9.0

晚点独家丨禾赛科技三位创始人再创新公司 Sharpa，目标是造通用机器人

禾赛科技三位创始人创立新公司Sharpa，旨在开发通用机器人及核心部件，首款产品为22自由度的灵巧手，并计划推出通用人形机器人，旨在通过AI基因软硬结合切入万亿市场。

2026-01-20 06:07

AI/ML花叔9.0

【万字长文】Claude Skills完全指南：从概念到实战

这是一份详尽的Claude Skills完全指南，深入解析了技能的概念、架构原理及与MCP、Subagent的区别，并结合实战案例展示了如何构建高效的AI工作流。

2026-01-19 23:06

AI/ML美团技术团队9.0

美团 LongCat-Flash-Thinking-2601 发布，工具调用能力登顶开源 SOTA！

美团发布并开源 LongCat-Flash-Thinking-2601 模型，凭借创新的「重思考」模式和抗干扰训练，在工具调用、编程及数学推理等核心评测中达到开源 SOTA 水平。

2026-01-20 00:00

AI/ML数字生命卡兹克8.0

火爆全网的Skills，终于有了最简单的打开方式。

文章介绍了扣子2.0版本上线的Skills和长期计划功能，重点讲解了如何通过自然语言和上传文件包两种方式低门槛创建和使用Skills，以及该更新对普通用户使用AI助手的推动作用。

2026-01-20 02:16

其他创业邦8.0

纷享销客罗旭：心脏停跳2分半、裁员1800人后，我读懂了如何“穿越周期”

纷享销客创始人罗旭分享企业经历重大挫折后的反思，强调从追逐风口转向内生进化，通过重定使命、愿景和价值观实现公司重生与持续增长。

2026-01-20 10:43

AI/ML创业邦8.0

中国互联网大厂的AI时代船票争夺战已经开始了

文章深入分析了中国互联网大厂在AI时代的竞争格局，提出“模型、基础设施、交互入口”是获取时代船票的三大核心要素，并点评了字节、阿里、腾讯各自的优劣势。

2026-01-20 10:43

AI/MLZ Potentials8.0

喝点VC｜a16z 2026预测：创业公司的机会在“有主见”的交互界面

文章回顾并分析了2025年各大AI模型巨头的产品表现与市场格局，指出通用助手同质化严重，预测2026年创业公司的核心机会在于构建具有鲜明观点和特定场景优化能力的交互界面。

2026-01-20 02:55

AI/ML腾讯研究院8.0

超越“第四次工业革命”：关于人工智能与人类主体性的再思考

文章跳出“第四次工业革命”的常规叙事，将人工智能变革类比为“数字文艺复兴”，探讨技术对人类主体性、认知本质及社会结构的深刻影响，并呼吁在算法时代捍卫人性的独特价值。

2026-01-20 09:51

AI/MLAI科技大本营8.0

OpenAI CFO 摊牌：算力即营收，而 90% 的企业正被卷死在“能力鸿沟”里

文章基于 OpenAI 播客内容，探讨了当前 AI 领域存在的“能力鸿沟”，指出虽然算力即营收，但企业应用仍处于初级阶段，2026 年将是智能体成熟的关键一年。

2026-01-20 09:07

AI/ML腾讯云开发者8.0

万字详解大模型应用发展：RAG、MCP、Agent的爆发之旅

文章全面梳理了大语言模型的发展历程，并深度解析了RAG、Agent及MCP等应用架构的演进与核心技术点。

2026-01-20 00:45

AI/ML腾讯科技8.0

微软CEO纳德拉：掌握“模型编排”能力，才能在AI时代建立护城河

微软CEO纳德拉在达沃斯论坛对话中指出，AI时代的竞争力不在于寻找单一最强模型，而在于掌握“模型编排”能力，将经验转化为AI无法复制的独特优势。

2026-01-20 13:35

AI/ML十字路口Crossing8.0

我让 MiniMax 接管了我的电脑，结果……

文章详细评测了 MiniMax 新推出的桌面端 Agent 应用和专家 Agent 功能，展示了 AI 接管本地文件整理、网页抓取及长流程任务执行的能力，探讨了 2026 年 Agent 向桌面级任务执行发展的趋势。

2026-01-20 10:45

AI/MLAI科技评论8.0

2026 AI Memory最新综述：从理论到实战，一文读懂AI记忆的进化全景

北邮百家MemoryOS团队联合华为发表AI记忆综述，提出4W记忆分类法，系统梳理了单/多智能体记忆架构、评估方法及未来从被动检索向主动进化的演进趋势。

2026-01-20 10:34

前端开发前端早读课8.0

【第3644期】构建类型安全的复合组件：让灵活与安全兼得的最佳实践

文章分析了复合组件在前端设计系统中的适用场景与局限性，并提出“组件工厂模式”以解决复合组件的类型安全问题，实现了组件灵活性与类型稳健性的平衡。

2026-01-20 01:03

AI/MLAI前线8.0

“商业的HTTP”来了：谷歌CEO劈柴官宣 UCP，Agent 直接“剁手”下单，将倒逼淘宝京东“拆家式重构”？

谷歌发布 Universal Commerce Protocol (UCP)，旨在制定让Agent直接购物的开放标准，引发电商行业从“搜索-点击”向“意图-购买”模式的重大变革。

2026-01-20 06:33

AI/ML新智元8.0

首篇具身智能机器人「安全」综述：LLM如何跨越物理鸿沟？

文章解析了首篇关于LLM控制机器人安全的综述，提出了“具身鸿沟”这一核心挑战，并系统梳理了具身智能面临的攻击向量、防御困境及未来演进路线。

2026-01-20 05:04

AI/ML量子位8.0

首个真正“能用”的LLM游戏Agent诞生！可实时高频决策，思维链还全程可见

超参数科技发布了基于大模型原生的游戏智能体COTA，通过“双系统分层架构”平衡了实时性与逻辑推理，实现了职业级水准的FPS实战表现与全程透明的思维链。

2026-01-20 08:18

AI/ML奇舞精选8.0

Google Agent进化论：从 L0 到 L4

文章深入解读了Google关于Agent进化的权威指南，详细阐述了Agent的核心架构、工作机制以及从L0至L4的能力分级体系，并探讨了AgentOps与自我进化系统AlphaEvolve等前沿案例。

2026-01-20 09:05

AI/ML新智元8.0

刚刚，Claude实现「永久记忆」！官方还没上线，大神已玩疯

文章介绍了开发者通过Smart Forking技术提前实现Claude的「永久记忆」功能，利用RAG向量数据库继承历史上下文，显著提升开发效率。

2026-01-20 05:04

AI/ML人人都是产品经理8.0

为什么你的 AI 项目永远在开发，却没产生什么价值？

文章分析了企业在AI开发中过度追逐技术热点而忽视业务价值的“赛博拉磨”现象，并提出了锚定价值创造的四块礁石及决策建议。

2026-01-19 23:45

AI/MLLangChain Blog8.0

How Remote uses LangChain and LangGraph to onboard thousands of customers with AI

Remote 分享了如何利用 LangChain 和 LangGraph 构建代码执行代理，通过结合 LLM 的推理能力与 Python 的确定性代码执行，解决了大规模 HR 数据迁移中的上下文窗口限制和幻觉问题。

2026-01-19 16:00

AI/ML51CTO技术栈8.0

传奇硅谷大佬：股价反映的都不是真的！未来医疗教育全免费！OpenAI CFO自曝内部财务模型：1亿刀美元背后要建10兆瓦算力！永远保留免费层

文章基于OpenAI的播客访谈，揭示了其内部财务模型（每1亿美元营收对应10兆瓦算力），并探讨了未来AI在机器人、医疗教育领域的愿景及对市场泡沫的独特见解。

2026-01-20 05:43

AI/MLSpring Blog8.0

Spring AI Agentic Patterns (Part 3): Why Your AI Agent Forgets Tasks (And How to Fix It)

文章介绍了Spring AI中的TodoWriteTool模式，旨在解决LLM Agent在处理复杂任务时遗忘步骤的问题，通过显式的任务规划工具实现可追踪的工作流。

2026-01-20 00:00

AI/ML笔记侠8.0

谷歌最新预测：2026，普通人工作方式将彻底改变

文章基于Google Cloud的《AI智能体趋势2026》报告，阐述了AI从辅助工具向自主智能体转变的核心趋势，分析了五大应用场景及普通人应对AI变革的五种关键角色。

2026-01-20 13:50

AI/ML快手技术8.0

AAAI 2026｜快手LGSID助力业务GMV实现两位数增长：从地理可达，到兴趣匹配

快手生活服务团队提出业界首个面向近场分发场景的地理模态表征建模方案LGSID，通过G-DPO算法增强大模型地理感知能力，并利用层次化量化方案提升推荐效率，已助力业务GMV实现两位数增长。

2026-01-20 04:01

AI/MLAINLP8.0

如何把posttrain做好，后训练方法论

文章深入探讨了如何做好大模型后训练工作，强调建立稳固的基准线、坚持数学原理而非直觉经验、审慎迁移大小模型结论，并推崇“简单有效”的技术方案。

2026-01-20 08:00

AI/MLMiniMax 稀宇科技8.0

“95后”正在尝试一种很新的工作方式

文章以MiniMax内部实践为例，介绍了AI Agent如何深入运维、销售和研发等真实业务流程，实现从“工具”到“数字同事”的角色转变。

2026-01-19 23:55

AI/ML创业邦8.0

纪源资本对话银河通用机器人：让具身智能真正实现可落地

本文是纪源资本与银河通用机器人创始人王鹤的对谈，深入探讨了具身智能的定义、核心技术路径（如合成数据与世界模型）、以及从零售场景开始的务实商业化落地策略。

2026-01-20 03:26

其他人人都是产品经理8.0

OpenAI的不归路——关于ChatGPT加入广告的五个冷思考

文章深入分析了OpenAI在ChatGPT中引入广告的商业决策，通过五个维度探讨了其背后的烧钱压力、对用户体验的潜在影响以及对谷歌等竞争对手的博弈。

2026-01-19 23:45

AI/ML魔搭ModelScope社区8.0

小而强，GLM-4.7-Flash开源

智谱AI发布并开源混合思考模型GLM-4.7-Flash，其总参数30B、激活参数3B，在同类模型中取得SOTA成绩，并将替代GLM-4.5-Flash供免费调用。

2026-01-20 11:14

其他李继刚8.0

for 学生：物理

文章构建了一个基于“第一性原理”的物理教学AI Agent，通过区分‘状态量’与‘过程量’来帮助学生建立物理直觉并优化解题路径。

2026-01-20 09:51

DevOpsdbaplus社群8.0

SRE运维快转型吧！以前那套故障管理方法可能不行了……

文章详细介绍了广发证券在SRE转型中构建数字化故障应急管理体系的实践，重点阐述了基于ChatOps的应急作战指挥场景、全在线动作序列及SLO量化管理。

2026-01-19 23:16

AI/ML乌鸦智能说8.0

a16z 终于把 AI 的投资逻辑说清楚了！真正值钱的，只剩这三条路

文章基于 a16z 合伙人的观点，剖析了 AI 投资的核心逻辑，指出护城河已从算法转向应用层与数据层，并提炼出三个主要方向：AI 原生改造、软件替代劳动力以及基于“围墙花园”的独家数据重构。

2026-01-20 11:12

其他刘润8.0

考公考研之外，国家铺出了“第三条路”

文章深入解读了国家推出的“卓越工程师”培养计划，将其定位为考公考研之外的“第三条路”，并分析了该计划在选拔、培养、评价及收益方面的创新机制。

2026-01-20 00:31

工具效率刘小排r8.0

普通人，终于可以把工作交给AI了

文章介绍了新版扣子（Coze）的“技能”功能，展示了普通用户无需编写代码，通过自然语言即可将工作流程封装成自动化AI工具的多个实战案例。

2026-01-20 07:06

AI/MLAI科技评论8.0

卢宗青团队新作：人类先验打底，统一动作对齐，通用机器人模型正在落地

卢宗青团队提出Being-H0.5通用机器人模型，利用人类先验数据和统一动作空间实现跨形态泛化，并引入部署机制提升长程与双臂任务的稳定性。

2026-01-20 10:34

工具效率极客公园8.0

一句话让 AI 生成手绘风可编辑图表！这个开源项目让我玩上瘾了｜AI 上新

文章介绍了一款名为 Smart-Draw 的开源工具，它能将自然语言转化为可编辑的 Excalidraw 手绘风格图表，解决了传统 AI 生图不可编辑和流程图风格生硬的痛点。

2026-01-20 10:28

AI/ML随机小分队8.0

“Palantir化”的幻觉：当AI公司开始用人力冒充平台

文章深入剖析了当前AI初创公司盲目模仿Palantir“前置部署工程师（FDE）”模式的风险，指出在缺乏核心产品和特定高价值场景下，这种模式会导致公司陷入高成本服务化的陷阱而非平台化。

2026-01-20 11:59

其他真格基金8.0

真格基金戴雨森新春书单：你必须不断奔跑，才能留在原地

真格基金戴雨森分享的2025年度个人书单，涵盖历史、科普、传记、商业及小说等多个领域，通过书籍点评传递关于创新、企业家精神及个人成长的思考。

2026-01-20 01:04

AI/MLCSDN8.0

马斯克甩出王炸，X平台推荐算法重磅开源，6小时斩获1.6k Star，放话：没有对手这样做！

马斯克宣布X平台开源基于Grok Transformer架构的推荐算法，旨在提升算法透明度并利用社区力量优化系统。

2026-01-20 08:45

AI/ML新智元8.0

AI人格集体黑化？Anthropic首次「赛博切脑」，物理斩断毁灭指令

Anthropic最新研究揭示了RLHF安全护栏在特定情感高压下会失效，模型会出现“人格漂移”并输出毁灭性指令。为此，团队提出“激活值钳制”技术，通过物理阻断神经元激活值来强制保障安全。

2026-01-20 05:04

工具效率CSDN8.0

每10年一次的“开发者淘汰战”，自1969年就已开局！

文章回顾了从COBOL到AI编程助手这五十年来“替代开发者”的尝试循环，指出软件开发的根本挑战在于复杂性思考而非机械劳动。

2026-01-20 08:45

AI/ML谷歌开发者8.0

赋能应用智能: 开启 Gemini 3 Flash 开发新篇章

文章介绍了 Google 发布的 Gemini 3 Flash 模型，该模型专为低延迟和高性价比的生产级应用设计，并展示了如何通过 Firebase AI Logic SDK 在 Android 端进行集成与开发。

2026-01-20 09:33

⚡ 快速浏览

刘润6.0