技术日报

2026-02-10

✍️ 主编按语

{
  "title": "AI重构软件与博弈论，端侧芯片造富新贵",
  "content": "## 今日技术看点：从端侧推理到 Agent 现实落地\n\n今日的技术前沿呈现出鲜明的两极化趋势：一端是向物理世界和数学深层逻辑的极致探索，从具身智能的“时空记忆”到博弈论“纳什均衡”的自动求解；另一端则是工程落地的硬核实践，无论是字节跳动的数据切面工程，还是 OpenAI 和阿里达摩院在 Agent 编程与规划上的贴身对打，都在昭示 AI 正从“聊天玩具”进化为“生产力工具”。同时，资本市场和硬件层也在剧烈响应，Anthropic 天价融资与爱芯元智的上市，验证了云端算力与端侧芯片的双重黄金赛道。\n\n### AI 进化：从对话到现实世界的 Agent\n\n[想让机器人春晚包饺子？阿里达摩院：别急，先把「大脑」优化一下](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651016237&idx=1&sn=1d0611988c1bde2d83b482fdfb4d2d51)\n\n阿里达摩院开源的 RynnBrain 为具身智能提供了一个关键的“大脑”基座。不同于以往仅懂视觉的 VLM，RynnBrain 将“时空记忆”和“物理空间推理”直接注入模型。这意味着机器人不再只是“看”世界，而是能像人类一样记忆历史轨迹，并在物理约束下进行长程规划。其 30B 的 MoE 版本仅需激活 3B 参数即可超越 72B 的竞品，这种高效能是未来机器人走出实验室、进入复杂现实环境的入场券。\n\n[达摩院开源RynnBrain：首个支持移动操作的具身大脑基础模型](https://mp.weixin.qq.com/s?__biz=Mzk3NTc1NTU0Mw==&mid=2247505090&idx=1&sn=b68695b1c7e0b0039cf8a4888d35b391)\n\n[贴脸对打Opus 4.5！最新Codex自己写自己，网友实测“放手”8小时不崩](https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651275013&idx=3&sn=ebc019fa982b0d149e5d20acc8eefa)\n\nOpenAI 发布的 GPT-5.3-Codex 不仅在终端执行能力上大幅提升，更验证了“AI 开发 AI”的闭环。其最大亮点在于长链路任务的稳定性，能够连续运行数小时不偏航，自动完成从编码、部署到调试的全流程。这种“放手不崩”的特性，标志着 Agent 正式从辅助工具演变为独立工程师，软件开发的组织模式面临重构。\n\n[AI编程真面目：完整项目通过率仅27%|上交大新基准](https://mp.weixin.qq.com/s?__biz=MzU3NjE4NjQ4MA==&mid=2247555703&idx=1&sn=e326a67bc79d8b8a02e69b955148e812)\n\n上交大发布的 ProjDevBench 基准给狂热的 AI 编程泼了一盆冷水。结果显示，主流 Agent 在“从零构建”完整软件项目时的通过率仅为 27.38%，远低于补全现有代码的表现。这揭示了当前 AI 的软肋：擅长局部修补，却缺乏宏观架构设计和复杂边界处理能力。这不仅是技术挑战，更指明了下一阶段“从补丁到工程”的进化方向。\n\n[美团发布基于 N-gram 全新模型：嵌入扩展新范式，实现轻量化 MoE 高效进化](https://tech.meituan.com/2026/02/10/longcat-flash-lite.html)\n\n美团 LongCat 团队提出的“嵌入扩展”范式，打破了单纯堆砌专家的传统 MoE 思路。通过将大量参数投入 N-gram 嵌入层以增强局部语义捕获，LongCat-Flash-Lite 在智能体和代码任务上实现了更优的帕累托前沿。这表明，提升模型效能未必非要以模型尺寸换算力，通过架构创新优化语义理解密度，可能是更具性价比的路径。\n\n[华为发布业界首个扩散语言模型Agent，部分场景提速8倍！](https://www.qbitai.com/2026/02/378286.html)\n\n华为的研究揭示了一个有趣的现象：将 Agent 的底座从自回归模型（AR）换成扩散大模型（DLLM），能让执行效率平均提升 30%，部分场景甚至高达 8 倍。这并非单纯的算力优势，而是扩散模型“先全局后细节”的生成特质，天然契合 Agent 的规划逻辑，减少了无效的回溯和试错。这为未来的 Agent 设计提供了一个全新的优化维度。\n\n### 深度推理与科学探索：AI 攻克数学与生命科学\n\n[首次！AI智能体破解「纳什均衡」，大模型学会博弈论｜Cell子刊](https://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652673881&idx=3&sn=b62f0d4af2b7ab70581dbe0ec8fc8d88)\n\n香港中文大学（深圳）等团队开发的 PrimeNash，首次实现了纳什均衡的自动推导与证明。这一框架不仅能像数学家一样进行符号推导，还在碳市场动态博弈等现实高维问题中找到了可解释的解析解。这标志着 AI 从“数值计算”迈向了“理论发现”，未来在经济学和政策制定领域，我们或将看到更多由 AI 驱动的严谨量化模型。\n\n[人类画了100年的脑图，AI仅用几小时！还绘制出新脑区](https://www.qbitai.com/2026/02/378423.html)\n\n加州大学旧金山分校的 CellTransformer 算法，仅用几小时就完成了对 1000 多万个小鼠脑细胞的图谱绘制，并发现了人类专家遗漏的新脑区。通过自监督学习细胞间的空间与分子关系，AI 正在将神经科学从“主观手绘”推向“客观计算”时代。这一技术若能迁移至人脑，将彻底改变我们对大脑结构和功能的理解。\n\n[利用 MedGemma 1.5 与 MedASR 构建下一代医疗应用](https://mp.weixin.qq.com/s?__biz=MzAwODY4OTk2Mg==&mid=2652160822&idx=1&sn=9a2c32b4c7c153f46ec3736783bf48ef)\n\n谷歌发布的 MedGemma 1.5 进一步强化了对 CT、MRI 等高维医学影像的理解，配合医疗语音模型 MedASR，构建了多模态的医疗 AI 基座。这不仅提升了诊断准确率，更重要的是为开发者提供了可离线部署、易于调整的工具。在医疗隐私要求极高的背景下，这种开放且强大的模型将加速 AI 在临床工作流中的深度渗透。\n\n### 工程与架构：基础设施的透明化与高效化\n\n[BSave - 数据切面工程在字节的大规模实践](https://mp.weixin.qq.com/s?__biz=MzI1MzYzMjE0MQ==&mid=2247518512&idx=1&sn=3c192e3b47c6080d15a0d9adeed89040)\n\n字节跳动的 BSave 项目展示了“数据切面工程”的威力。通过在业务与存储之间插入透明的 Sidecar 层，实现了零代码改造的加解密、压缩和治理。这种架构将通用数据操作从业务逻辑中彻底剥离，不仅解决了数据合规的痛点，更让业务团队能专注于核心逻辑，是企业级数据治理的一次范式升级。\n\n[首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型](https://mp.weixin.qq.com/s?__biz=MzkwODU2OTQyNQ==&mid=2247497344&idx=1&sn=4a7b88f26c7603cf76e40adfc812d897)\n\n腾讯混元开源的 HY-1.8B-2Bit 模型，将极致压缩带到了 2-bit 时代，内存占用仅 600MB。通过量化感知训练（QAT），它在保持性能的同时实现了 2-3 倍的速度提升。这对于手机、耳机等端侧设备而言意义重大，意味着真正智能的离线助手可以在不消耗云端资源、保护隐私的前提下流畅运行。\n\n### 行业动态：资本与硬件的共振\n\n[速递｜Anthropic的最新200亿美元融资

🔥 热门文章 (45 篇)

后端架构字节跳动技术团队9.0

BSave - 数据切面工程在字节的大规模实践

文章介绍了字节跳动数据切面工程理念及 BSave 系统的大规模实践，通过引入透明切面层实现了在线、离线及数据同步场景下的数据安全、成本优化与治理。

2026-02-10 09:02

AI/ML创业邦9.0

浙江宁波女博士造AI芯片，5年干到全球第一，刚刚IPO

文章详细报道了爱芯元智在创始人仇肖莘博士带领下，专注边缘侧AI芯片研发，5年内实现出货量全球第一并成功在港交所IPO的历程。

2026-02-10 03:42

AI/ML机器之心9.0

想让机器人春晚包饺子？阿里达摩院：别急，先把「大脑」优化一下

阿里达摩院发布具身智能模型RynnBrain，通过引入时空记忆和物理空间推理能力，解决了具身大模型在复杂物理环境中的感知与规划痛点，在16项具身Benchmark上实现SOTA。

2026-02-10 03:44

AI/ML新智元9.0

首次！AI智能体破解「纳什均衡」，大模型学会博弈论｜Cell子刊

香港中文大学（深圳）与多所高校联合发布PrimeNash框架，这是首个能自动推导纳什均衡闭式解析解并生成可验证证明的大模型智能体系统。

2026-02-10 05:00

AI/ML量子位9.0

华为发布业界首个扩散语言模型Agent，部分场景提速8倍！

华为诺亚方舟实验室联合多所高校发布业界首个扩散语言模型Agent，在完全相同的实验条件下，通过仅改变生成范式实现了部分场景8倍以上的效率提升。

2026-02-10 07:18

AI/ML量子位9.0

人类画了100年的脑图，AI仅用几小时！还绘制出新脑区

加州大学旧金山分校团队提出CellTransformer算法，利用Transformer架构在数小时内完成小鼠大脑图谱绘制，发现了新脑区并展示了在人类大脑研究中的应用潜力。

2026-02-10 12:42

AI/MLInfoQ 中文9.0

贴脸对打Opus 4.5！最新Codex自己写自己，网友实测“放手”8小时不崩

OpenAI 发布最新 Agent 化编程模型 GPT-5.3-Codex，在终端执行、长链路稳定性等方面超越 Claude Opus 4.6，展示了 AI 自主参与开发及重构软件工程流程的潜力。

2026-02-10 06:05

AI/MLZ Potentials9.0

速递｜Anthropic的最新200亿美元融资，或最快于下周敲定

Anthropic即将敲定超过200亿美元的新融资，投前估值达3500亿美元，反映了投资者对其AI模型及企业级应用的高度认可。

2026-02-10 02:06

AI/ML大模型智能9.0

AI编程真面目：完整项目通过率仅27%|上交大新基准

上海交大等联合团队发布ProjDevBench基准测试，首次系统性评估AI智能体从零构建完整软件项目的能力，揭示了当前智能体在架构设计和复杂逻辑处理上的短板。

2026-02-09 16:02

AI/ML魔搭ModelScope社区9.0

达摩院开源RynnBrain：首个支持移动操作的具身大脑基础模型

达摩院开源首个支持移动操作的具身大脑基础模型RynnBrain，具备时空记忆、物理空间推理与强大泛化能力，并在多项具身任务Benchmark上实现SOTA。

2026-02-10 13:37

AI/ML量子位9.0

清华女博士造芯，刚刚IPO市值166亿

清华女博士仇肖莘创立的爱芯元智成功在港交所IPO，成为“中国边缘AI芯片第一股”，市值达166亿港元。文章详细介绍了公司的技术平台、产品布局、财务表现及核心团队。

2026-02-10 03:12

AI/ML谷歌开发者9.0

利用 MedGemma 1.5 与 MedASR 构建下一代医疗应用

Google 发布 MedGemma 1.5 4B 与 MedASR 开放模型，大幅增强了对高维医学影像（CT/MRI）及医疗语音识别的支持，并启动 Kaggle 挑战赛推动医疗应用开发。

2026-02-10 09:32

AI/ML腾讯混元9.0

首个产业级2Bit量化新突破，腾讯混元开源0.3B端侧模型

腾讯混元发布首个产业级2Bit端侧量化模型HY-1.8B-2Bit，通过量化感知训练（QAT）技术将内存占用降至600MB，在保持高性能的同时实现生成速度提升2-3倍，推动大模型在消费级硬件上的落地。

2026-02-10 03:40

AI/ML美团技术团队9.0

美团发布基于 N-gram 全新模型：嵌入扩展新范式，实现轻量化 MoE 高效进化

美团发布 LongCat-Flash-Lite 模型，提出基于 N-gram 的嵌入扩展新范式，相比传统 MoE 专家扩展实现更优效能，并凭借系统级优化实现高效推理。

2026-02-10 00:00

AI/ML硅谷1018.0

深度拆解Clawdbot，为何它能成为2026年第一个现象级产品？

本文深度拆解了2026年现象级AI Agent产品Clawdbot，探讨了其“活人感”来源、技术实现原理（如Markdown记忆、心跳机制）及硬件部署趋势。

2026-02-10 00:20

AI/MLAWS Machine Learning Blog8.0

Agent-to-agent collaboration: Using Amazon Nova 2 Lite and Amazon Nova Act for multi-agent systems

文章介绍了如何利用 Amazon Nova 2 Lite 进行规划推理，结合 Amazon Nova Act 处理浏览器交互，通过 Agent-to-Agent (A2A) 消息传递模式构建健壮的多智能体旅行规划系统。

2026-02-09 16:00

AI/ML快手技术8.0

文末有礼｜快手技术年度盘点，码力全开，驰骋新春！

快手技术年度盘点，回顾了2025年在生成式大模型、推荐搜索系统、数字人及视频理解等领域的创新突破与业务落地成果，并展示了开源贡献、顶会论文及知识产权布局。

2026-02-10 06:35

AI/MLInfoQ 中文8.0

Vibe Coding 在代码生成与协作中的实践与思考

文章基于阿里巴巴的实践，深入探讨了Vibe Coding工具（如Agent和IDE插件）在代码生成中的现状、用户面临的调试与质量挑战，以及通过模板化和国产模型适配等技术落地的解决方案。

2026-02-10 06:05

AI/MLMartin Fowler8.0

Fragments: February 9

Martin Fowler 分享了关于 AI 时代软件开发的思考，探讨了 LLM 带来的认知债务、模型构建乐趣的缺失以及未来源代码形态的变化。

2026-02-09 19:32

AI/MLQunar技术沙龙8.0

去哪儿网 C 端研发 AI Coding 探索及落地

文章详细阐述了去哪儿网在 C 端研发中 AI Coding 的落地实践，通过融合规则算法与 AI 模型解决 D2C 像素级还原难题，并利用多 Agent 架构与知识库增强实现 P2C 逻辑代码生成，最终通过 IDE 插件打通全流程。

2026-02-10 10:02

AI/ML阿里云开发者8.0

别再让语音机器人“答非所问”：AI Force任务型语音对话技术总结

文章详细总结了企业级任务型语音Agent在“拟人化”与“专业化”方面的技术挑战与解法，重点介绍了三段式语音架构的演进及自研“衍算”推理框架。

2026-02-10 00:32

AI/MLAWS Machine Learning Blog8.0

New Relic transforms productivity with generative AI on AWS

文章详细介绍了New Relic如何基于AWS构建企业级生成式AI助手NOVA，通过RAG和代理架构优化知识检索并自动化业务流程。

2026-02-09 16:45

AI/MLAWS Machine Learning Blog8.0

Automated Reasoning checks rewriting chatbot reference implementation

文章介绍了AWS开源的一个聊天机器人参考实现，展示了如何利用Automated Reasoning（自动推理）检查来迭代优化LLM生成的答案，并通过数学证明提高准确性和可审计性。

2026-02-09 19:34

云计算dbaplus社群8.0

实现GPU大幅降本！顺丰科技基于自研的算力资源管理与调度实践

顺丰科技自研EffectiveGPU（EGPU）方案，通过GPU切分、超分及与Volcano调度器结合，解决传统GPU资源浪费问题，实现算力资源的大幅降本。

2026-02-09 23:15

AI/ML量子位8.0

中文版Nano Banana来了？Qwen-Image-2.0炸场：1K长文本硬吃，中文生图彻底不拧巴了

阿里发布新一代图像生成及编辑模型Qwen-Image-2.0，支持1K token长文本理解、复杂指令执行及高精度中文汉字渲染。

2026-02-10 12:18

AI/ML随机小分队8.0

多模型架构、混合定价，硅谷AI产品还在拼什么？来自ICONIQ的AI半年报

基于ICONIQ Growth的半年报，文章指出AI竞争焦点已从模型能力转向应用层的产品、成本控制与GTM执行力，并分析了多模型架构与混合定价模式的兴起。

2026-02-10 11:59

AI/MLZ Potentials8.0

Z Potentials｜沈俊潇：从 Meta 出走，剑桥博士创立 Memories.ai，获 Samsung Next、Susa Ventures 千万美元押注

文章介绍了Memories.ai及其创始人Shawn，该公司致力于构建LVMM（Large Visual Memory Model），通过将视频转化为结构化数据来解决AI的长期记忆问题，而非传统的文本生成或Caption路线。

2026-02-10 02:06

AI/MLThe JetBrains Blog8.0

Introducing Databao: The JetBrains Tool That Lets You Talk to Your Data

JetBrains 推出了名为 Databao 的新产品，旨在通过语义层和数据代理实现可靠的 AI 辅助分析，并邀请数据团队参与概念验证。

2026-02-10 13:31

AI/MLFounder Park8.0

AI硬件闭门探讨：未来硬件只是数据的入口，接下来是「软件定义硬件」的时代

文章通过闭门研讨探讨了AI硬件的现状与未来，指出目前市场处于早期阶段，唯有解决特定痛点或提供不可替代场景的产品才能存活，未来将是“软件定义硬件”和服务订阅制的时代。

2026-02-10 11:29

AI/ML十字路口Crossing8.0

Vibe Coding 下半场：四大天王，和想赢的人｜对话朱广翔：百度秒哒产品总经理

文章是对话百度秒哒产品总经理朱广翔，探讨了Vibe Coding下半场的No-Code路线、AI Coding竞争格局及秒哒的商业模式与护城河。

2026-02-10 09:03

AI/MLAI科技大本营8.0

YC 专访 OpenClaw 创始人：80% 的 App 将会消失，我们还剩下什么？

文章通过 YC 对 OpenClaw 创始人的专访，探讨了本地运行 AI 智能体的优势及其对软件行业未来（如 App 消亡、数据所有权）的深刻影响。

2026-02-10 02:11

AI/ML量子位8.0

阿里达摩院开源具身大脑基模：3B激活参数性能超越72B，转身就忘事的机器人有救了

阿里达摩院开源业界首个具备时空记忆的具身大脑基础模型RynnBrain，通过3B激活参数超越72B模型，解决了机器人在三维物理空间中“健忘”和感知缺失的问题。

2026-02-10 03:19

AI/MLAWS Machine Learning Blog8.0

Accelerate agentic application development with a full-stack starter template for Amazon Bedrock AgentCore

文章介绍了全栈 AgentCore 解决方案模板 (FAST)，这是一个基于 AWS CDK 的现成可部署项目，旨在通过集成 Bedrock AgentCore、认证和前后端架构来加速 AI Agent 应用从原型到生产的开发。

2026-02-09 16:40

AI/ML硅星人Pro8.0

OpenClaw爆火两周后，它的用法已经比科幻世界还离谱了

文章介绍了开源AI Agent项目OpenClaw，其通过赋予AI系统级权限和持久记忆，实现了从自动化谈判到自主决策的复杂操作，同时也引发了关于安全与伦理的广泛讨论。

2026-02-10 02:15

AI/ML机器之心8.0

2026开年关键词：Self-Distillation，大模型真正走向「持续学习」

文章综述了2026年初大模型领域关于Self-Distillation（自蒸馏）的三项重要研究，探讨如何通过自蒸馏机制实现大模型的持续学习和内生进化，解决传统训练中的灾难性遗忘和奖励信号稀疏问题。

2026-02-10 03:44

AI/ML机器之心8.0

破解机器人「慢半拍」难题：南洋理工解决VLA致命短板，动态世界断层领先

南洋理工（NTU）提出DynamicVLA，通过连续推理、感知流和轻量化架构解决VLA模型在动态环境下的延迟问题，并构建了首个动态操控基准DOM Benchmark。

2026-02-10 03:44

AI/ML笔记侠8.0

字节跳动，又甩出一张王炸！

文章深入分析了字节跳动推出的新一代视频生成模型Seedance2.0，实测展示了其在多镜头叙事、角色一致性和自动运镜等方面的突破，并探讨了该模型对短剧、传统影视及特效行业的颠覆性影响。

2026-02-10 13:31

AI/ML51CTO技术栈8.0

UML之父：Dario大错特错，根本不懂软件工程！软件工程不会死亡！软件已经迎来第三次黄金时代！业界回应：有了AI，SaaS只会更加繁荣！

UML之父Grady Booch驳斥Anthropic CEO关于“软件工程将被AI淘汰”的观点，认为AI只是提高了抽象层级，真正的软件工程在于系统思维和权衡决策，并指出当前正处于软件的第三个黄金时代。

2026-02-10 04:29

产品设计白鲸出海8.0

2026年最大趋势已现？ “万物皆可CMLike”时代正式开启

文章深入分析了2026年游戏市场的“Coin Master Like”融合趋势，探讨了开发者如何利用“T3-MCC”设计哲学将核心循环与各类玩法结合，创新游戏体验。

2026-02-10 13:30

工具效率HelloGitHub8.0

追更 HelloGitHub 一整年，终于等到了这篇年度盘点

文章发布了 HelloGitHub 2025 年度热门开源项目榜单，综合社区评选出年度十佳及 40 个分类精选项目。

2026-02-10 00:15

AI/ML新智元8.0

硅谷豪赌算力烧到停电，中国团队反向出击！这一刀，直接砍碎Scaling Law

文章介绍了Yuan 3.0 Flash模型，通过RIRM和RAPO算法有效抑制了大模型的“过度思考”问题，在大幅削减75%推理Token的同时保持了高精度，提出了以高效推理替代单纯Scaling Law的发展方向。

2026-02-10 05:00

AI/MLAI科技评论8.0

对话冯雷：从 AI 播客，到真人感 Agent

文章记录了ListenHub创始人冯雷关于AI创业、商业化落地及产品打造的深度对话，探讨了如何通过服务小众付费创作者实现盈利，并分享了打造“真人感”Agent的实践与思考。

2026-02-10 10:40

云计算AWS Machine Learning Blog8.0

Scale LLM fine-tuning with Hugging Face and Amazon SageMaker AI

文章介绍了如何利用 Hugging Face Transformers 库与 Amazon SageMaker AI 结合，通过分布式训练（如 FSDP）和参数高效微调（如 LoRA）技术，实现对 Llama 3.1 8B 模型的高效微调。

2026-02-09 16:48

AI/ML量子位8.0

GLM-5架构曝光，智谱两日涨近60%：采用DeepSeek同款稀疏注意力

文章报道了智谱AI即将发布的GLM-5架构细节，指出其采用了与DeepSeek类似的稀疏注意力机制，并引发了智谱AI两日股价大涨近60%的市场反应。

2026-02-10 07:59

AI/MLAI科技评论8.0

击败 GPT-5！理想汽车开源 RubricHub：大模型开放生成从此有了专业裁判

理想汽车联合高校开源RubricHub数据集，通过将主观评价转化为可验证的细粒度评分细则，解决了开放式生成任务的评测难题，并使小模型在医疗等领域超越GPT-5。

2026-02-10 10:40

⚡ 快速浏览

LangChain Blog6.0