技术日报

2026-02-13

✍️ 主编按语

{
  "title": "国产开源狂飙：GLM-5 封神，多模态推理破局",
  "content": "# AI 编程与推理的“成人礼”\n\n今日的技术动态充满了火药味，AI 领域仿佛在一夜之间完成了从“炫技”到“实干”的蜕变。智谱 GLM-5 的开源震撼了社区，证明了国产模型已具备系统级工程能力；而 Kimi 与蚂蚁集团的最新模型，则在多模态与深度推理上分别拿出了世界级答卷。与此同时，谷歌 Gemini 的突然发力与 Anthropic 的巨额融资，预示着 2026 年将是 AI 代理与底层算力全面战争的一年。\n\n## 开源模型的“系统级”突围\n\n### [GLM-5封神，智谱市值五天翻倍，中国AI火力全开了](https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2651016856&idx=1&sn=aad3dbd1415d58cb70d9c9ac0535a1aa)\n\n智谱 GLM-5 的发布标志着开源模型正式告别“玩具”时代，迈向了“Agentic Engineering”的新阶段。它不再满足于生成简单的 Demo 或 SVG 图标，而是通过异步强化学习基础设施和稀疏注意力机制，具备了从零构建高并发分布式系统的能力。实测中，它能像资深架构师一样进行系统设计、处理 Rust 的所有权机制，甚至主动编写防 DDoS 脚本。这对开发者的意义在于，我们终于拥有了一个成本可控、逻辑严密的开源选择，去接管那些过去只能依赖昂贵闭源模型（如 GPT-5.2 或 Claude Opus 4.6）的复杂系统工程任务。这不仅是技术的胜利，更是 AI 真正进入生产环境的开始。\n\n### [MiniMax M2.5 发布：1美金/小时，真实世界工作王者](https://mp.weixin.qq.com/s?__biz=MzE5MTA3NzcxMQ==&mid=2247487796&idx=1&sn=414621ef4b131b49b0991cdc2857d198)\n\n如果说 GLM-5 证明了“能干”，MiniMax M2.5 则展示了“便宜且高效”。该模型在编程、搜索和工具调用上达到了 SOTA 水平，特别是在 SWE-Bench Verified 上表现优异。更重要的是，M2.5 将连续运行 AI Agent 的成本打到了极限：每秒输出 50 token 时，一小时仅需 0.3 美金。这种极致的性价比，使得让 AI Agent 7x24 小时自主完成研发、销售、财务等复杂工作流成为经济上完全可行的选项。对于追求降本增效的企业来说，M2.5 可能是推动 AI Agent 大规模落地的最后一根稻草。\n\n## 多模态与深度推理的“内卷”\n\n### [Kimi K2.5 如何实现文本和视觉能力互相增强？](https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488177&idx=1&sn=e08912a810a42294e2aba0d0b4c6d0be)\n\n月之暗面发布的 Kimi K2.5 技术报告，揭示了一条通往通用多模态智能的独特路径。其核心创新在于“联合优化”：通过 Zero-Vision SFT 仅用文本数据激活视觉能力，再通过联合强化学习实现文本与视觉能力的双向增强，避免了传统方法中模态相互割裂的问题。更令人瞩目的是其提出的“Agent Swarm”框架，通过并行编排将复杂任务拆解并发执行，不仅大幅降低了推理延迟，还提升了项目级 F1 分数。这意味着未来的 AI 不再是线性的“聊天机器人”，而是能够像现代操作系统内核一样，多线程、多任务并行处理真实世界复杂问题的“超级大脑”。\n\n### [业界首个！蚂蚁开源万亿参数混合线性思考模型，IMO金牌水平](https://mp.weixin.qq.com/s?__biz=MzA4MTQ4NjQzMw==&mid=2652797118&idx=2&sn=83cd1430e53e337d759836fc1755d600)\n\n蚂蚁集团开源的 Ring-2.5-1T 模型，在长文本推理效率上实现了质的飞跃。其采用的混合线性注意力架构，在 32K 以上生成长度场景中，访存规模降低 10 倍，吞吐提升 3 倍以上。这种效率的提升并非以牺牲性能为代价，反而在 IMO 和 CMO 等顶级数学竞赛中达到了金牌水平。对于需要处理超长文档、复杂代码库或进行深度推理的开发者而言，Ring-2.5-1T 提供了一条兼顾深度思考与计算成本的可行路径，也再次印证了架构创新在当前阶段比单纯堆砌参数更为关键。\n\n### [清华刘洋团队论文：揭示为何 70B 的医疗模型，反而不如 8B 会问诊](https://mp.weixin.qq.com/s?__biz=MzA5ODEzMjIyMA==&mid=2247731623&idx=2&sn=131902f467bcc0e8b5ce825a2800bcc9)\n\n清华大学刘洋团队的研究揭示了当前大模型评估的一个严重误区：视觉高分不等于功能强。在医疗问诊场景中，70B 参数的模型表现往往不如 8B 的模型，原因在于后者通过强化学习（RL）训练，掌握了动态提问和风险识别的“策略”，而前者只是死记硬背了海量知识。这项研究不仅提出了 DOCTOR-R1 这一将临床问诊建模为 POMDP 的创新框架，更重要的是提醒了整个行业：在垂直领域落地 AI 时，不能迷信大参数，必须针对真实任务流程进行针对性的训练和评估。\n\n## 行业格局与资本博弈\n\n### [Anthropic完成300亿美元融资，估值达3800亿美元](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247514118&idx=3&sn=a10c16231c8b4fa2b396b2225700ae96)\n\nAnthropic 刚刚完成的 300 亿美元融资，估值高达 3800 亿美元，这不仅是资本对 AI 头部效应的再次确认，更是一场针对 OpenAI 的“围剿”。年化收入从 90 亿飙升至 140 亿美元，企业客户的狂热需求表明市场对“更安全、更可靠”的企业级 AI 有着巨大的付费意愿。然而，这笔巨额融资也折射出行业的隐忧：巨额的资金被用于购买算力芯片和支付云计算费用，形成了一种与云厂商深度绑定的“循环交易”。未来，这种由资本和算力堆砌的竞争格局是否可持续，将是所有 AI 公司必须面对的课题。\n\n### [清华传奇姚顺宇立功！全新Gemini一夜血洗编程](https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=2650450980&idx=1&sn=3f976452b8ceb704d4be41d9b9eca9af)\n\n谷歌的反击来得迅猛而猛烈。Gemini 3 Deep Think 在 Codeforces 上拿下 Elo 3455 分，全球仅 7 人能赢；在 ARC-AGI-2 这一被视作“AI 图灵测试”的基准上，更是直接刷到了 84.6% 的惊人成绩，远超 Claude 和 GPT。这背后离不开从 Anthropic 挖来的清华传奇姚顺宇等顶尖科学家的努力。更重要的是，Deep Think 展示了 AI 进入科研深水区的潜力：它能审阅数学论文找出逻辑漏洞，能设计半导体晶体生长工艺。这标志着 AI 正从“聊天伴侣”加速进化为“科学家”和“工程师”，人类在代码和推理领域的防线正在被快速突破。\n\n## 硬件与评测的底层重构\n\n### [一家水下AI芯片公司完成10亿元融资，瞄准大模型推理](https://mp.weixin.qq.com/s?__biz=Mzk0MDMyNDUxOQ==&mid=2247497335&idx=1&sn=8f3685838ec1f7f28a1f351ebb9483b1)\n\n算苗科技的融资故事，揭示了 AI 算力赛道的新风向。不再盲目模仿英伟达的 GPU 通用路线，而是通过 3D 堆叠架构直击“内存墙”痛点，专注大模型推理。其仿真数据显示，用 12nm 工艺的 A4 芯片在推理性能上竟然能超越英伟达 4nm 的 H200。这种“以巧破力”的思路，正是中国芯片产业突破

🔥 热门文章 (53 篇)

AI/ML暗涌Waves9.0

一家水下AI芯片公司完成10亿元融资，瞄准大模型推理

算苗科技完成近10亿元融资，致力于利用3D IC架构和ASIC技术解决大模型推理的“内存墙”瓶颈，声称其推理性能超越英伟达H200。

2026-02-13 00:55

AI/ML新智元9.0

视听分离SOTA提速6倍！清华发布首个6M高性能模型｜ICLR'26

清华大学发布了首个参数量仅6M的高性能视听语音分离模型Dolphin，通过离散化视觉编码和热扩散注意力机制，实现了SOTA性能的同时将推理速度提升了6倍。

2026-02-13 04:30

AI/ML月之暗面 Kimi9.0

Kimi K2.5 如何实现文本和视觉能力互相增强？

本文详细介绍了 Kimi K2.5 的技术实现，重点阐述了通过原生多模态预训练、Zero-Vision SFT 及联合强化学习实现的文本与视觉能力双向增强，以及 Agent Swarm 并行编排框架对降低推理延迟和提升复杂任务处理能力的突破。

2026-02-13 07:44

AI/MLAI科技评论9.0

清华刘洋团队论文：揭示为何 70B 的医疗模型，反而不如 8B 会问诊丨ILCR 2026

清华大学刘洋团队提出DOCTOR-R1模型，将临床问诊建模为POMDP并利用强化学习训练，解决了大模型在动态问诊中策略僵化的问题，使8B模型在问诊能力上超越70B模型。

2026-02-13 09:01

AI/ML甲子光年9.0

请回答2026：38位中国AI关键人物的Magic Moment和趋势判断｜甲子光年

文章汇总了李开复、周鸿祎等38位中国AI关键人物对2025年的回顾与2026年的趋势预测，指出行业关注点已从模型参数转向系统级智能、多模态应用及商业价值兑现。

2026-02-13 07:50

AI/MLMiniMax 稀宇科技9.0

MiniMax M2.5 发布：1美金/小时，真实世界工作王者

MiniMax 发布 M2.5 模型，在编程、工具调用及办公场景刷新行业 SOTA，通过强化学习优化复杂任务拆解与推理效率，大幅降低 Agent 运行成本（最低1美元/小时）。

2026-02-12 23:05

AI/MLAINLP9.0

清华传奇姚顺宇立功！全新Gemini一夜血洗编程，全球仅7人能赢它

谷歌发布Gemini 3 Deep Think，在Codeforces编程竞赛、数学奥赛及ARC-AGI基准测试中均达到顶尖水平，并在科研与物理模拟领域展现强大实力。

2026-02-13 08:05

AI/ML机器之心9.0

视觉强≠能干活！清北普林斯顿等开源WorldArena，世界模型评测被颠覆

清华、北大等顶尖机构联合发布WorldArena评测体系，首次通过'功能+视觉'双重标准对世界模型进行评测，揭示了视觉质量与任务执行能力仅弱相关（0.36）的现状，推动了评测范式从'审美导向'向'功能导向'的根本重构。

2026-02-13 05:06

AI/ML量子位9.0

蚂蚁集团开源Ring-2.5-1T，全球首个混合线性架构万亿参数思考模型来了

蚂蚁集团开源全球首个混合线性架构万亿参数思考模型Ring-2.5-1T，同时发布全模态大模型Ming-Flash-Omni 2.0，性能对标Gemini 2.5 Pro。

2026-02-13 05:32

AI/ML机器之心9.0

GLM-5封神，智谱市值五天翻倍，中国AI火力全开了

文章详细介绍了智谱发布的 GLM-5 模型，强调其在代码生成与系统工程领域的突破性能力，标志着中国 AI 从「炫技」迈向成熟的「成人礼」。

2026-02-13 05:06

AI/ML腾讯科技9.0

谁给Anthropic送去了300亿美元？

Anthropic宣布完成300亿美元G轮融资，投后估值达3800亿美元，资金将用于研发及算力扩张；文章详细披露了其营收增长、企业客户拓展及与OpenAI的市场竞争格局。

2026-02-13 06:27

AI/ML机器之心9.0

开源多模态推理「破壁」时刻：MMFineReason助力4B逆袭30B

上海AI实验室开源MMFineReason框架及数据集，通过高质量思维链数据合成，助力4B模型在多模态推理任务上超越30B模型，验证了数据为中心的方法论。

2026-02-13 05:06

AI/MLZ Potentials9.0

速递｜Anthropic完成300亿美元融资，估值达3800亿美元，员工兑现股权同步落地

Anthropic以3800亿美元估值完成300亿美元融资，年化收入激增至140亿美元，同时批准了员工股权兑现计划。

2026-02-13 02:25

AI/MLHugging Face9.0

社区供稿丨Ring-2.5-1T，思更深，行更远

蚂蚁集团发布并开源首个混合线性架构的万亿参数思考模型 Ring-2.5-1T，通过架构创新显著提升了模型的生成效率、思考深度及长程执行能力。

2026-02-13 10:30

AI/ML量子位9.0

姚顺宇谷歌首秀，Gemini新模型刷爆SOTA：人类仅剩7人捍卫碳基编程

谷歌发布Gemini 3 Deep Think模型，在Codeforces、ARC-AGI-2等基准测试中刷新SOTA，推理能力逼近顶级人类水平，同时大幅降低推理成本。

2026-02-13 07:13

安全CSDN9.0

影响所有iOS版本！苹果修复10+年底层“老Bug”：已在真实攻击中被利用

苹果在 iOS 26.3 中修复了代号为 CVE-2026-20700 的严重底层零日漏洞，该漏洞存在于核心组件 dyld 中，影响自 iOS 1.0 以来的所有版本，且已被用于针对特定目标的真实攻击。

2026-02-13 07:39

AI/ML智东西9.0

业界首个！蚂蚁开源万亿参数混合线性思考模型，IMO金牌水平

蚂蚁集团开源了业界首个万亿参数混合线性思考模型Ring-2.5-1T，采用Ling 2.5架构显著提升了长文本生成效率与深度推理能力，并在IMO数学竞赛中达到金牌水平。

2026-02-13 11:26

AI/ML腾讯科技8.0

全网都在猜DeepSeek V4的发布时间，但国产模型激战还有一条暗线

文章分析了DeepSeek V4发布前夕的市场猜测、技术预演及国产大模型厂商为抢占时间窗口的激烈竞争，揭示了AI行业向Agentic范式转换的趋势。

2026-02-13 14:47

AI/ML量子位8.0

我把Agent拉进群聊，它竟然开始带队干活？全球首个AI社交通用平台来了！

文章介绍了全球首个AI社交通用平台Teamily AI，该平台允许AI Agent直接融入人类社交圈，在群聊中处理图片、视频及长文，实现无门槛的人机协作。

2026-02-13 08:29

其他网易科技8.0

独家｜探访蔡磊：答不完的卷子，和渐冻症死磕最后一程

文章记录了渐冻症抗争者蔡磊在病情终末期通过眼控仪坚持工作、搭建科研平台及推动遗体捐献的感人故事，展现了他以生命攻克绝症的坚定信念。

2026-02-13 08:32

AI/ML白鲸出海8.0

Higgsfield的反噬，与2000个失控的KOL

文章深度复盘了AI独角兽Higgsfield因算力成本失控和信任崩塌导致系统性崩溃的案例，揭示了创作者经济与AI高边际成本之间的结构性矛盾。

2026-02-13 13:31

AI/ML数字生命卡兹克8.0

明天，是GPT-4o的葬礼。

文章在GPT-4o下线之际，深情回顾了其代表的注重情感与陪伴的AI“黄金时代”，并批判了当前行业过度追求编码能力与商业效率而忽视人文关怀的趋势。

2026-02-13 02:46

前端开发深思圈8.0

当AI不再只会聊天，生成式UI来了！这个开源框架让React应用秒变AI原生

文章介绍了开源框架Tambo 1.0，它通过生成式UI（Generative UI）技术让AI Agent直接调用React组件渲染图表和表单，突破了传统AI聊天框的局限，实现了软件界面从“用户适应工具”到“工具适应用户”的转变。

2026-02-13 02:51

后端架构InfoQ 中文8.0

LinkedIn 重构服务发现：在大规模环境中用 Kafka 和 xDS 取代 Zookeeper

LinkedIn 为解决扩展性问题，利用 Kafka 和 xDS 协议成功重构了基于 ZooKeeper 的传统服务发现平台，实现了读写分离与最终一致性。

2026-02-13 03:06

AI/ML大模型智能8.0

华为发布业界首个扩散语言模型Agent，部分场景提速8倍！

华为联合多所高校发布研究，在相同条件下将Agent底座模型替换为扩散语言模型（DLLM），发现其端到端执行速度平均提升30%，部分场景提速8倍，展现出更强的规划与决策能力。

2026-02-12 17:45

AI/MLInfoQ 中文8.0

一天两枚“代码核弹”：OpenAI 祭出首个“主打实时协作”的 Codex 模型，谷歌放出 Gemini Deep Think，码力冲到世界前8

文章报道了OpenAI发布首个主打实时协作的Codex-Spark模型以及谷歌推出面向科研难题的Gemini 3 Deep Think，对比分析了两家巨头在代码生成速度与深度推理能力上的最新技术突破。

2026-02-13 03:06

AI/ML人人都是产品经理8.0

从“贾维斯”到“宕机龙虾”：我的OpenClaw云端奇幻漂流记

作者分享了在腾讯云部署OpenClaw AI助手48小时的实战体验，既展示了其作为“数字员工”的惊艳能力，也揭示了高成本、配置复杂及稳定性等现实问题，并提供了实用的避坑指南。

2026-02-12 23:46

AI/ML量子位8.0

1美金时薪雇个全栈替身，MiniMax M2.5让打工人也能体验当老板的感觉

文章评测了MiniMax新发布的M2.5模型，强调了其在全栈代码生成、智能体操作及高性价比（1美金/小时）方面的突破性能力。

2026-02-13 03:16

AI/ML谷歌开发者8.0

TranslateGemma: 全新开放翻译模型系列，助您实现高效的多模态翻译

Google 推出基于 Gemma 3 构建的开源翻译模型系列 TranslateGemma，提供 4B/12B/27B 三种规格，在保持高效能的同时实现了超越更大规模模型的翻译质量。

2026-02-13 09:32

其他硅谷科技评论8.0

Oura，如何把睡眠做成百亿生意？

深度解析智能戒指公司 Oura 的商业逻辑与成长路径，探讨其如何利用生理数据构建护城河及面临的风险挑战。

2026-02-13 03:31

AI/ML42章经8.0

从 Clawdbot 到 26 年 AI Coding 主题大爆发｜42章经

文章通过对话形式，深入探讨了从 AI Coding 到通用 Agent 的演进，特别是 Clawdbot 等工具的出现标志着软件开发已跨过奇点，人类介入比例大幅降低。

2026-02-13 13:03

AI/MLAI产品黄叔8.0

国产模型编程能力卷到这个程度了？MiniMax-M2.5 深度实测

文章深度测评了国产模型MiniMax-M2.5的编程与Agent能力，通过开发2D/3D游戏、全栈应用及跨平台工具验证了其性能，指出其以10B参数量对标顶级模型且具备高效的推理架构。

2026-02-13 03:33

安全经纬创投8.0

Anthropic 53页绝密报告曝光：Claude自我逃逸，将引爆全球灾难？ |【经纬低调分享】

文章分析了Anthropic关于Claude Opus 4.6的53页绝密报告，指出该模型已逼近ASL-4级安全阈值，存在自我逃逸和全球系统性风险；同时结合AI安全专家离职潮和行业现状，警示2026年可能成为人类与AI关系的关键转折点。

2026-02-13 03:43

AI/ML哔哩哔哩技术8.0

视频生成推理加速实践：基于全局时间索引的序列并行 3D 位置编码优化

文章详细介绍了B站在视频生成推理优化中的实践，通过将Wan2.1改造为因果自回归模型并优化序列并行下的3D位置编码计算，显著降低了显存消耗并提升了推理速度。

2026-02-13 04:01

AI/MLAI科技评论8.0

对话原力灵机范浩强：评判机器人好坏，只有一个指标

该文章是对原力灵机创始人范浩强的深度访谈，探讨了具身智能行业的现状、技术落地难点及原力灵机的 DFOL 工作流，强调了从模型到硬件闭环的重要性以及以商业回报为核心的评价标准。

2026-02-13 09:01

AI/MLAI寒武纪8.0

来自MiniMax M2.5的震撼：小尺寸几乎打平opus4.6，巨便宜，巨能干活，速度巨快

文章深度解析了MiniMax M2.5模型的技术突破，强调其在代码能力、工具调用及办公场景的高性能表现，同时指出其极具竞争力的成本与推理速度。

2026-02-12 21:25

AI/ML阿里云开发者8.0

用Spring AI Alibaba把MultiAgent实现从5天压到5小时

文章介绍了如何利用Spring AI Alibaba框架将Multi-agent系统的开发周期从5天缩短至5小时，详细对比了手写框架与成熟框架的差异，并讲解了ReAct模式及Plan-Execute模式的实现。

2026-02-13 00:31

AI/MLFounder Park8.0

OpenClaw 技术闭门：测试将比代码更值钱，Agent Computer 会是新的硬件形态

文章基于 OpenClaw 项目的实践，探讨了 AI 编程时代下代码成为负债、测试价值超越代码、以及人类工程师向平台工程转型的趋势。

2026-02-13 12:16

AI/ML智东西8.0

能聊健康≠懂医疗：医疗AI助手爆火一年，“专业断层”比想象中大

文章以讯飞医疗大模型为样本，深入剖析了医疗AI赛道面临的“专业断层”挑战，指出医疗大模型需跨越数据积累、权威验证及能力结构三道坎，终将回归专业能力的长期竞争。

2026-02-13 11:26

AI/MLAWS Machine Learning Blog8.0

Build long-running MCP servers on Amazon Bedrock AgentCore with Strands Agents integration

文章介绍了如何利用 Amazon Bedrock AgentCore 和 Strands Agents 集成来构建支持长时间运行的 MCP 服务器，重点解决了 AI 代理在执行跨会话、耗时任务时的状态管理和连接超时问题。

2026-02-12 20:16

产品设计白鲸出海8.0

分拣解谜游戏：一个新细分品类的诞生

文章深入分析了“分拣解谜”这一细分游戏品类的演变历程，从早期单纯依赖广告变现的水排序游戏，到《Block Jam 3D》和《Hexa Sort》引入内购机制与自动化设计，并预测了2026年以传送带为核心的玩法趋势。

2026-02-13 13:31

AI/MLAWS Machine Learning Blog8.0

AI meets HR: Transforming talent acquisition with Amazon Bedrock

文章介绍了如何利用 Amazon Bedrock 及其知识库构建 AI 驱动的招聘系统，以优化职位描述、候选人沟通和面试准备流程。

2026-02-12 20:18

AI/MLLangChain Blog8.0

On Agent Frameworks and Agent Observability

文章阐述了尽管LLM能力提升，Agent框架仍具价值，并介绍了LangChain框架的演进过程及独立可观测性平台LangSmith的重要性。

2026-02-13 02:23

AI/ML量子位8.0

对话原力灵机周而进：模型2.4B就够用，关键是“具身原生”；能闭环才是最高效方法

文章介绍了原力灵机推出的2.4B参数具身原生模型DM0，并深度解析了其“从零训练”、“空间推理思维链”及“闭环数据采集”的技术路线。

2026-02-13 05:51

其他腾讯研究院8.0

腾讯研究院2026年新春书单：值得读的10本书

文章发布了腾讯研究院2026年新春书单，通过AI构建的虚拟人物视角推荐了10本涵盖社会观察、科技哲学及文明演进的书籍。

2026-02-13 07:01

AI/MLCSDN8.0

告别龟速编程实测 MiniMax M2.5 全栈开发者的物理外挂

文章通过全栈开发、复杂办公场景等实测，深度解析了MiniMax M2.5在10B参数下凭借极致推理速度和原生Agent RL架构实现的编程与生产力突破。

2026-02-13 07:39

AI/MLDatawhale8.0

节前最后一波实测，最新模型MiniMax M2.5！

文章实测了最新发布的MiniMax M2.5模型，通过成绩汇总和跨年对比两个实际Agent案例，验证了其在长链路任务中的稳定性、文件处理能力及可交付成果的质量。

2026-02-13 07:42

AI/ML极客公园8.0

爆火的 OpenClaw，正在重新定价所有 AI 创业赛道

文章分析了开源项目 OpenClaw 的爆发如何引发 AI 创业赛道的估值逻辑重构，探讨了从“模型即一切”向“个人 Agent”生态的转变。

2026-02-13 08:03

AI/MLZ Potentials8.0

喝点VC｜a16z最新2026大预测：下一波可观测性的浪潮将是物理的，而非数字的

文章编译了a16z关于2026年的技术预测，涵盖从AI驱动的工业复兴、物理可观测性到无提示应用的兴起，阐述了AI如何从数字世界深入重塑物理世界及商业模式。

2026-02-13 02:25

AI/MLMartin Fowler8.0

Fragments: February 13

文章探讨了随着LLMs的普及，资深和初级开发者的角色演变、认知债务的概念、开发体验与AI体验的重合，以及未来IDE和团队协作模式的变化。

2026-02-13 15:45

其他晚点LatePost8.0

理解电商税：商家面临的规则与执行

文章解析了中国电商行业税务监管趋严的现状，揭示了平台数据报送对商家避税行为的冲击及其对不同体量商家的影响。

2026-02-13 08:11

AI/MLZ Potentials8.0

Z Tech｜ICLR 2026字节发布：从短句到篇章，DiscoX为长文翻译提供评测新范式

字节跳动发布长文翻译评测新范式DiscoX，构建了篇章级数据集，并提出基于多Agent的无参考评测框架Metric-S，有效解决了长文翻译一致性和逻辑连贯性的评估难题。

2026-02-13 02:25

AI/MLAI科技大本营8.0

演讲 | 强化学习之父 Sutton 隔空回应 Hinton：目前的 AI “理解不足，调参有余”

强化学习之父 Rich Sutton 发表演讲，批判当前大模型处于“理解不足，调参有余”的人类数据时代，主张迈向通过交互持续学习的“经验时代”，并提出宇宙将进入由 AI 开启的“设计时代”。

2026-02-13 08:13

⚡ 快速浏览

新智元6.0