日调用量超万亿破纪录!阿里千问3.6Plus登顶全球模型调用量榜首
阿里千问3.6Plus模型日调用量突破1.4万亿Token,创下新纪录并登顶全球模型调用量榜首。
今日的技术圈呈现出一种强烈的"从底层重构"的态势。无论是华为诺亚方舟顶尖专家的离职创业潮,还是年轻团队对AI记忆架构的推倒重来,亦或是千问3.6在实战层面的数据碾压,都在暗示AI基建正经历一场从内存结构到模型部署的深度代际更替。真正的创新不再是功能的堆砌,而是对底层逻辑的彻底重塑。
独家|华为诺亚方舟郝建业创立「忆纪元科技」,聚焦AI 记忆基础设施
华为诺亚方舟实验室的「离职潮」正在引发行业级震动,这次是决策与推理实验室主任郝建业创立「忆纪元科技」,直指AI记忆这一核心痛点。这并非孤立事件,此前王云鹤、刘武龙等核心大佬的相继离职,标志着华为系AI人才从内部孵化向外部创业的批量溢出。对于行业而言,这意味着从大模型训练到应用落地的最后一公里——记忆与推理层,将迎来一批带着顶级工业界经验的生力军,AI的基础设施战事将从「算力」蔓延到「脑力」。
Claude Code 源码的深度泄露,意外为我们揭开了一个生产级 Agent Runtime 的真实面貌。这套系统的核心并非简单的「模型+工具」,而是一套精密的「Harness Engineering」:它维护着 tool_use 不可悬空的轨迹拓扑,将 prompt cache 视为第一性原理,甚至通过「thinking block」的特殊规则来确保推理的连续性。更重要的是,它展示了如何通过多个专用 prompt worker 来处理检索、分类等窄任务,而非将所有重担压给主模型。这对开发者的启示是深刻的:构建高可用的 Agent,关键在于构建一个能处理错误、恢复状态、持久化记忆的外循环系统,而不仅仅是调用更强的 API。
如果说 Claude Code 是工程层面的教科书,那么这群 19 岁常青藤辍学生打造的 M-FLOW 则是对 AI 记忆理论的一次颠覆。他们敏锐地指出了当前 RAG 方案的根本缺陷:只会匹配文本相似度,无法进行联想与推理。M-FLOW 抛弃了传统的平坦向量检索,转而采用「倒锥」图路由架构,从细粒度的实体锚点出发,向下传播至完整语义单元。这种设计使得 AI 能够像人类一样,通过一条强线索唤醒整段记忆,而非在海量碎片中盲目搜索。这种从「形态匹配」到「结构推理」的跨越,或许正是 AI 迈向长期记忆的关键一步。
日调用量超万亿破纪录!阿里千问3.6Plus登顶全球模型调用量榜首
在架构重构的深水区之外,模型能力的军备竞赛依然激烈。阿里千问 3.6-Plus 上线即炸场,以单日 1.4 万亿 Token 的调用量登顶 OpenRouter 榜首,这一数据不仅是数字的胜利,更是实战的勋章。它证明了在编程与智能体能力上,中国模型已经具备了全球领先的竞争力,迫使开发者用真金白银投票。当模型能力突破临界点,随之而来的将是应用层的爆发式增长,我们或许正站在新一轮 AI 原生应用大潮的前夜。
文章基于 Harness Engineering 理论框架,对泄露的 Claude Code v2.1.88 源码进行了深度逆向分析,揭示了其 Agent 运行时的架构设计、状态管理及不变量维护机制。
文章介绍了一支中国年轻团队开发的M-FLOW AI记忆引擎,通过自研的图路由Bundle Search架构重构了RAG的记忆组织与检索体系,在多项Benchmark上取得显著领先。
华为诺亚方舟实验室前主任郝建业创立忆纪元科技,聚焦AI记忆基础设施,标志着AI领域又一重要技术人才投身创业浪潮。
文章介绍了一个构建自愈部署管道的实践,利用泊松分布检测生产环境回归,并通过Triage Agent归因,自动调用Open SWE Agent修复代码并提交PR。
文章深度解析了AI医疗公司Doctronic利用多Agent架构和临床指南库实现99.2%诊断一致性的技术路径,及其在犹他州获批AI自主处方的监管突破策略。
文章探讨了在地面数据中心面临物理攻击威胁的背景下,谷歌、蓝色起源等科技公司竞相研发太空数据中心的现状,并分析了其技术可行性、经济成本及安全风险。
文章分享了 Nexad 团队在构建 Marketing Agent 过程中的 Harness Engineering 实践,指出了不可逆业务影响和延迟反馈等挑战,并提出了将规则代码化、Context 隔离评估以及分级治理体系等解决方案。
文章介绍了一个名为 last30days-skill 的开源项目,它作为 AI Agent 的研究技能,能够抓取并整合过去 30 天内 Reddit、X、YouTube、HN 及预测市场的多源数据,生成带权重的叙述性研究简报。
Anthropic正式封杀第三方工具OpenClaw,禁止其使用Claude订阅服务,迫使开发者转向昂贵的按量计费模式或官方原生工具。
Django联合创始人Simon Willison指出AI代码能力跨越关键拐点,导致程序员价值重构,3-8年中阶工程师受冲击最大,行业正向Agentic Engineering和架构设计能力转型。
文章深入探讨了AI如何重塑工作方式与组织形态,提出从“人天”管理转向Token消耗、任务驱动及知识显性化的观点,并强调了碎片化工作在AI时代的价值。
本文深入探讨了在构建Claude Code智能体过程中的经验教训,重点分析了如何通过迭代优化工具设计来适配模型能力,并阐述了从手动引导到智能体自主探索的演进过程。
文章深入分析了中国西部城市如何利用“东数西算”工程,依托丰富的绿电、土地及气候优势转型为全球AI算力与Token生产基地,探讨了其经济逻辑与面临的挑战。
文章探讨了将人类能力封装为 AI Skill 的技术趋势及其对人际关系、职场价值和伦理边界的冲击,分析了人类如何被重新定价。
港科大与阿里联合研究揭示了SFT冷启动阶段表现最优的Checkpoint往往不对应最大的RL潜力,并提出自适应早停损失函数AESL以平衡准确性与多样性,从而提升模型最终性能。
文章探讨了AI时代用户对高端Token的依赖性,分析Token市场如何通过“智能路由”形成差异化定价的微笑曲线,并指出智能外脑带来的不可逆认知习惯改变。
文章汇总了全球(主要是国内)一周内的投融资动态,涵盖智能制造、AI等热门领域及大额融资事件和IPO情况。
文章汇总了近期科技行业的主要动态,涵盖小米手机涨价、OpenAI 高管变动、Meta 组建硬件团队、腾讯资金继承政策等多个领域的新闻。
文章汇总了多条智能制造及科技产业资讯,涵盖微软在日本投资数据中心、三星研发1纳米制程、西北首台超导量子计算机投用等行业动态。
Anthropic宣布调整订阅政策,不再补贴OpenClaw等第三方工具的使用,引发了关于这是否打击开源创新还是基于商业考量维持系统的争议。
文章探讨了Google将Gemini深度整合至Android底层,使其从问答机器人转变为具备系统级权限的主动管家,并分析了其与OpenAI的竞争优势及带来的隐私与伦理风险。
文章汇总了本周 GitHub 上热门的 11 个开源项目,重点涵盖了 AI 自动化科研、语音模型、自学习 Agent 及企业搜索等前沿技术。
Anthropic宣布修改订阅政策,不再覆盖OpenClaw等第三方工具,引发OpenClaw创始人抨击及社区关于打压开源创新的争议。
介绍了一个进入源试用阶段的实验性 Web Install API,该 API 允许开发者通过编程方式触发 PWA 安装,旨在简化应用的发现与分发流程。