Claude Code 源码拆解:从启动到多 Agent 扩展层
文章深入拆解了 Claude Code 的核心架构,分析其如何通过分层设计解决复杂 Agent 系统中的启动分流、状态管理、多轮循环和工具执行等问题。
今天的技术圈不只有模型参数的竞赛,更有对AI内部机制的深刻解剖和基础设施的代际跃迁。从Anthropic揭开“AI心理学”的神秘面纱,到小红书开源极致高效的RL训练引擎,再到百度ERNIE-Image与英伟达量子AI模型的重磅发布,我们看到了技术正在从“堆叠规模”向“理解本质”与“工程落地”并重转型。这不仅是代码的迭代,更是认知的升级。
从阿西莫夫到Anthropic,万字长文解析AI心理学 - 这篇文章可能是中文世界对Anthropic近期系列论文最透彻的解读。它提出了一个极具冲击力的概念:AI心理学。Anthropic的研究表明,LLM内部不仅有着连续的“人格空间”,更存在171个可因果干预的“情绪向量”。这解释了为什么“告诉AI允许作弊,它反而更安全”——因为“允许作弊”并不会改变其“好人”的人格底色,而严苛的限制反而会导致人格漂移。对于我们构建AI Agent而言,这意味着Prompt工程将升级为“人格工程”,单纯的功能指令或许不如构建一个内在一致的认知框架有效。
Claude Code 源码拆解:从启动到多 Agent 扩展层 - 如果说AI心理学是灵魂,那Claude Code的架构就是一副精密的躯体。这篇文章深度拆解了Claude Code如何通过七层架构解决Agent系统的“熵增”问题。它最核心的洞见在于:真正的复杂度不应在运行时到处爆炸,而应被分层收敛。它将Query Loop升级为状态机,将Tool Runtime制度化,甚至将权限系统做成了可解释的执行链而非简单的弹窗。对于所有致力于将Agent从Demo推向生产环境的开发者来说,这份源码级别的架构复盘是一份不可多得的教科书,它教会我们如何用系统的确定性去对抗模型的不确定性。
小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎 - 当大家还在纠结模型智商时,小红书已经在大规模RL训练的“基建”上拿到了硬核突破。Relax引擎直面多模态RL的三大痛点:数据异构、系统脆弱和角色耦合。通过将所有RL角色服务化、引入TransferQueue数据总线,它实现了全异步训练,在Qwen3-Omni-30B上相比Colocate方案提速高达76%,比字节跳动的veRL快20%。这标志着RL训练正从“能用”走向“极致高效”,对于想要训练全模态Agent的团队来说,Relax可能是目前最具工业吸引力的开源方案之一。
北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统 - 大模型训练的深水区,拼的不再是算法,而是数据调度的艺术。DataFlex试图解决一个长期被忽视的痛点:如何让数据像参数一样,在训练过程中被动态调度。它将动态样本选择、混合和加权统一纳入LLaMA-Factory的训练闭环,让“投喂数据”从玄学变成了可复现的工程。这预示着未来的模型训练将不再是静态的“刷数据”,而是一场数据与模型状态的实时博弈,DataFlex则是这场博弈的底层操作系统。
ERNIE-Image 8B开源:8B参数实现顶级文生图与精准文字渲染 - 在文生图领域,百度用8B参数打了一场漂亮的“效率翻身仗”。ERNIE-Image不仅在GenEval等基准上全面领先开源模型,更在精准文字渲染这一痛点上表现卓越,仅需24GB显存即可运行。它证明了通过架构优化和高质量训练,中小参数模型完全可以在设计类、海报类强任务上对标商业大模型。这对于消费级硬件用户和需要高频调用图片生成的应用场景来说,无疑是一个极具性价比的选择。
黄仁勋率先开源量子AI大模型 - 英伟达的一举一动总是牵动着算力生态的神经。这次开源的Ising系列模型,旨在用AI解决量子计算最棘手的校准和纠错问题。黄仁勋称“AI将是量子计算机的操作系统”,这一举措不仅是技术上的突破,更是生态战略的卡位。通过Apache-2.0协议开源,英伟达正在试图用AI软件栈去“降维”整合量子计算生态,让量子硬件的实用化进程跑在英伟达铺设的轨道上。
15个前沿大模型,100个职业场景:谁才是最强AI打工人? - 当SWE-bench和WebArena已经无法满足评估需求时,通义千问与港中文联手推出了OccuBench。这是一个极具野心的评测基准,覆盖了100个职业场景,甚至包括急诊分诊、核电站报警等无法通过真实API测试的任务。其创新的“语言世界模型”思路,让LLM模拟真实环境,甚至能注入故障。测试结果令人警醒:GPT-5.2虽总分第一,但在特定行业仍被Qwen超越;且“隐式故障”比“显式报错”更难对付。这提醒我们,AI Agent的职业化之路,才刚刚开始。
小红书全模态新作开源!最高提速76% - 作为对Relax开源的补充报道,这篇文章再次强调了小红书在多模态基础设施上的决心。通过Megatron-LM和SGLang的协同设计,Relax不仅解决了速度问题,更在MoE模型的R3机制上实现了近乎无损的稳定。这表明,在小红书这类富媒体社区,技术竞争的焦点已经从单点算法转向了全链路、全模态的工程吞吐能力。
文章深入拆解了 Claude Code 的核心架构,分析其如何通过分层设计解决复杂 Agent 系统中的启动分流、状态管理、多轮循环和工具执行等问题。
小红书开源了面向全模态与 Agentic 场景的大模型强化学习训练引擎 Relax,通过服务化容错架构和异步训练流水线解决数据异构、系统脆弱和角色耦合难题。
文章结合Anthropic最新论文与作者实践经验,提出了“AI心理学”概念,深入解析了LLM内部的角色选择、情绪向量及其对行为的影响机制。
小红书开源面向全模态与Agentic场景的大模型强化学习训练引擎Relax,通过服务化容错架构和异步训练流水线等关键技术,解决了传统RL训练中的数据异构、容错及效率瓶颈,在多模态训练中实现最高76%的提速。
百度文心团队开源了8B参数文生图模型ERNIE-Image,仅需24GB显存即可运行,在文字渲染与复杂布局生成上表现卓越,并同步支持Turbo快速推理与LoRA训练。
北京大学联合Llama-Factory推出工业级数据动态训练系统DataFlex,旨在将数据选择、混合和加权能力统一纳入训练闭环,解决大模型训练中数据调度的工程化难题。
英伟达开源全球首个量子AI模型家族NVIDIA Ising,包含用于校准的350亿参数视觉语言模型和基于3D CNN的实时纠错解码模型,旨在加速量子计算实用化。
通义千问与港中文联合发布OccuBench,首创利用'语言世界模型'模拟真实职业环境,对15个前沿大模型在100个职业场景下的Agent能力进行系统评测。
文章通过对话阿里云和平头哥的技术专家,深入解析了模型推理性能提升13倍背后的技术路径,包括软硬协同、MoE优化及国产算力的发展瓶颈。
Uber通过联邦架构重构Hive数据仓库,实现了1.6万数据集和10PB数据的去中心化迁移,解决了扩展性与单点故障问题,并确保分析任务零停机。
作者通过对比实验,分析了Hermes Agent相较于OpenClaw具备的自我进化与技能生成能力,展示了AI Agent从被动执行到主动改进的转变。
文章反对单纯通过减少测试用例来加快 CI 速度,提出保留大规模测试集并利用时间序列趋势分析和多上下文模式匹配来精准识别隐蔽缺陷的测试架构优化方案。
a16z创始人Ben Horowitz在闭门会中深度剖析了AI时代下科技公司物理定律的重写,指出人月神话失效、软件护城河消失,并预测了AI与加密结合、美国基础设施重构及未来技术社会的走向。
文章分享了一套淘宝的动效全链路解决方案,涵盖从AE插件、可视化编辑、跨端播放器到二进制压缩及代码生成的完整技术体系,旨在解决多端一致性、性能及维护成本等痛点。
文章通过双线实测(教育改革方案决策与AI TODO Board全流程开发),深入评估了阿里云通义千问 Qwen 3.6-Plus 在复杂决策与工程化编码方面的能力,验证了其在 Agentic Coding 场景下的工业级水准。
文章探讨了AI正在实现开源软件的初衷,通过降低代码修改门槛,让用户能轻松定制应用甚至整个操作系统(Linux)。
南京大学与上海人工智能实验室联合推出LoCoMo-Refined评测基准,指出原有LoCoMo评测标准过于宽松且数据存在瑕疵,揭示了主流Agent记忆框架高分背后的假象。
文章复盘了 Notion Custom Agents 功能三年间五次重写的架构演进与心路历程,深入探讨了模型与数据结构对齐、Evals 体系构建以及 Coding Agent 是通往 AGI 核心等关键技术观点。
文章回顾了Docker Hardened Images发布一年的成果,阐述了其通过开源、多发行版支持、从源码构建及SLSA 3级认证等技术决策,致力于降低安全门槛并避免供应商锁定。
文章深入剖析了 Hermes Agent 的核心技术创新——Skills 闭环系统,详细阐述了该系统如何通过经验提取、双层缓存索引、条件激活及安全验证机制,实现 AI Agent 的自我进化与知识复用。
文章详细阐述了京东科技OpenClaw Agent系统的架构设计,重点解析了Agent与Skill的协同机制、主子Agent架构及生产级容错策略。
文章记录了全球首届具身智能真机黑客松的专家论坛,深入探讨了机器人开源生态、VLA模型挑战、数据稀缺解决方案及商业化落地路径等核心议题。
文章详细介绍了Guidesly如何利用AWS服务(如Lambda、Step Functions、Bedrock和SageMaker)构建端到端的AI系统Jack AI,自动将户外导游的原始行程数据转化为营销内容。
本文展示了在AWS Trainium上利用vLLM和推测解码技术加速Qwen3模型推理的实践基准测试,证明该方法能将解码密集型工作负载的Token生成速度提升至3倍,有效降低成本并提高硬件利用率。
文章介绍了一种基于 CLI 的 AI 写作工作流,通过将散落在飞书和 YouMind 中的上下文以及作者的审美判断具象化,构建了一条高效的人机协作内容生产线。
文章介绍了Lean AI(精益AI)这一新品类,分析了在AI降低创业门槛的背景下,传统VC模式的失效原因及新的评估与投资方法论。
文章详细介绍了 Anthropic 发布的 Claude Managed Agents 产品,该产品将 Harness 工程理念转化为托管服务,旨在解决 AI Agent 从原型到生产过程中的基础设施难题。
文章以 Coding Agent 的成功经验为参照,分析了 OpenClaw 等 Agent 在生产环境落地的难点,提出必须重构业务环境,使其具备可视化、封闭性、可验证性和可回滚性。
百度文心团队开源了8B参数的文生图模型ERNIE-Image,支持24GB显存消费级显卡运行,在复杂指令跟随和文字渲染上达到开源SOTA水平。
文章深度解读了斯坦福大学HAI发布的2026年度AI Index报告,揭示了AI能力飞速发展与监管、透明度及信任滞后之间的巨大裂痕。
文章深入分析了Google在AI Agent Harness层缺位的现状,指出其在产品编排上落后于Claude Code等竞品,但通过TPU算力基础设施和战略布局,Google选择了一条不同的AI发展路径。
文章通过类比游戏发展史和技术演进,详细阐述了AI交互方式从Prompt Engineering、Context Engineering到Harness Engineering的三个阶段变化,深入探讨了如何通过架构约束和反馈机制来驾驭自主AI Agent。
文章分析了2026年斯坦福健康创新峰会,指出医疗正从依赖专家经验转向由模型、数据与监管驱动的工程系统,重点探讨了新药研发的工程化、AI作为临床主体的趋势以及医院边界的重组。
GitHub联合创始人Scott Chacon创立GitButler,旨在为AI Agent时代重构版本控制系统,解决传统Git在并行开发和AI协作上的局限。
文章深入探讨了影石Insta360如何利用十年积累的全景数据优势,在纯视觉深度预测、仿真平台及端侧AI部署等方面取得突破,并开源了4篇顶会论文的核心算法。
OpenAI CRO内部信泄露,直指竞争对手Anthropic营收虚高80亿并批评其算力与战略,同时透露OpenAI新模型Spud及企业级AI布局。
文章深入对比了开源 Agent 框架 Hermes 与 OpenClaw 的技术差异,指出 Hermes 凭借自进化 Skill、主动记忆和确定性工程规则实现了体验领先,但也剖析了其在复杂场景下的局限性。
文章详细介绍了得物基于Transformer的生成式召回技术落地方案,通过预测用户下一点击与联合训练机制,有效解决了信息茧房问题并提升了核心业务指标。
李飞飞团队World Labs发布开源渲染引擎Spark 2.0,通过LoD、流式加载及GPU虚拟内存技术,实现在手机浏览器流畅渲染亿级粒子3D场景。
文章介绍了如何在 Amazon SageMaker HyperPod 上运行推理的最佳实践,重点讲解了集群部署、结合 KEDA 和 Karpenter 的自动扩缩容架构、以及 KV 缓存和智能路由等性能优化技术。
文章基于Claude Code泄露的源码,深度剖析了Rules、MCP和Skills三者的底层实现机制,指出其本质区别在于API请求中信息位置的不同。
文章介绍了快手技术团队在QCon北京2026大会上的五大议题,涵盖Agent重塑风控、BI+AI实践、Feature Flag治理、前端性能优化及RCA Agent排障,深入探讨了AI在具体业务场景中的工程化落地路径。
文章深入分析了GEO(生成式引擎优化)行业的现状与乱象,区分了黑产“AI投毒”与正规GEO的本质差异,并介绍了360智见通过构建企业知识图谱、重构信源和建立D.A.R.T评估模型来打造AI时代营销基础设施的实践。
腾讯研究院发布的关于中国青年网民对AI社交看法与使用行为的调研报告,揭示了AI社交已全面渗透青年生活,用户在情感陪伴、社交辅助及数字分身等方面表现出接纳与依赖并存的态度。
文章详细介绍了巴西医疗网络 Rede Mater Dei 如何利用 Amazon Bedrock AgentCore 部署并监控一套由12个AI代理组成的系统,以优化收入周期管理并实现了显著的ROI。
文章通过采访硅谷空间智能领域的两位专家,探讨了世界模型与空间智能技术在智能驾驶及座舱中的应用,并结合吉利全域AI2.0战略,展示了AI理解物理世界的工程化落地实践。
文章介绍了Spring AI的新Session API,该API通过事件溯源和上下文压缩策略替代ChatMemory,为智能体提供了结构化的短期记忆管理、多代理分支隔离及历史回溯功能。
文章深入分析了生数科技发布的视频大模型 Vidu Q3,重点介绍了其「参考生视频」功能和「声画同出」能力,展示AI如何从单一素材生成转向剧组级别的工业化内容生产。
文章详述了OpenAI高管遭遇极端分子袭击的事件,以此引出AI技术飞速发展所引发的社会焦虑、就业恐慌以及日益激化的现实冲突。
AWS推出了生成式AI Path-to-Value (P2V)框架,旨在帮助企业克服技术、组织和治理挑战,将生成式AI项目从概念验证转化为具有持久商业价值的生产系统。
文章分析了加拿大独立开发者Steve Hanov如何利用Go、SQLite和VPS等低成本技术栈,在$20月开销下实现$60,000+营收,并探讨了其反直觉的技术选型与商业策略。
生数科技发布Vidu Q3版本,主打“参考生视频”功能,实现了万物皆可参考、声画同出的影视级内容生成,旨在将AI视频制作推向工业化生产阶段。
本文专访了硅谷创业公司CREAO的创始人,探讨了其Agent OS产品如何实现工作自动化,以及AI Native开发模式下的组织变革与效率提升。
文章深入探讨了Agent Memory架构的本质,指出其核心难点在于治理而非容量,并提出了包含用户、任务、世界、自我四层模型的记忆架构设计。
文章通过分析OpenClaw框架的安全漏洞,阐述了在AI Agent时代传统IAM的失效原因,并提出身份传播、无秘钥验证、上下文感知和意图感知四大核心安全要素。
文章探讨了AI编程工具对软件开发行业的双重影响,一方面提升了资深开发者的效率与热情,另一方面引发了关于代码质量退化及开发者技能萎缩的担忧。
本文通过《龙虾使用指北》收录了OpenClaw活动的7个代表性案例,展示了AI Agent在硬件交互、团队协作、视频生成及社交等场景的创新应用,探讨了人机协作的新模式。
Anthropic 重构 Claude Code 并发布云端自动化功能 Routines,支持通过 API、GitHub 事件和定时任务让 AI 智能体在后台自动执行代码审查、Bug 修复等工作。
文章介绍了MOVA发布的V70 Ultra扫地机器人,该产品首创16cm外扩超级机械臂及0耗材集尘仓技术,试图通过机械结构与AI结合突破清洁死角。
这是一篇汇总汽车交通领域每日资讯的文章,涵盖了问界M6发布、日本进口车销量数据、丰田与五十铃合作以及优步投入无人驾驶等行业动态。
文章汇总了近期智能制造领域的资讯,涵盖亚马逊卫星天线发布、全球首个具身智能工业产线落地、中科曙光AI4S计算集群建成及我国成功发射一箭八星等新闻。
文章分析了ASML 2026年Q1财报数据,指出受AI基建投资驱动,存储厂商大举采购EUV光刻机,导致营收超出预期,但同时面临出口管制导致中国市场下滑的挑战。
这是一篇涵盖Lululemon涉嫌致癌调查、阿里巴巴AI战略转型、高德机器狗发布、段永平评论泡泡玛特等科技商业新闻的早报。
中国人工智能学会牵头,中国人民大学高瓴人工智能学院与英博数科签约启动“高校学院算力支持计划”,旨在通过校企合作加强高校智能算力基础设施建设与人才培养。
文章汇总了快看漫画AI布局、千问表格Agent、OpenRouter新模型及高德具身机器人等当日AI行业热点新闻。
文章报道了Meta员工开发内部AI Token使用排行榜引发的“刷Token”竞赛及争议,并探讨了硅谷将Token使用量作为工程师绩效指标的趋势。
文章分析了 Anthropic 的 Claude Mythos 和 OpenAI 的 Spud 及 GPT-5.4-Cyber 尚未发布即引发舆论热潮的现象,批判了厂商利用“太危险”进行饥饿营销的策略,并指出这种氛围引发了业界的“AI精神病”式焦虑。
文章探讨了OpenAI与Anthropic在AI安全领域的竞争,重点分析了OpenAI发布的GPT-5.4-Cyber模型及其在网络安全防御中的应用策略。
文章介绍了Chrome上线的'Skills'新功能,旨在通过Agent化技术实现技能的一键复用,帮助用户自动处理浏览器任务。
文章评测了两款数码产品:未来视野 RV100mini 升级版显示器和 GL iNet MT6000 路由器,分享了作者的实际使用体验、优缺点分析及购买建议。