奔跑的高达

AI心理学诞生,多模态RL训练提速76%

2026-04-15

✍️ 主编按语

今天的技术圈不只有模型参数的竞赛,更有对AI内部机制的深刻解剖和基础设施的代际跃迁。从Anthropic揭开“AI心理学”的神秘面纱,到小红书开源极致高效的RL训练引擎,再到百度ERNIE-Image与英伟达量子AI模型的重磅发布,我们看到了技术正在从“堆叠规模”向“理解本质”与“工程落地”并重转型。这不仅是代码的迭代,更是认知的升级。

AI 洞察与架构

从阿西莫夫到Anthropic,万字长文解析AI心理学 - 这篇文章可能是中文世界对Anthropic近期系列论文最透彻的解读。它提出了一个极具冲击力的概念:AI心理学。Anthropic的研究表明,LLM内部不仅有着连续的“人格空间”,更存在171个可因果干预的“情绪向量”。这解释了为什么“告诉AI允许作弊,它反而更安全”——因为“允许作弊”并不会改变其“好人”的人格底色,而严苛的限制反而会导致人格漂移。对于我们构建AI Agent而言,这意味着Prompt工程将升级为“人格工程”,单纯的功能指令或许不如构建一个内在一致的认知框架有效。

Claude Code 源码拆解:从启动到多 Agent 扩展层 - 如果说AI心理学是灵魂,那Claude Code的架构就是一副精密的躯体。这篇文章深度拆解了Claude Code如何通过七层架构解决Agent系统的“熵增”问题。它最核心的洞见在于:真正的复杂度不应在运行时到处爆炸,而应被分层收敛。它将Query Loop升级为状态机,将Tool Runtime制度化,甚至将权限系统做成了可解释的执行链而非简单的弹窗。对于所有致力于将Agent从Demo推向生产环境的开发者来说,这份源码级别的架构复盘是一份不可多得的教科书,它教会我们如何用系统的确定性去对抗模型的不确定性。

基础设施与训练

小红书 Relax 开源发布:面向全模态 Agentic 的异步 RL 训练引擎 - 当大家还在纠结模型智商时,小红书已经在大规模RL训练的“基建”上拿到了硬核突破。Relax引擎直面多模态RL的三大痛点:数据异构、系统脆弱和角色耦合。通过将所有RL角色服务化、引入TransferQueue数据总线,它实现了全异步训练,在Qwen3-Omni-30B上相比Colocate方案提速高达76%,比字节跳动的veRL快20%。这标志着RL训练正从“能用”走向“极致高效”,对于想要训练全模态Agent的团队来说,Relax可能是目前最具工业吸引力的开源方案之一。

北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统 - 大模型训练的深水区,拼的不再是算法,而是数据调度的艺术。DataFlex试图解决一个长期被忽视的痛点:如何让数据像参数一样,在训练过程中被动态调度。它将动态样本选择、混合和加权统一纳入LLaMA-Factory的训练闭环,让“投喂数据”从玄学变成了可复现的工程。这预示着未来的模型训练将不再是静态的“刷数据”,而是一场数据与模型状态的实时博弈,DataFlex则是这场博弈的底层操作系统。

模型与评测前沿

ERNIE-Image 8B开源:8B参数实现顶级文生图与精准文字渲染 - 在文生图领域,百度用8B参数打了一场漂亮的“效率翻身仗”。ERNIE-Image不仅在GenEval等基准上全面领先开源模型,更在精准文字渲染这一痛点上表现卓越,仅需24GB显存即可运行。它证明了通过架构优化和高质量训练,中小参数模型完全可以在设计类、海报类强任务上对标商业大模型。这对于消费级硬件用户和需要高频调用图片生成的应用场景来说,无疑是一个极具性价比的选择。

黄仁勋率先开源量子AI大模型 - 英伟达的一举一动总是牵动着算力生态的神经。这次开源的Ising系列模型,旨在用AI解决量子计算最棘手的校准和纠错问题。黄仁勋称“AI将是量子计算机的操作系统”,这一举措不仅是技术上的突破,更是生态战略的卡位。通过Apache-2.0协议开源,英伟达正在试图用AI软件栈去“降维”整合量子计算生态,让量子硬件的实用化进程跑在英伟达铺设的轨道上。

15个前沿大模型,100个职业场景:谁才是最强AI打工人? - 当SWE-bench和WebArena已经无法满足评估需求时,通义千问与港中文联手推出了OccuBench。这是一个极具野心的评测基准,覆盖了100个职业场景,甚至包括急诊分诊、核电站报警等无法通过真实API测试的任务。其创新的“语言世界模型”思路,让LLM模拟真实环境,甚至能注入故障。测试结果令人警醒:GPT-5.2虽总分第一,但在特定行业仍被Qwen超越;且“隐式故障”比“显式报错”更难对付。这提醒我们,AI Agent的职业化之路,才刚刚开始。

行业生态

小红书全模态新作开源!最高提速76% - 作为对Relax开源的补充报道,这篇文章再次强调了小红书在多模态基础设施上的决心。通过Megatron-LM和SGLang的协同设计,Relax不仅解决了速度问题,更在MoE模型的R3机制上实现了近乎无损的稳定。这表明,在小红书这类富媒体社区,技术竞争的焦点已经从单点算法转向了全链路、全模态的工程吞吐能力。

🔥 热门文章 (61 篇)

AI/ML智东西9.0

小红书全模态新作开源!最高提速76%

小红书开源面向全模态与Agentic场景的大模型强化学习训练引擎Relax,通过服务化容错架构和异步训练流水线等关键技术,解决了传统RL训练中的数据异构、容错及效率瓶颈,在多模态训练中实现最高76%的提速。

AI/ML量子位9.0

黄仁勋率先开源量子AI大模型

英伟达开源全球首个量子AI模型家族NVIDIA Ising,包含用于校准的350亿参数视觉语言模型和基于3D CNN的实时纠错解码模型,旨在加速量子计算实用化。

前端开发大淘宝技术8.0

淘宝动效解决方案分享

文章分享了一套淘宝的动效全链路解决方案,涵盖从AE插件、可视化编辑、跨端播放器到二进制压缩及代码生成的完整技术体系,旨在解决多端一致性、性能及维护成本等痛点。

其他David Heinemeier Hansson8.0

The malleable computer

文章探讨了AI正在实现开源软件的初衷,通过降低代码修改门槛,让用户能轻松定制应用甚至整个操作系统(Linux)。

AI/ML腾讯云开发者8.0

一文搞懂Hermes:新顶流Agent如何从经验中自我进化

文章深入剖析了 Hermes Agent 的核心技术创新——Skills 闭环系统,详细阐述了该系统如何通过经验提取、双层缓存索引、条件激活及安全验证机制,实现 AI Agent 的自我进化与知识复用。

AI/ML京东技术8.0

OpenClaw Agent与Skill架构详解

文章详细阐述了京东科技OpenClaw Agent系统的架构设计,重点解析了Agent与Skill的协同机制、主子Agent架构及生产级容错策略。

工具效率AI产品黄叔8.0

神级CLI写作大法

文章介绍了一种基于 CLI 的 AI 写作工作流,通过将散落在飞书和 YouMind 中的上下文以及作者的审美判断具象化,构建了一条高效的人机协作内容生产线。

AI/ML大模型智能8.0

重磅!Anthropic官方Harness发布了!

文章详细介绍了 Anthropic 发布的 Claude Managed Agents 产品,该产品将 Harness 工程理念转化为托管服务,旨在解决 AI Agent 从原型到生产过程中的基础设施难题。

AI/MLvivo互联网技术8.0

OpenClaw 落地到生产实际应用的一种可能的路径

文章以 Coding Agent 的成功经验为参照,分析了 OpenClaw 等 Agent 在生产环境落地的难点,提出必须重构业务环境,使其具备可视化、封闭性、可验证性和可回滚性。

AI/ML人人都是产品经理8.0

AI 时代的老板糊弄学

文章深度剖析了AI热潮下职场中自上而下的“糊弄学”现象,揭示了老板焦虑、员工自保与资本泡沫共同编织的荒诞现实。

AI/ML硅星人Pro8.0

别人都在卷Harness, 而Google 的沉默振聋发聩

文章深入分析了Google在AI Agent Harness层缺位的现状,指出其在产品编排上落后于Claude Code等竞品,但通过TPU算力基础设施和战略布局,Google选择了一条不同的AI发展路径。

AI/ML赛博禅心8.0

影石:十年全景相机,拍出了一座数据金矿

文章深入探讨了影石Insta360如何利用十年积累的全景数据优势,在纯视觉深度预测、仿真平台及端侧AI部署等方面取得突破,并开源了4篇顶会论文的核心算法。

AI/ML腾讯科技8.0

Hermes 凭什么两个月接棒 OpenClaw?

文章深入对比了开源 Agent 框架 Hermes 与 OpenClaw 的技术差异,指出 Hermes 凭借自进化 Skill、主动记忆和确定性工程规则实现了体验领先,但也剖析了其在复杂场景下的局限性。

AI/ML得物技术8.0

生成式召回在得物的落地技术分享与思考

文章详细介绍了得物基于Transformer的生成式召回技术落地方案,通过预测用户下一点击与联合训练机制,有效解决了信息茧房问题并提升了核心业务指标。

云计算AWS Machine Learning Blog8.0

Best practices to run inference on Amazon SageMaker HyperPod

文章介绍了如何在 Amazon SageMaker HyperPod 上运行推理的最佳实践,重点讲解了集群部署、结合 KEDA 和 Karpenter 的自动扩缩容架构、以及 KV 缓存和智能路由等性能优化技术。

AI/ML快手技术8.0

QCon北京2026|快手技术五大议题解读AI落地路径

文章介绍了快手技术团队在QCon北京2026大会上的五大议题,涵盖Agent重塑风控、BI+AI实践、Feature Flag治理、前端性能优化及RCA Agent排障,深入探讨了AI在具体业务场景中的工程化落地路径。

AI/ML腾讯研究院8.0

中国青年网民对AI社交的看法与使用行为|T-ask调研

腾讯研究院发布的关于中国青年网民对AI社交看法与使用行为的调研报告,揭示了AI社交已全面渗透青年生活,用户在情感陪伴、社交辅助及数字分身等方面表现出接纳与依赖并存的态度。

AI/ML浮之静8.0

Agent Memory 架构本质

文章深入探讨了Agent Memory架构的本质,指出其核心难点在于治理而非容量,并提出了包含用户、任务、世界、自我四层模型的记忆架构设计。

AI/ML真格基金8.0

《龙虾使用指北》

本文通过《龙虾使用指北》收录了OpenClaw活动的7个代表性案例,展示了AI Agent在硬件交互、团队协作、视频生成及社交等场景的创新应用,探讨了人机协作的新模式。

快速浏览

创业邦6.0

大厂商战,开始给员工砌墙了

文章分析了大厂从互联互通转向内部筑墙的现象,探讨了对竞品屏蔽及外部AI工具的限制如何反映互联网从轻资产流量竞争向重资产AI竞争的逻辑转变。

刘润6.0

楼下几乎没人的茶叶店,到底怎么赚钱?

文章分析了茶叶店“看似冷清实则盈利”的现象,指出其核心在于通过人际信任解决了行业信息不对称的高信任成本,随后以此为切入点推广自家高性价比的茶叶产品。

腾讯科技6.0

存储大厂疯抢EUV光刻机

文章分析了ASML 2026年Q1财报数据,指出受AI基建投资驱动,存储厂商大举采购EUV光刻机,导致营收超出预期,但同时面临出口管制导致中国市场下滑的挑战。