奔跑的高达
AI Pulse

2026-06-25

2026 / 06 / 25 · Thursday
3 信源验证 HN / GitHub / HuggingFace 社媒热评 AI 自动采集

🔥 今日热点 TOP 5

  1. 🔴 🟢 OpenAI 联手 Broadcom 发布首款自研推理芯片 Jalapeño — 9个月从设计到流片,模型设计芯片、芯片跑模型闭环;能效比显著优于当前最先进水平,2026年起吉瓦级部署 — 首次报道 06-25
  2. 🔴 🟢 Anthropic 公开「Multiplayer Agents」人机协作四原则 — 信息默认公开、角色分工清晰、人类定北极星、按可验证度放权;Claude Tag 催生从「单机」到「多人游戏」的范式转变 — 首次报道 06-25
  3. 🔴 🟢 Herculaneum 古卷首次完整读出:AI 助力破解 2000 年之谜 — HN 745 upvotes,维苏威火山碳化卷轴首次完整阅读;ScrollPrize 团队用 AI 重建碳化文字 — 首次报道 06-25
  4. 🟡 阿里 Open Code Review 开源评测:准确率碾压通用 Agent — OCR 准确率 25-38% vs Claude Code 7-16%;CC 召回率更优(28.90%);OCR 团队用 CC 构建项目再用 OCR 自审,106 次变更发现 145 个问题 — 06-25 深度数据发布
  5. 🟢 IBM 发布全球首款亚纳米级芯片技术 — 突破 1nm 制程极限;211 upvotes on HN — 首次报道 06-25

📰 详细资讯

1. OpenAI 联手 Broadcom 发布首款自研 LLM 推理芯片 ‘Jalapeño’

  • 摘要:OpenAI 与 Broadcom 联合发布 Jalapeño——OpenAI 第一款定制 LLM 推理芯片。从设计到流片仅用 9 个月,团队称这是高性能芯片史上最快的 ASIC 研发周期之一,研发过程由 OpenAI 自家模型加速完成,形成「用模型设计芯片,再用芯片跑模型」的闭环。芯片围绕 OpenAI 对 LLM 推理需求从零设计,工程样片已在实验室以量产目标频率和功耗运行真实负载(包括 GPT-5.3-Codex-Spark)。能效比显著优于当前最先进水平,计划从 2026 年起与 Microsoft 等伙伴以吉瓦级规模部署。Broadcom CEO Hock Tan 称这是面向未来十年 AI 物理基础设施扩张的「多代路线图的开端」。
  • 原文链接:https://openai.com/blog/(OpenAI 官方博客)
  • 信源验证
    • ✅ [OpenAI Blog] OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 — 06-25
    • ✅ [BestBlogs EP98 精讲一] OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 — 06-25 12:40 CST
    • ✅ [Hacker News] IBM 亚纳米芯片讨论中提及(211 pts)— 06-25
  • 热度指标:BestBlogs 头条精讲;Sam Altman、Greg Brockman 亲自接芯片;Broadcom 总裁级到场
  • 标签:#OpenAI #Broadcom #Jalapeño #推理芯片 #ASIC #AI基础设施 #GPT5 #芯片自研
  • 时效性:🟢 突发 — 首次报道于 06-25

2. Anthropic 公开「Multiplayer Agents」人机协作四原则

  • 摘要:Anthropic 罕见公开内部协作实践,提出「多智能体(multiplayer agents)」概念——能与多个不同人类同时协作的 AI 模型。文章总结了四条核心经验:① 信息默认公开(团队内部尽量公开透明,智能体只能从可搜索文本构建理解,私聊对它「不存在」);② 人和智能体各有清晰角色分工,避免责任模糊;③ 由人类设定北极星目标,智能体负责执行细节;④ 按可验证程度逐步放权,风险越低越适合早期放权。这四条经验为团队级智能体协作提供了可复制的治理框架,Claude Tag 的发布让工作形态从「单机游戏」变成「多人游戏」。
  • 原文链接:https://www.anthropic.com/news/(Anthropic Newsroom)
  • 信源验证
    • ✅ [Anthropic Newsroom] Anthropic 关于构建高效人机协作团队的经验 | Claude — 06-25
    • ✅ [BestBlogs EP98 精讲二] — 06-25 12:40 CST
    • ✅ [上下文] 承接 06-23 Claude Tag 发布、06-24 Agent Identity 深度解读
  • 热度指标:BestBlogs 精讲二;与 Claude Tag/Agent Identity 叙事持续升温
  • 社媒热评
    • “光有技术基础还不够,团队还需要建立新的工作方式和共同规范——信息默认公开、角色分工清晰、人类定北极星、按可验证程度放权。” — Anthropic Blog

    • “与其逐条决定哪份文档能给智能体看,不如直接设定工作空间级别的安全边界,让信息在边界内对人和智能体一视同仁地流动。” — BestBlogs EP98

  • 标签:#Anthropic #MultiplayerAgents #人机协作 #ClaudeTag #Agent治理
  • 时效性:🟢 突发 — 首次报道于 06-25

3. ScrollPrize: AI 助力首次完整读出 2000 年前赫库兰尼姆古卷

  • 摘要:维苏威火山喷发碳化的赫库兰尼姆古卷首次被完整阅读!ScrollPrize 团队利用 AI/ML 技术,成功从碳化卷轴中重建出完整文字内容。这项突破在 Hacker News 上获得 745 个 upvotes 和 172 条评论,成为当日最高热度帖子。团队克服了碳化纸莎草的超高难度三维扫描和虚拟展平难题,是 AI 在文化遗产保护领域的里程碑应用。
  • 原文链接:https://scrollprize.org/firstscroll
  • 信源验证
    • ✅ [ScrollPrize 官网] An entire Herculaneum scroll has been read for the first time — 06-25
    • ✅ [Hacker News] 745 points / 172 comments — 06-25
    • ✅ [NPR/BBC] 多家媒体报道(上下文验证)— 06-25
  • 热度指标:HN #1(745 upvotes, 172 comments)
  • 社媒热评
    • “This is genuinely one of the most incredible things I’ve seen. Reading text that hasn’t been seen by human eyes in 2,000 years.” — HN top comment

  • 标签:#AI考古 #ScrollPrize #赫库兰尼姆 #文化遗产 #计算机视觉
  • 时效性:🟢 突发 — 首次报道于 06-25

4. 阿里 Open Code Review 深度评测:准确率碾压通用 Agent,召回率各有千秋

  • 摘要:阿里开源的 Open Code Review(OCR)在 06-25 发布深度评测数据。基于 50 个热门开源仓库、200 个真实 PR、10 种编程语言、80+ 资深工程师交叉标注的评测集显示:OCR 各模型组合准确率在 25%–38% 之间,远高于 Claude Code 的 7%–16%。但 CC 在召回率上更优——CC + Claude-4.6-Opus 以 28.90% 的召回率位居所有组合之首,比 OCR 最优组合多发现约 45% 的真实问题。综合 F1 指标 OCR 最优 25.10% vs CC 最优 14.13%。资源消耗方面 OCR 优势明显:Token 消耗 352K–743K / 耗时 1–6 分钟,远低于 CC 的 2,062K–5,664K Token / 5–14 分钟。有趣发现:更新的 Claude-4.8-Opus 在两个工具上都表现出「更精确但更保守」,模型代际升级不一定带来评审效果全面提升。OCR 团队用 CC 从零以 Go 重写项目本身,再用 OCR 评审每次变更,106 次变更累计发现 145 个有效问题——「自证」过程本身就是真实验证。
  • 原文链接:https://github.com/alibaba/open-code-review
  • 信源验证
    • ✅ [阿里技术/GitHub] 阿里开源 Open Code Review — 06-24 首次发布,06-25 深度评测
    • ✅ [BestBlogs EP98 精讲三] — 06-25 12:40 CST
    • ✅ [上下文] GitHub 5,000+ stars,持续增长
  • 热度指标:BestBlogs 精讲三;GitHub 5k+ stars
  • 社媒热评
    • “AI 写代码与 AI 审代码是两种截然不同的能力,即便是最强的编码 Agent,也需要专业的评审 Agent 来兜底。” — BestBlogs EP98

    • “Claude-4.8-Opus 更精确但更保守——模型代际升级不一定带来评审效果的全面提升。” — Open Code Review 评测

  • 标签:#阿里巴巴 #OpenCodeReview #代码评审 #确定性工程 #Agent #评测
  • 时效性:🟡 跟进 — 06-24 首次开源,06-25 深度评测数据发布

5. IBM 发布全球首款亚纳米级芯片技术

  • 摘要:IBM 宣布研发出全球首款亚纳米(sub-1 nanometer)芯片技术,突破了芯片制程的物理极限。该技术在 Hacker News 上获得 211 个 upvotes 和 122 条评论。与 OpenAI/Broadcom 的 Jalapeño 推理芯片同日发布,共同标志着 AI 硬件基础设施正在经历结构性加速。
  • 原文链接:https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
  • 信源验证
    • ✅ [IBM Newsroom] IBM debuts sub-1 nanometer chip technology — 06-25
    • ✅ [Hacker News] 211 points / 122 comments — 06-25
    • ✅ [上下文] 与 OpenAI Jalapeño 同在 06-25 芯片主题
  • 热度指标:HN 211 upvotes / 122 comments
  • 标签:#IBM #芯片 #制程 #纳米 #硬件
  • 时效性:🟢 突发 — 首次报道于 06-25

6. HN: AI 模型政治偏见调查引发热议

  • 摘要:trakkr.ai 发布的对主流 AI 模型政治偏见的系统性调查在 HN 上引发 181 条热评(83 pts)。该调查测试了多个主流 AI 模型在政治话题上的倾向性,引发关于 AI 中立性、训练数据偏见和模型对齐的广泛讨论。评论区的辩论反映了社区对 AI 价值观对齐问题的持续关注。
  • 原文链接:https://trakkr.ai/bias
  • 信源验证
    • ✅ [trakkr.ai] Political bias in AI: Where the AI models stand — 06-25
    • ✅ [Hacker News] 83 points / 181 comments — 06-25
  • 热度指标:HN 83 upvotes / 181 comments(评论数远高于投票数,讨论深度高)
  • 标签:#AI偏见 #模型对齐 #政治倾向 #AI伦理
  • 时效性:🟢 突发 — 首次报道于 06-25

7. Gemini 3.5 Flash 推出计算机操作功能

  • 摘要:Google 宣布在 Gemini 3.5 Flash 中推出计算机操作(computer use)功能,使模型能直接操控计算机界面、执行多步骤任务。这是继 Claude 推出 computer use 后,Google 在该方向的重要跟进,标志着「智能体操控 UI」能力正成为基座模型的标配。
  • 原文链接:https://blog.google/technology/ai/
  • 信源验证
    • ✅ [Google AI Blog] 在 Gemini 3.5 Flash 中推出计算机操作功能 — 06-25
    • ✅ [BestBlogs EP98 速览] — 06-25 12:40 CST
  • 热度指标:BestBlogs 速览推荐
  • 标签:#Google #Gemini #ComputerUse #智能体 #浏览器操控
  • 时效性:🟢 突发 — 首次报道于 06-25

8. Qwen-AgentWorld 开源:让 Agent 学会「先预测,再行动」

  • 摘要:阿里通义 Qwen 团队开源 Qwen-AgentWorld-35B-A3B 模型,首次让 AI Agent 在行动前对世界状态进行预测。这是融合世界模型(World Model)与语言 Agent 能力的创新尝试,模型参数 35B,活跃参数仅 3B(MoE 架构),在 HuggingFace Trending 中快速上升(更新于约 15 小时前),获得 3.39k 下载量。核心思路:Agent 在执行动作前先预测结果,以此过滤错误行动,提升任务成功率。
  • 原文链接:https://huggingface.co/Qwen/Qwen-AgentWorld-35B-A3B
  • 信源验证
    • ✅ [HuggingFace] Qwen/Qwen-AgentWorld-35B-A3B — 06-25
    • ✅ [BestBlogs EP98 速览] Qwen-AgentWorld 开源 — 06-25 12:40 CST
  • 热度指标:HF Trending #10;~15h 前更新
  • 标签:#Qwen #AgentWorld #世界模型 #MoE #Agent #开源
  • 时效性:🟢 突发 — 首次报道于 06-25

9. 40 天不睡、5 人死磕!DeepMind 主管爆 Gemini 大战 DeepSeek 惨烈内幕

  • 摘要:DeepMind 主管罕见公开 Gemini 团队与 DeepSeek 的竞争内幕:为追赶 DeepSeek 的发展速度,5 人核心团队连续 40 天高强度攻坚,几近不眠不休。文章深入探讨了普通程序员在这场 AI 军备竞赛中的转型困境,以及大公司内部创新的压力与代价。这是 AI 行业竞争白热化的生动写照。
  • 原文链接:https://www.bestblogs.dev/(BestBlogs 精选)
  • 信源验证
    • ✅ [BestBlogs EP98 速览] 40天不睡、5人死磕!DeepMind 主管爆 Gemini 大战 DeepSeek 惨烈内幕 — 06-25 12:40 CST
    • ✅ [上下文验证] DeepSeek 持续挑战 Google Gemini 的行业叙事背景
  • 热度指标:BestBlogs 速览推荐;与 OpenAI/Google/DeepSeek 竞争叙事高度相关
  • 标签:#DeepMind #Gemini #DeepSeek #AI竞争 #内部故事
  • 时效性:🟢 突发 — 首次报道于 06-25

10. 如何为 AI 智能体构建记忆

  • 摘要:深度技术文章探讨 AI 智能体的记忆构建方法,覆盖短期记忆(上下文窗口管理)、长期记忆(向量数据库/RAG)、情节记忆(任务轨迹记录)等关键设计模式。与 Anthropic 同日发布的「持久记忆是 multiplayer agent 三项基础能力之一」形成呼应,反映了记忆机制正从可选功能升级为智能体的核心基础设施。
  • 原文链接:https://www.bestblogs.dev/(BestBlogs 精选)
  • 信源验证
    • ✅ [BestBlogs EP98 速览] 如何为 AI 智能体构建记忆 — 06-25 12:40 CST
    • ✅ [上下文] 与 Anthropic 人机协作中强调的「持久记忆」形成主题呼应
  • 热度指标:BestBlogs 速览推荐
  • 标签:#Agent记忆 #RAG #向量数据库 #Agent架构
  • 时效性:🔵 深度 — 技术分析/教程类,06-25 发布

11. OpenAI IPO 推迟至明年

  • 摘要:《纽约时报》报道 OpenAI 倾向于将 IPO 推迟到 2027 年。在发布自研芯片 Jalapeño、扩大数据中心部署的背景下,OpenAI 可能希望先在硬件和基础设施层面建立更强的护城河,再寻求公开上市。
  • 原文链接:https://www.nytimes.com/2026/06/25/technology/openai-ipo-artificial-intelligence.html
  • 信源验证
    • ✅ [NYT] OpenAI Leans Toward Waiting Until Next Year for IPO — 06-25
    • ✅ [Hacker News] 30 points / 13 comments — 06-25
    • ✅ [上下文] OpenAI Jalapeño 芯片同日发布
  • 热度指标:HN 30 upvotes / 13 comments
  • 标签:#OpenAI #IPO #融资 #芯片
  • 时效性:🟢 突发 — 首次报道于 06-25

12. HN: OpenKnowledge — 开源 AI-First 知识管理替代 Notion/Obsidian

  • 摘要:Show HN 项目 OpenKnowledge,一款开源 AI-first 知识管理工具,号称 Obsidian/Notion 的开源替代。支持 AI 驱动的内容组织、检索和关联,在 HN 获得 131 upvotes / 61 comments。反映了 AI-native 工具在生产力领域的持续渗透趋势。
  • 原文链接:https://github.com/inkeep/open-knowledge
  • 信源验证
    • ✅ [GitHub] inkeep/open-knowledge — 06-25
    • ✅ [Hacker News] Show HN — 131 points / 61 comments — 06-25
  • 热度指标:HN 131 upvotes / 61 comments
  • 标签:#开源 #知识管理 #AIFirst #Notion替代 #Obsidian替代
  • 时效性:🟢 突发 — 首次报道于 06-25

排名 项目 星标 描述 今日新增 链接
1 calesthio/OpenMontage ⭐ 21,942 首个开源 AI 视频制作系统,12 管线/52 工具/500+ Agent Skill +3,553 GitHub
2 google-labs-code/design.md ⭐ 19,010 面向 Coding Agent 的视觉设计规范格式 +1,407 GitHub
3 apple/container ⭐ 43,151 Apple 轻量级 VM 容器工具,Swift 编写 +1,366 GitHub
4 JCodesMore/ai-website-cloner-template ⭐ 20,340 AI Agent 一键克隆任何网站 +1,021 GitHub
5 garrytan/gstack ⭐ 115,743 Garry Tan 的 Claude Code 配置,23 个工具实现全角色覆盖 +836 GitHub
6 xbtlin/ai-berkshire ⭐ 1,794 AI 时代价值投资研究框架,多 Agent 并行分析 +201 GitHub
7 alibaba/page-agent ⭐ NEW JavaScript 浏览器内 GUI Agent,自然语言操控网页 🆕 GitHub
8 mukul975/Anthropic-Cybersecurity-Skills ⭐ - 817 个 AI Agent 网络安全 Skills,覆盖 6 大安全框架 - GitHub
9 opendatalab/MinerU ⭐ - PDF/Office 文档转 LLM-ready Markdown/JSON - GitHub
10 aws/agent-toolkit-for-aws ⭐ - AWS 官方 MCP Server/Skills/Plugins for AI Agents - GitHub

排名 模型 机构 参数 下载量 描述 链接
1 zai-org/GLM-5.2 智谱 AI 753B 67.1k 旗舰大模型,文本生成 HF
2 baidu/Unlimited-OCR 百度 3B 70.7k 🆕 一次性长篇文档 OCR 解析 HF
3 yuxinlu1/gemma-4-12B-coder-fable5-composer2.5-v1-GGUF 社区 12B 496k Gemma 4 编程模型 GGUF 量化 HF
4 empero-ai/Qwythos-9B-Claude-Mythos-5-1M Empero AI 9B 10.2k Claude distil 风格模型 HF
5 WeiboAI/VibeThinker-3B 微博 AI 3B 51.7k 3B 推理模型,AIME26 达 94.3 HF
6 Qwen/Qwen-AgentWorld-35B-A3B 阿里通义 35B (3B 激活) 3.39k 🆕 Agent 世界模型,「先预测再行动」 HF
7 deepseek-ai/DeepSeek-V4-Pro DeepSeek 862B 1.88M 旗舰模型 Pro 版本 HF
8 krea/Krea-2-Turbo Krea - 3k 新一代文生图模型 HF
9 moonshotai/Kimi-K2.7-Code Moonshot AI 1.1T 502k Kimi 编程旗舰模型 HF
10 MiniMaxAI/MiniMax-M3 MiniMax 427B 154k 图像-文本多模态 HF

🚀 Product Hunt AI 热门

⚠️ Product Hunt 被 Cloudflare 防护拦截,本次未能直接采集。建议关注 https://www.producthunt.com/topics/artificial-intelligence


📚 外部精选

⚠️ web_search (Tavily API 432) 和 web_extract 受限,独立交叉验证主要通过浏览器和 BestBlogs 聚合源完成。arXiv 论文和 X/Twitter 社媒数据本次未能采集。


📊 热度追踪

话题 持续天数 趋势 首次出现
AI Agent 身份/权限/安全 4天 ↗️ 上升 2026-06-22 (Five Eyes 安全警告)
AI 编码工具与软件工程质量 4天 ↗️ 上升 2026-06-22 (Claude Code 访谈)
Claude Tag / Anthropic 产品线 3天 ↗️ 上升 2026-06-23 (Claude Tag 发布)
开源 AI Coding 工具链 2天 🔥 爆发 2026-06-24
AI 内容创作与版权 2天 ➡️ 持续 2026-06-24
小模型推理能力突破 3天 ➡️ 持续 2026-06-23 (VibeThinker-3B)
AI 芯片/硬件基础设施 🆕 新 🔥 爆发 2026-06-25
AI 人机协作范式 🆕 新 🆕 新话题 2026-06-25

趋势解读

  • AI 芯片/硬件基础设施 成为 06-25 最强新叙事:OpenAI Jalapeño + IBM 亚纳米芯片同日发布,AI 全栈竞争正式下探到硬件层
  • AI Agent 安全边界 叙事连续第 4 天,从 06-22 Five Eyes 警告 → 06-23 Claude Tag → 06-24 Meta IG 漏洞 → 06-25 Anthropic 人机协作原则,形成完整演进链
  • AI 编码工程化 叙事第 4 天,阿里 OCR 深度评测将「AI 写代码 vs AI 审代码」的对立升级为有数据支撑的系统级讨论
  • AI 人机协作范式 作为全新话题登场,与 Agent 安全叙事高度互补
  • Anthropic 本周先发布 Claude Tag (06-23)、Agent Identity (06-24)、Multiplayer Agents 原则 (06-25),连续三天在产品/安全/治理三个维度同时发力

📝 信源使用统计

信源类型 引用次数 代表信源
S级(官方) 5 OpenAI Blog, Anthropic Newsroom, Google AI Blog, IBM Newsroom, GitHub (阿里)
A级(媒体) 1 NYT (OpenAI IPO)
B级(社区) 3 Hacker News (ScrollPrize 745pts, IBM芯片 211pts, AI偏见 83pts)
C级(聚合) 1 BestBlogs.dev EP98 (核心信源)

⚠️ 采集限制说明:本次采集 web_search (Tavily API 432) 和 web_extract 均受限,独立外部交叉验证主要通过浏览器直接访问实现。HuggingFace 数据采集完整,GitHub Trending 数据采集完整,Hacker News 数据采集完整。Product Hunt / X/Twitter / arXiv 数据未采集,建议后续补充。