AI Pulse

2026-06-25

2026 / 06 / 25 · Thursday

3 信源验证 HN / GitHub / HuggingFace 社媒热评 AI 自动采集

🔥 今日热点 TOP 5

🔴 🟢 OpenAI 联手 Broadcom 发布首款自研推理芯片 Jalapeño — 9个月从设计到流片，模型设计芯片、芯片跑模型闭环；能效比显著优于当前最先进水平，2026年起吉瓦级部署 — 首次报道 06-25
🔴 🟢 Anthropic 公开「Multiplayer Agents」人机协作四原则 — 信息默认公开、角色分工清晰、人类定北极星、按可验证度放权；Claude Tag 催生从「单机」到「多人游戏」的范式转变 — 首次报道 06-25
🔴 🟢 Herculaneum 古卷首次完整读出：AI 助力破解 2000 年之谜 — HN 745 upvotes，维苏威火山碳化卷轴首次完整阅读；ScrollPrize 团队用 AI 重建碳化文字 — 首次报道 06-25
🟡 阿里 Open Code Review 开源评测：准确率碾压通用 Agent — OCR 准确率 25-38% vs Claude Code 7-16%；CC 召回率更优(28.90%)；OCR 团队用 CC 构建项目再用 OCR 自审，106 次变更发现 145 个问题 — 06-25 深度数据发布
🟢 IBM 发布全球首款亚纳米级芯片技术 — 突破 1nm 制程极限；211 upvotes on HN — 首次报道 06-25

📰 详细资讯

1. OpenAI 联手 Broadcom 发布首款自研 LLM 推理芯片 ‘Jalapeño’

摘要：OpenAI 与 Broadcom 联合发布 Jalapeño——OpenAI 第一款定制 LLM 推理芯片。从设计到流片仅用 9 个月，团队称这是高性能芯片史上最快的 ASIC 研发周期之一，研发过程由 OpenAI 自家模型加速完成，形成「用模型设计芯片，再用芯片跑模型」的闭环。芯片围绕 OpenAI 对 LLM 推理需求从零设计，工程样片已在实验室以量产目标频率和功耗运行真实负载（包括 GPT-5.3-Codex-Spark）。能效比显著优于当前最先进水平，计划从 2026 年起与 Microsoft 等伙伴以吉瓦级规模部署。Broadcom CEO Hock Tan 称这是面向未来十年 AI 物理基础设施扩张的「多代路线图的开端」。
原文链接：https://openai.com/blog/（OpenAI 官方博客）
信源验证：
- ✅ [OpenAI Blog] OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 — 06-25
- ✅ [BestBlogs EP98 精讲一] OpenAI 与 Broadcom 发布针对 LLM 优化的推理芯片 — 06-25 12:40 CST
- ✅ [Hacker News] IBM 亚纳米芯片讨论中提及（211 pts）— 06-25
热度指标：BestBlogs 头条精讲；Sam Altman、Greg Brockman 亲自接芯片；Broadcom 总裁级到场
标签：#OpenAI #Broadcom #Jalapeño #推理芯片 #ASIC #AI基础设施 #GPT5 #芯片自研
时效性：🟢 突发 — 首次报道于 06-25

2. Anthropic 公开「Multiplayer Agents」人机协作四原则

摘要：Anthropic 罕见公开内部协作实践，提出「多智能体（multiplayer agents）」概念——能与多个不同人类同时协作的 AI 模型。文章总结了四条核心经验：① 信息默认公开（团队内部尽量公开透明，智能体只能从可搜索文本构建理解，私聊对它「不存在」）；② 人和智能体各有清晰角色分工，避免责任模糊；③ 由人类设定北极星目标，智能体负责执行细节；④ 按可验证程度逐步放权，风险越低越适合早期放权。这四条经验为团队级智能体协作提供了可复制的治理框架，Claude Tag 的发布让工作形态从「单机游戏」变成「多人游戏」。
原文链接：https://www.anthropic.com/news/（Anthropic Newsroom）
信源验证：
- ✅ [Anthropic Newsroom] Anthropic 关于构建高效人机协作团队的经验 | Claude — 06-25
- ✅ [BestBlogs EP98 精讲二] — 06-25 12:40 CST
- ✅ [上下文] 承接 06-23 Claude Tag 发布、06-24 Agent Identity 深度解读
热度指标：BestBlogs 精讲二；与 Claude Tag/Agent Identity 叙事持续升温
社媒热评：
- “光有技术基础还不够，团队还需要建立新的工作方式和共同规范——信息默认公开、角色分工清晰、人类定北极星、按可验证程度放权。” — Anthropic Blog
- “与其逐条决定哪份文档能给智能体看，不如直接设定工作空间级别的安全边界，让信息在边界内对人和智能体一视同仁地流动。” — BestBlogs EP98
标签：#Anthropic #MultiplayerAgents #人机协作 #ClaudeTag #Agent治理
时效性：🟢 突发 — 首次报道于 06-25

3. ScrollPrize: AI 助力首次完整读出 2000 年前赫库兰尼姆古卷

摘要：维苏威火山喷发碳化的赫库兰尼姆古卷首次被完整阅读！ScrollPrize 团队利用 AI/ML 技术，成功从碳化卷轴中重建出完整文字内容。这项突破在 Hacker News 上获得 745 个 upvotes 和 172 条评论，成为当日最高热度帖子。团队克服了碳化纸莎草的超高难度三维扫描和虚拟展平难题，是 AI 在文化遗产保护领域的里程碑应用。
原文链接：https://scrollprize.org/firstscroll
信源验证：
- ✅ [ScrollPrize 官网] An entire Herculaneum scroll has been read for the first time — 06-25
- ✅ [Hacker News] 745 points / 172 comments — 06-25
- ✅ [NPR/BBC] 多家媒体报道（上下文验证）— 06-25
热度指标：HN #1（745 upvotes, 172 comments）
社媒热评：
- “This is genuinely one of the most incredible things I’ve seen. Reading text that hasn’t been seen by human eyes in 2,000 years.” — HN top comment
标签：#AI考古 #ScrollPrize #赫库兰尼姆 #文化遗产 #计算机视觉
时效性：🟢 突发 — 首次报道于 06-25

4. 阿里 Open Code Review 深度评测：准确率碾压通用 Agent，召回率各有千秋

摘要：阿里开源的 Open Code Review（OCR）在 06-25 发布深度评测数据。基于 50 个热门开源仓库、200 个真实 PR、10 种编程语言、80+ 资深工程师交叉标注的评测集显示：OCR 各模型组合准确率在 25%–38% 之间，远高于 Claude Code 的 7%–16%。但 CC 在召回率上更优——CC + Claude-4.6-Opus 以 28.90% 的召回率位居所有组合之首，比 OCR 最优组合多发现约 45% 的真实问题。综合 F1 指标 OCR 最优 25.10% vs CC 最优 14.13%。资源消耗方面 OCR 优势明显：Token 消耗 352K–743K / 耗时 1–6 分钟，远低于 CC 的 2,062K–5,664K Token / 5–14 分钟。有趣发现：更新的 Claude-4.8-Opus 在两个工具上都表现出「更精确但更保守」，模型代际升级不一定带来评审效果全面提升。OCR 团队用 CC 从零以 Go 重写项目本身，再用 OCR 评审每次变更，106 次变更累计发现 145 个有效问题——「自证」过程本身就是真实验证。
原文链接：https://github.com/alibaba/open-code-review
信源验证：
- ✅ [阿里技术/GitHub] 阿里开源 Open Code Review — 06-24 首次发布，06-25 深度评测
- ✅ [BestBlogs EP98 精讲三] — 06-25 12:40 CST
- ✅ [上下文] GitHub 5,000+ stars，持续增长
热度指标：BestBlogs 精讲三；GitHub 5k+ stars
社媒热评：
- “AI 写代码与 AI 审代码是两种截然不同的能力，即便是最强的编码 Agent，也需要专业的评审 Agent 来兜底。” — BestBlogs EP98
- “Claude-4.8-Opus 更精确但更保守——模型代际升级不一定带来评审效果的全面提升。” — Open Code Review 评测
标签：#阿里巴巴 #OpenCodeReview #代码评审 #确定性工程 #Agent #评测
时效性：🟡 跟进 — 06-24 首次开源，06-25 深度评测数据发布

5. IBM 发布全球首款亚纳米级芯片技术

摘要：IBM 宣布研发出全球首款亚纳米（sub-1 nanometer）芯片技术，突破了芯片制程的物理极限。该技术在 Hacker News 上获得 211 个 upvotes 和 122 条评论。与 OpenAI/Broadcom 的 Jalapeño 推理芯片同日发布，共同标志着 AI 硬件基础设施正在经历结构性加速。
原文链接：https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
信源验证：
- ✅ [IBM Newsroom] IBM debuts sub-1 nanometer chip technology — 06-25
- ✅ [Hacker News] 211 points / 122 comments — 06-25
- ✅ [上下文] 与 OpenAI Jalapeño 同在 06-25 芯片主题
热度指标：HN 211 upvotes / 122 comments
标签：#IBM #芯片 #制程 #纳米 #硬件
时效性：🟢 突发 — 首次报道于 06-25

6. HN: AI 模型政治偏见调查引发热议

摘要：trakkr.ai 发布的对主流 AI 模型政治偏见的系统性调查在 HN 上引发 181 条热评（83 pts）。该调查测试了多个主流 AI 模型在政治话题上的倾向性，引发关于 AI 中立性、训练数据偏见和模型对齐的广泛讨论。评论区的辩论反映了社区对 AI 价值观对齐问题的持续关注。
原文链接：https://trakkr.ai/bias
信源验证：
- ✅ [trakkr.ai] Political bias in AI: Where the AI models stand — 06-25
- ✅ [Hacker News] 83 points / 181 comments — 06-25
热度指标：HN 83 upvotes / 181 comments（评论数远高于投票数，讨论深度高）
标签：#AI偏见 #模型对齐 #政治倾向 #AI伦理
时效性：🟢 突发 — 首次报道于 06-25

7. Gemini 3.5 Flash 推出计算机操作功能

摘要：Google 宣布在 Gemini 3.5 Flash 中推出计算机操作（computer use）功能，使模型能直接操控计算机界面、执行多步骤任务。这是继 Claude 推出 computer use 后，Google 在该方向的重要跟进，标志着「智能体操控 UI」能力正成为基座模型的标配。
原文链接：https://blog.google/technology/ai/
信源验证：
- ✅ [Google AI Blog] 在 Gemini 3.5 Flash 中推出计算机操作功能 — 06-25
- ✅ [BestBlogs EP98 速览] — 06-25 12:40 CST
热度指标：BestBlogs 速览推荐
标签：#Google #Gemini #ComputerUse #智能体 #浏览器操控
时效性：🟢 突发 — 首次报道于 06-25

8. Qwen-AgentWorld 开源：让 Agent 学会「先预测，再行动」

摘要：阿里通义 Qwen 团队开源 Qwen-AgentWorld-35B-A3B 模型，首次让 AI Agent 在行动前对世界状态进行预测。这是融合世界模型（World Model）与语言 Agent 能力的创新尝试，模型参数 35B，活跃参数仅 3B（MoE 架构），在 HuggingFace Trending 中快速上升（更新于约 15 小时前），获得 3.39k 下载量。核心思路：Agent 在执行动作前先预测结果，以此过滤错误行动，提升任务成功率。
原文链接：https://huggingface.co/Qwen/Qwen-AgentWorld-35B-A3B
信源验证：
- ✅ [HuggingFace] Qwen/Qwen-AgentWorld-35B-A3B — 06-25
- ✅ [BestBlogs EP98 速览] Qwen-AgentWorld 开源 — 06-25 12:40 CST
热度指标：HF Trending #10；~15h 前更新
标签：#Qwen #AgentWorld #世界模型 #MoE #Agent #开源
时效性：🟢 突发 — 首次报道于 06-25

9. 40 天不睡、5 人死磕！DeepMind 主管爆 Gemini 大战 DeepSeek 惨烈内幕

摘要：DeepMind 主管罕见公开 Gemini 团队与 DeepSeek 的竞争内幕：为追赶 DeepSeek 的发展速度，5 人核心团队连续 40 天高强度攻坚，几近不眠不休。文章深入探讨了普通程序员在这场 AI 军备竞赛中的转型困境，以及大公司内部创新的压力与代价。这是 AI 行业竞争白热化的生动写照。
原文链接：https://www.bestblogs.dev/（BestBlogs 精选）
信源验证：
- ✅ [BestBlogs EP98 速览] 40天不睡、5人死磕！DeepMind 主管爆 Gemini 大战 DeepSeek 惨烈内幕 — 06-25 12:40 CST
- ✅ [上下文验证] DeepSeek 持续挑战 Google Gemini 的行业叙事背景
热度指标：BestBlogs 速览推荐；与 OpenAI/Google/DeepSeek 竞争叙事高度相关
标签：#DeepMind #Gemini #DeepSeek #AI竞争 #内部故事
时效性：🟢 突发 — 首次报道于 06-25

10. 如何为 AI 智能体构建记忆

摘要：深度技术文章探讨 AI 智能体的记忆构建方法，覆盖短期记忆（上下文窗口管理）、长期记忆（向量数据库/RAG）、情节记忆（任务轨迹记录）等关键设计模式。与 Anthropic 同日发布的「持久记忆是 multiplayer agent 三项基础能力之一」形成呼应，反映了记忆机制正从可选功能升级为智能体的核心基础设施。
原文链接：https://www.bestblogs.dev/（BestBlogs 精选）
信源验证：
- ✅ [BestBlogs EP98 速览] 如何为 AI 智能体构建记忆 — 06-25 12:40 CST
- ✅ [上下文] 与 Anthropic 人机协作中强调的「持久记忆」形成主题呼应
热度指标：BestBlogs 速览推荐
标签：#Agent记忆 #RAG #向量数据库 #Agent架构
时效性：🔵 深度 — 技术分析/教程类，06-25 发布

11. OpenAI IPO 推迟至明年

摘要：《纽约时报》报道 OpenAI 倾向于将 IPO 推迟到 2027 年。在发布自研芯片 Jalapeño、扩大数据中心部署的背景下，OpenAI 可能希望先在硬件和基础设施层面建立更强的护城河，再寻求公开上市。
原文链接：https://www.nytimes.com/2026/06/25/technology/openai-ipo-artificial-intelligence.html
信源验证：
- ✅ [NYT] OpenAI Leans Toward Waiting Until Next Year for IPO — 06-25
- ✅ [Hacker News] 30 points / 13 comments — 06-25
- ✅ [上下文] OpenAI Jalapeño 芯片同日发布
热度指标：HN 30 upvotes / 13 comments
标签：#OpenAI #IPO #融资 #芯片
时效性：🟢 突发 — 首次报道于 06-25

12. HN: OpenKnowledge — 开源 AI-First 知识管理替代 Notion/Obsidian

摘要：Show HN 项目 OpenKnowledge，一款开源 AI-first 知识管理工具，号称 Obsidian/Notion 的开源替代。支持 AI 驱动的内容组织、检索和关联，在 HN 获得 131 upvotes / 61 comments。反映了 AI-native 工具在生产力领域的持续渗透趋势。
原文链接：https://github.com/inkeep/open-knowledge
信源验证：
- ✅ [GitHub] inkeep/open-knowledge — 06-25
- ✅ [Hacker News] Show HN — 131 points / 61 comments — 06-25
热度指标：HN 131 upvotes / 61 comments
标签：#开源 #知识管理 #AIFirst #Notion替代 #Obsidian替代
时效性：🟢 突发 — 首次报道于 06-25

排名	项目	星标	描述	今日新增	链接
1	calesthio/OpenMontage	⭐ 21,942	首个开源 AI 视频制作系统，12 管线/52 工具/500+ Agent Skill	+3,553	GitHub
2	google-labs-code/design.md	⭐ 19,010	面向 Coding Agent 的视觉设计规范格式	+1,407	GitHub
3	apple/container	⭐ 43,151	Apple 轻量级 VM 容器工具，Swift 编写	+1,366	GitHub
4	JCodesMore/ai-website-cloner-template	⭐ 20,340	AI Agent 一键克隆任何网站	+1,021	GitHub
5	garrytan/gstack	⭐ 115,743	Garry Tan 的 Claude Code 配置，23 个工具实现全角色覆盖	+836	GitHub
6	xbtlin/ai-berkshire	⭐ 1,794	AI 时代价值投资研究框架，多 Agent 并行分析	+201	GitHub
7	alibaba/page-agent	⭐ NEW	JavaScript 浏览器内 GUI Agent，自然语言操控网页	🆕	GitHub
8	mukul975/Anthropic-Cybersecurity-Skills	⭐ -	817 个 AI Agent 网络安全 Skills，覆盖 6 大安全框架	-	GitHub
9	opendatalab/MinerU	⭐ -	PDF/Office 文档转 LLM-ready Markdown/JSON	-	GitHub
10	aws/agent-toolkit-for-aws	⭐ -	AWS 官方 MCP Server/Skills/Plugins for AI Agents	-	GitHub

排名	模型	机构	参数	下载量	描述	链接
1	zai-org/GLM-5.2	智谱 AI	753B	67.1k	旗舰大模型，文本生成	HF
2	baidu/Unlimited-OCR	百度	3B	70.7k	🆕 一次性长篇文档 OCR 解析	HF
3	yuxinlu1/gemma-4-12B-coder-fable5-composer2.5-v1-GGUF	社区	12B	496k	Gemma 4 编程模型 GGUF 量化	HF
4	empero-ai/Qwythos-9B-Claude-Mythos-5-1M	Empero AI	9B	10.2k	Claude distil 风格模型	HF
5	WeiboAI/VibeThinker-3B	微博 AI	3B	51.7k	3B 推理模型，AIME26 达 94.3	HF
6	Qwen/Qwen-AgentWorld-35B-A3B	阿里通义	35B (3B 激活)	3.39k	🆕 Agent 世界模型，「先预测再行动」	HF
7	deepseek-ai/DeepSeek-V4-Pro	DeepSeek	862B	1.88M	旗舰模型 Pro 版本	HF
8	krea/Krea-2-Turbo	Krea	-	3k	新一代文生图模型	HF
9	moonshotai/Kimi-K2.7-Code	Moonshot AI	1.1T	502k	Kimi 编程旗舰模型	HF
10	MiniMaxAI/MiniMax-M3	MiniMax	427B	154k	图像-文本多模态	HF

🚀 Product Hunt AI 热门

⚠️ Product Hunt 被 Cloudflare 防护拦截，本次未能直接采集。建议关注 https://www.producthunt.com/topics/artificial-intelligence

📚 外部精选

⚠️ web_search (Tavily API 432) 和 web_extract 受限，独立交叉验证主要通过浏览器和 BestBlogs 聚合源完成。arXiv 论文和 X/Twitter 社媒数据本次未能采集。

📊 热度追踪

话题	持续天数	趋势	首次出现
AI Agent 身份/权限/安全	4天	↗️ 上升	2026-06-22 (Five Eyes 安全警告)
AI 编码工具与软件工程质量	4天	↗️ 上升	2026-06-22 (Claude Code 访谈)
Claude Tag / Anthropic 产品线	3天	↗️ 上升	2026-06-23 (Claude Tag 发布)
开源 AI Coding 工具链	2天	🔥 爆发	2026-06-24
AI 内容创作与版权	2天	➡️ 持续	2026-06-24
小模型推理能力突破	3天	➡️ 持续	2026-06-23 (VibeThinker-3B)
AI 芯片/硬件基础设施	🆕 新	🔥 爆发	2026-06-25
AI 人机协作范式	🆕 新	🆕 新话题	2026-06-25

趋势解读：

AI 芯片/硬件基础设施 成为 06-25 最强新叙事：OpenAI Jalapeño + IBM 亚纳米芯片同日发布，AI 全栈竞争正式下探到硬件层
AI Agent 安全边界 叙事连续第 4 天，从 06-22 Five Eyes 警告 → 06-23 Claude Tag → 06-24 Meta IG 漏洞 → 06-25 Anthropic 人机协作原则，形成完整演进链
AI 编码工程化 叙事第 4 天，阿里 OCR 深度评测将「AI 写代码 vs AI 审代码」的对立升级为有数据支撑的系统级讨论
AI 人机协作范式 作为全新话题登场，与 Agent 安全叙事高度互补
Anthropic 本周先发布 Claude Tag (06-23)、Agent Identity (06-24)、Multiplayer Agents 原则 (06-25)，连续三天在产品/安全/治理三个维度同时发力

📝 信源使用统计

信源类型	引用次数	代表信源
S级(官方)	5	OpenAI Blog, Anthropic Newsroom, Google AI Blog, IBM Newsroom, GitHub (阿里)
A级(媒体)	1	NYT (OpenAI IPO)
B级(社区)	3	Hacker News (ScrollPrize 745pts, IBM芯片 211pts, AI偏见 83pts)
C级(聚合)	1	BestBlogs.dev EP98 (核心信源)

⚠️ 采集限制说明：本次采集 web_search (Tavily API 432) 和 web_extract 均受限，独立外部交叉验证主要通过浏览器直接访问实现。HuggingFace 数据采集完整，GitHub Trending 数据采集完整，Hacker News 数据采集完整。Product Hunt / X/Twitter / arXiv 数据未采集，建议后续补充。

🔥 今日热点 TOP 5

📰 详细资讯

1. OpenAI 联手 Broadcom 发布首款自研 LLM 推理芯片 ‘Jalapeño’

2. Anthropic 公开「Multiplayer Agents」人机协作四原则

3. ScrollPrize: AI 助力首次完整读出 2000 年前赫库兰尼姆古卷

4. 阿里 Open Code Review 深度评测：准确率碾压通用 Agent，召回率各有千秋

5. IBM 发布全球首款亚纳米级芯片技术

6. HN: AI 模型政治偏见调查引发热议

7. Gemini 3.5 Flash 推出计算机操作功能

8. Qwen-AgentWorld 开源：让 Agent 学会「先预测，再行动」

9. 40 天不睡、5 人死磕！DeepMind 主管爆 Gemini 大战 DeepSeek 惨烈内幕

10. 如何为 AI 智能体构建记忆

11. OpenAI IPO 推迟至明年

12. HN: OpenKnowledge — 开源 AI-First 知识管理替代 Notion/Obsidian

🛠️ GitHub Trending AI 项目

🤗 HuggingFace Trending Models

🚀 Product Hunt AI 热门

📚 外部精选

📊 热度追踪

📝 信源使用统计