MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行
面壁智能发布 MiniCPM-o 4.5 技术报告,推出 9B 参数的端到端全双工全模态大模型,支持 RTX 5070 显卡实时运行,并开源了 Omni-Flow 框架及本地部署方案。
{
"title": "光计算芯片上市,DeepSeek-V4 开源重构长文本",
"content": "今日技术圈可谓是硬核与变革并存的一天。从光子计算打破“电子”桎梏在港交所敲钟,到 DeepSeek-V4 以系统级架构创新挑战长上下文极限;从 OpenAI 与微软“松绑”开启算力新博弈,到 MiniCPM-o 4.5 让全双工 AI 走进消费级显卡。AI 正在从模型层面向基础设施、算力底座乃至交互范式全速渗透,一场关于“智能定义权”的争夺已然拉开帷幕。\n\n### 硬科技与算力新基建\n\n[曦智科技今日港股上市](https://mp.weixin.qq.com/s?__biz=MzA3ODk5OTEzOA==&mid=2962187536&idx=1&sn=50f36e2f0fa515ed0c2fefce40167006) - 全球 AI 硅光芯片第一股曦智科技今日正式登陆港交所,开盘暴涨 380%,市值突破 800 亿港元。这不仅是一家公司的胜利,更标志着“光电混合算力”路线穿越死亡谷后的高光时刻。曦智科技从最初挑战英伟达的光计算理想,务实转向光互连造血,如今再次重启光计算芯片研发。对于行业而言,这证明了在摩尔定律放缓的当下,利用光信号解决数据中心带宽与能耗瓶颈已成为必由之路,英伟达等巨头在 CPO(共封装光学)上的布局也印证了这一点。\n\n[对话曦智科技沈亦晨:一个 MIT 博士与光计算穿越死亡谷的十年](https://mp.weixin.qq.com/s?__biz=MzU3Mjk1OTQ0Ng==&mid=2247535652&idx=1&sn=2848724a492b200502e9c53b775a019f) - 如果说上市是结果,这篇深度长文则还原了过程。沈亦晨坦陈了从一篇 Nature 论文到商业落地的巨大鸿沟,以及 2022 年为了“活下去”砍掉光计算项目、all in 光互连的痛苦决策。这对所有硬科技创业者都是一剂清醒剂:技术理想主义必须配合务实的商业化节奏。如今光互连贡献了 80% 收入,为光计算的星辰大海提供了坚实的面包,这种“曲线救国”的战略或许比单纯的烧钱更值得借鉴。\n\n### 大模型架构与开源激战\n\n[读完这篇,你就搞懂 DeepSeek v4 了](https://mp.weixin.qq.com/s?__biz=MjM5ODYwMjI2MA==&mid=2649801469&idx=1&sn=6d9db2b546577d488b242c1a185d49d8f) - DeepSeek-V4 的发布再次证明了“开源最强”并非虚名。但比 SOTA 分数更值得关注的是其系统级的架构创新。引入 Manifold-Constrained Hyper-Connections (mHC) 解决深层网络训练不稳定性,利用 CSA/HCA 混合稀疏注意力机制将 1M 上下文的计算复杂度从 O(L^2) 降维,再到 Infra 层的 TileLang 算子优化与 Muon 优化器。DeepSeek 不再是简单的模型堆料,而是从数学原理到底层 Kernel 的全栈重构,这对开发者意味着:超长上下文不再是昂贵的噱头,而是 Agent 和代码重构任务可依赖的稳定基座。\n\n[小米 MiMo-V2.5 系列开源 & Orbit 百万亿 Token 计划启动](https://mp.weixin.qq.com/s?__biz=MzUxMDQxMDMyNg==&mid=2247519162&idx=1&sn=5b1a00208a6c0d1f901183753a106676) - 小米不仅开源了支持百万级上下文的 MiMo-V2.5 系列,更推出了 Orbit 100T Token 计划,豪掷 100 万亿 Token 权益拉拢开发者。这背后是国产大模型在生态战上的积极信号:单纯的模型开源已不够,必须通过算力补贴和 Agent 框架适配来抢占开发者的心智。MiMo-V2.5-Pro 在 ClawEval 等榜单的领先,结合 MIT 协议的宽松授权,试图在 Agent 与 Coding 这一关键赛道建立自己的护城河。\n\n[智谱入选《时代》“2026年最具影响力的10家人工智能公司”](https://mp.weixin.qq.com/s?__biz=MzkyMzI3NzQ0Mg==&mid=2247493765&idx=1&sn=767386e647680380a476e949fa46eb19) - 智谱 GLM-5 模型入选《时代》榜单,与 OpenAI、Anthropic 并列,这不仅是荣誉,更是中国大模型在全球话语权提升的缩影。评价特别提到其在 Coding 和 Agent 任务上逼近 Claude Opus,这表明开源模型在专业能力上已具备与闭源巨头掰手腕的实力。对于行业而言,这意味着全球 AI 格局正从“西方垄断”走向“中美双雄”,技术路线的多元化将加速应用落地。\n\n### AI 落地与范式转移\n\n[你不知道的 Agent:原理、架构与工程实践](https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247559745&idx=1&sn=31903f96e842d95a2fa2f6b5a5a012cc) - 这是一篇对 Agent 开发者极具实操价值的“避坑指南”。文章指出,Agent 能力的瓶颈往往不在模型本身,而在 Harness(测试验证体系)、上下文工程和工具设计。特别是强调了“Harness 比模型更关键”的观点——没有清晰的验收基线和自动验证,再强的模型也只是空中楼阁。这对于当前盲目追求模型参数、忽视工程约束的泡沫现象是一剂清凉油,提醒大家回归工程本质。\n\n[MiniCPM-o 4.5 技术报告发布:全双工全模态 API 开放,RTX5070 即可实时运行](https://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=2650451713&idx=1&sn=c7c9173d69ad2a9624946d1f522f641a) - 面壁智能的 MiniCPM-o 4.5 将“全双工”交互带到了消费级显卡上。通过 Omni-Flow 框架,模型实现了像人类一样边听边说、可被打断的流式交互,且只需 12GB 显存即可运行。这标志着 AI 交互范式从“问答”向“陪伴”的演进。对于开发者来说,这意味着智能座舱、无障碍辅助、实时监控等需要低延迟、持续感知的场景终于有了可落地的端侧方案,隐私与算力成本不再是拦路虎。\n\n### 行业动态与格局演变\n\n[Microsoft放弃OpenAI独家销售权,OpenAI进驻其他云计算平台?](https://mp.weixin.qq.com/s?__biz=MzI4NTgxMDk1NA==&mid=2247515445&idx=2&sn=08f17d475300e0ed323e7ceaf85dad99) - 微软与 OpenAI 的“七年之痒”终于修成正果——双方修订协议,取消独家云销售权。这一变化背后是 OpenAI 寻求算力多元化(牵手 AWS 等)和商业化自主的必然结果,也是微软“去 OpenAI 化”、构建多模型策略的主动选择。这标志着 AI 基础设施层的竞争进入新阶段:单一云厂商绑定时代结束,模型厂商将更积极地横跨多云平台,而云厂商则需通过更完善的生态服务来留住客户。\n\n[OpenAI 硬件负责人的闭门分享,向我们揭示了为什么硬件「终点」仍是智能手机](https://mp.weixin.qq.com/s?__biz=MTMwNDMwODQ0MQ==&mid=2653104921&idx=1&sn=04db895551a5ce298b50043e1936c734) - 为什么 OpenAI 要做手机?不是因为想做硬件,而是因为“手机不是为 Agent 设计的”。硬件负责人 Richard Ho 透露,OpenAI 正在构建从芯片到数据中心再到端侧设备的完整系统,以解决算力、能耗和交互延迟问题。这预示着未来的智能终端将不再是 App 的载体,而是 Agent 的躯体。苹果和谷歌的操作系统霸权,可能面临来自 AI 原生设备的直接挑战。\n\n[百度废除职级标签](https://mp.weixin.qq.com/s?__biz=MzIw
面壁智能发布 MiniCPM-o 4.5 技术报告,推出 9B 参数的端到端全双工全模态大模型,支持 RTX 5070 显卡实时运行,并开源了 Omni-Flow 框架及本地部署方案。
全球AI硅光芯片第一股曦智科技在港交所上市,首日股价大涨,标志着光电混合算力技术及商业化的重大突破。
小米正式开源 MiMo-V2.5 系列大模型,采用宽松的 MIT 协议并支持百万级上下文窗口,同时推出百亿 Token 激励计划及 Agent 生态共建计划。
面壁智能发布MiniCPM-o 4.5技术报告,推出基于Omni-Flow框架的业界首个端到端全双工全模态大模型,支持消费级显卡运行,实现了毫秒级实时感知与流式交互。
小米正式开源 MiMo-V2.5 系列模型,采用宽松 MIT 协议并支持 100 万上下文窗口,同时启动 MiMo Orbit 100T Token 计划以共建 AI 生态。
Microsoft与OpenAI达成修订协议,终止独家销售权,OpenAI将能进驻AWS等其他云平台,同时Microsoft将不再为转售产品支付收入分成。
快手联合复旦大学提出生成式回归(GR)范式,将连续值预测转化为序列生成任务,有效解决了短视频播放时长预测中的长尾分布与训练推断不一致难题,刷新了多项SOTA并带来显著线上收益。
本文深入解析了 AI Agent 的核心架构、工程化设计原则及最佳实践,重点探讨了控制流、上下文工程、工具设计、记忆系统及测试验证体系对 Agent 效果的关键影响。
联影智能发布并开源了全球首个医疗视频理解大模型uAI-NEXUS-MedVLM,通过构建MedVidBench基准数据集和MedGRPO训练方法,解决了通用大模型在医疗视频领域表现不佳的难题。
这是一篇对曦智科技创始人沈亦晨的深度专访,回顾了其从MIT博士创业、面对摩尔定律挑战调整战略、转向光互连业务以穿越“死亡谷”,最终带领公司上市的十年历程。
文章深入解读了DeepSeek-V4的技术报告,详细剖析了其在架构层面的核心创新(如mHC残差机制、混合稀疏注意力)以及基础设施层面的优化,旨在解决万亿参数模型和百万token上下文带来的计算与存储难题。
文章详细报道了曦智科技(Lightelligence)成为“全球AI硅光芯片第一股”的历程,回顾了创始人沈亦晨从MIT博士论文到建立商业帝国的创业故事,并深度剖析了其核心技术、财务表现及光计算赛道的市场前景。
文章介绍了阿里巴巴达摩院在三年内成功研发胰腺癌、胃癌、肠癌三种平扫CT AI筛查模型,通过“平扫CT+AI”路线实现多癌种机会性筛查,大幅提升早期发现率并降低成本。
智谱AI入选《时代》杂志“2026年最具影响力的10家人工智能公司”名单,其GLM-5模型因开源及优异表现获高度评价。
文章通过分析OpenAI硬件负责人的观点,揭示了OpenAI自研芯片和手机的底层逻辑:为了突破GPU限制、适应Agent时代的系统级需求,以及重新定义以Agent为中心的计算范式。
文章详细记录了一次因Kubernetes集群中VXLAN隧道MTU配置不当导致的网络丢包故障排查过程,并系统梳理了MTU/MSS原理及不同场景下的配置策略。
文章以《三体》黑暗森林为隐喻,深入分析了Anthropic、OpenAI和DeepSeek在2026年的竞争策略,揭示了顶级AI实验室在技术发布上的“挤牙膏”现象及其背后的博弈逻辑。
JetBrains阐述了其IDE在2026年的发展方向,致力于让传统的手动编码与新兴的AI辅助工作流在IDE中和谐共存。
文章详细介绍了开源工具CC Switch,它能够通过桌面图形界面一键管理Claude Code、OpenClaw等AI Agent的底层模型配置,解决了手动修改配置文件的繁琐问题,并提供了故障转移和用量统计等高级功能。
基于2025年开发者调查数据,文章分析了Go语言中最流行的Web框架及其优缺点,探讨了使用标准库net/http与主流框架(如Gin、Echo、Chi、Fiber)之间的选择依据。
文章介绍了AI产品Helio,其核心概念是将AI打造为团队中的'原住民'同事而非工具,通过赋予AI完整的上下文感知、主动执行能力和权限控制机制,重新定义AI Native时代的工作流。
文章系统阐述了AI Agent推动“智联网”时代的到来,从技术临界点、交互范式变革、商业模式重构及基础设施五个维度,深度解析了数字世界底层逻辑的根本性转变。
这是《HelloGitHub》第 121 期内容,精选了 GitHub 上有趣且实用的开源项目,涵盖多种编程语言,重点介绍了开发工具、AI 编程助手及实用效率软件。
文章深度评测了 Keep 9.0 版本及其 AI 教练「卡卡」,分析了基于 Keepace.ai 垂直大模型的产品重构与数据整合能力。
文章介绍了谌鹏飞提出的AI-GROW数智增长理论,结合绝味、孩子王等企业的实战案例,阐述了企业如何通过战略锚定、对话提效、场景落地和组织进化实现AI转型。
火山引擎在Black Hat Asia 2026发布了Agent Miner和BoardSentinel两项AI安全研究成果,分别针对AI智能体生态和BMC固件提供自动化安全审计能力。
文章介绍了openJiuwen社区发布的Coordination Engineering(协同工程)技术体系,旨在通过Agent Team、Team Skills及自演进机制解决多智能体高效协作与经验复用的难题。
文章报道了GTC2026全球流量大会上的AI漫剧沙龙,四大技术巨头(火山引擎、万兴科技、腾讯云、炫佳科技)分享了AI在漫剧制作中的工业化应用与未来赛点,指出行业正从产能竞争转向IP、合规与精细化运营。
文章提出了结构化提示驱动开发(SPDD)方法,通过将提示视为一等交付物并结合REASONS画布,旨在将AI辅助从个人效率提升为可控、可审查的组织级能力。
文章讲述了前字节、阶跃员工张心皓创业做 Jovida 的经历,提出区别于大厂卷效率的 Agent Loop,专注于工作以外 16 小时的“Human Loop”个人生活助理,旨在消除从愿望到行动的摩擦。
文章介绍了一款基于 Karpathy 理念的开源桌面应用 LLM Wiki,它利用 LLM 自动构建结构化知识库,具备知识图谱可视化、深度研究及网页剪藏等强大功能。
文章通过实测展示了千问AI在PPT制作、Excel建表等办公场景中的能力,强调了提示词在具体工作流中还原用户处境、提升交付质量的关键作用。
文章深入分析了2026北京车展上大模型上车的现状,指出了当前大多数“AI座舱”仍停留在Chatbot阶段,探讨了实现真正Agent控车的技术瓶颈与MaaS生态竞争格局。
文章介绍了Z.ai发布的开源大模型GLM-5.1,该模型专为长时任务和智能体编程设计,具备长达8小时的自主运行能力,并在多项编程基准测试中表现优异。
面壁智能联合清华大学发布 MiniCPM-o 4.5 技术报告,推出了业界首个端到端全双工全模态大模型 Omni-Flow,支持实时视听交互并可在消费级显卡(如 RTX 5070)上本地部署。
本期前端播客周刊聚焦 AI 时代的工程化实践,探讨了如何通过工具链验证 AI 代码、Cloudflare 与 Vercel 的框架之争,以及 2026 年开发者应具备的判断力与作品集策略。
NUS与NTU团队发布Pask,通过流式意图检测模型与自进化记忆系统,实现了具备实时性、深度理解和基于全局记忆的主动智能体架构,解决了现有Agent在实际落地中延迟高和意图识别难的问题。
文章报道了Anthropic对多家企业进行无预警大规模封号及AI误删数据库的事件,揭示了闭源AI服务的风控缺陷与潜在安全风险。
文章深度解析了DeepSeek V4为了实现核心设计「batch invariance」,在工程上牺牲了GPU利用率和推理速度,以确保训练、推理全流程的数值可复现性与稳定性。
文章深度剖析了微软与OpenAI修改合作协议结束排他性绑定的原因、财务细节及对各方的影响,指出这是由亚马逊投资引发的法律僵局及反垄断压力共同推动的商业博弈。
文章通过波音777项目的数字化转型案例,类比当前企业用AI做会议纪要的局限性,指出真正的AI转型应重构组织协作流程,而非仅停留在个人提效的工具层面。
文章分析了DeepSeek V4通过架构创新大幅降低长上下文推理成本,并指出行业正从单纯的价格竞争转向Agent范式下的系统级成本优化。
文章分析了百度文库网盘通过发布GenFlow 4.0并兼容OpenClaw,将AI从单点生成器升级为融入办公与协作全链路的智能体工作流,标志着超级智能标准转向结果交付的稳定性。
文章详细介绍了零犀科技如何通过因果大模型和后训练技术,构建销售智能体并实现按结果付费(RaaS)的盈利闭环,展示了大模型在垂直行业落地的新路径。
文章深入记录了沃伦·巴菲特关于投资与人生的智慧,重点阐述了能力圈原则、正直品格的重要性以及穿越周期的长期主义价值。
华为泰勒实验室提出SHAPE框架,通过引入基于势函数的「推理税」机制,在强化学习训练中同时提升了LLM的推理准确率并降低了Token消耗,有效解决了稀疏信号和模型啰嗦的问题。
openJiuwen社区提出Coordination Engineering新范式,发布Agent Team、Team Skills及Team Skills Hub,旨在解决多智能体自主协作、经验沉淀与能力自进化的问题。
文章基于游戏开发的实战案例,深入阐述了从Prompt到Harness Engineering的AI编程范式转变,详细解析了多Agent协作体系、自动化验证规则及流程控制机制。
文章提出AI时代将技能与底层能力拆解,指出职业竞争力正从操作技能向判断力、想象力等核心能力转移,并呼吁教育体系进行从传授知识到培养认知能力的深刻变革。
文章深入分析了Choco如何利用OpenAI技术构建OrderAgent和VoiceAgent,实现餐饮分销订单的全自动化处理,并分享了生产环境中的工程方法论与显著成效。
文章通过深度访谈形式,以OpenClaw爆火为切入点,探讨AI Agent从技术尝鲜走向企业规模化应用所面临的挑战、路径及未来发展方向。
文章介绍了华为开源社区openJiuwen发布的JiuwenClaw项目及其提出的Coordination Engineering新范式,旨在通过Agent Team、Team Skills、Team Skills Hub和自演进机制解决多智能体协作中的任务编排、技能沉淀与复用难题。
文章深度剖析了AWS新服务S3 Files的底层架构、工作机制及其性能边界,指出其利用EFS作为高性能层实现S3的文件系统语义,并对比了不同对象存储文件化方案的选型差异。
寻明生科完成3500万美元A+轮融资,资金将用于推动其智能体驱动抗体设计平台AuraIDE™及高通量实验设施建设,加速创新药管线转化。
本文汇总了近期科技圈的多条重要资讯,重点涵盖了小红书公布AI治理主张、微软调整与OpenAI合作模式、阿里推视频生成模型以及小米机器人、微信周边等硬件与商业动态。
文章介绍了百度网盘在AI Day上发布的GenFlow 4.0智能体、基于网盘的“龙虾”部署方案及多Agent协作的团队空间,强调网盘作为数据上下文对于Agent落地的优势。
前字节高管张心皓创立的维塔流动完成数千万元 Pre-Seed 轮融资,推出面向 C 端的主动式 Life Agent 产品 Jovida,致力于消除用户从心愿到行动之间的摩擦。
耶鲁学生创立的社交应用Series获510万美元种子前轮融资,该平台利用AI在iMessage内建立社交网络,通过轮播图匹配用户。
这是一篇涵盖OpenAI手机开发、特斯拉人形机器人量产、国产大模型迭代及多家科技公司融资动态的综合科技早报。
文章汇总了2026年4月28日多项AI开源成果,涵盖小米1M上下文全模态模型MiMo-V2.5、数学推理框架MathForge及时空推理模型STReasoner等。
文章汇总了近期AI行业的几条关键资讯,包括马斯克诉OpenAI案件的进展、腾讯QClaw的版本升级、蚂蚁灵光推出移动端世界模型功能,以及华策影视与Utopai Studios的战略合作。
这是一篇财经科技资讯类文章,汇总了规上工业企业利润增长、AI大模型调用量变化、OpenAI研发AI手机、腾讯发布出行智能体平台以及全球股市动态等多条行业新闻。
文章梳理了 Google Play Games Level Up 计划的核心权益、参与要求及关键里程碑,旨在帮助游戏开发者利用该计划提升业务。
这是一篇Spring社区的技术周报,汇总了最新的版本发布(如Spring Boot 4.x、Spring AI等)、相关技术文章以及社区动态。