昨日 AI 领域迎来多项重磅发布：OpenAI 推出首款自研推理芯片 Jalapeño，IBM 发布全球首个亚 1 纳米芯片技术，DeepReinforce 开源 Ornith-1.0 系列编码模型。同时，Anthropic 指控阿里大规模蒸馏 Claude，高盛预测 AI 智能体 token 使用量将增长 24 倍，16 款国民级 App 开放 MCP 接口，AI 智能体生态加速成型。

Flowtify 公开资讯日报

日期： 2026-06-25 主题： AI 动态

昨日重点

芯片与算力： OpenAI 与 Broadcom 联合发布首款自研 AI 推理芯片 Jalapeño，专为 LLM 推理设计，性能功耗比显著优于当前方案，成本减半，计划 2026 年底部署。IBM 推出全球首个 亚 1 纳米芯片技术（0.7nm），采用 NanoStack 架构，性能提升 50%，能效提高 70%。
模型发布： DeepReinforce 开源 Ornith-1.0 系列模型（MIT 许可），覆盖 9B 到 397B 参数，专为智能体编码设计，旗舰模型在 SWE-Bench 上超越 Claude Opus 4.7。百度开源 Unlimited OCR 模型（3B 参数，仅激活 500M），在 OmniDocBench 上得分 93.23，超越 DeepSeek OCR。OpenAI 发布 GPT-5.5 Instant，号称更智能、更直观。
行业竞争与安全： Anthropic 指控阿里巴巴通过约 2.5 万个虚假账号，对 Claude 发起大规模蒸馏攻击（2880 万次交互），目标锁定软件工程和 Agent 推理能力。美国商务部已对 Anthropic 的 Fable 5 模型实施出口管制。
智能体生态： 瑞幸、麦当劳、飞猪、滴滴等 16 款国民级 App 陆续开放 Skill/MCP/CLI 接口，AI 智能体可调用点咖啡、叫车、查航班等核心能力。Google 将计算机使用功能集成至 Gemini 3.5 Flash。Notion 通过 Cursor SDK 嵌入编码智能体。
市场与预测： 高盛预测到 2030 年 AI 智能体 token 使用量将增长 24 倍。英伟达 CEO 黄仁勋表示 AI 已进入获利阶段，本轮基建周期长达数十年。内存芯片短缺预计持续至 2027 年，苹果因存储成本飙升宣布产品涨价约 20%。

分主题观察

1. 芯片与基础设施：自研与突破

OpenAI Jalapeño 芯片： 与 Broadcom 合作，从设计到流片仅 9 个月，由 AI 模型辅助设计。首批样片性能功耗比显著优于当前顶级加速器，成本降低约一半，目标 2026 年底实现吉瓦级部署。此举标志着 AI 公司从通用 GPU 向自研加速器转型。
IBM 亚 1 纳米技术： 采用首创的 NanoStack 三维纳米堆栈架构，在指甲盖大小芯片上集成近 1000 亿晶体管，SRAM 缩小 40%。商用芯片有望在未来 5 至 10 年内量产。
其他动态： 高通推出数据中心处理器 Dragonfly C1000，Meta 计划 2028 年起部署。富士通介绍 PHOTON 架构，宣称多查询性能最高达 Transformer 的 475 倍。快手系芯片公司凌川科技完成数亿元 A+ 轮融资。

2. 模型与开源：百花齐放，性能逼近

Ornith-1.0 系列： DeepReinforce 发布的开源智能体编码模型家族，基于 gemma4 和 qwen3.5 后训练，采用自我改进策略。旗舰 397B MoE 在 SWE-Bench Verified 上取得 82.4，超越 Claude Opus 4.7。全部模型以 MIT 许可证开源。
GLM-5.2： 中国公司 z.AI 开源，拥有百万 token 上下文窗口，性能接近 Claude Opus 4.8 和 GPT-5.5。在 ARC-AGI-2 上得分 22.8%，成本仅 $0.25/任务，性价比极高。社区已推出魔改版，使推理速度飙升至 43 token/s。
百度 Unlimited OCR： 3B 参数 MoE 模型，推理时仅激活 500M 参数。核心创新 Reference Sliding Window Attention 将 KV 缓存大小固定，实现长文档高效解析。
字节豆包 Seed-2.1： 火山引擎发布，Agent 和 Coding 能力达到生产级可用线，多模态识别表现惊艳。
Qwen-AgentWorld： 阿里发布的原生语言世界模型，可模拟 7 种 Agent 环境，在 AgentWorldBench 上超越 Claude Opus 4.8 和 GPT-5.4。

3. 智能体与应用：生态加速落地

国民级 App 开放接口： 16 款 App 将核心能力封装为 Skill、MCP 或 CLI，覆盖餐饮、出行、办公、支付等场景。支付环节目前仍需用户跳转 App 完成，但 Agent 化趋势已不可逆。
企业级应用： 浦发银行上线超 2500 个金融智能体，覆盖营销、风控等核心场景。Notion 通过 Cursor SDK 嵌入编码智能体，用户可在文档中直接调用。PostHog 工程师用多个并行 Claude Code 会话重写 SQL 解析器，速度提升 70 倍。
内容生产： 百度智能云联合伙伴加速 AIGC 内容工业化生产，漫剧制作周期压缩 90%。字节 Seedance 2.0 4K 视频模型日均收益超 3000 万元。广电总局发布 AI 微短剧分类分层标准，7 月 1 日起施行。

4. 行业竞争与监管：蒸馏、出口管制与人才流动

蒸馏攻击升级： Anthropic 指控阿里通过 2.5 万假账户进行 2880 万次交互，实施“迄今已知最大规模的蒸馏攻击”。此前 Anthropic 曾点名 DeepSeek、MiniMax、Moonshot AI。美国商务部已对 Anthropic 的 Fable 5 模型发出出口管制令。
人才流动： Google DeepMind 核心研究人员持续流失至 Anthropic 和 OpenAI，包括 Gemini 团队关键人物 Jonas Adler 和 Alexander Pritzel。SignalFire 分析显示，DeepMind 工程师流向 Anthropic 的频率是反方向的 11 倍。
监管动态： 美国国会两党计划在国防授权法中提出修正案，对非法获取美国 AI 模型输出的中国公司实施制裁。谷歌前 CEO 施密特批评中国 AI 开源“不受控制”。

5. 市场与趋势：成本、瓶颈与反思

成本与 ROI： 高盛预测 AI 智能体 token 使用量到 2030 年增长 24 倍，推理成本每年下降 60%-70%。Uber 和 Microsoft 已开始重新考虑昂贵的智能体使用。Snowflake CEO 实测显示，GLM-5.2 编程能力接近 Opus 4.7，但成本仅为几分之一。
基础设施瓶颈： AI 数据中心扩张的真正瓶颈是电网接入。美国电网并网等待时间中位数已增至 55 个月。亚马逊在印度追加 130 亿美元投资 AI 基础设施。
反思与局限： 福特因 AI 未能有效保留专业知识，重新聘用了 350 名工程师。AI 编码智能体导致 OpenClaw 项目 PR 泛滥，合并率从 48% 暴跌至 9.3%。一个名为“你的 AI 垃圾让我厌烦”的网站吸引上万人假扮 AI 互相聊天，折射出人类互动的稀缺。

值得继续关注

OpenAI Jalapeño 芯片的后续部署与性能实测，以及其对 Nvidia 市场地位的影响。
Anthropic 指控阿里蒸馏事件的后续发展，包括美国政府的制裁措施及阿里方面的回应。
Ornith-1.0 和 GLM-5.2 等开源模型的实际应用效果，以及它们对闭源模型定价的冲击。
16 款国民级 App 开放 MCP 接口后的实际 Agent 应用案例，尤其是支付环节的打通进展。
AI 智能体带来的代码质量与项目管理挑战，如 PR 泛滥问题，以及社区如何应对。
内存芯片短缺对消费电子和 AI 基础设施建设的持续影响。

本日报由 Flowtify 公开资讯日报编辑生成，基于 2026-06-25 已精选动态。

AI 动态

2026年7月

2026年6月

2026年5月

Flowtify 公开资讯日报 | 2026-06-25