AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年6月25日

Flowtify 公开资讯日报 | 2026-06-25

昨日 AI 领域迎来多项重磅发布:OpenAI 推出首款自研推理芯片 Jalapeño,IBM 发布全球首个亚 1 纳米芯片技术,DeepReinforce 开源 Ornith-1.0 系列编码模型。同时,Anthropic 指控阿里大规模蒸馏 Claude,高盛预测 AI 智能体 token 使用量将增长 24 倍,16 款国民级 App 开放 MCP 接口,AI 智能体生态加速成型。

Flowtify 公开资讯日报

日期: 2026-06-25 主题: AI 动态


昨日重点

  • 芯片与算力: OpenAI 与 Broadcom 联合发布首款自研 AI 推理芯片 Jalapeño,专为 LLM 推理设计,性能功耗比显著优于当前方案,成本减半,计划 2026 年底部署。IBM 推出全球首个 亚 1 纳米芯片技术(0.7nm),采用 NanoStack 架构,性能提升 50%,能效提高 70%。
  • 模型发布: DeepReinforce 开源 Ornith-1.0 系列模型(MIT 许可),覆盖 9B 到 397B 参数,专为智能体编码设计,旗舰模型在 SWE-Bench 上超越 Claude Opus 4.7。百度开源 Unlimited OCR 模型(3B 参数,仅激活 500M),在 OmniDocBench 上得分 93.23,超越 DeepSeek OCR。OpenAI 发布 GPT-5.5 Instant,号称更智能、更直观。
  • 行业竞争与安全: Anthropic 指控阿里巴巴通过约 2.5 万个虚假账号,对 Claude 发起大规模蒸馏攻击(2880 万次交互),目标锁定软件工程和 Agent 推理能力。美国商务部已对 Anthropic 的 Fable 5 模型实施出口管制。
  • 智能体生态: 瑞幸、麦当劳、飞猪、滴滴等 16 款国民级 App 陆续开放 Skill/MCP/CLI 接口,AI 智能体可调用点咖啡、叫车、查航班等核心能力。Google 将计算机使用功能集成至 Gemini 3.5 Flash。Notion 通过 Cursor SDK 嵌入编码智能体。
  • 市场与预测: 高盛预测到 2030 年 AI 智能体 token 使用量将增长 24 倍。英伟达 CEO 黄仁勋表示 AI 已进入获利阶段,本轮基建周期长达数十年。内存芯片短缺预计持续至 2027 年,苹果因存储成本飙升宣布产品涨价约 20%。

分主题观察

1. 芯片与基础设施:自研与突破

  • OpenAI Jalapeño 芯片: 与 Broadcom 合作,从设计到流片仅 9 个月,由 AI 模型辅助设计。首批样片性能功耗比显著优于当前顶级加速器,成本降低约一半,目标 2026 年底实现吉瓦级部署。此举标志着 AI 公司从通用 GPU 向自研加速器转型。
  • IBM 亚 1 纳米技术: 采用首创的 NanoStack 三维纳米堆栈架构,在指甲盖大小芯片上集成近 1000 亿晶体管,SRAM 缩小 40%。商用芯片有望在未来 5 至 10 年内量产。
  • 其他动态: 高通推出数据中心处理器 Dragonfly C1000,Meta 计划 2028 年起部署。富士通介绍 PHOTON 架构,宣称多查询性能最高达 Transformer 的 475 倍。快手系芯片公司凌川科技完成数亿元 A+ 轮融资。

2. 模型与开源:百花齐放,性能逼近

  • Ornith-1.0 系列: DeepReinforce 发布的开源智能体编码模型家族,基于 gemma4 和 qwen3.5 后训练,采用自我改进策略。旗舰 397B MoE 在 SWE-Bench Verified 上取得 82.4,超越 Claude Opus 4.7。全部模型以 MIT 许可证开源。
  • GLM-5.2: 中国公司 z.AI 开源,拥有百万 token 上下文窗口,性能接近 Claude Opus 4.8 和 GPT-5.5。在 ARC-AGI-2 上得分 22.8%,成本仅 $0.25/任务,性价比极高。社区已推出魔改版,使推理速度飙升至 43 token/s。
  • 百度 Unlimited OCR: 3B 参数 MoE 模型,推理时仅激活 500M 参数。核心创新 Reference Sliding Window Attention 将 KV 缓存大小固定,实现长文档高效解析。
  • 字节豆包 Seed-2.1: 火山引擎发布,Agent 和 Coding 能力达到生产级可用线,多模态识别表现惊艳。
  • Qwen-AgentWorld: 阿里发布的原生语言世界模型,可模拟 7 种 Agent 环境,在 AgentWorldBench 上超越 Claude Opus 4.8 和 GPT-5.4。

3. 智能体与应用:生态加速落地

  • 国民级 App 开放接口: 16 款 App 将核心能力封装为 Skill、MCP 或 CLI,覆盖餐饮、出行、办公、支付等场景。支付环节目前仍需用户跳转 App 完成,但 Agent 化趋势已不可逆。
  • 企业级应用: 浦发银行上线超 2500 个金融智能体,覆盖营销、风控等核心场景。Notion 通过 Cursor SDK 嵌入编码智能体,用户可在文档中直接调用。PostHog 工程师用多个并行 Claude Code 会话重写 SQL 解析器,速度提升 70 倍。
  • 内容生产: 百度智能云联合伙伴加速 AIGC 内容工业化生产,漫剧制作周期压缩 90%。字节 Seedance 2.0 4K 视频模型日均收益超 3000 万元。广电总局发布 AI 微短剧分类分层标准,7 月 1 日起施行。

4. 行业竞争与监管:蒸馏、出口管制与人才流动

  • 蒸馏攻击升级: Anthropic 指控阿里通过 2.5 万假账户进行 2880 万次交互,实施“迄今已知最大规模的蒸馏攻击”。此前 Anthropic 曾点名 DeepSeek、MiniMax、Moonshot AI。美国商务部已对 Anthropic 的 Fable 5 模型发出出口管制令。
  • 人才流动: Google DeepMind 核心研究人员持续流失至 Anthropic 和 OpenAI,包括 Gemini 团队关键人物 Jonas Adler 和 Alexander Pritzel。SignalFire 分析显示,DeepMind 工程师流向 Anthropic 的频率是反方向的 11 倍。
  • 监管动态: 美国国会两党计划在国防授权法中提出修正案,对非法获取美国 AI 模型输出的中国公司实施制裁。谷歌前 CEO 施密特批评中国 AI 开源“不受控制”。

5. 市场与趋势:成本、瓶颈与反思

  • 成本与 ROI: 高盛预测 AI 智能体 token 使用量到 2030 年增长 24 倍,推理成本每年下降 60%-70%。Uber 和 Microsoft 已开始重新考虑昂贵的智能体使用。Snowflake CEO 实测显示,GLM-5.2 编程能力接近 Opus 4.7,但成本仅为几分之一。
  • 基础设施瓶颈: AI 数据中心扩张的真正瓶颈是电网接入。美国电网并网等待时间中位数已增至 55 个月。亚马逊在印度追加 130 亿美元投资 AI 基础设施。
  • 反思与局限: 福特因 AI 未能有效保留专业知识,重新聘用了 350 名工程师。AI 编码智能体导致 OpenClaw 项目 PR 泛滥,合并率从 48% 暴跌至 9.3%。一个名为“你的 AI 垃圾让我厌烦”的网站吸引上万人假扮 AI 互相聊天,折射出人类互动的稀缺。

值得继续关注

  1. OpenAI Jalapeño 芯片的后续部署与性能实测,以及其对 Nvidia 市场地位的影响。
  2. Anthropic 指控阿里蒸馏事件的后续发展,包括美国政府的制裁措施及阿里方面的回应。
  3. Ornith-1.0 和 GLM-5.2 等开源模型的实际应用效果,以及它们对闭源模型定价的冲击。
  4. 16 款国民级 App 开放 MCP 接口后的实际 Agent 应用案例,尤其是支付环节的打通进展。
  5. AI 智能体带来的代码质量与项目管理挑战,如 PR 泛滥问题,以及社区如何应对。
  6. 内存芯片短缺对消费电子和 AI 基础设施建设的持续影响

本日报由 Flowtify 公开资讯日报编辑生成,基于 2026-06-25 已精选动态。