AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年5月29日

Anthropic 三连击:Opus 4.8、650 亿美元融资与动态工作流引爆 AI 圈

昨日 AI 领域被 Anthropic 的密集动作主导:发布旗舰模型 Claude Opus 4.8,在编码、推理与诚实度上全面升级;完成 650 亿美元 H 轮融资,估值逼近万亿美元;推出 Claude Code 动态工作流,支持数百个并行子智能体处理复杂任务。与此同时,阶跃星辰开源了聚焦智能体效率的 Step 3.7 Flash 模型,谷歌 DeepMind CEO 预测 AGI 最快三年内到来,而 Claude Opus 4.8 也因被曝“蒸馏”中国模型陷入争议。

Flowtify 公开资讯日报 | AI 动态

日期:2026-05-29


昨日重点

1. Anthropic 发布 Claude Opus 4.8

Anthropic 发布新一代旗舰模型 Claude Opus 4.8,在编码、智能体技能、推理和实用知识工作等基准测试中均取得显著进步。核心提升包括:

  • 编码与诚实度:代码错误漏检率降低约 75%,SWE-bench Pro 得分从 64.3% 提升至 69.2%。
  • 新功能:用户可控制任务投入程度、Claude Code 动态工作流,以及 2.5 倍速模式(价格降低为以往的三分之一)。
  • 价格:标准模式价格与前代相同,快速模式大幅降价。
  • 争议:用户发现其在某些场景下自称是阿里千问或 DeepSeek,引发“蒸馏”中国模型的质疑。

2. Anthropic 完成 650 亿美元 H 轮融资

Anthropic 宣布完成 650 亿美元 H 轮融资,投后估值达 9650 亿美元,超越 OpenAI。公司年化收入已突破 470 亿美元。资金将用于推进 AI 安全研究、扩大算力合作和规模化产品线。Claude 成为首个同时在 AWS、Google Cloud 和 Microsoft Azure 上线的前沿模型。

3. Claude Code 推出动态工作流

Claude Code 推出“动态工作流”功能,将工作模式从单个 agent 执行升级为 agent 自主担任项目经理与调度层。该功能根据用户 prompt 动态生成编排脚本,在单次会话中启动数十至数百个并行 subagent,并对结果进行独立验证。标杆案例:Bun 从 Zig 迁移至约 75 万行 Rust 代码,99.8% 现有测试通过,从首次 commit 到 merge 仅用时 11 天。


分主题观察

模型发布与更新

  • 阶跃星辰 Step 3.7 Flash:开源视觉语言模型,198B 参数 MoE 架构,约 11B 活跃参数,支持 256K 上下文,在 τ2-bench 上得分超 98%,兼容 Claude Code 和 MCP 协议。
  • Google 发布 Nano Banana 系列:Nano Banana Pro 和 Nano Banana 2 模型正式上线 Gemini API。
  • ChatGPT 上线 GPT-5.5 Instant:改进了输出风格,在谄媚性、事实性和多语言性能方面有所提升。

推理与基础设施

  • Kog 实现超高速推理:在标准 GPU 上达到 3,000 tokens/s(8× AMD MI300X),技术核心是将 token 生成循环置于单一持久 GPU 程序内。
  • SGLang 与 AMD 合作:优化 MI355X GPU 运行 DeepSeek-R1 推理,成本比 NVIDIA B200 方案低 5%-40%。
  • 字节跳动自研推理芯片:基于 Groq LPU 架构,设计旨在绕过美国出口限制。

行业趋势与观点

  • AGI 预测:谷歌 DeepMind CEO 哈萨比斯预测 AGI 最快在 2029-2030 年到来,但警告全球社会准备不足。
  • AI 编程趋势:Cursor 开发者报告揭示五大趋势,包括 AI 理解代码上下文的成本急剧上升、AI 自主性提高等。
  • 开源项目抵制 AI 代码:QEMU、NetBSD、Zig、OBS Studio 等知名开源项目全面禁止 AI 生成的代码贡献。
  • 组织效率问题:MIT Sloan 报告显示 95% 企业 AI 投资未产生可衡量回报,导致“个人在飞,组织在垮”现象。

其他重要动态

  • OpenAI 推生物防御平台 GPT-Rosalind:旨在加速生物防御领域的防御性进展。
  • 小米开源 ControlFoley:可控视频音效生成模型,在多个基准测试上取得开源 SOTA。
  • 苹果 iOS 27 爆料:Siri 彻底重做,AI 功能系统级整合。
  • 江西赣州智驾事故:司机激活智驾后双手脱离方向盘,致 3 死。

值得继续关注

  1. Anthropic 的后续动作:Opus 4.8 的“蒸馏”争议如何发展?动态工作流是否会成为行业标准?
  2. 阶跃星辰 Step 3.7 Flash:作为开源模型,其在智能体工作流中的实际表现和社区采用情况。
  3. Kog 推理技术:其超高速推理方案是否会改变推理成本结构?
  4. AI 编程工具演进:Cursor 报告揭示的趋势是否意味着 AI 编程将进入新阶段?
  5. 开源社区与 AI 的张力:更多项目是否会跟进禁止 AI 代码贡献?