AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年7月1日

Flowtify 公开资讯日报 | 2026-07-01

Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但定价更低,同时 Fable 5 和 Mythos 5 在美国解除出口管制后恢复访问。美团发布万亿参数大模型 LongCat-2.0,全程运行于国产芯片。Jim Fan 团队推出机器人技能库自我进化系统 ASPIRE。日本启动国家级 AI 机器人计划,目标 2040 年部署 1000 万台。此外,Meta 发布非侵入式脑机接口 Brain2Qwerty v2,OpenAI 论文揭示 GPT-5.6 三个 Pro 变体。

Flowtify 公开资讯日报

日期:2026-07-01

📌 昨日重点

1. Anthropic 密集发布:Sonnet 5 上线,Fable 5 解禁

  • Claude Sonnet 5 发布,定位最具智能体能力的 Sonnet 模型,性能接近 Opus 4.8,定价更低(推广期输入 $2/百万 token、输出 $10/百万 token)。支持 1M token 上下文窗口,在 SWE-bench Pro 得分 63.2%,Terminal-Bench 2.1 得分 80.4%。
  • Claude Fable 5 和 Mythos 5 在美国商务部解除出口管制后,于 7 月 1 日起全球恢复访问。Anthropic 部署了新安全分类器,可阻断 99% 以上的越狱攻击。
  • Claude Science 科研 AI 工作台正式上线,内置 60+ 科学数据库与技能,支持本地部署和 HPC 远程连接。
  • Claude Code 隐写术争议:社区发现 Claude Code 内置检测中国用户的隐蔽代码,Anthropic 承认是实验性措施,承诺在 7 月 2 日更新中回滚。

2. 美团发布万亿参数大模型 LongCat-2.0

  • 总参数 1.6T,每 token 激活约 480 亿参数的 MoE 模型,从预训练到部署全程运行在 5 万张国产算力芯片上。
  • 训练消耗超 35 万亿 tokens,原生支持 1M 超长上下文。
  • 在 Agent 场景表现突出,编程任务追平 Gemini 3.1 Pro,通用 Agent 任务与 Claude Opus 4.6 持平。
  • 已开源并开放 API 接入,支持 OpenAI 和 Anthropic 生态。

3. Jim Fan 团队推出 ASPIRE 机器人技能库系统

  • 为机器人构建可自我进化、无限累积的技能库,通过编码智能体观察多模态感官轨迹,对控制程序进行进化搜索。
  • 无需梯度下降或端到端策略,绕过 sim2real 和跨本体迁移难题,实现约 10 倍迁移学习 token 缩减。
  • 已在 150+ 任务和 90+ 技能上验证,计划开源全栈。

4. 日本启动国家级 AI 机器人计划

  • 日本经济产业省与 NEDO 委托开发“物理 AI”多模态基础模型,使机器人能自主理解环境并行动。
  • 初始版本计划本财年发布,政府目标到 2040 年在 18 个行业部署 1000 万台 AI 机器人。
  • 资金上限 1 万亿日元(约 61 亿美元)。

5. Meta 发布非侵入式脑机接口 Brain2Qwerty v2

  • 基于脑磁图(MEG)设备,无需手术植入即可实时解码句子。
  • 平均词准确率 61%,最佳参与者达 78%,远超其他非侵入方法的 8%。
  • Meta 已开源 v1 和 v2 训练代码。

6. OpenAI 论文揭示 GPT-5.6 三个 Pro 变体

  • 首次列出 GPT-5.6 的三个 Pro 变体:Luna Pro、Terra Pro 和 Sol Pro,取代以往单一 Pro 模式。
  • 在基因组学基准中,Sol Pro 通过率 31.5% 居 60 个测试模型之首,领先标准 Sol(28.7%)和 Claude Opus 4.8(16.0%)。

🔍 分主题观察

🤖 模型与产品发布

  • Anthropic:Claude Sonnet 5(中端智能体模型)、Claude Science(科研工作台)、Fable 5/Mythos 5 解禁回归。
  • 美团:LongCat-2.0(万亿参数 MoE,国产芯片训练)。
  • Google DeepMind:Nano Banana 2 Lite(快速图像生成,$0.034/千张)、Gemini Omni Flash(视频编辑 SOTA,$0.10/秒)。
  • 面壁智能:VoxCPM2(2B 开源语音编辑模型,支持 30 种语言)。
  • Google Research:TabFM v1.0.0(零样本表格数据基座模型)。

🧠 前沿研究

  • ASPIRE(Jim Fan 团队):机器人技能库自我进化系统。
  • Brain2Qwerty v2(Meta):非侵入式脑机接口,词准确率 78%。
  • prover-verifier LLM 循环:攻克 9 个未解数学难题。
  • GeneBench-Pro(OpenAI):评估 AI 模型生物学计算能力的基准测试。

🏢 行业与商业动态

  • 日本:国家级 AI 机器人计划,目标 2040 年部署 1000 万台。
  • Meta:计划推出云基础设施业务 Meta Compute,出售多余 AI 算力。
  • 亚马逊 AWS:投入 10 亿美元派遣工程师进驻客户公司,协助落地 AI 应用。
  • Venice AI:完成 6500 万美元 A 轮融资,估值 10 亿美元。
  • EquiLibre(前 DeepMind 团队):将扑克 AI 强化学习用于量化交易,估值 5 亿美元。
  • Etched:走出隐身模式,首套推断系统今夏发货,获超 10 亿美元客户合同。
  • 英伟达:刷新 DeepSeek V4 推理纪录,单 Token 成本降至 1/5。
  • OpenAI:将部分模型推理成本降低过半,未登录 ChatGPT 仅用几百张 GPU。

🔒 安全与治理

  • Anthropic Fable 5 出口管制:美国商务部解除管制,Anthropic 部署新分类器,正与 Amazon、Microsoft、Google 等起草 AI 越狱评估框架。
  • Claude Code 隐写术争议:Anthropic 承认内置检测中国用户的实验性代码,承诺回滚。
  • Google 下一代 TPU(Humufish):确认采用 Intel EMIB-T 封装,首次脱离 TSMC CoWoS 生态。

👀 值得继续关注

  1. Anthropic 后续更新:Fable 5 恢复后的实际使用体验、安全分类器误报率优化、与科技巨头合作的 AI 越狱评估框架进展。
  2. 美团 LongCat-2.0 生态发展:开源后社区采用情况、API 调用量增长、国产芯片大模型训练的实际效果验证。
  3. 日本 AI 机器人计划:物理 AI 基础模型开发进展、2040 年部署目标的阶段性里程碑。
  4. Meta 云业务 Meta Compute:与 AWS、Azure、Google Cloud 的竞争格局、定价策略。
  5. 非侵入式脑机接口:Meta Brain2Qwerty v2 的开源社区应用、医疗与辅助技术领域的落地。
  6. AI 安全治理:美国出口管制政策走向、行业共识框架的制定、模型越狱防护技术的演进。
  7. 机器人技能库系统 ASPIRE:开源后的社区贡献、跨本体迁移的实际效果验证。
  8. OpenAI GPT-5.6 Pro 变体:三个 Pro 变体是否会正式推出、对 ChatGPT 订阅策略的影响。