2026年7月1日
Flowtify 公开资讯日报 | 2026-07-01
Anthropic 发布 Claude Sonnet 5,性能接近 Opus 4.8 但定价更低,同时 Fable 5 和 Mythos 5 在美国解除出口管制后恢复访问。美团发布万亿参数大模型 LongCat-2.0,全程运行于国产芯片。Jim Fan 团队推出机器人技能库自我进化系统 ASPIRE。日本启动国家级 AI 机器人计划,目标 2040 年部署 1000 万台。此外,Meta 发布非侵入式脑机接口 Brain2Qwerty v2,OpenAI 论文揭示 GPT-5.6 三个 Pro 变体。
Flowtify 公开资讯日报
日期:2026-07-01
📌 昨日重点
1. Anthropic 密集发布:Sonnet 5 上线,Fable 5 解禁
- Claude Sonnet 5 发布,定位最具智能体能力的 Sonnet 模型,性能接近 Opus 4.8,定价更低(推广期输入 $2/百万 token、输出 $10/百万 token)。支持 1M token 上下文窗口,在 SWE-bench Pro 得分 63.2%,Terminal-Bench 2.1 得分 80.4%。
- Claude Fable 5 和 Mythos 5 在美国商务部解除出口管制后,于 7 月 1 日起全球恢复访问。Anthropic 部署了新安全分类器,可阻断 99% 以上的越狱攻击。
- Claude Science 科研 AI 工作台正式上线,内置 60+ 科学数据库与技能,支持本地部署和 HPC 远程连接。
- Claude Code 隐写术争议:社区发现 Claude Code 内置检测中国用户的隐蔽代码,Anthropic 承认是实验性措施,承诺在 7 月 2 日更新中回滚。
2. 美团发布万亿参数大模型 LongCat-2.0
- 总参数 1.6T,每 token 激活约 480 亿参数的 MoE 模型,从预训练到部署全程运行在 5 万张国产算力芯片上。
- 训练消耗超 35 万亿 tokens,原生支持 1M 超长上下文。
- 在 Agent 场景表现突出,编程任务追平 Gemini 3.1 Pro,通用 Agent 任务与 Claude Opus 4.6 持平。
- 已开源并开放 API 接入,支持 OpenAI 和 Anthropic 生态。
3. Jim Fan 团队推出 ASPIRE 机器人技能库系统
- 为机器人构建可自我进化、无限累积的技能库,通过编码智能体观察多模态感官轨迹,对控制程序进行进化搜索。
- 无需梯度下降或端到端策略,绕过 sim2real 和跨本体迁移难题,实现约 10 倍迁移学习 token 缩减。
- 已在 150+ 任务和 90+ 技能上验证,计划开源全栈。
4. 日本启动国家级 AI 机器人计划
- 日本经济产业省与 NEDO 委托开发“物理 AI”多模态基础模型,使机器人能自主理解环境并行动。
- 初始版本计划本财年发布,政府目标到 2040 年在 18 个行业部署 1000 万台 AI 机器人。
- 资金上限 1 万亿日元(约 61 亿美元)。
5. Meta 发布非侵入式脑机接口 Brain2Qwerty v2
- 基于脑磁图(MEG)设备,无需手术植入即可实时解码句子。
- 平均词准确率 61%,最佳参与者达 78%,远超其他非侵入方法的 8%。
- Meta 已开源 v1 和 v2 训练代码。
6. OpenAI 论文揭示 GPT-5.6 三个 Pro 变体
- 首次列出 GPT-5.6 的三个 Pro 变体:Luna Pro、Terra Pro 和 Sol Pro,取代以往单一 Pro 模式。
- 在基因组学基准中,Sol Pro 通过率 31.5% 居 60 个测试模型之首,领先标准 Sol(28.7%)和 Claude Opus 4.8(16.0%)。
🔍 分主题观察
🤖 模型与产品发布
- Anthropic:Claude Sonnet 5(中端智能体模型)、Claude Science(科研工作台)、Fable 5/Mythos 5 解禁回归。
- 美团:LongCat-2.0(万亿参数 MoE,国产芯片训练)。
- Google DeepMind:Nano Banana 2 Lite(快速图像生成,$0.034/千张)、Gemini Omni Flash(视频编辑 SOTA,$0.10/秒)。
- 面壁智能:VoxCPM2(2B 开源语音编辑模型,支持 30 种语言)。
- Google Research:TabFM v1.0.0(零样本表格数据基座模型)。
🧠 前沿研究
- ASPIRE(Jim Fan 团队):机器人技能库自我进化系统。
- Brain2Qwerty v2(Meta):非侵入式脑机接口,词准确率 78%。
- prover-verifier LLM 循环:攻克 9 个未解数学难题。
- GeneBench-Pro(OpenAI):评估 AI 模型生物学计算能力的基准测试。
🏢 行业与商业动态
- 日本:国家级 AI 机器人计划,目标 2040 年部署 1000 万台。
- Meta:计划推出云基础设施业务 Meta Compute,出售多余 AI 算力。
- 亚马逊 AWS:投入 10 亿美元派遣工程师进驻客户公司,协助落地 AI 应用。
- Venice AI:完成 6500 万美元 A 轮融资,估值 10 亿美元。
- EquiLibre(前 DeepMind 团队):将扑克 AI 强化学习用于量化交易,估值 5 亿美元。
- Etched:走出隐身模式,首套推断系统今夏发货,获超 10 亿美元客户合同。
- 英伟达:刷新 DeepSeek V4 推理纪录,单 Token 成本降至 1/5。
- OpenAI:将部分模型推理成本降低过半,未登录 ChatGPT 仅用几百张 GPU。
🔒 安全与治理
- Anthropic Fable 5 出口管制:美国商务部解除管制,Anthropic 部署新分类器,正与 Amazon、Microsoft、Google 等起草 AI 越狱评估框架。
- Claude Code 隐写术争议:Anthropic 承认内置检测中国用户的实验性代码,承诺回滚。
- Google 下一代 TPU(Humufish):确认采用 Intel EMIB-T 封装,首次脱离 TSMC CoWoS 生态。
👀 值得继续关注
- Anthropic 后续更新:Fable 5 恢复后的实际使用体验、安全分类器误报率优化、与科技巨头合作的 AI 越狱评估框架进展。
- 美团 LongCat-2.0 生态发展:开源后社区采用情况、API 调用量增长、国产芯片大模型训练的实际效果验证。
- 日本 AI 机器人计划:物理 AI 基础模型开发进展、2040 年部署目标的阶段性里程碑。
- Meta 云业务 Meta Compute:与 AWS、Azure、Google Cloud 的竞争格局、定价策略。
- 非侵入式脑机接口:Meta Brain2Qwerty v2 的开源社区应用、医疗与辅助技术领域的落地。
- AI 安全治理:美国出口管制政策走向、行业共识框架的制定、模型越狱防护技术的演进。
- 机器人技能库系统 ASPIRE:开源后的社区贡献、跨本体迁移的实际效果验证。
- OpenAI GPT-5.6 Pro 变体:三个 Pro 变体是否会正式推出、对 ChatGPT 订阅策略的影响。