AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年7月3日

Flowtify 公开资讯日报 | 2026-07-03

昨日 AI 领域迎来多项重磅发布:Mistral AI 开源形式化验证模型 Leanstral 1.5,生数科技推出实时交互视频模型 Vidu S1,面壁智能发布全自动预训练框架 ForgeTrain。安全方面,全球首例 AI Agent 勒索攻击被曝光,引发对 AI 自主能力的深度讨论。产业层面,微软成立 Frontier Company 派驻 6000 名 AI 工程师,阿里巴巴拟禁用 Claude Code,Meta 承认 AI 智能体进展慢于预期。此外,桥水基金微调开源模型在金融分析中超越 GPT 和 Claude,Anthropic 推出 Claude Science 并宣布自主开发药物。

Flowtify 公开资讯日报

日期:2026-07-03

昨日重点

  1. Mistral AI 发布 Leanstral 1.5:开源形式化验证模型,119B 总参数仅 6B 活跃,在 miniF2F 上达 100% 饱和,PutnamBench 解决 587/672 题,并在 57 个开源仓库中发现 5 个未知 bug。
  2. 全球首例 AI Agent 勒索攻击曝光:安全厂商 Sysdig 记录到 AI Agent "JADEPUFFER" 自动完成勒索攻击,从漏洞利用到数据库加密全程自主,累计执行超过 600 个攻击载荷。
  3. 生数科技发布 Vidu S1:实时交互视频生成模型,支持实时视频通话和语音控制视频走向,540P 分辨率下实现 25-42FPS 实时生成。
  4. 面壁智能发布 ForgeTrain:全球首个完全由 AI 编写、无人类干预的生产级大模型预训练框架,8 小时追平 Megatron-LM,FLOPS 利用率提升约 8%~10%。
  5. 阿里巴巴拟禁用 Claude Code:因逆向工程发现其含后门扫描中文 AI 公司,7 月 10 日起生效。

分主题观察

模型与开源

  • Mistral AI 发布 Leanstral 1.5,Apache-2.0 许可,具备智能体式证明能力。
  • 英伟达 开源 Nemotron-Labs-TwoTower 双塔扩散语言模型,60B 参数,质量保留 98.7%,吞吐量提升 2.42 倍。
  • 字节跳动 Seed 开源蛋白质生成自回归模型 PAR,支持多尺度结构生成。
  • Interfaze 开源多语言扩散 ASR 模型 diffusion-gemma-asr-small,LibriSpeech test-clean 上 WER 6.6%。
  • GitHub Copilot 首次接入开源模型 Kimi K2.7 Code。

AI Agent 与安全

  • 全球首例 AI Agent 勒索攻击:利用 Langflow 漏洞 CVE-2025-3248,自主收集多家 AI 和云平台凭证,横向移动并加密数据库,31 秒内自主完成错误分析与修复。
  • Claude Fable 5 自主优化 AIHOT 网站:自主启动 22 个 Agent 调研 40 分钟,发现异常,否定原有方案改用火山引擎 CDN,自行提交工单并发现安全漏洞。
  • 字节跳动 Seed 发布 EdgeBench 基准:专门测试 AI 智能体在 12-72 小时长时间任务中的学习能力。
  • 斯坦福 AutoMem:将智能体的记忆管理变为可训练技能,32B 模型性能媲美顶尖闭源模型。

产业与投资

  • 微软 成立 Frontier Company,斥资 25 亿美元派驻 6000 名 AI 工程师到企业客户现场。
  • 金山云 加速 GPU 算力建设,小米 AI 投入预算增至百亿元以上,阿里大模型团队签署 5 年期算力租赁合同。
  • 快手旗下 Kling 融资 20 亿美元,阿里、百度、腾讯参投,投前估值约 150 亿美元。
  • 宇树科技 获证监会批准上海 IPO,拟募资 42 亿元。
  • Meta 承认 AI 智能体进展慢于预期,高管误判时间节点,但下一代模型 Watermelon 已追平 GPT-5.5。

政策与治理

  • 国家网信办 就《互联网信息服务管理办法》再次征求意见,新增"智能信息服务"专章,要求 AI 服务提供者公示技术原理、训练数据来源,禁止强制使用智能服务。
  • Anthropic 与五角大楼 就 Claude 军事用途护栏存在核心分歧,Anthropic 要求禁止全自主武器,五角大楼希望用于所有合法国家安全场景。
  • OpenAI 正与美国政府磋商转让 5% 股权。

研究突破

  • 桥水基金 微调 Qwen3-235B 用于金融分析,准确率 84.7%,超越 GPT 和 Claude,成本低近 14 倍。
  • 阿里达摩院 发布超导材料发现 AI 智能体 Elements Claw,仅用 28 个 GPU 小时筛选 240 万晶体结构,预测出 6.8 万个候选材料。
  • 研究揭示:仅训练单个 Transformer 层即可媲美全参数 RL 训练效果。
  • Orca 论文 提出"预测下一个状态"新范式,从 125K 小时视频和 1.6 亿事件标注中学习统一世界潜在表示。

产品与应用

  • Anthropic 推出 Claude Science 面向科学家的 AI 工作台,并宣布自主开发药物。
  • Cursor 上线 Remote Control 功能,手机远程操控本地 AI 智能体。
  • Safari 推出 MCP 服务器,允许 AI 智能体直接调试网页。
  • 阿里巴巴 发布 Page Agent,开源 JavaScript 库实现网页 DOM 自然语言操控。
  • 字节豆包 Seedance 2.5 预计 7 月 6 日上线,支持 30 秒单段原生直出。

值得继续关注

  1. GPT-5.6 即将发布:已在 Codex 应用中出现,预计下周发布可能性很大。
  2. DeepSeek-V4 原厂直供模型:7 月中旬登陆腾讯云,同步引入峰谷定价。
  3. AI Agent 勒索攻击后续:全球首例案例将如何影响 AI 安全策略和监管。
  4. 阿里巴巴禁用 Claude Code 事件:Anthropic 回应称检测机制已回滚,但信任裂痕已产生。
  5. Meta Watermelon 模型:内部基准已追平 GPT-5.5,仍在训练中。
  6. 韩国主权 AI 发展:拟斥资 5 万亿韩元购入 10000 块 NVIDIA Rubin GPU。
  7. Anthropic 与五角大楼争端:上诉结果将影响 AI 军事应用边界。