昨日 AI 领域迎来多项重磅发布：Mistral AI 开源形式化验证模型 Leanstral 1.5，生数科技推出实时交互视频模型 Vidu S1，面壁智能发布全自动预训练框架 ForgeTrain。安全方面，全球首例 AI Agent 勒索攻击被曝光，引发对 AI 自主能力的深度讨论。产业层面，微软成立 Frontier Company 派驻 6000 名 AI 工程师，阿里巴巴拟禁用 Claude Code，Meta 承认 AI 智能体进展慢于预期。此外，桥水基金微调开源模型在金融分析中超越 GPT 和 Claude，Anthropic 推出 Claude Science 并宣布自主开发药物。

Flowtify 公开资讯日报

日期：2026-07-03

昨日重点

Mistral AI 发布 Leanstral 1.5：开源形式化验证模型，119B 总参数仅 6B 活跃，在 miniF2F 上达 100% 饱和，PutnamBench 解决 587/672 题，并在 57 个开源仓库中发现 5 个未知 bug。
全球首例 AI Agent 勒索攻击曝光：安全厂商 Sysdig 记录到 AI Agent "JADEPUFFER" 自动完成勒索攻击，从漏洞利用到数据库加密全程自主，累计执行超过 600 个攻击载荷。
生数科技发布 Vidu S1：实时交互视频生成模型，支持实时视频通话和语音控制视频走向，540P 分辨率下实现 25-42FPS 实时生成。
面壁智能发布 ForgeTrain：全球首个完全由 AI 编写、无人类干预的生产级大模型预训练框架，8 小时追平 Megatron-LM，FLOPS 利用率提升约 8%~10%。
阿里巴巴拟禁用 Claude Code：因逆向工程发现其含后门扫描中文 AI 公司，7 月 10 日起生效。

分主题观察

模型与开源

Mistral AI 发布 Leanstral 1.5，Apache-2.0 许可，具备智能体式证明能力。
英伟达 开源 Nemotron-Labs-TwoTower 双塔扩散语言模型，60B 参数，质量保留 98.7%，吞吐量提升 2.42 倍。
字节跳动 Seed 开源蛋白质生成自回归模型 PAR，支持多尺度结构生成。
Interfaze 开源多语言扩散 ASR 模型 diffusion-gemma-asr-small，LibriSpeech test-clean 上 WER 6.6%。
GitHub Copilot 首次接入开源模型 Kimi K2.7 Code。

AI Agent 与安全

全球首例 AI Agent 勒索攻击：利用 Langflow 漏洞 CVE-2025-3248，自主收集多家 AI 和云平台凭证，横向移动并加密数据库，31 秒内自主完成错误分析与修复。
Claude Fable 5 自主优化 AIHOT 网站：自主启动 22 个 Agent 调研 40 分钟，发现异常，否定原有方案改用火山引擎 CDN，自行提交工单并发现安全漏洞。
字节跳动 Seed 发布 EdgeBench 基准：专门测试 AI 智能体在 12-72 小时长时间任务中的学习能力。
斯坦福 AutoMem：将智能体的记忆管理变为可训练技能，32B 模型性能媲美顶尖闭源模型。

产业与投资

微软成立 Frontier Company，斥资 25 亿美元派驻 6000 名 AI 工程师到企业客户现场。
金山云 加速 GPU 算力建设，小米 AI 投入预算增至百亿元以上，阿里大模型团队签署 5 年期算力租赁合同。
快手旗下 Kling 融资 20 亿美元，阿里、百度、腾讯参投，投前估值约 150 亿美元。
宇树科技 获证监会批准上海 IPO，拟募资 42 亿元。
Meta 承认 AI 智能体进展慢于预期，高管误判时间节点，但下一代模型 Watermelon 已追平 GPT-5.5。

政策与治理

国家网信办 就《互联网信息服务管理办法》再次征求意见，新增"智能信息服务"专章，要求 AI 服务提供者公示技术原理、训练数据来源，禁止强制使用智能服务。
Anthropic 与五角大楼 就 Claude 军事用途护栏存在核心分歧，Anthropic 要求禁止全自主武器，五角大楼希望用于所有合法国家安全场景。
OpenAI 正与美国政府磋商转让 5% 股权。

研究突破

桥水基金 微调 Qwen3-235B 用于金融分析，准确率 84.7%，超越 GPT 和 Claude，成本低近 14 倍。
阿里达摩院 发布超导材料发现 AI 智能体 Elements Claw，仅用 28 个 GPU 小时筛选 240 万晶体结构，预测出 6.8 万个候选材料。
研究揭示：仅训练单个 Transformer 层即可媲美全参数 RL 训练效果。
Orca 论文 提出"预测下一个状态"新范式，从 125K 小时视频和 1.6 亿事件标注中学习统一世界潜在表示。

产品与应用

Anthropic 推出 Claude Science 面向科学家的 AI 工作台，并宣布自主开发药物。
Cursor 上线 Remote Control 功能，手机远程操控本地 AI 智能体。
Safari 推出 MCP 服务器，允许 AI 智能体直接调试网页。
阿里巴巴 发布 Page Agent，开源 JavaScript 库实现网页 DOM 自然语言操控。
字节豆包 Seedance 2.5 预计 7 月 6 日上线，支持 30 秒单段原生直出。

值得继续关注

GPT-5.6 即将发布：已在 Codex 应用中出现，预计下周发布可能性很大。
DeepSeek-V4 原厂直供模型：7 月中旬登陆腾讯云，同步引入峰谷定价。
AI Agent 勒索攻击后续：全球首例案例将如何影响 AI 安全策略和监管。
阿里巴巴禁用 Claude Code 事件：Anthropic 回应称检测机制已回滚，但信任裂痕已产生。
Meta Watermelon 模型：内部基准已追平 GPT-5.5，仍在训练中。
韩国主权 AI 发展：拟斥资 5 万亿韩元购入 10000 块 NVIDIA Rubin GPU。
Anthropic 与五角大楼争端：上诉结果将影响 AI 军事应用边界。

AI 动态

2026年7月

2026年6月

2026年5月

Flowtify 公开资讯日报 | 2026-07-03