AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年6月5日

Flowtify 公开资讯日报 | 2026-06-05

Anthropic 发布重磅报告,称其 Claude 模型能力加速,接近递归自我改进,并呼吁全球暂缓前沿 AI 研发;OpenAI 为 ChatGPT 上线全新“Dreaming”记忆系统;Cloudflare 数据显示机器人流量首次超过人类;Kimi 发布 Kimi Work,支持 300 Agent 协作;NVIDIA 确认三大内存供应商为 HBM4 供货;腾讯称今年大部分代码由 AI 生成。

Flowtify 公开资讯日报

日期:2026-06-05 | 主题:AI 动态


一、昨日重点

1. Anthropic 发布递归自我改进报告,呼吁全球暂缓前沿 AI 研发

Anthropic 内部数据显示,Claude 能力增速远超预期,可能接近递归自我改进——即 AI 自主构建更强大的后继者。关键指标:

  • 工程师人均季度代码产出是此前四年平均的 8 倍
  • AI 可可靠完成的任务时长每 4 个月翻倍,Mythos Preview 可连续工作超 16 小时
  • 截至 2026 年 5 月,Claude 撰写代码占 Anthropic 代码库 80%+,代码质量已与人类持平。

Anthropic 公开呼吁全球采取行动减缓前沿 AI 发展,主张建立可验证的全球 AI 开发暂停机制,类比“核武器不扩散条约”。该观点引发美国白宫部分官员不满,批评其夸大风险。

2. OpenAI 为 ChatGPT 上线“Dreaming”记忆系统

OpenAI 为 ChatGPT 推出名为“Dreaming”的新型记忆系统。新系统将记忆从“存储笔记”转变为“主动维护画像”:跨对话扫描历史,提取仍有用的内容,更新已变化的信息,并生成可见摘要供用户审查或纠正。系统已开始逐步推送。

3. Cloudflare:机器人流量首次超过人类

Cloudflare 数据显示,机器人已生成全球 57.4% 的 HTML 请求,人类仅占 42.6%。AI Agent 是主因:一个用户任务可触发数千次机器访问,它们替人类读取页面,却跳过广告浏览、会话时长等信号。Cloudflare CEO 表示网络的未来将是“pay to crawl”(付费爬取)。

4. Kimi Work 发布:300 Agent 协作,面向办公场景

Kimi 推出新工具 Kimi Work,继承 Kimi Code 核心功能和 Kimi Agent 的专业技能,并打通金融、科研、法律等专业数据库。用户通过文字描述需求即可让系统拆解任务、并行执行,最多可同时调度 300 个 Agent 互相配合,最终交付文档、表格、PPT 等成果。

5. 腾讯:今年大部分代码由 AI 生成

在腾讯云 AI 产业应用大会上,腾讯高级执行副总裁汤道生表示,今年腾讯大部分代码都由 AI 生成,工程师将更多时间用于架构设计。腾讯 2026 年 Q1 财报显示,AI 研发团队重构了基础设施,并搭建了 Hy3 preview 模型。去年在 AI 新产品上投入 180 亿元,今年投入至少翻倍。


二、分主题观察

🧠 模型与能力突破

  • Anthropic 递归自我改进:Claude 训练代码加速从 3 倍升至 52 倍,有经验工程师在相同设置下仅约 4 倍。人类剩余优势在于研究判断。
  • OpenAI 模型发现 80 年历史的 Erdős 猜想反例:研究人员在播客中分享了这一故事,并解释了数学家与模型如何合作取得新发现。
  • Google LEAP 框架:将通用 LLM 形式化数学证明性能从不到 10% 提升至 70%,在 Putnam 2025 竞赛中成功解出全部 12 道题。
  • NVIDIA 发布 Nemotron 3 Ultra:550B MoE 混合 Mamba-Transformer 模型,支持 1M token 上下文窗口,推理速度提升 5 倍。
  • NVIDIA 发布 Nemotron 3.5 Content Safety:多模态安全模型,支持 128K 上下文,可对用户提示、图像和助手响应进行统一安全评估。

🛠️ 产品与应用

  • Kimi Work:300 Agent 协作办公工具,打通专业数据库。
  • OpenAI Build iOS Apps 插件:Codex 内可直接运行 iOS 应用并热重载。
  • 谷歌 Magenta RealTime 2:本地实时音乐 AI 模型,延迟降至约 200 毫秒。
  • xAI 图转视频模型:支持 720p 电影感视频生成。
  • Meta Business Agent:在 Instagram、Messenger 等平台集成对话式商务工作流。
  • 苹果新版 Siri:内部标记为 Beta,部分查询将调用谷歌 Gemini。

🏭 基础设施与算力

  • NVIDIA 确认三大内存供应商为 HBM4 供货:三星、SK 海力士、美光通过认证,为 Vera Rubin 平台供应 HBM4。
  • NVIDIA 开源 Rubin NVSwitch Tray:内含 AMD CPU,已在 GitHub 开源。
  • AMD 展示 Helios 机架级 AI 平台:配置 72 颗 Instinct MI455X 加速器,总计 31TB HBM4 显存。
  • 深圳团队依托华为昇腾 910C 训练 1.6 万亿参数模型:算力利用率超过 30%,证实国产 AI 芯片可支撑超大参数模型训练。
  • 华为云发布 Agentic Infra 新品:联合 20 余家模型厂商发布生态合作计划。

🔒 安全、治理与伦理

  • Anthropic 呼吁全球暂缓前沿 AI 研发:模型可能接近递归自我改进,需加强安全防护。
  • OpenAI 自愿接受政府审查:在 AI 模型发布前允许联邦监管机构进行 30 天安全审查。
  • Meta 智能眼镜暗藏人脸识别代码:NameTag 功能已推送至超 5000 万设备,引发隐私争议。
  • AI 科学家 Bengio 警告:我们正在构建无法控制的系统,呼吁加强 AI 安全研究。
  • 微软 CEO 纳德拉抨击 AI 智能体致瘾计划:表示 AI 应赋能用户,减少屏幕使用时间。

🌐 开源与社区

  • 腾讯混元联合人大开源 PlanningBench:可扩展的 LLM 规划能力评估与训练框架。
  • 腾讯混元提出 Stem 稀疏注意力算法:被 ICML-26 收录,首字延迟降低 3.6 倍。
  • Ladybird 浏览器收紧外部 PR:因大量 LLM 生成的低质量提交导致维护负担加重。
  • Boson AI 与 LMSYS 发布 Higgs Audio v3 TTS:支持 100 种语言,零样本语音克隆。

🏆 竞赛与荣誉

  • Meta SAM 3D 获 CVPR26 最佳论文荣誉提名
  • 小米机器人团队拿下 CVPR 2026 和 ICRA 2026 双料冠军:自研 WAM 世界动作模型以 40.89% 成功率位列总榜第一。

💰 商业与投资

  • Anthropic 估值约 1 万亿美元,年化收入或达 500 亿美元。
  • SpaceX 与 Anthropic 签订 450 亿美元算力合同:每月 12.5 亿美元至 2029 年 5 月。
  • 孙正义:Physical AI 和机器人是下一个万亿美元机会,AI 革命规模可能是互联网泡沫的 50 倍。
  • AI 行业 Token 成本失控:引发紧急管控,从加速转向设护栏。
  • Sam Altman 承认 AI 预算已成“巨大问题”:顶级内部用户月耗约 100B 模型 token。

三、值得继续关注

  1. Anthropic 递归自我改进的后续发展:Anthropic 呼吁全球暂缓,但自身模型能力仍在加速。Mythos 新版本(代号 Oceanus)即将发布,性能超越 Mythos Preview。
  2. ChatGPT Dreaming 记忆系统的用户反馈:新架构能否真正解决记忆的被动性与时序僵化问题,值得观察。
  3. AI 智能体流量超过人类流量的长期影响:对广告经济模型、网站运营策略、内容付费模式的冲击。
  4. Anthropic 与 NSA 的合作传闻:Mythos 模型据报用于进攻性网络行动,引发伦理争议。
  5. HBM4 供应链的竞争格局:三星、SK 海力士、美光三家供应商全线进入量产,整机产品将于今年秋季出货。
  6. 腾讯 AI 代码生成的实际效果:今年大部分代码由 AI 生成,工程师角色转变,对软件工程实践的影响。
  7. AI 设计疫苗的临床试验进展:剑桥大学 AI 设计的通用疫苗完成首次人体试验,未发现明显副作用。

本日报由 Flowtify 公开资讯日报编辑生成,基于 2026-06-05 的精选动态。