AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年5月31日

Flowtify 公开资讯日报 | 2026-05-31

今日AI动态密集:苹果WWDC将展示基于Gemini蒸馏的本地AI,但技术栈高度依赖外部;OpenAI模型推翻80年数学猜想,并发布生物防御工具Rosalind;特斯拉FSD完成全球首次零干预横穿加拿大;软银宣布750亿欧元法国AI数据中心计划;Anthropic公开沙盒技术细节,估值突破万亿美元;OpenRouter完成1.13亿美元B轮融资;NVIDIA发布AI安全扫描工具SkillSpector;Grok视频模型登顶榜单;微软将发布新图像与语音模型;小参数MoE模型在特定任务上击败大模型。

Flowtify 公开资讯日报

日期:2026-05-31

昨日重点

  1. 苹果WWDC将推AI升级:Gemini蒸馏模型本地运行,但技术栈外部依赖显著 苹果下月WWDC将重点展示延迟已久的Siri及设备端AI升级,核心是在iPhone芯片本地运行从Google Gemini蒸馏而来的更小模型。但该技术栈大部分源自外部:本地模型由Gemini蒸馏,设备无法处理的复杂查询将路由至Google Cloud处理,并采用了Nvidia的机密计算技术。苹果据称正在寻觅小型设备端AI初创公司以加速模型缩减工作。

  2. OpenAI模型推翻80年数学经典猜想,引发学界震动 OpenAI的AI推理模型成功攻克了匈牙利数学家埃尔德什于1946年提出的“平面单位距离问题”,推翻了其关于点对单位距离数量上限的猜想。完整推理过程超75000词,菲尔兹奖得主高尔斯称这是AI数学领域的里程碑。

  3. 特斯拉FSD完成全球首次横穿加拿大自动驾驶,全程零干预 一辆特斯拉汽车搭载FSD V14.3.3版本,完成了全球首次全程零人工干预、横穿加拿大的自动驾驶行程。车辆从温哥华出发,历时近5天,行驶6051公里抵达哈利法克斯,全程所有驾驶操作均由系统自主完成。

  4. 软银豪掷750亿欧元在法国建设5吉瓦AI数据中心 软银集团宣布计划投入至多750亿欧元,在法国扩建并运营总功率最高达5吉瓦的数据中心。项目一期将在敦刻尔克、博斯凯勒和布尚三地兴建,目标在2031年为上法兰西大区提供3.1吉瓦的算力容量。

  5. Anthropic公开跨产品AI沙盒技术细节 Anthropic公开了其在不同产品中隔离Claude的沙盒实现细节:Claude.ai使用gVisor,本地运行的Claude Code在macOS上使用Seatbelt、Linux上使用Bubblewrap,Claude Cowork则运行完整虚拟机。核心理念是通过硬边界限制AI智能体行为。

分主题观察

模型与基础设施

  • OpenRouter完成1.13亿美元B轮融资:投资方包括NVIDIA、ServiceNow、MongoDB、Snowflake和Databricks等。其核心模式是将开发者的一次调用转发到OpenAI、Anthropic、DeepSeek等不同后端。
  • 戴尔交付全球首个Nvidia Vera Rubin NVL72机架:包含72个Rubin GPU、36个Vera CPU、3.6 exaFLOPS的FP4推理性能。
  • Step 3.7 Flash:可运行于桌面级设备的198B视觉模型:阶跃星辰发布,可在DGX Spark等桌面设备运行,用户实测显示128GB统一内存是门槛。
  • NVIDIA发布SkillSpector:AI智能体技能安全扫描工具:覆盖16个类别共64项安全检查,检测能力涵盖提示词注入、凭证窃取以及供应链漏洞扫描。
  • 微软将发布新图像与语音模型:包括MAI Voice 2(多语言语音模型)、MAI Transcribe 1.5(语音转文本)、MAI Image 2.5(支持文件上传和图像编辑)。
  • NVIDIA或将于六月发布整合Blackwell GPU与AI单元的ARM笔记本芯片N1X:目标使轻薄本具备接近RTX 4070的图形性能。

产品与应用

  • OpenAI发布生物防御AI工具Rosalind:旨在帮助全球在生物防御领域抢占先机,利用AI技术提升对生物威胁的检测与应对能力。
  • Grok Imagine Video 1.5 Preview登顶视频生成榜单:在Video Arena的图生视频基准测试中排名第一,超越了Seedance 2.0、HappyHorse和Veo 3.1。
  • 马斯克展示Cybercab自动驶出工厂,即将开启商业化运营:该车型专为自动驾驶设计,无方向盘和踏板。
  • 微软拟建"超级应用"统一Copilot产品,应对低付费率:Microsoft 365近5亿席位中,仅约2000万付费使用Copilot。
  • Anthropic预告多款新AI产品:包括Conway agent、Orbit assistant、知识记忆、多语言语音模式以及面向生物科学研究的Operon。
  • 百度提出DAA新指标,衡量AI智能体任务完成成果:DAA(每日活跃智能体)直接计数成功完成工作循环的智能体,衡量交付成果。

研究与发现

  • AI搜索代理往往只是确认其已知信息,而非真正研究网络:哈尔滨工业大学研究人员发现,包括GPT-5.4和Kimi K2.6在内的领先AI搜索代理,主要利用网络来确认其在训练阶段已学到的知识。
  • 本地测试:小参数MoE模型在工具调用任务上击败大模型:Liquid的LFM2.5-8B-A1B模型(活跃参数1B)在旅行规划工具调用任务中,以266tok/s速度完成7/7调用,而OpenAI的gpt-oss-20b仅完成3/7。
  • Opus 4.8在DeepSWE上相比Opus 4.7有扎实提升:在默认高思考努力设置下,其得分比Opus 4.7高出6%。
  • Anthropic研究发现:男性使用AI编程智能体的频率是女性的两倍以上:在社会科学领域,通常男性名字的研究者使用AI编程智能体的频率,超过通常女性名字研究者的两倍。

行业与观点

  • 黄仁勋批评AI裁员"甩锅":是管理失误,不是技术革命:他指出真正能产生价值的AI应用普遍只有约半年历史,但两年前的裁员潮已将其归因于AI,这不符合事实。
  • Bill Gurley:Anthropic造的不是软件,是"神":他称Anthropic真心相信在创造比人类更高级的物种,真正的风险在于怀有"造物主"心态的人类,而非AI本身。
  • Chamath:AI竞争核心将从模型转向私有数据:当各大实验室能构建相似模型时,真正的竞争优势将来自独特的私有数据输入。
  • 开源与闭源模型之争:智能边际价值:闭源模型将保持略微更智能,开源模型将更便宜。
  • EY网络安全报告被指充满AI幻觉:疑似使用ChatGPT等大语言模型起草后未经仔细核对,引发对专业服务行业流程的讨论。

其他动态

  • 北大校友苏炜杰加入OpenAI:刚获统计学“诺贝尔奖”COPSS会长奖,是华人14年来首次获奖。
  • Anthropic在求职面试中禁止使用AI工具:面试流程多达五轮,重点考察候选人的技能、价值观和伦理思维。
  • GitHub Copilot新计费模式引发开发者不满:基于token的新计费模式取代原有订阅制,被批评为“黄金时代的终结”。
  • 《使命召唤:现代战争4》确认使用生成式AI制作内容:此前《黑色行动7》因大量AI美术素材备受玩家批评。
  • 20亿美元机器人独角兽将民宿当实验室:The Bot Company被指控秘密租用多处Airbnb房源作为机器人测试场地,导致房屋严重损坏。
  • 小米汽车:YU7标准版交付即搭载最新的「小米XLA认知大模型」
  • 比亚迪城市领航兜底首例赔付落地:24小时内完成技术判定,确认事故符合兜底权益范围。

值得继续关注

  • 苹果WWDC(6月):苹果将展示基于Gemini蒸馏的本地AI模型,其技术栈外部依赖程度及后续自主化进展值得关注。
  • NVIDIA 6月1日发布会:预计发布ARM笔记本芯片N1X,整合Blackwell GPU与AI单元,可能改变PC端AI算力格局。
  • 微软6月2日发布会:将发布新图像与语音模型,以及自研编程模型,挑战Claude。
  • OpenAI Codex进展:Codex在数学研究、个人生活自动化等领域的应用持续扩展,其计算机使用体验令人震撼。
  • Anthropic产品线扩展:预告多款新AI产品,包括Conway agent、Orbit assistant等,计划拓展至消费与生物科学领域。
  • 软银法国AI数据中心项目:750亿欧元投资规模巨大,但软银在全球宣布的类似项目尚未完全落地,后续进展值得关注。
  • AI芯片产能与竞争:前沿产能共识已变,NVIDIA、AMD、英特尔等厂商的芯片供应与竞争态势将持续影响行业。