AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年6月4日

Flowtify 公开资讯日报 | 2026-06-04

昨日AI领域迎来多项重磅发布:NVIDIA 开源 550B MoE 模型 Nemotron 3 Ultra,专为长时智能体优化;Google 发布 Gemma 4 12B 无编码器多模态模型,可在 16GB 笔记本本地运行;Ideogram 4.0 开源文生图模型登顶开放模型榜首。同时,OpenAI 观察到递归自我改进的早期迹象,Anthropic 用 Claude 实现 95% 业务分析自动化,台积电与博通财报显示 AI 需求持续高涨。

Flowtify 公开资讯日报

日期:2026-06-04


📌 昨日重点

  • NVIDIA 发布 Nemotron 3 Ultra:550B 总参数(55B 活跃)的完全开源 MoE 模型,采用混合 Mamba-Attention 架构,推理速度提升 5 倍,复杂智能体任务成本降低 30%,是首个达到前沿水平且可完全复现的开源模型。
  • Google 发布 Gemma 4 12B:采用无编码器 Unified 架构,原生支持文本、图像、音频、视频,仅需 16GB VRAM 即可在笔记本上本地运行,性能接近 26B 参数模型,采用 Apache 2.0 开源许可。
  • Ideogram 4.0 开源:9.3B 参数单流架构文生图模型,在 DesignArena 人类评价排名中位列全球第 4,支持边界框控制与多语言文字渲染。
  • OpenAI 称 AI 递归自我改进迹象初现:AI 开发本身正被 AI 加速,预计将加剧竞争压力并带来治理挑战。
  • Anthropic 用 Claude 自动化 95% 业务分析查询:准确率约 95%,核心发现是准确性问题本质是上下文和验证,而非代码生成。

🔍 分主题观察

🧠 大模型与开源

  • Nex-N2-Pro:基于 Qwen3.5 的 397B MoE 推理模型,性能达 GPT-5.5 和 Claude Opus 4.7 级别,支持 262K 上下文与多模态,可自动调节推理深度减少 30-50% 思考 token。
  • 阶跃星辰 Step 3.7 Flash:MoE 架构开源模型,输出速度超 400 tokens/s,支持 256K 上下文。
  • 商汤 SenseNova U1:开源统一文本图像模型,原生理解与生成。
  • MOSS-Audio:开源统一语音、环境音、音乐的音频-语言模型,登顶 Hugging Face Trending 第一。

🤖 AI 智能体与工具

  • 微软 Scout:跨 M365 工作的智能 Autopilot,拥有独立身份,支持多智能体协同。
  • Nous Research Hermes Desktop:桌面端公测版,支持长期记忆、任务规划、工具调用与闭环学习。
  • OpenJarvis:本地优先的开源个人 AI 智能体框架,与云端模型性能差距在 3.2 分以内,API 成本降低约 800 倍。
  • 腾讯微信内测 AI 智能体:可操作数百万微信小程序,完成订外卖、订票等任务。

🏭 产业与基础设施

  • 台积电:Q1 营收约 11341 亿元新台币,AI 需求转向智能体模式推升 token 消耗,全年营收预计增长超 30%。已购入 High-NA EUV 但暂不量产。
  • 博通:2026 财年 Q2 营收 221.87 亿美元,AI 半导体业务同比增 143%,预计 Q3 AI 半导体营收将达 160 亿美元。
  • Google TPUv8t 与 Virgo 网络:可互联 13.4 万芯片,提供 47 Pbps 无阻塞双向带宽。
  • Alphabet 创纪录 850 亿美元融资:用于 Google AI 业务。

🛡️ AI 安全与治理

  • Google DeepMind 论文:首次系统分类六类自主 AI 智能体攻击方法,隐藏提示注入在 86% 场景中部分控制智能体。
  • OpenAI、DeepMind、Anthropic CEO 联名:支持强制 DNA 合成筛查,警告 AI 正在削弱制造生物武器的知识门槛。
  • 特朗普新行政令:要求 AI 公司自愿提交模型供政府安全审查。
  • 伯尼·桑德斯提议:对 AI 公司征收 50% 股权税。

🎨 多模态与生成

  • xAI Grok Imagine 1.5:图像转视频模型,支持最高 720p 分辨率。
  • Runway Aleph 2.0:支持精准局部编辑。
  • Krea 2 Turbo:2 秒生成高质量图像。
  • MisoTTS:8B 参数情感文本转语音模型,开放权重。

📊 数据与趋势

  • Cloudflare Radar:机器人流量首次超过人类,占比 57.5%,互联网流量主体已从人类浏览转向机器间通信。
  • 苹果 App Store 生态:2025 年规模达 1.4 万亿美元,AI 正融入应用体验。
  • SpaceX IPO:发行价每股 135 美元,估值有望达 1.77 万亿美元,计划 6 月 12 日上市。

🔭 值得继续关注

  1. NVIDIA Nemotron 3 Ultra 生态落地:SGLang 和 Miles 已即日支持,后续社区应用与性能评测值得跟踪。
  2. Gemma 4 12B 本地部署实践:16GB 笔记本即可运行,将推动更多边缘端 AI 应用。
  3. AI 递归自我改进:OpenAI 的观察可能预示能力加速拐点,需关注后续研究与政策响应。
  4. 台积电产能瓶颈:AI 需求远超供给,可能影响下半年芯片供应与价格。
  5. 微信 AI 智能体内测:14 亿用户生态下的智能体落地,或引发国内最大 AI 应用浪潮。

本日报由 Flowtify 基于公开资讯自动生成,仅供参考。