AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年6月24日

Flowtify 公开资讯日报 | 2026-06-24

OpenAI 发布首款自研 AI 推理芯片 Jalapeño,Anthropic 推出 Claude Tag 将 AI 嵌入 Slack 团队协作,阿里千问发布 Qwen-AgentWorld 原生语言世界模型,微信内测 AI 智能体“小微”,豆包推出专业版订阅服务。

Flowtify 公开资讯日报

日期:2026-06-24


昨日重点

  1. OpenAI 发布首款自研 AI 推理芯片 Jalapeño:与 Broadcom 合作,9 个月完成从设计到流片,专为大语言模型推理优化,能效显著优于当前 SOTA,计划 2026 年底大规模部署。
  2. Anthropic 推出 Claude Tag:将 Claude 以团队成员身份嵌入 Slack 频道,支持 @ 提及委派任务、异步协作、自主执行,内部产品团队 65% 代码由该工具生成。
  3. 阿里千问发布 Qwen-AgentWorld:首个原生语言世界模型,单一模型覆盖 MCP、搜索、终端等 7 种智能体环境,在 AgentWorldBench 上超越 GPT-5.4 和 Claude Opus 4.8。
  4. 微信内测 AI 智能体“小微”:常驻左上角,支持语音/文本输入,可向个人/群聊发消息、发起视频通话、发红包、查询朋友圈等。
  5. 豆包推出专业版订阅:基于豆包 2.1 系列大模型,新增办公任务模式,支持操作本地电脑、浏览器、调用 Skills 技能,定价 68 元/月起。

分主题观察

🔬 模型与基础设施

  • OpenAI Jalapeño 芯片:多篇报道确认,该芯片由 OpenAI 从零设计,Broadcom 和 Celestica 代工,专为 ChatGPT、Codex、API 及未来智能体产品优化,推理成本可降低 30%-50%。微软预计将购买其中 40% 的芯片。
  • 高通收购 Modular:交易预计 2026 下半年完成,Modular 提供 AI 原生软件平台,可在各类 XPU 上高效运行 AI 模型,高通将结合硬件与软件优势。
  • NVIDIA Rubin 服务器采用 45°C 液冷:大幅降低水耗,一个 50MW AI 设施每年可节省超 400 万美元冷却费用。
  • 中科曙光 ParaStor F9000 包揽 IO500 双榜冠军:支持千亿参数大模型部署时间缩短 1 倍、训练效率提升 50%。

🤖 智能体与协作

  • Anthropic Claude Tag:多项报道深入分析其影响——Claude 以独立身份加入 Slack 频道,具备频道专属记忆、主动监控、独立跑代码并提 PR。但存在严重锁效应:团队无法查看或编辑 Claude 的独立记忆,解雇 Claude 会导致工作流和隐性知识丢失。定价按 token 计费,企业难以管控成本。
  • 微信“小微”内测:调用 WeLM-V4-80B 与 DeepSeek 模型,可操作小程序至最后一步后交给用户。
  • 字节跳动 TRAE Work:日均 Token 消耗 5.6 万亿,AI 代码贡献率增长 6 倍,但可交付性仅 40-60 分,结合 Harness 基建后提升至 80 分。
  • 火山引擎 Agent Ready 基础设施:推出 AgentKit 与 ArkClaw 企业版升级,实践案例包括海底捞和创维酷开。

🗣️ 语音与多模态

  • OpenAI Bidi 1 语音模型:部分用户反馈 ChatGPT 上线双向 AI 语音模型,支持边说话边监听,用户可在对话中途打断并发出新指令。OpenAI 尚未官宣,预计本周启动更大范围测试。
  • 字节跳动 Seedance 2.5 视频模型:支持一次生成 30 秒 4K 短片,可输入 50 个全模台参考素材,并推出 AI 版权商业化平台。
  • FastWan-QAD 视频生成:单卡 RTX 5090 上 1.8 秒生成 5 秒 480P 视频,模型已开源。

🏢 企业应用与风险

  • AI 招聘工具种族偏见:覆盖 340 万人、400 万份申请的大规模研究发现,26% 黑人申请者和 15% 亚裔申请者遭遇算法系统性排斥,多数雇主依赖同一第三方算法形成“算法单一文化”。
  • Oracle 因 AI 转型裁员 21000 人:员工总数降 12.9%,公司计划 2026 年通过债务和股权筹集 450-500 亿美元扩建云基础设施。
  • 五眼联盟警告 AI 网络攻击:AI 模型可能在数月内使毁灭性网络攻击变得极其容易,能自动化专家级攻击任务。
  • 维基百科联合创始人:AI 幻觉仍严重:不会让 AI 直接编辑内容,但可用 AI 提醒编辑社区关注小众新闻。

🌍 开源与社区

  • Qwen-AgentWorld 开源:提供 35B-A3B 与 397B-A17B 两种规模,基于超 1000 万条真实交互轨迹训练,模型与评测基准已开源。
  • 智谱 GLM-5.2 登顶开源模型:击败 DeepSeek,成为全球公认的最佳开源模型。
  • 百度开源 Unlimited OCR:采用 R-SWA 技术,3B 参数可一次前向推理处理数十页文档。
  • 开源 AI 投资系统:4.6 万星标项目,18 位智能体模仿巴菲特、芒格等大师独立分析股票。

🤖 机器人

  • 摩根士丹利上调中国人形机器人出货量预测:2026 年增至 5 万台,市场规模达 20 亿美元。
  • 宁德时代与银河通用合作:首款搭载宁德时代电池的重载人形机器人 Galbot S1 上岗,具备双臂 50 公斤级载重。
  • 孙正义宣布软银已开始量产机器人:目标成为“世界第一的机器人公司”,计划收购 ABB 旗下机器人业务。

值得继续关注

  • OpenAI Jalapeño 芯片:2026 年底大规模部署进展,实际性能与能效独立验证结果。
  • Claude Tag 企业采用:锁效应与成本管控问题如何解决,是否会出现新的企业 AI 治理模式。
  • Qwen-AgentWorld 开源生态:世界模型在智能体训练中的应用效果,社区贡献与衍生项目。
  • 微信“小微”正式上线:内测范围扩大后的功能迭代与用户体验反馈。
  • Anthropic Mythos 模型:与政府合作的安全测试后续,Legion 起诉特朗普政府的法律进展。
  • 甲骨文 AI 转型:裁员后的云基础设施投资回报,与 OpenAI、xAI 的合作深化。
  • AI 招聘偏见监管:大规模研究引发的政策讨论与独立监管呼声。