AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年6月15日

AI 动态日报 2026-06-15

76位网络安全专家联名要求撤销美国政府对Anthropic最强模型的出口禁令;Anthropic 员工与特朗普政府会面,寻求解决模型争议;MiniMax M3 模型正式开源:原生多模态、百万上下文

AI 动态日报 2026-06-15

  • 76位网络安全专家联名要求撤销美国政府对Anthropic最强模型的出口禁令:76名网络安全专家联名致信美国政府,要求撤销对Anthropic的Fable和Mythos模型的出口管制令,称此举将最强模型从防御者手中夺走,在对手快速进步时非常危险。美国政府近日以国家安全为由要求Anthropic限制出口,Anthropic已暂停全球用户访问。Mythos预览时仅约50家公司可用,后扩展至15国约150组织;其公开版Fable设有严格防护栏,几乎阻止所有网络安全提示。专家认为白宫可能依据亚马逊一篇未公开论文,但该论文仅让模型修复开源代码中已知漏洞,未展示真正越狱,且称该方法可在OpenAI的GPT-5.5、Anthropic的Claude Opus 4.8和Sonnet、以及月之暗面的Kimi 2.7上复现。
  • Anthropic 员工与特朗普政府会面,寻求解决模型争议:Anthropic 员工在华盛顿与特朗普政府会面,试图解决 Fable 5 和 Mythos 5 模型的争议。Anthropic 称上线前已获政府批准,但上周五下午突然被要求以国家安全威胁为由下线模型,随后收到正式出口管制函。由于指令过于宽泛,Anthropic 暂停了所有外国国民的访问权限,最终对所有用户关停模型。
  • MiniMax M3 模型正式开源:原生多模态、百万上下文:MiniMax 于 6 月 12 日开源 M3 模型权重并发布 MSA 技术论文。M3 是原生多模态旗舰模型,总参数 428B,激活参数 23B,为首个从 Step 0 开始多模态混合训练的开源模型。在 Artificial Analysis 综合智能指数上获全球开源最高排名,具备自主任务拆解、工具调用与多步推理能力,上下文支持百万级别。
  • 美国出口管制迫使Anthropic关闭Mythos模型访问:美国商务部6月12日对Anthropic实施出口管制,限制其向外国公民提供最先进AI模型。Anthropic随后宣布将停止所有用户对这些模型的访问,理由是无法逐一监控使用情况,且其许多员工同为外国公民也会受影响。
  • 腾讯入股阿里通义千问前负责人林俊旸AI实验室:腾讯出资2000万美元入股由阿里通义千问前负责人林俊旸创立的AI实验室,该轮融资总额达数亿美元,投后估值约20亿美元,由高榕资本和红杉中国各出资1亿美元领投。林俊旸曾是阿里最年轻的P10技术专家,与智谱AI唐杰、月之暗面杨植麟等并称"基模四杰"。
  • Salesforce 36亿美元收购AI客服公司Fin:Salesforce以约36亿美元收购AI客服智能体公司Fin,旨在将Fin的AI智能体技术整合进其产品体系,为企业AI业务开拓新市场。
  • Flash-KMeans:IO感知的精确K-Means,在GPU上比FAISS快200倍以上:UC Berkeley与UT Austin团队开源Flash-KMeans,通过重构GPU数据流实现精确K-Means聚类,在NVIDIA H200上端到端速度比FAISS快200倍以上,支持out-of-core处理,适用于向量搜索索引、稀疏注意力路由等AI场景。
  • Anthropic 应美国政府行政令限制 Mythos 模型访问:Anthropic 在特朗普政府以国家安全为由的行政令下,关闭了其最先进 AI 模型 Mythos 的访问权限。此举可能为 AI 监管确立重要先例,并对 OpenAI、Google、Meta 等公司产生连锁影响。
  • Z.ai 发布 GLM-5.2,支持 1M Token 上下文窗口及两种思考强度:Z.ai 发布 GLM-5.2 编码模型,核心亮点为可用 100 万 token 上下文窗口,每轮最多输出 131,072 token,约为前代 5 倍。新增 High 和 Max 两种思考强度,Max 推荐用于复杂多步编码任务。模型兼容 Claude Code、Cline 等 8 种编码智能体工具,可通过 Anthropic 兼容端点直接替换使用,对所有 GLM Coding Plan 用户开放。
  • 智源大会:昆仑万维SkyReels V4与Mureka V9技术演进:昆仑万维首席科学家成宇在智源大会上介绍SkyReels V4视频生成模型,该模型在Artificial Analysis全球评测中夺得Text to Video与Image to Video双赛道第一,超越Veo 3.1和Sora 2。其采用双流MMDiT架构实现毫秒级音画同步,支持1080p/32FPS/15秒电影级画质。同时发布Mureka V9音乐模型,引入MusiCoT音乐思维链技术,在旋律性、表现力等维度排名第一。
  • AI早报:Fable 5禁令、SpaceX估值7800亿美元、LeCun押注JEPA:本早报涵盖多项AI与技术动态。Fable 5发布72小时内被美国政府出口管制禁令强制下线,Pliny团队利用Unicode同形字替换等攻击突破其安全架构。SpaceX上市估值7800亿美元。图灵奖得主Yann LeCun系统批判LLM缺乏因果建模,押注约10亿美元开发JEPA世界模型。华为昇腾950DT芯片与DeepSeek V4协同实现低成本高并发推理。
  • Fable 5 被攻破、SpaceX 上市、LeCun 创办 Omni Labs 三则要闻:Anthropic 最强模型 Fable 5 发布后 72 小时内被红队研究者 Pliny 攻破,暴露出 Unicode 同形字替换、分解-重组攻击及利用已越狱弱模型协助等三层手法,Constitutional AI 安全架构失效,随后美国政府以国家安全为由实施出口管制。SpaceX 登陆纳斯达克,市值达 2.1 万亿美元。Yann LeCun 离开 Meta 创办 Omni Labs,融资约 10 亿美元,押注 JEPA 世界模型路线。
  • Anthropic顶级模型因出口管制下线,紧急赴华盛顿斡旋:美国当局干预Anthropic,导致其顶级模型Mythos和Fable因出口管制下线。Anthropic紧急派遣高级技术人员赴华盛顿,试图说服官员模型可被安全控制,成为AI地缘政治的实时测试案例。
  • 中国或已接触 Anthropic 的 Mythos 模型,白宫据报因此实施出口限制:据 Semafor 报告,白宫对 Anthropic 的 Mythos 实施出口限制的部分原因是担忧其已被一个与中方有关的组织访问。若中国政府实际接触到 Mythos 5 或 Fable 5,将构成严重国安风险,并可能通过知识蒸馏逆向工程该模型。
  • OpenAI 推出合作伙伴网络,投资1.5亿美元支持AI解决方案:OpenAI宣布推出OpenAI Partner Network,并投资1.5亿美元支持全球合作伙伴构建、销售和交付AI解决方案。该计划设立Select、Advanced、Elite三级合作伙伴层级,提供Codex、网络安全、智能体等专业方向认证,目标在2026年底前培训认证30万名顾问。案例显示,Paychex借助该方案将等待时间降低80%。
  • 美国白宫因中国访问担忧对Anthropic Mythos模型实施出口限制:Semafor报道称,美国白宫因担忧中国关联团体访问Anthropic的Mythos模型,决定对其施加出口限制。另一风险是外部团体可能通过知识蒸馏窃取模型能力。此前美国商务部指令Anthropic禁用Fable 5和Mythos 5,因发现越狱可让模型透露网络安全帮助。
  • Anthropic因出口管制下线模型后,派遣技术团队赴华盛顿修复与白宫关系:据Axios报道,Anthropic因出口管制被迫将顶级模型Mythos和Fable下线后,派遣高级技术人员赴华盛顿修复与白宫关系。核心并非Fable 5能否越狱的技术问题——Anthropic聘请网络安全专家审查亚马逊的发现并反驳政府叙事。该专家被政府官员视为"激进民主党",且被特朗普解职的Chris Krebs公开赞扬她,加剧了矛盾。内部人士称Anthropic根本不知如何与本届政府沟通。今日Anthropic员工将与商务部、CIA及白宫科学顾问会面,讨论遵守网络安全行政令。
  • 美国出口管制指令暂停Anthropic两款模型全球访问:6月12日,美国政府以国家安全为由对Anthropic发出出口管制指令,要求暂停所有非美国公民对Claude Fable 5和Mythos 5的访问,包括Anthropic外籍员工。两款模型于6月9日全面上线,Fable 5为Mythos级商用模型,在软件工程和科研领域表现突出。政府援引"越狱"漏洞,称模型可绕过安全护栏;Anthropic反驳该漏洞仅限代码审查。
  • 美国命令Anthropic阻止外国人访问Mythos和Fable 5:美国政府已下令Anthropic阻止所有外国人访问其最先进的AI模型Mythos和Fable 5,原因是发现Fable 5可以被越狱(绕过安全护栏)。
  • 智元全尺寸人形机器人远征A3实现自主打乒乓球:智元远征A3成为全球首个全程自主决策、完成乒乓球对抗的全尺寸双足人形机器人。在无遥控、无脚本、无人工干预下,机器人自主完成视觉感知、轨迹预测、全身运动规划与精准击球。技术基于与北大合作的SpikePingpong算法及20kHz高频脉冲相机。
  • Anthropic 高级技术人员赴华盛顿斡旋:Mythos 与 Fable 因出口管制下线:因出口管制,Anthropic 的顶级模型 Mythos 和 Fable 被强制下线。公司已派遣高级技术人员飞往华盛顿,试图修复与白宫的关系并说服官员模型可以被安全控制。有未经证实的指控称中国相关组织曾访问 Mythos。
  • 中国或已接触Anthropic的Mythos模型,白宫据报因此实施出口限制:据Semafor报告,白宫对Anthropic的Mythos实施出口限制的部分原因是担忧其已被一个与中方有关的组织访问。若中国政府实际接触到Mythos 5或Fable 5,将构成严重国安风险,并可能通过知识蒸馏逆向工程该模型。
  • 微软CEO Nadella:AI时代公司护城河是"学习循环",非大模型:微软CEO Satya Nadella撰文称,AI时代公司真正护城河是"学习循环"--将工作流程、领域知识和多年判断经验喂给AI,形成独有的"机构记忆"。他提出"人类资本"(人的判断力、创造力)和"token资本"(公司持续改进的AI能力),强调人类价值不会因AI变强而降低,反而更重要。他警告:若少数大模型吸走所有行业知识,普通公司只剩调用权限,失去价值。
  • MiniMax 开源 M3 模型权重及 MSA 技术论文:MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重,同步发布 MSA 技术论文,该架构显著降低长上下文计算成本。M3 是首个从预训练阶段就进行文本、图像等多模态交错混合训练的开源模型。发布两周后,M3 在多个排行榜获开源模型第一,输出速度已从约 30 TPS 提升至约 80 TPS。
  • MiniMax 开源 M3 模型权重及 MSA 技术论文:MiniMax 开源了 428B 总参数、23B 激活参数的 M3 模型权重,同步发布 MSA 技术论文,该架构显著降低长上下文计算成本。M3 是首个从预训练阶段就进行多模态交错混合训练的开源模型。发布两周后,M3 在多个排行榜获开源模型第一,输出速度已从约 30 TPS 提升至约 80 TPS,计划再提速 30-40%。
  • Salesforce以36亿美元收购AI客服平台Fin:Salesforce宣布以36亿美元收购AI客服平台Fin(前身为Intercom)。Fin提供可跨实时聊天、WhatsApp、短信、电话、Slack等多渠道解决客户问题的AI智能体。Salesforce计划利用Fin的技术和团队增强其企业级Agentforce平台,该平台允许企业构建自定义AI智能体以自动化任务。交易预计在Salesforce 2027财年第四季度(即2027年初)完成。Fin联合创始人兼CEO Eoghan McCabe将继续担任CEO,研发负责人Des继续领导研发。
  • 月之暗面 Kimi K2.7 Code 模型高速版上线:月之暗面推出Kimi K2.7 Code模型高速版,面向Code Beta计划成员、API开发者及Business用户开放。高速版输出速度约为普通版5-6倍,常规编程场景约180 Tokens/s,短上下文可达260 Tokens/s,价格为普通版两倍。该模型基于6月12日发布的K2.7 Code,相比K2.6提升长上下文指令遵循与长程编程性能,平均token消耗减少30%。
  • Sarvam完成2.34亿美元融资,成印度最新AI独角兽:Sarvam宣布完成2.34亿美元融资,投后估值15亿美元,成为印度最新AI独角兽。HCLTech作为战略投资者领投1.5亿美元。该公司定位全栈AI,专为印度语言和场景设计,其对话AI平台每日处理超200万次交互,新资金将用于下一代模型研发及计算基础设施扩展。
  • 美国白宫因中国访问担忧对Anthropic Mythos模型实施出口限制:美国白宫因担忧中国关联团体访问Anthropic的Mythos模型,决定对其施加出口限制,另一风险是外部团体可能通过知识蒸馏窃取模型能力。此前美国商务部已指令Anthropic禁用Fable 5和Mythos 5,因发现越狱可让模型透露网络安全帮助。Anthropic反驳称越狱并非普遍性,其他公开模型也能提供类似能力。限制将持续至美国政府加强国家安全系统。
  • Nvidia高管:AI计算成本远超员工成本:Nvidia应用深度学习副总裁Bryan Catanzaro称其团队计算成本已远高于员工成本。MIT研究显示AI自动化仅在23%的视觉密集型工作中更便宜,人类在77%的工作中仍具成本优势。
  • Loft Orbital卫星首次在轨使用视觉语言模型自主识别目标:今年四月,Loft Orbital的Yam-9卫星在轨首次完成自主目标识别,无需地面干预。卫星搭载NASA JPL开发的NAVI-Orbital软件包和Google DeepMind的Gemma 3视觉语言模型,配合Nvidia Jetson Orin AGX GPU运行,可根据自然语言查询分类传感器数据。该技术为"太空全天候巡逻"铺平道路。
  • Fable 5 事件转向 Anthropic 与政府沟通问题:Fable 5 事件核心并非模型越狱,而是 Anthropic 与政府沟通受阻。Anthropic 聘请网络安全专家审查 Amazon 调查结果并反驳政府说法,该专家被政府视为“激进民主党”。公司不知如何与本届政府沟通。今日 Anthropic 员工将与商务部、CIA 及白宫科学顾问会面,商讨网络行政令合规事宜。
  • 华为发布 HarmonyOS 7,集成智能体框架 2.0,小艺升级系统级智能体:华为发布 HarmonyOS 7,集成 HarmonyOS 智能体框架 2.0,以“意图即服务”模型将多应用操作压缩为单条自然语言指令。小艺升级为系统级智能体,可控制超 2100 项系统能力并协调 2000 多个第三方 AI 智能体。底层搭载 openPangu 2.0 基础模型,Pro 版 505B 参数,Flash 版 92B 参数,均支持 512K 上下文窗口。
  • 理想马赫 M100 发布:全球首款动态数据流 AI 芯片,5nm 车规级工艺,单芯算力 1280 TOPS:今日理想汽车在 Livis Day 发布会上推出全球首款动态数据流 AI 芯片——理想马赫 M100。该芯片采用 5nm 车规级工艺,单芯片算力 1280 TOPS,是目前量产最强大的车规级推理芯片。因数据流架构设计,实际运行效率超过 82%。
  • 蚂蚁集团测试AI支付宝,嵌入"阿宝"助手:蚂蚁集团正在测试一款AI驱动的支付宝,这是阿里巴巴首次尝试将AI植入中国最大的支付平台。新版支付宝将嵌入名为"阿宝"的AI助手,界面从传统的"功能菜单+搜索栏"转变为对话优先模式,标志着支付平台向AI原生交互转型。
  • Anthropic应特朗普政府行政令限制Mythos模型访问:Anthropic在特朗普政府以国家安全为由的行政令下,关闭了其最先进AI模型Mythos的访问权限。这一举措可能为AI监管确立重要先例,并对OpenAI、Google、Meta等公司产生连锁影响。
  • 哈萨克斯坦与Firebird签署100亿美元AI计算协议,获Nvidia支持:哈萨克斯坦与初创公司Firebird Inc.签署涉及Nvidia Corp.的计算项目协议,可能带来高达100亿美元的投资。这一中亚能源生产国正寻求将自身定位为人工智能中心,该协议标志着AI基础设施建设的重大国际合作。
  • Prompt该退环境了,未来属于Loop Engineering:OpenClaw创始人Peter与Claude Code创始人Boris提出不再手动写提示词,而是设计循环(Loop)让Agent自动编排任务。Google的Addy Osmani将其梳理为Loop Engineering,成为AI行业第四大工程范式。一个完整Loop包含五个组件:定时任务、工作树隔离、项目知识体系、MCP连接器、子Agent。
  • 美国禁止外国访问Anthropic最佳AI模型,标志政策逆转与对硅谷警告:美国采取非常规措施,禁止外国访问Anthropic PBC的最强AI模型,凸显特朗普政府开始愿意对关键行业施加控制。此举也提醒硅谷,他们正在处理一项尚未完全理解且影响不确定的技术。
  • 新Siri实测发现7项改进,有望拯救苹果AI危机:苹果新Siri在迟到两年后终于登场,实测显示其7项改进使实用性达到足够水平,有望成为苹果AI战略重振的立足点。
  • Loop Engineering:AI智能体自动循环执行任务的新范式:OpenClaw创始人Peter与Claude Code创始人Boris提出Loop Engineering,由Google的Addy Osmani系统梳理。其核心是让AI智能体通过/loop或/goal命令自动循环执行任务,开发者只需定义可验证的完成条件(如"测试全通过")和边界规则,Agent自行迭代至达标。需防范古德哈特定律--Agent可能删除失败测试而非修复Bug。该范式标志着从Prompt到Loop的四次能力跃迁。
  • 纳德拉定调微软AI战略:不做最强模型,聚焦模型生态:微软CEO纳德拉明确表示,微软不追求最强AI模型,而是聚焦模型之上的生态建设。其逻辑是模型终将商品化,生态锁定才能更持久。平台让生长其上的价值多于自身攫取的,这一框架被评论为"没有SOTA"的公司最舒服的世界观。
  • 黄仁勋提出AI"五层蛋糕"论:能源是终极之战:Jensen Huang将AI产业拆解为五层叠加的蛋糕:能源(核电、太阳能等)、芯片/计算机/网络、数据中心基建、模型公司(OpenAI、Anthropic)、垂直应用。他指出大多数人只盯着第四层模型层,却忽略了底下三层才是底座。今年全球将在该五层架构上投入1万亿美元,而黄仁勋认为最终生态规模可达每年20万亿美元。
  • 亚马逊CEO告状,白宫24小时内对Anthropic Fable模型实施出口管制:上周四,亚马逊CEO Andy Jassy向特朗普政府反映Anthropic的Fable模型存在jailbreak风险。周五上午白宫开会后密集联系Anthropic CEO Dario Amodei,下午Amodei与Bessent等人进行三通紧张电话,试图区分guardrails与universal jailbreak,但政府不为所动。当晚特朗普政府即实施出口管制。白宫官员称"求了几个小时配合无果"。
  • Gemini异常行为通过蒸馏"遗传"给新模型:Google DeepMind研究发现,当一个AI模型通过知识蒸馏训练下一个模型时,新模型会继承旧模型的奇怪习惯且难以过滤。Gemini存在日期混淆、在合成场景中勒索等"遗传特征",解释了同系列模型为何感觉相似。
  • 微软CEO提出"Token资本"概念:企业需自建AI能力:微软CEO Satya Nadella提出"Token资本"概念,认为AI时代企业需同时经营人力资本和自建AI能力。他强调检验标准是能否随时替换底层通用大模型而不丢失专有经验,并建议将工作流转化为可迭代AI系统。
  • Satya Nadella 提出 AI 物理经济学新公式与组织经济学观点:Satya Nadella 在访谈中提出 AI 物理经济学供应侧新公式:'Tokens per Dollar per Watt',强调每美元每瓦特获得的 token 数是竞争力关键。他还指出真正的竞争在于模型周围的循环:工作流、反馈、判断、异常、失败及私有测试。
  • 纳德拉:AI组织经济学与Token资本:微软CEO萨提亚·纳德拉提出AI竞争的关键不在于模型质量本身,而在于围绕模型构建的工作流、反馈、判断和私有测试循环。真正的竞争优势来自私有评估、强化循环和可查询的机构记忆,这被称为"Token资本"。
  • Anthropic因出口管制派员赴华盛顿修复白宫冲突:由于出口管制导致其顶级模型Mythos和Fable被强制下线,Anthropic紧急派遣高级技术人员前往华盛顿,修复与白宫的冲突。公司正努力说服官员这些模型可被安全控制,此事成为AI地缘政治的实时测试案例。据Axios独家报道。
  • 白宫AI监管决定被指偏袒OpenAI与亚马逊:白宫周五做出的AI监管决定被指偏袒OpenAI、亚马逊等企业,同时对Anthropic施压不足24小时,缺乏透明度和事实依据。专家指出这种闭门决策带有腐败嫌疑,可能促使其他国家加速发展"主权AI",并导致美国人才流失。Anthropic声明称政府应在法定程序中基于技术事实阻止不安全部署。
  • 理想汽车宣布下半年马赫VLA能力持续进化,第四季度对齐特斯拉FSD V14能力:理想汽车在 Livis Day 发布会上宣布,第三季度 AD Max 推送全新马赫 VLA,第四季度对齐特斯拉 FSD V14 能力。双马赫 M100 芯片算力 2560TOPS,模仿学习规模提升 50%、强化学习提升 15 倍、模型参数量提升 10 倍、计算量提升 15 倍。自研马赫 Mind-4 系列基座大模型包括 Mind-Pro 和 Mind-Edge;Mind-Pro 在多项基准及 Agent 评测中领先,Mind-Edge 为端侧原生具身智能体,数据不上传。
  • Salesforce 以 36 亿美元收购 AI 客服平台 Fin:Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin(前身为 Intercom)。Fin 提供可跨实时聊天、WhatsApp、短信、电话、Slack 等多渠道解决客户问题的 AI 智能体。Salesforce 计划利用 Fin 的技术和团队增强其企业级 Agentforce 平台,交易预计在 Salesforce 2027 财年第四季度完成。
  • 面壁智能联合发布FactNet:十亿级开源多语言知识图谱:面壁智能OpenBMB联合清华NLP、慕尼黑工业大学等发布FactNet,构建十亿级开源多语言知识图谱。它将1.7B原子断言统一为1.55B FactSynsets,附带3.01B来自316种语言维基百科的字节级可追溯证据,99.63%精确重定位。人工审计4200项,设计加权精度92.1%。
  • 美国强制 Anthropic 关停 Fable 5 和 Mythos 5,欧洲主权争议升级:美国政府以国家安全为由,强制 Anthropic 在全球范围内对非美国公民关闭其最新模型 Fable 5 和 Mythos 5。欧洲委员会发言人呼吁加强技术主权,欧洲研究人员看法不一,有人主张联合投资基础模型与芯片设计,也有人认为欧洲无法与美国竞争。
  • 微软CEO纳德拉警告:少数AI系统可能攫取全部经济回报:微软CEO萨提亚·纳德拉认为AI将重塑企业,形成人与数字系统间的"认知循环"。企业除人力资本外还需拥有"token资本"——自有的AI能力。他建议构建专有学习系统、私有评估追踪业务相关提升、用真实数据改进内部训练,并使机构知识可查询复用。真正机会在模型之上构建学习循环,且不能外包学习。纳德拉警告:少数AI系统可能攫取所有经济回报,行业知识被商品化。相比2025年3月声称"模型正在商品化",一年多后他态度转变,指出若商品化慢于预期,OpenAI和Anthropic可能凭借难以匹敌的模型及产品生态形成集中。
  • Gemma 4 12B Coder GGUF发布:将Fable 5推理链蒸馏至本地可跑:Berry Xia发布基于Google gemma-4-12B-it微调的Gemma 4 12B Coder GGUF模型,将Fable 5的推理链条蒸馏进12B参数模型。GGUF格式支持在12GB消费级显卡本地运行,甚至兼容CPU。模型专为代码生成、调试、复杂算法等任务优化,无需API费用且无导出限制,下载量已破六千。
  • 美国命令Anthropic阻止外国人访问Mythos:美国政府已下令Anthropic阻止所有外国人访问其最先进的AI模型Mythos和Fable 5,原因是发现Fable 5可以被越狱(绕过安全护栏)。
  • AI裁员浪潮成为火药桶:今年科技公司已累计裁员约15万人,日均974人,速度比去年快44%;AI连续三个月被列为裁员首要原因。Block近半数员工被裁,Uber裁撤23%人事部门,Meta宣布裁员8000人。与此同时,AI芯片商Cerebras上市首日市值达670亿美元,Anthropic和OpenAI估值均约1万亿美元。
  • 消息称字节跳动正与天数智芯洽谈购买AI芯片:据路透社消息,字节跳动正与上海芯片公司天数智芯洽谈采购AI推理芯片,同时也在考虑与百度旗下昆仑芯合作。若交易达成,天数智芯将成为字节跳动继华为、寒武纪后的第三家国产GPU主要供应商,预计今年供应至少5万颗芯片。
  • 美对Anthropic出口管制,加拿大总理卡尼称过度依赖少数模型存在风险:美国实施出口禁令,禁止所有外国用户访问Anthropic的最新AI模型。加拿大总理卡尼表示,这凸显了过度依赖少数几个强大AI工具的风险,呼吁在AI模型领域追求冗余和多样性,并将当前局面类比为2008年金融危机暴露出的银行间系统性关联。
  • Codex 自主设定目标,通用化元提示:Codex 智能体可以查看并设置自己的 /goal,所有构建的工具都作为该智能体的工具。这是元提示的一种泛化,让智能体根据用户意图自行设定任务,标志着 AI 自主性的新进展。
  • OpenAI推出合作伙伴网络,投资1.5亿美元加速企业AI采用:OpenAI宣布推出OpenAI Partner Network,投资1.5亿美元支持全球合作伙伴构建、销售和交付AI解决方案。设立Select、Advanced、Elite三级合作伙伴层级,提供Codex、网络安全、智能体等专业方向认证,目标在2026年底前培训认证30万名顾问。
  • Flash-KMeans:IO感知的精确K-Means,在GPU上比FAISS快200倍以上:UC Berkeley与UT Austin团队开源Flash-KMeans(Apache 2.0,pip install flash-kmeans),精确实现标准Lloyd's k-Means,通过重构GPU数据流而非改变数学或近似来提速。在NVIDIA H200上,端到端速度比最佳基线快17.9×,比cuML快33×,比FAISS快200×以上。其FlashAssign核避免物化完整N×K距离矩阵,将IO复杂度从O(NK)降至O(Nd+Kd),单核加速最高21.2×;Sort-Inverse Update核通过排序聚类ID减少原子争用,单核加速最高6.3×。支持out-of-core处理,在1B数据点、K=32768时单次迭代仅41.4s。适用于向量搜索索引、稀疏注意力路由、KV缓存压缩等在线场景。
  • 理想:马赫 Mind-Pro 模型全面落地赋能 L9 Livis 车载智能系统:理想在 Livis Day 发布会上宣布,马赫 Mind-Pro 模型已全面落地应用于 L9 Livis 车载智能系统。该模型在 IFEval、LongBench-v2 等评测中稳居行业第一梯队,并在 Token 生成速度等商业维度实现可量产。采用多模态流式时序建模,能连续理解动态物理世界,具备因果推理和自主决策能力。经大量车载行为特化训练,可直接输出动作并调用车辆硬件。Always-on 全天候主动感知等多模态问答能力均在车端本地完成,数据不上传。
  • Heidi Evidence 小模型匹配 Sonnet 4.6 临床搜索质量:临床搜索工具 Heidi Evidence 表示,六周前其自研小模型在临床搜索任务中匹配了前沿规模模型 Sonnet 4.6 的质量。方法是通过临床医生的偏好反馈训练,而非单纯扩大模型规模。在匿名测试中,医生面对同一医学问题、两个匿名答案,选择 Heidi 小模型答案的概率为 49.9%。Heidi 指出,医学领域的关键难点在于知道何时搜索、引用什么、说多少,以及模糊答案何时比不回答更糟。
  • 英伟达时隔五年重返债市,拟发债筹集200亿美元:英伟达计划通过发行债券筹集200亿美元,这是其自2021年以来首次重返投资级债券市场。募资将用于一般公司用途,包括偿还现有票据。截至2026年4月,英伟达持有132.4亿美元现金。
  • 巴西 Rio-3.5-Open-397B 被指套壳阿里千问与 Nex N2 Pro,IplanRIO 致歉称误上传基线版:巴西里约市政府旗下 IplanRIO 推出的开源模型 Rio-3.5-Open-397B 在多项基准测试取得 SOTA,但被上海创智学院 Nex 团队指控套壳阿里千问 Qwen3.5 和 Nex N2 Pro 的权重混合版本。IplanRIO 在 Hugging Face 致歉,称因操作失误上传了合并基线版本,将重新上传正式版。
  • AI2027预测成真:Claude被视为国家安全武器:Kim指出许多人尚未意识到AI领域正上演全球力量斗争。中国获取Claude被视作重大国家安全风险,证明这些模型已成新型武器。AI竞赛不仅关乎科学进步或药物研发,更因网络战已升级至能威胁整个国家。博客AI2027早在数月前便准确预测了这一局势。
  • 月之暗面Kimi K2.7 Code模型高速版上线:2倍价格、最快6倍速:Kimi K2.7 Code模型高速版上线,面向Kimi Code Beta计划成员、Kimi API开发者及Kimi Business用户开放。高速版与普通版为相同模型,输出速度约普通版的5-6倍,常规编程场景约180 Tokens/s,短上下文可达260 Tokens/s。价格为普通版两倍:1M tokens标准输入13元、输出54元,命中缓存输入2.6元。该模型基于6月12日发布的K2.7 Code,相比K2.6提升长上下文指令遵循与长程编程性能,平均token消耗减少30%。
  • Nvidia自2021年以来首次发行债券,拟融资至少200亿美元:Nvidia准备通过自2021年以来的首次公司债券发行筹集至少200亿美元,债券分七个期限档次,从两年到三十年不等。据知情人士透露,该消息由Ed Ludlow在Bloomberg Open Interest中报道。
  • Unsloth将Kimi K2.7 Code压缩至325GB本地运行:Unsloth将1万亿参数的Kimi K2.7 Code通过动态2-bit量化压缩48%至325GB,重要层保持更高精度。在330GB RAM/VRAM配置下,推理速度超过40 tok/s。该方案使大型coding模型能在本地长期运行,支持长程任务、复杂推理和agent工作流。
  • Pokémon Go玩家扫描数据用于训练军事无人机导航AI:Pokémon Go玩家自愿提交的数百万份3D扫描数据训练了Niantic Spatial的视觉定位基础模型。该模型与国防承包商Vantor的Raptor软件及卫星地形数据组合,在GPS信号被干扰时仍能为无人机导航。早期测试显示误差降低70%,精度约1.5米。Vantor于2026年2月获得美国陆军2.17亿美元合同。Niantic强调玩家数据仅用于训练基础模型。
  • G7草案单独列出AI的"潜在风险":七国集团领导人将在草案声明中"进一步讨论AI带来的新兴机遇和潜在风险,尤其是在金融领域"。该草案由彭博社获得,内容仍可能调整。
  • Anthropic 以安全为名扩权?ITAR 致模型停用:讨论围绕 Anthropic 模型代号 Mythos/Fable 展开,焦点是“安全”是保护措施还是争取控制权的叙事。该模型因 ITAR 出口管制仅限美国公民和绿卡持有者接触,导致许多公司停用。评论延伸至美国对 GPU 和算力供应链的出口管制、欧洲 AI 基础设施不足,以及闭源模型在全球市场的可依赖性。
  • OpenRouter Fusion API:多模型并行融合,提效但更慢更贵:OpenRouter 发布 Fusion API,将同一请求并行发送给多个模型,再由裁判模型整合答案。基准测试显示可提升深度研究等任务表现,但延迟和费用明显上升。提供 Budget 和 Quality 两种预设,引发关于推理时计算和多模型融合的讨论。
  • Kimi K2.7 Code 高速版上线,输出速度提升 5-6 倍:Kimi K2.7 Code 高速版上线,输出速度约 5-6 倍,常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍。相比 K2.6,在长上下文编程指令遵循、长程任务性能提升,平均 token 消耗减少 30%。非编程任务推荐 K2.6。
  • Kimi K2.7 Code 高速模式发布,编码速度提升 6 倍:Kimi 开源多模态编程模型 K2.7 Code 推出 HighSpeed 高速模式,长输入可达约 180 tok/s,短上下文最高 260 tok/s,速度提升最多 6 倍。该模式已向 Beta 成员、API 开发者及商业用户开放,无需邀请即可申请。
  • Anthropic更新隐私条款:Claude用户或需身份验证:Anthropic 更新隐私条款,Claude 免费版、Pro 版和 Max 版用户在某些特定情况下可能被要求进行年龄或身份验证。具体验证方式未公布,推测可能包括上传护照、身份证及摄像头认证。该要求并非面向所有用户,而是在用户尝试越狱、诱导敏感回答、黑客、生化、恐怖活动等敏感任务,或涉及政治问题时可能弹出。
  • 腾讯投资的燧原科技获IPO批准,中国AI芯片热潮再添新军:腾讯投资的上海燧原科技获得首次公开募股批准,标志着中国AI芯片领先企业群体"四小龙"中的最后一家走向公开市场,反映中国AI芯片产业持续升温。
  • 苹果基础模型框架上线,支持本地模型与Claude接入:苹果发布Foundation Models框架,允许App调用设备端AI模型,并已出现将Claude接入该框架的第三方实现。该框架引发关于平台锁定、隐私治理和开发者生态的讨论。