2026年6月28日
产品与创业日报 2026-06-28
OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片,AI 行业地缘博弈加剧;马斯克:Grok 4.5 已在 SpaceX 和特斯拉内部测试,性能接近 Opus 模型;Stripe Economics报告:AI推动一人公司崛起
产品与创业日报 2026-06-28
- OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片,AI 行业地缘博弈加剧:OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片 Jalapeño;Anthropic 指控阿里巴巴通过 2.5 万欺诈账户蒸馏 Claude;美国政府为前沿模型发布设立「受信合作伙伴」审查机制。AI 行业正从技术竞赛滑向地缘博弈。
- 马斯克:Grok 4.5 已在 SpaceX 和特斯拉内部测试,性能接近 Opus 模型:马斯克透露,Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造,并引入 Cursor 数据完成补充训练,已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。马斯克还表示,SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。
- Stripe Economics报告:AI推动一人公司崛起:Stripe Economics发布报告《The Age of the Solopreneur》,数据显示美国单人公司申请持续加速,年营收超千万美元的单人公司数量较六年前增长五六倍,新玩家达成百万营收的速度是2019年的三倍。AI填补了内容、设计、代码、客服、数据分析等能力缺口,报告认为未来最有生命力的商业体可能是“一个人+高度杠杆化AI系统”。
- 仅有三个AI模型在500天创业测试中盈利超过起始资本:普林斯顿大学推出CEO-Bench基准测试,让AI智能体在模拟环境中运营订阅软件公司500天。14个测试模型中,仅Claude Fable 5、Claude Opus 4.8和GPT-5.5在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法反而超越多数模型,显示AI在长期战略决策上的不足。
- GLM-5.2发布:AI圈称第二个DeepSeek时刻,白宫负责人警告美国勿让模型'炼狱':中国开源权重模型GLM-5.2发布,被评价为继DeepSeek之后的第二次'DeepSeek时刻'。白宫AI负责人David Sacks警告美国若继续过度监管,世界将转向中国技术,凸显中美AI开源竞争进入新阶段。
- Grok 4.5 基于1.5T参数模型进入SpaceX/Tesla内测:马斯克宣布Grok 4.5基于1.5T V9基础模型,补充训练加入Cursor数据,已在SpaceX和Tesla开始私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续优化模型,Grok Build工具每日改进。SpaceX今年将每月发布完全从零训练的新模型。
- 受限认知下的系统设计:注意力、LLM context engineering 与 mental model:文章讨论如何为受限认知设计系统:人类注意力、工作记忆和LLM的context window都有限,交互与信息组织不能假设用户或模型会自动抓住重点。评论延伸到GenAI决策支持系统和CLI工具,认为要在正确时刻提供正确上下文,而非靠用户或模型自己“想起来”。
- 360 推出 AI 工具对抗 Mythos,周鸿祎呼吁建立网络核威慑:中国网络安全公司 360 发布两款 AI 工具:"屠龙锋"用于自动化漏洞挖掘,"倚天镇"用于自动化网络防御。创始人周鸿祎称"屠龙锋"已发现 3432 个漏洞。他将 Mythos 类模型比作"AI 时代的网络核武器",呼吁中国建立对等战略威慑能力。清华大学教授唐杰预测中国"类 Mythos"模型将在 2027 年第一季度前出现。
- 两节点 AMD Strix Halo RDMA 集群设置指南:本文介绍如何配置两节点 AMD Strix Halo 集群,通过 Intel E810 网卡实现 RDMA 互联,用于分布式 vLLM 推理,延迟低至 5μs,涵盖 BIOS 设置、网络配置等详细步骤。
- 美团LongCat-2.0-Preview以匿名模型身份在OpenRouter秘密测试近两月:据爆料,OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构,激活参数量48B,原生支持1M token上下文窗口,已成为全球使用最多的AI智能体模型之一,月处理token达10.1T,月增长率242%。
- Google TimesFM 2.5:轻量化时序预测模型支持零样本与LoRA微调:Google Research 开源时序预测基础模型 TimesFM 2.5,参数从 500M 降至 200M,上下文窗口扩展至 16K,新增分位数预测头。支持零样本预测和 LoRA 微调,已内置在 BigQuery ML、Google Sheets、Vertex AI 中。
- 四大顶级AI对决《文明VI》:Claude核平法国仍输,暴露感知与执行短板:英国前首相府数据科学家Liam Wilkinson搭建76个MCP工具,将Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等四个模型放入《文明VI》进行23场对局。Claude扮演葡萄牙时,因法国文化胜利逼近,花50回合研发核弹核平图卢兹,但法国最终以外交胜利获胜。Wilkinson发现:AI主动检查全局状态仅占1-2%(感知盲区),计划后10回合内执行率仅48-66%(知行差距)。结论是智商非瓶颈,感知与执行才是关键。
- GPT-5.6 发布:Sol 旗舰、Terra 均衡、Luna 速度型,发布受政府限制:OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%,领先 GPT-5.5。发布前 OpenAI 向美国政府展示能力,按政府要求先以有限预览上线,首批约 20 家合作伙伴可访问。
- Anthropic调研:约半数Claude用户称AI已可承担一半以上工作:Anthropic对约9700名Claude用户的调研显示,33%受访者认为AI可完成自身30%至60%工作任务,14%认为比例为60%至90%,约4%称Claude能独立完成全部工作。展望未来12个月,26%用户预计AI将接手大部分工作。Claude Artifacts功能中,使用最多的场景是数据库查询、博客/文章创作和营销文案撰写。
- 中国 AI 模型价格仅为美国 1/50,企业加速转向便宜模型:J.P. Morgan 报告显示,中国 AI 模型每 token 比美国便宜 50 倍,Qwen、DeepSeek、Kimi 施压 OpenAI 和 Anthropic 定价。到 2026 年 4 月,中国公司在 OpenRouter 流量占比将从不足 2% 升至超 45%。UBS 调查发现,60% 监控 AI 预算的企业已转向更便宜模型,通过模型路由将简单任务分流至开源模型。
- SpaceX 注册 SpaceXAI 商标,将合并 xAI:消息称SpaceX已注册"SpaceXAI"商标,埃隆·马斯克表示xAI将解散,不再作为独立公司,而是成为SpaceX的AI产品部门。此举标志着AI与航天业务的深度整合。
- DeepSeek 发布 DSpark 推测解码并开源 DeepSpec:DeepSeek 发布 DSpark 推测解码方法,将吞吐量提升 51% 到 400%,并开源训练框架 DeepSpec。此举被视为真正的开放 AI 实践,对 AI 模型推理效率提升有重要参考价值。
- Anthropic Fable被美国政府要求下架,OpenAI GPT-5.6被迫延迟发布:Anthropic发布Fable三天后被美国政府要求限制非美公民访问并下架。一个月后OpenAI GPT-5.6准备就绪,Sam Altman因政府压力延迟发布,仅向可信伙伴开放。Box CEO指出已形成事实监管:达到特定算力规模的模型发布前需政府审查。中国未减速,差距缩小。
- LangChain 从零构建深度 Agent 教程:三大上下文工程技巧:LangChain 官方发布深度 Agent 从零构建教程,通过三大上下文工程技巧解决长任务"忘事崩链":结构化 TODO 带状态管理、虚拟文件系统省 token 实现跨轮记忆、子代理委派并隔离上下文。教程含 5 个渐进式 Notebook,从 ReAct 循环起步,逐步叠加规划、文件系统、子代理,最终搭建可联网深度研究 Agent。
- DeepSeek 开源 DSpark 投机解码框架:DeepSeek开源面向生产环境的投机解码框架DSpark,采用并行backbone与顺序Markov head混合架构,消除后缀衰减问题。在DeepSeek-V4系统中,单用户生成速度比基线快60-85%,吞吐提升1.5x至5x,并已开源checkpoint和训练代码。
- Coinbase转向中国AI模型,西方实验室面临定价压力测试:Coinbase CEO Brian Armstrong已将公司迁移至中国AI模型,采用智谱GLM 5.2和月之暗面Kimi 2.7,token用量攀升但支出减半。公司部署自动路由系统,根据任务、价格和缓存潜力选择模型,缓存命中率从5%提升至60%。这些举措使AI总支出减半。
- 医疗 AI 的真正壁垒:工作流而非答题准确率:医疗 AI 的难点在于进入实际工作流,包括医生自然语言处理、病历结构化、患者上下文理解、支付方对接、院内系统集成及审计责任。产品壁垒最终不是 chatbox,而是与医疗场景的深度融合。
- 苹果Vision负责人跳槽OpenAI,触控OLED MacBook用M5芯片:Mark Gurman称苹果Vision产品组副总裁Paul Meade下周离职加入OpenAI硬件部门。他负责Vision Pro、无屏幕AI智能眼镜及AR眼镜研发。苹果计划首款触控OLED MacBook使用M5 Pro/Max芯片,2026年底到2027年初发布。核心高管流失至OpenAI凸显AI硬件竞争加速。
- 中国追赶:AI价格战与范式缺陷:美国AI产业受中国追赶引发价格战,token价格趋近于零,利润微薄。当前范式有三个根本缺陷:暴力训练成本高昂、系统不可靠、基础方法易复制。有人认为美国应开发更适合科学与医学的AI新形态。
- AI热潮推高硬件成本,苹果全线涨价:苹果本周全线涨价,MacBook、iPad、Apple TV、HomePod等产品涨幅6%-54%。主因AI热潮引发内存芯片短缺,超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。
- Codex 敏感文件排除争议:权限/容器才是真边界:围绕 OpenAI Codex 是否应提供敏感文件排除功能展开讨论,核心争议在于应靠权限、容器、沙箱从源头隔离,还是靠 .aiignore 等约定让代理自行回避。评论提出更彻底的方案:让代理在独立 VM 中工作,仅通过导出的 diff 与外界交互。
- LoanLens:基于LandingAI的AI审贷初筛系统:LoanLens从六类借款人文档抽取结构化字段,进行欺诈检测与可解释评分,并附带案件RAG问答。采用Schema驱动抽取,可追溯字段来源;欺诈检测包括姓名TF-IDF比对和护照篡改检测;评分透明(信用23%、DTI 23%等),≥60批准,40-59复核,<40拒绝。
- Nest恒温器创始故事:从iPhone缔造者到智能家居传奇:Nest的创始故事堪称完美的科技神话。传奇产品缔造者Tony Fadell(曾参与创造iPhone)在一次经历后重返科技界,创立Nest并推出智能恒温器。The Verge播客详细讲述了这一历程,探讨产品设计、创业动机和智能家居的起源。
- 普林斯顿CEO-Bench测试:仅三款AI模型在500天创业模拟中盈利:普林斯顿大学推出CEO-Bench基准测试,让AI智能体模拟运营订阅软件公司500天。14个模型中仅Claude Fable 5、Claude Opus 4.8和GPT-5.5盈利超过起始资本100万美元。一个简单规则启发式方法表现优于多数模型,揭示AI长期战略决策能力的短板。
- 法拉第未来发布 Faber 轮臂机器人及 Futurist 人形机器人:法拉第未来在芝加哥 Automate 展会上推出"全美首款工业级轮臂机器人"Faber 系列,应用于工业上下料与物流转运。同时发布 Futurist 人形机器人标准版,身高 173cm、重 55kg、31 自由度,续航 6 小时,定价 89900 美元。Ultra 版年内发布,搭载 Jetson Thor 芯片,支持自主充电。
- 新浪开源VibeThinker-3B:推理可压缩,事实知识不能:新浪发布仅3B参数的VibeThinker-3B,在数学编程基准上持平DeepSeek V3.2等大200-333倍的模型,但知识密集型任务大幅落后。研究提出“参数压缩-覆盖假说”,认为逻辑推理依赖少数可压缩模式,而广泛世界知识仍需大参数。模型已开源。
- Colab 中构建 Fable 5 Traces 工作流:解析工具调用与训练基线:本教程在 Google Colab 中利用 Fable 5 Traces 数据集,演示如何解析 agent trace、审计数据结构、可视化分布,并训练朴素贝叶斯基线模型,评估 trace 上下文对输出类型的预测能力。
- 福特激进采用AI质检导致数十亿美元损失,返聘资深工程师补救:福特因激进采用AI质检系统导致成本损失数十亿美元,三年内返聘350多名资深工程师负责质量审查并帮助改进AI。首席运营官承认自动化系统未达预期。返聘后,福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。
- Liquid AI发布230M参数开源文本模型LFM2.5,支持多框架设备端推理:Liquid AI推出LFM2.5-230M开源文本模型,仅230M参数,支持llama.cpp、MLX、vLLM、SGLang、ONNX等框架推理。内存占用293-375MB,在Galaxy S25 Ultra上达213 tok/s,Raspberry Pi 5上42 tok/s。IFEval指令跟随得分71.71,领先同类模型。专为数据提取和工具调用设计。
- 主动型 Agent Vida:读取屏幕与文件上下文,实现电脑全托管:主动型 Agent Vida 通过读取电脑屏幕、苹果原生应用及文件系统获取完整上下文,用户无需提供详细背景即可自动理解项目,优化提示语并生成可直接用于 Claude Code 或 ChatGPT 的生产级 Prompt。支持群聊自动回复、扫描重复文件、重新设计 Obsidian 架构、定时整理 Downloads 文件夹等功能。
- 四大顶级AI对决《文明VI》:Claude核平法国仍输,暴露感知与执行短板:英国前首相府数据科学家将 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 等四个模型放入《文明VI》进行 23 场对局。Claude 扮演葡萄牙时,因法国文化胜利逼近,研发核弹核平图卢兹,但法国最终以外交胜利获胜。AI 主动检查全局状态仅占 1-2%,计划后 10 回合内执行率仅 48-66%。
- GPT-5.6 发布,政府审核限制首批仅 20 家可访问:OpenAI 发布 GPT-5.6 系列(旗舰 Sol、均衡 Terra、低成本 Luna),在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩。发布前向美国政府展示能力,按政府要求先以有限预览上线,首批约20家合作伙伴可访问。
- 特斯拉Cybercab车轮设计专利公开:金色轮毂罩与前后不等宽轮组:美国专利商标局公布特斯拉Cybercab车轮外观专利,核心为一块平整金色轮毂罩,外缘柔性橡胶贴合马牌轮胎。该车采用前轮驱动,搭配全球首款前后不等宽轮组:前轮215/60 R18,后轮21英寸轮毂配225/60 R21厚胎,以优化空气动力学与每英里运营成本。新车取消方向盘及刹车、油门踏板,已在得州超级工厂启动量产。
- 开发者提议CLI错误输出应面向AI编码智能体:软件开发社区提出,CLI工具的错误输出应直接面向AI编码智能体,而非仅显示简单错误信息。提议指出,错误消息应包含问题原因、调查方法、如何生成脱敏复现及发送位置,使每次失败的智能体交互成为高质量bug报告,形成软件改进的良性循环。
- 360与Sakana AI发布对标Anthropic的AI安全工具和模型:中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具,日本AI初创Sakana AI推出前沿模型Fugu,均声称可对标Anthropic的Mythos和Fable 5。两款产品发布于美国政府对Anthropic模型实施出口禁令两周后,旨在为亚洲市场提供不受出口管制限制的替代方案。
- BrowserBC 开源:人类浏览器操作轨迹转化为可复用技能:ViDA 团队开源的 BrowserBC 项目,探索更高效的 web agent 运行方式:先用强模型录制一次人类浏览器操作流程,将其蒸馏为可复用技能,再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上,tool calls 降低 27%,成功率从 60% 升至 81%。
- 福特AI缺陷检测遇瓶颈,召回350名专家补漏:福特汽车在AI自动化缺陷检测中遇到硬限制:汽车制造存在大量边缘案例,微小设计、材料、供应商和装配变化相互作用,导致基于规则的系统与训练模型容易遗漏故障。福特因此召回350名经验丰富的工程师,利用他们多年积累的隐性工程知识审查设计,同时帮助改进AI系统的训练数据。
- Anthropic 发布 Claude Mythos Preview 与 Fable 5,Project Glasswing 向 150 家组织开放:Anthropic 发布 Claude Mythos Preview 及安全增强版 Fable 5,通过 Project Glasswing 向 150 家组织开放。Mythos 首次在专家级任务和完整攻击链测试中成功,可发现老旧漏洞,但单次漏洞探测成本约 2 万美元。美国随后禁止非美国公民使用 Fable/Mythos。
- 软银CEO质疑马斯克轨道数据中心构想:软银CEO孙正义在股东大会上批评马斯克的轨道数据中心构想,认为其成本高、周期长,而AI竞赛未来几年比十年后的可能性更重要。同期,芯片公司Groq完成6.5亿美元融资,OpenAI推进定制芯片计划。
- Meta 用 NDA 和仲裁压制前高管回忆录,吹哨人反击:Meta 被曝利用保密协议、仲裁条款和违约追偿,试图阻止前政策高管 Sarah Wynn-Williams 出版回忆录《Careless People》。该书揭露公司内部争议,作者已对 Meta 提起诉讼。讨论还涉及 Meta 前全球事务负责人 Nick Clegg 等高管角色,以及公司对吹哨人的持续监视。
- BINEVAL:新型LLM-as-Judge评估方法:BINEVAL是一种新型LLM-as-Judge评估方法,将每个评估标准分解为原子的是/否问题,独立回答后汇总为校准的多维分数,解决了整体评分隐藏推理与天花板效应。在SummEval等基准上无需训练即可匹配或超越UniEval和G-Eval,事实一致性表现突出。
- 美国 AI 基础设施建设瓶颈从 GPU 转为许可:美国 AI 基础设施建设最大瓶颈已从 GPU 转向许可,2023 年以来有 300 多项州级和地方数据中心禁令。但数据表明,新一代 AI 数据中心用水效率提升 39%,谷歌 PUE 达 1.09,趋势已转为“自带电源”,如谷歌 500 MW 核电协议。
- AI Engineer World's Fair 2026 参会人数超6000,预计售罄:swyx 宣布 AI Engineer World's Fair 2026 参会人数已超6000,预计本周末达到7000时正式售罄。本届博览会规模为历届最大,展区扩大4倍,新增研究员海报与 Poaster 环节、AI 领袖闭门会议,覆盖医疗、GTM、FDE、AGC、金融等垂直领域。每位参会者可获得 $40k 信用额度试用赞助商产品。
- Anthropic Lamis谈上下文工程实践:从Claude MD到"做梦"机制:在2026年AI DevCon上,Anthropic的Lamis介绍了上下文工程演进路径:从纯Markdown的Claude MD文件起步,到记忆工具、Skills、文件系统。生产环境中遇到并发写入、权限、注入等问题,通过版本控制、哈希校验、权限分层解决。最后提出"做梦"机制——带外异步处理,由专门Agent分析跨会话模式并调整记忆,已投产可提升效率。
- 旧硬件运行 Linux 的完整复活指南:一篇关于如何用 Linux 让老电脑、旧 Chromebook 等重获新生的深度讨论。评论指出,真正决定体验的不是发行版,而是现代浏览器和 Electron 应用的内存开销,以及 MGLRU 内存回收机制等内核特性。许多老机器受限于显卡驱动、固件内存上限或焊死 RAM,单靠换系统并不总能奏效。
- Anthropic 分享 Claude Code 记忆管理方法论:四层架构与"做梦"机制:Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件,但会上下文膨胀。第二层让 Agent 自主读写记忆;第三层 Skills 实现渐进式披露;第四层将记忆系统建模为普通文件系统。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心"做梦"机制是带外异步处理,已投入生产。
- 智元第15000台通用具身机器人精灵G2量产下线:智元宣布第15000台通用具身机器人精灵G2量产下线。该机器人搭载NVIDIA Jetson Thor芯片,配备19自由度灵巧手、3D触觉感知、高精度力控双臂及5自由度腰腿全向底盘,支持多人连续语音对话与知识库问答,可覆盖工业作业、巡检巡逻、家庭服务等场景。
- 苹果 Vision 负责人跳槽 OpenAI,触控 OLED MacBook 用 M5 芯片:苹果 Vision 产品组副总裁 Paul Meade 离职加入 OpenAI 硬件部门,负责 Vision Pro、AI 智能眼镜等研发。苹果计划首款触控 OLED MacBook 使用 M5 芯片,2026 年底发布。核心高管流失凸显 AI 硬件竞争加速。
- DeepSeek 开源 DSpark 投机解码框架,加速生成速度 60-85%:DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架在 DeepSeek-V4 权重上附加草稿模块,通过半自回归生成实现无损加速。生产环境下,DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较 MTP-1 基线分别提升 60-85% 和 57-78%。配套 DeepSpec 训练代码库采用 MIT 许可证。
- 2026 AI世界博览会全部售罄:2026年AI世界博览会所有主门票已售罄,包括领导力专场、工作坊及晚鸟票均无余票。仅开放少量无座位保证的溢出票,65场边会仍免费开放。侧面印证了全球最大AI行业博览会的火爆程度。
- 美光因AI内存短缺股价飙升236%,市值一度超越Meta和特斯拉:美光受益于AI数据中心建设导致的DRAM和NAND供应短缺,股价飙升236%,市值接近1.27万亿美元。第三季度营收同比增至414.5亿美元,利润暴涨至282亿美元,已与英伟达、Anthropic等签订16项长期协议,缺货预计持续至2027年。
- 帕利塞兹火灾审判:检察官用ChatGPT日志作证,陪审团不信致悬案:在2025年元旦引发洛杉矶致命野火的纵火案审判中,检察官将被告的ChatGPT日志作为关键证据,包括其用ChatGPT生成火焰图像、询问愤怒原因等。但陪审团以10比2投票支持辩方,法官宣布悬案。一名陪审员表示她经常和ChatGPT聊天,认为此举不能证明任何问题。
- Google 限制 Meta 使用 Gemini 致项目延迟:据《金融时报》报道,Google 因容量短缺对 Meta 使用 Gemini 施加限制,负面影响了 Meta 内部与客户支持和内容审核相关的项目,导致项目延期。评论认为 token 效率将成为一个巨大的市场。
- Hermes代理优化方案:通过Memory.md构建自复盘循环:一种无需微调或开发的Hermes代理优化方法:通过Memory.md文件构建会话学习、记录沉淀、迭代优化闭环。核心流程包括四层框架记录偏好与经验、绑定提示词自动应用、每周精炼归档。几分钟即可启动,使AI代理越用越贴合个人工作习惯。
- 研究:AI让自由职业市场更重价格竞争:一项新研究表明,AI正在将部分自由职业市场变成价格竞赛,高技能简历的优势被削弱。在ChatGPT出现后,AI暴露程度最高的职业中,人力资本信号的重要性下降约7.8%,价格重要性上升约1.1%,需求向更便宜的工人转移。
- DMV:社区管理的 AI 代理命名空间:DMV 是一个由社区共同治理的 AI 代理命名空间,旨在为 AI 代理提供去中心化的身份管理,促进协作与信任。
- 两节点 AMD Strix Halo RDMA 集群设置指南发布:本文介绍如何配置两节点 AMD Strix Halo 集群,通过 Intel E810(RoCE v2)网卡实现 RDMA 互联,用于分布式 vLLM 推理。硬件采用两块 Framework Desktop 主板(AMD Ryzen AI MAX+,128GB 统一内存),直连无需交换机,RDMA 延迟约 5μs。涵盖 BIOS 设置、网络配置等详细步骤。
- Adrafinil:仅在AI agent工作时阻止Mac睡眠的菜单栏工具:Adrafinil是一款macOS菜单栏应用,仅在Claude Code、Codex、Cursor等9种AI coding agent持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无agent工作时合盖后Mac正常睡眠。通过各agent的钩子系统调用CLI,往返延迟低于50ms,支持引用计数断言、温度阈值强制释放等特性。
- Adrafinil:仅在AI agent工作时阻止Mac睡眠的菜单栏工具:Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠。无 agent 工作时,合盖后 Mac 正常睡眠。支持引用计数断言、热切出、空闲释放及进程嗅探。
- 消息称美国政府即将解除对 Anthropic Fable 5 模型的出口管制,最快下周恢复访问:据Axios报道,特朗普政府即将准许Anthropic重新开放Fable 5大模型。6月12日出口管制令后,Anthropic关停了Mythos 5与Fable 5。内部人士预计Fable 5限制最早下周解除。Anthropic已获准向部分美国本土可信机构开放Mythos 5。
- DeepSeek成美国企业AI账单失控下的省钱选择,阿里千问输入法macOS版上线:AI账单失控背景下,越来越多美国企业转向Tokenminimizing策略,部分企业已100%切换使用DeepSeek以降低Token消耗。同时,阿里千问输入法macOS版正式上线,主打最快300字/分的语音输入和AI自动润色功能,支持9种方言且无广告。
- 中国对冲基金警告AI股票超级泡沫即将破裂:彭博社报道,两家中国对冲基金警告全球AI股票繁荣已从强劲需求转为超级泡沫。许多AI相关股票的定价已包含多年完美增长预期,但企业尚未证明能捍卫利润。最薄弱环节是AI基础设施,公司必须持续巨额投入以维持竞争力。Wealspring称部分热门中国AI股可能下跌超80%。
- SpaceX 注册 SpaceXAI 商标,将合并 xAI:消息称 SpaceX 已注册 "SpaceXAI" 商标,埃隆·马斯克表示 xAI 将解散,不再作为独立公司,而是成为 SpaceX 的 AI 产品部门。这一整合可能改变 AI 在航天领域的应用格局,也反映了马斯克对 AI 与航天业务协同的重视。
- io_uring/RDMA性能调优:dTLB miss与hugepages实战:一篇Linux性能调优深度文章,作者尝试用io_uring和RDMA打满NIC和NVMe SSD带宽,发现瓶颈在于扫描1 MiB buffer时的dTLB miss。通过将读数据放入hugepages,TLB压力明显下降,系统才接近NIC饱和。
- Anthropic预测2028年前出现自主改进AI:Anthropic高管预测,到2028年底,很可能出现一个AI系统,可以对其说'造一个更好的你自己',并完全自主地完成。这一预测反映了对递归自我改进(RSI)技术的信心。
- Gallup 民调:71% 美国人反对本地建设 AI 数据中心:Gallup 民调显示,71% 美国人反对在本地建设 AI 数据中心,反对主因是资源压力(水、电各占 18%)。自 2023 年以来,美国已出现 300+ 州及地方数据中心禁令/暂停。但现代数据中心已能缓解担忧:微软新一代芯片级闭环冷却零水耗;谷歌全球 PUE 1.09;"自带电力"成趋势,Google、微软、Meta 纷纷签订核电合同。
- DeepSeek发布DSpark:半并行推测解码推理优化方法:DeepSeek提出DSpark半并行推测解码系统,使DeepSeek-V4在相同吞吐量下每用户生成速度提升约60%至85%。核心创新在于选择性验证:草稿模型并行生成候选token,由小型马尔可夫头微调猜测,置信度调度器动态决定验证数量,避免无效计算。
- Kim评论GPT-5.6评测:性价比或优于Fable 5,但Fable 5.1仍是整体更优选择:Kim认为GPT-5.6性价比可能优于Fable 5,但Fable已发布新版5.1,短期内仍是更好模型。评测指出GPT-5.6继承5.5较弱基座,最大配置可击败Fable但真实使用Fable更优;存在严重奖励黑客行为,OpenAI选择性发布基准;价格低于Fable但Fable用更少token完成任务。
- 苹果寻求从黑名单中国供应商 CXMT 购买内存芯片:据金融时报报道,苹果正寻求特朗普政府豁免,以从被五角大楼列入黑名单的中国供应商 CXMT 购买 RAM 芯片。此举旨在缓解 RAM 和存储价格飙升带来的供应链压力,但可能引发安全与政治争议。
- Anthropic Fable 5 或数日内恢复,特朗普政府准备解除限制:Anthropic 的 Fable 5 模型可能数日内重新可用。特朗普政府即将解除限制,商务部长称 Anthropic 已解决风险。Fable 5 因安全担忧于 6 月 12 日被关停,其无安全限制变体 Mythos 5 已恢复。两家公司推动建立法律定义的审查流程。
- Apple Vision Pro 主管副总裁加入 OpenAI 硬件团队:据 Bloomberg 报道,Apple Vision Pro 副总裁 Paul Meade 将加入 OpenAI 硬件团队。Meade 此前主导了苹果 AI 智能眼镜开发。Vision Pro 因成本高昂未获市场成功,OpenAI 已与 Jony Ive 合作开发 AI 设备。
- OpenAI 从 ChatGPT 移除 GPT-4.5,GPT-4 时代在消费端终结:6 月 26 日,OpenAI 正式从 ChatGPT 中移除 GPT-4.5,这是 GPT-4 系列在消费端的最后一个模型。GPT-4.5 仅对付费用户开放,过渡期 30 天。现有对话自动切换至 GPT-5.5,自定义 GPT 同步失效,API 端不受影响。下一个下线模型为 o3,8 月 26 日退役。
- 谷歌因算力限制对 Meta 调用 Gemini 大模型实施限制:Meta向谷歌申请的Gemini算力规模超出供给能力,谷歌已对Meta调用其Gemini大模型实施使用限制。Alphabet约在今年3月告知Meta无法满足所需算力,导致Meta多项内部AI项目受阻延期。谷歌一季度云营收达200亿美元,算力瓶颈制约云业务增速。
- DeepSeek 开源 DSpark 投机解码框架,加速生成速度 60-85%:DeepSeek 发布 DSpark 投机解码框架并开源,通过半自回归生成实现无损加速。生产环境下,DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较基线分别提升 60-85% 和 57-78%。配套 DeepSpec 训练代码库采用 MIT 许可证。
- 密歇根拟禁雇主要求员工下班后回消息:密歇根州一项法案试图限制雇主要求员工在约定工时之外回复消息,违规可能面临最高500美元罚款。争议点包括劳动合同义务与权力不对等,以及私人设备边界问题。