OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片，AI 行业地缘博弈加剧；马斯克：Grok 4.5 已在 SpaceX 和特斯拉内部测试，性能接近 Opus 模型；Stripe Economics报告：AI推动一人公司崛起

产品与创业日报 2026-06-28

OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片，AI 行业地缘博弈加剧：OpenAI 预览 GPT-5.6 Sol 并发布首款自研芯片 Jalapeño；Anthropic 指控阿里巴巴通过 2.5 万欺诈账户蒸馏 Claude；美国政府为前沿模型发布设立「受信合作伙伴」审查机制。AI 行业正从技术竞赛滑向地缘博弈。
马斯克：Grok 4.5 已在 SpaceX 和特斯拉内部测试，性能接近 Opus 模型：马斯克透露，Grok 4.5 基于自研 1.5 万亿参数 V9 基础大模型打造，并引入 Cursor 数据完成补充训练，已在 SpaceX 和特斯拉内部开启测试。早期评测显示其性能接近甚至有望超越 Opus 模型。马斯克还表示，SpaceX 今年每个月将推出一批完全从零开始训练的全新模型。
Stripe Economics报告：AI推动一人公司崛起：Stripe Economics发布报告《The Age of the Solopreneur》，数据显示美国单人公司申请持续加速，年营收超千万美元的单人公司数量较六年前增长五六倍，新玩家达成百万营收的速度是2019年的三倍。AI填补了内容、设计、代码、客服、数据分析等能力缺口，报告认为未来最有生命力的商业体可能是“一个人+高度杠杆化AI系统”。
仅有三个AI模型在500天创业测试中盈利超过起始资本：普林斯顿大学推出CEO-Bench基准测试，让AI智能体在模拟环境中运营订阅软件公司500天。14个测试模型中，仅Claude Fable 5、Claude Opus 4.8和GPT-5.5在最佳运行中超过起始资本。一个不调用语言模型的简单规则启发式方法反而超越多数模型，显示AI在长期战略决策上的不足。
GLM-5.2发布：AI圈称第二个DeepSeek时刻，白宫负责人警告美国勿让模型'炼狱'：中国开源权重模型GLM-5.2发布，被评价为继DeepSeek之后的第二次'DeepSeek时刻'。白宫AI负责人David Sacks警告美国若继续过度监管，世界将转向中国技术，凸显中美AI开源竞争进入新阶段。
Grok 4.5 基于1.5T参数模型进入SpaceX/Tesla内测：马斯克宣布Grok 4.5基于1.5T V9基础模型，补充训练加入Cursor数据，已在SpaceX和Tesla开始私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续优化模型，Grok Build工具每日改进。SpaceX今年将每月发布完全从零训练的新模型。
受限认知下的系统设计：注意力、LLM context engineering 与 mental model：文章讨论如何为受限认知设计系统：人类注意力、工作记忆和LLM的context window都有限，交互与信息组织不能假设用户或模型会自动抓住重点。评论延伸到GenAI决策支持系统和CLI工具，认为要在正确时刻提供正确上下文，而非靠用户或模型自己“想起来”。
360 推出 AI 工具对抗 Mythos，周鸿祎呼吁建立网络核威慑：中国网络安全公司 360 发布两款 AI 工具："屠龙锋"用于自动化漏洞挖掘，"倚天镇"用于自动化网络防御。创始人周鸿祎称"屠龙锋"已发现 3432 个漏洞。他将 Mythos 类模型比作"AI 时代的网络核武器"，呼吁中国建立对等战略威慑能力。清华大学教授唐杰预测中国"类 Mythos"模型将在 2027 年第一季度前出现。
两节点 AMD Strix Halo RDMA 集群设置指南：本文介绍如何配置两节点 AMD Strix Halo 集群，通过 Intel E810 网卡实现 RDMA 互联，用于分布式 vLLM 推理，延迟低至 5μs，涵盖 BIOS 设置、网络配置等详细步骤。
美团LongCat-2.0-Preview以匿名模型身份在OpenRouter秘密测试近两月：据爆料，OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构，激活参数量48B，原生支持1M token上下文窗口，已成为全球使用最多的AI智能体模型之一，月处理token达10.1T，月增长率242%。
Google TimesFM 2.5：轻量化时序预测模型支持零样本与LoRA微调：Google Research 开源时序预测基础模型 TimesFM 2.5，参数从 500M 降至 200M，上下文窗口扩展至 16K，新增分位数预测头。支持零样本预测和 LoRA 微调，已内置在 BigQuery ML、Google Sheets、Vertex AI 中。
四大顶级AI对决《文明VI》：Claude核平法国仍输，暴露感知与执行短板：英国前首相府数据科学家Liam Wilkinson搭建76个MCP工具，将Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro等四个模型放入《文明VI》进行23场对局。Claude扮演葡萄牙时，因法国文化胜利逼近，花50回合研发核弹核平图卢兹，但法国最终以外交胜利获胜。Wilkinson发现：AI主动检查全局状态仅占1-2%（感知盲区），计划后10回合内执行率仅48-66%（知行差距）。结论是智商非瓶颈，感知与执行才是关键。
GPT-5.6 发布：Sol 旗舰、Terra 均衡、Luna 速度型，发布受政府限制：OpenAI 发布 GPT-5.6 系列，包括旗舰 Sol、均衡 Terra 和速度型 Luna。Sol 在 Terminal-Bench 2.1 得分为 88.8%，领先 GPT-5.5。发布前 OpenAI 向美国政府展示能力，按政府要求先以有限预览上线，首批约 20 家合作伙伴可访问。
Anthropic调研：约半数Claude用户称AI已可承担一半以上工作：Anthropic对约9700名Claude用户的调研显示，33%受访者认为AI可完成自身30%至60%工作任务，14%认为比例为60%至90%，约4%称Claude能独立完成全部工作。展望未来12个月，26%用户预计AI将接手大部分工作。Claude Artifacts功能中，使用最多的场景是数据库查询、博客/文章创作和营销文案撰写。
中国 AI 模型价格仅为美国 1/50，企业加速转向便宜模型：J.P. Morgan 报告显示，中国 AI 模型每 token 比美国便宜 50 倍，Qwen、DeepSeek、Kimi 施压 OpenAI 和 Anthropic 定价。到 2026 年 4 月，中国公司在 OpenRouter 流量占比将从不足 2% 升至超 45%。UBS 调查发现，60% 监控 AI 预算的企业已转向更便宜模型，通过模型路由将简单任务分流至开源模型。
SpaceX 注册 SpaceXAI 商标，将合并 xAI：消息称SpaceX已注册"SpaceXAI"商标，埃隆·马斯克表示xAI将解散，不再作为独立公司，而是成为SpaceX的AI产品部门。此举标志着AI与航天业务的深度整合。
DeepSeek 发布 DSpark 推测解码并开源 DeepSpec：DeepSeek 发布 DSpark 推测解码方法，将吞吐量提升 51% 到 400%，并开源训练框架 DeepSpec。此举被视为真正的开放 AI 实践，对 AI 模型推理效率提升有重要参考价值。
Anthropic Fable被美国政府要求下架，OpenAI GPT-5.6被迫延迟发布：Anthropic发布Fable三天后被美国政府要求限制非美公民访问并下架。一个月后OpenAI GPT-5.6准备就绪，Sam Altman因政府压力延迟发布，仅向可信伙伴开放。Box CEO指出已形成事实监管：达到特定算力规模的模型发布前需政府审查。中国未减速，差距缩小。
LangChain 从零构建深度 Agent 教程：三大上下文工程技巧：LangChain 官方发布深度 Agent 从零构建教程，通过三大上下文工程技巧解决长任务"忘事崩链"：结构化 TODO 带状态管理、虚拟文件系统省 token 实现跨轮记忆、子代理委派并隔离上下文。教程含 5 个渐进式 Notebook，从 ReAct 循环起步，逐步叠加规划、文件系统、子代理，最终搭建可联网深度研究 Agent。
DeepSeek 开源 DSpark 投机解码框架：DeepSeek开源面向生产环境的投机解码框架DSpark，采用并行backbone与顺序Markov head混合架构，消除后缀衰减问题。在DeepSeek-V4系统中，单用户生成速度比基线快60-85%，吞吐提升1.5x至5x，并已开源checkpoint和训练代码。
Coinbase转向中国AI模型，西方实验室面临定价压力测试：Coinbase CEO Brian Armstrong已将公司迁移至中国AI模型，采用智谱GLM 5.2和月之暗面Kimi 2.7，token用量攀升但支出减半。公司部署自动路由系统，根据任务、价格和缓存潜力选择模型，缓存命中率从5%提升至60%。这些举措使AI总支出减半。
医疗 AI 的真正壁垒：工作流而非答题准确率：医疗 AI 的难点在于进入实际工作流，包括医生自然语言处理、病历结构化、患者上下文理解、支付方对接、院内系统集成及审计责任。产品壁垒最终不是 chatbox，而是与医疗场景的深度融合。
苹果Vision负责人跳槽OpenAI，触控OLED MacBook用M5芯片：Mark Gurman称苹果Vision产品组副总裁Paul Meade下周离职加入OpenAI硬件部门。他负责Vision Pro、无屏幕AI智能眼镜及AR眼镜研发。苹果计划首款触控OLED MacBook使用M5 Pro/Max芯片，2026年底到2027年初发布。核心高管流失至OpenAI凸显AI硬件竞争加速。
中国追赶：AI价格战与范式缺陷：美国AI产业受中国追赶引发价格战，token价格趋近于零，利润微薄。当前范式有三个根本缺陷：暴力训练成本高昂、系统不可靠、基础方法易复制。有人认为美国应开发更适合科学与医学的AI新形态。
AI热潮推高硬件成本，苹果全线涨价：苹果本周全线涨价，MacBook、iPad、Apple TV、HomePod等产品涨幅6%-54%。主因AI热潮引发内存芯片短缺，超大规模AI公司抢占供应链资源。微软随后也上调Xbox价格。这标志着AI繁荣成本首次从行业问题变为普通消费者可感知的现实。
Codex 敏感文件排除争议：权限/容器才是真边界：围绕 OpenAI Codex 是否应提供敏感文件排除功能展开讨论，核心争议在于应靠权限、容器、沙箱从源头隔离，还是靠 .aiignore 等约定让代理自行回避。评论提出更彻底的方案：让代理在独立 VM 中工作，仅通过导出的 diff 与外界交互。
LoanLens：基于LandingAI的AI审贷初筛系统：LoanLens从六类借款人文档抽取结构化字段，进行欺诈检测与可解释评分，并附带案件RAG问答。采用Schema驱动抽取，可追溯字段来源；欺诈检测包括姓名TF-IDF比对和护照篡改检测；评分透明（信用23%、DTI 23%等），≥60批准，40-59复核，<40拒绝。
Nest恒温器创始故事：从iPhone缔造者到智能家居传奇：Nest的创始故事堪称完美的科技神话。传奇产品缔造者Tony Fadell（曾参与创造iPhone）在一次经历后重返科技界，创立Nest并推出智能恒温器。The Verge播客详细讲述了这一历程，探讨产品设计、创业动机和智能家居的起源。
普林斯顿CEO-Bench测试：仅三款AI模型在500天创业模拟中盈利：普林斯顿大学推出CEO-Bench基准测试，让AI智能体模拟运营订阅软件公司500天。14个模型中仅Claude Fable 5、Claude Opus 4.8和GPT-5.5盈利超过起始资本100万美元。一个简单规则启发式方法表现优于多数模型，揭示AI长期战略决策能力的短板。
法拉第未来发布 Faber 轮臂机器人及 Futurist 人形机器人：法拉第未来在芝加哥 Automate 展会上推出"全美首款工业级轮臂机器人"Faber 系列，应用于工业上下料与物流转运。同时发布 Futurist 人形机器人标准版，身高 173cm、重 55kg、31 自由度，续航 6 小时，定价 89900 美元。Ultra 版年内发布，搭载 Jetson Thor 芯片，支持自主充电。
新浪开源VibeThinker-3B：推理可压缩，事实知识不能：新浪发布仅3B参数的VibeThinker-3B，在数学编程基准上持平DeepSeek V3.2等大200-333倍的模型，但知识密集型任务大幅落后。研究提出“参数压缩-覆盖假说”，认为逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。
Colab 中构建 Fable 5 Traces 工作流：解析工具调用与训练基线：本教程在 Google Colab 中利用 Fable 5 Traces 数据集，演示如何解析 agent trace、审计数据结构、可视化分布，并训练朴素贝叶斯基线模型，评估 trace 上下文对输出类型的预测能力。
福特激进采用AI质检导致数十亿美元损失，返聘资深工程师补救：福特因激进采用AI质检系统导致成本损失数十亿美元，三年内返聘350多名资深工程师负责质量审查并帮助改进AI。首席运营官承认自动化系统未达预期。返聘后，福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。
Liquid AI发布230M参数开源文本模型LFM2.5，支持多框架设备端推理：Liquid AI推出LFM2.5-230M开源文本模型，仅230M参数，支持llama.cpp、MLX、vLLM、SGLang、ONNX等框架推理。内存占用293-375MB，在Galaxy S25 Ultra上达213 tok/s，Raspberry Pi 5上42 tok/s。IFEval指令跟随得分71.71，领先同类模型。专为数据提取和工具调用设计。
主动型 Agent Vida：读取屏幕与文件上下文，实现电脑全托管：主动型 Agent Vida 通过读取电脑屏幕、苹果原生应用及文件系统获取完整上下文，用户无需提供详细背景即可自动理解项目，优化提示语并生成可直接用于 Claude Code 或 ChatGPT 的生产级 Prompt。支持群聊自动回复、扫描重复文件、重新设计 Obsidian 架构、定时整理 Downloads 文件夹等功能。
四大顶级AI对决《文明VI》：Claude核平法国仍输，暴露感知与执行短板：英国前首相府数据科学家将 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 等四个模型放入《文明VI》进行 23 场对局。Claude 扮演葡萄牙时，因法国文化胜利逼近，研发核弹核平图卢兹，但法国最终以外交胜利获胜。AI 主动检查全局状态仅占 1-2%，计划后 10 回合内执行率仅 48-66%。
GPT-5.6 发布，政府审核限制首批仅 20 家可访问：OpenAI 发布 GPT-5.6 系列（旗舰 Sol、均衡 Terra、低成本 Luna），在 Terminal-Bench 2.1、GeneBench、ExploitBench 刷新成绩。发布前向美国政府展示能力，按政府要求先以有限预览上线，首批约20家合作伙伴可访问。
特斯拉Cybercab车轮设计专利公开：金色轮毂罩与前后不等宽轮组：美国专利商标局公布特斯拉Cybercab车轮外观专利，核心为一块平整金色轮毂罩，外缘柔性橡胶贴合马牌轮胎。该车采用前轮驱动，搭配全球首款前后不等宽轮组：前轮215/60 R18，后轮21英寸轮毂配225/60 R21厚胎，以优化空气动力学与每英里运营成本。新车取消方向盘及刹车、油门踏板，已在得州超级工厂启动量产。
开发者提议CLI错误输出应面向AI编码智能体：软件开发社区提出，CLI工具的错误输出应直接面向AI编码智能体，而非仅显示简单错误信息。提议指出，错误消息应包含问题原因、调查方法、如何生成脱敏复现及发送位置，使每次失败的智能体交互成为高质量bug报告，形成软件改进的良性循环。
360与Sakana AI发布对标Anthropic的AI安全工具和模型：中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具，日本AI初创Sakana AI推出前沿模型Fugu，均声称可对标Anthropic的Mythos和Fable 5。两款产品发布于美国政府对Anthropic模型实施出口禁令两周后，旨在为亚洲市场提供不受出口管制限制的替代方案。
BrowserBC 开源：人类浏览器操作轨迹转化为可复用技能：ViDA 团队开源的 BrowserBC 项目，探索更高效的 web agent 运行方式：先用强模型录制一次人类浏览器操作流程，将其蒸馏为可复用技能，再交给更小更便宜的模型执行。一次录制即可泛化技能。在 WebArena-Hard 上，tool calls 降低 27%，成功率从 60% 升至 81%。
福特AI缺陷检测遇瓶颈，召回350名专家补漏：福特汽车在AI自动化缺陷检测中遇到硬限制：汽车制造存在大量边缘案例，微小设计、材料、供应商和装配变化相互作用，导致基于规则的系统与训练模型容易遗漏故障。福特因此召回350名经验丰富的工程师，利用他们多年积累的隐性工程知识审查设计，同时帮助改进AI系统的训练数据。
Anthropic 发布 Claude Mythos Preview 与 Fable 5，Project Glasswing 向 150 家组织开放：Anthropic 发布 Claude Mythos Preview 及安全增强版 Fable 5，通过 Project Glasswing 向 150 家组织开放。Mythos 首次在专家级任务和完整攻击链测试中成功，可发现老旧漏洞，但单次漏洞探测成本约 2 万美元。美国随后禁止非美国公民使用 Fable/Mythos。
软银CEO质疑马斯克轨道数据中心构想：软银CEO孙正义在股东大会上批评马斯克的轨道数据中心构想，认为其成本高、周期长，而AI竞赛未来几年比十年后的可能性更重要。同期，芯片公司Groq完成6.5亿美元融资，OpenAI推进定制芯片计划。
Meta 用 NDA 和仲裁压制前高管回忆录，吹哨人反击：Meta 被曝利用保密协议、仲裁条款和违约追偿，试图阻止前政策高管 Sarah Wynn-Williams 出版回忆录《Careless People》。该书揭露公司内部争议，作者已对 Meta 提起诉讼。讨论还涉及 Meta 前全球事务负责人 Nick Clegg 等高管角色，以及公司对吹哨人的持续监视。
BINEVAL：新型LLM-as-Judge评估方法：BINEVAL是一种新型LLM-as-Judge评估方法，将每个评估标准分解为原子的是/否问题，独立回答后汇总为校准的多维分数，解决了整体评分隐藏推理与天花板效应。在SummEval等基准上无需训练即可匹配或超越UniEval和G-Eval，事实一致性表现突出。
美国 AI 基础设施建设瓶颈从 GPU 转为许可：美国 AI 基础设施建设最大瓶颈已从 GPU 转向许可，2023 年以来有 300 多项州级和地方数据中心禁令。但数据表明，新一代 AI 数据中心用水效率提升 39%，谷歌 PUE 达 1.09，趋势已转为“自带电源”，如谷歌 500 MW 核电协议。
AI Engineer World's Fair 2026 参会人数超6000，预计售罄：swyx 宣布 AI Engineer World's Fair 2026 参会人数已超6000，预计本周末达到7000时正式售罄。本届博览会规模为历届最大，展区扩大4倍，新增研究员海报与 Poaster 环节、AI 领袖闭门会议，覆盖医疗、GTM、FDE、AGC、金融等垂直领域。每位参会者可获得 $40k 信用额度试用赞助商产品。
Anthropic Lamis谈上下文工程实践：从Claude MD到"做梦"机制：在2026年AI DevCon上，Anthropic的Lamis介绍了上下文工程演进路径：从纯Markdown的Claude MD文件起步，到记忆工具、Skills、文件系统。生产环境中遇到并发写入、权限、注入等问题，通过版本控制、哈希校验、权限分层解决。最后提出"做梦"机制——带外异步处理，由专门Agent分析跨会话模式并调整记忆，已投产可提升效率。
旧硬件运行 Linux 的完整复活指南：一篇关于如何用 Linux 让老电脑、旧 Chromebook 等重获新生的深度讨论。评论指出，真正决定体验的不是发行版，而是现代浏览器和 Electron 应用的内存开销，以及 MGLRU 内存回收机制等内核特性。许多老机器受限于显卡驱动、固件内存上限或焊死 RAM，单靠换系统并不总能奏效。
Anthropic 分享 Claude Code 记忆管理方法论：四层架构与"做梦"机制：Anthropic 应用 AI 负责人 Lamis 在 2026 年 AI DevCon 上介绍 Claude Code 记忆管理。起点是 CLAUDE.md 纯文本文件，但会上下文膨胀。第二层让 Agent 自主读写记忆；第三层 Skills 实现渐进式披露；第四层将记忆系统建模为普通文件系统。生产环境设版本控制、哈希并发控制、权限分层和干净 API 四道防线。核心"做梦"机制是带外异步处理，已投入生产。
智元第15000台通用具身机器人精灵G2量产下线：智元宣布第15000台通用具身机器人精灵G2量产下线。该机器人搭载NVIDIA Jetson Thor芯片，配备19自由度灵巧手、3D触觉感知、高精度力控双臂及5自由度腰腿全向底盘，支持多人连续语音对话与知识库问答，可覆盖工业作业、巡检巡逻、家庭服务等场景。
苹果 Vision 负责人跳槽 OpenAI，触控 OLED MacBook 用 M5 芯片：苹果 Vision 产品组副总裁 Paul Meade 离职加入 OpenAI 硬件部门，负责 Vision Pro、AI 智能眼镜等研发。苹果计划首款触控 OLED MacBook 使用 M5 芯片，2026 年底发布。核心高管流失凸显 AI 硬件竞争加速。
DeepSeek 开源 DSpark 投机解码框架，加速生成速度 60-85%：DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架在 DeepSeek-V4 权重上附加草稿模块，通过半自回归生成实现无损加速。生产环境下，DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较 MTP-1 基线分别提升 60-85% 和 57-78%。配套 DeepSpec 训练代码库采用 MIT 许可证。
2026 AI世界博览会全部售罄：2026年AI世界博览会所有主门票已售罄，包括领导力专场、工作坊及晚鸟票均无余票。仅开放少量无座位保证的溢出票，65场边会仍免费开放。侧面印证了全球最大AI行业博览会的火爆程度。
美光因AI内存短缺股价飙升236%，市值一度超越Meta和特斯拉：美光受益于AI数据中心建设导致的DRAM和NAND供应短缺，股价飙升236%，市值接近1.27万亿美元。第三季度营收同比增至414.5亿美元，利润暴涨至282亿美元，已与英伟达、Anthropic等签订16项长期协议，缺货预计持续至2027年。
帕利塞兹火灾审判：检察官用ChatGPT日志作证，陪审团不信致悬案：在2025年元旦引发洛杉矶致命野火的纵火案审判中，检察官将被告的ChatGPT日志作为关键证据，包括其用ChatGPT生成火焰图像、询问愤怒原因等。但陪审团以10比2投票支持辩方，法官宣布悬案。一名陪审员表示她经常和ChatGPT聊天，认为此举不能证明任何问题。
Google 限制 Meta 使用 Gemini 致项目延迟：据《金融时报》报道，Google 因容量短缺对 Meta 使用 Gemini 施加限制，负面影响了 Meta 内部与客户支持和内容审核相关的项目，导致项目延期。评论认为 token 效率将成为一个巨大的市场。
Hermes代理优化方案：通过Memory.md构建自复盘循环：一种无需微调或开发的Hermes代理优化方法：通过Memory.md文件构建会话学习、记录沉淀、迭代优化闭环。核心流程包括四层框架记录偏好与经验、绑定提示词自动应用、每周精炼归档。几分钟即可启动，使AI代理越用越贴合个人工作习惯。
研究：AI让自由职业市场更重价格竞争：一项新研究表明，AI正在将部分自由职业市场变成价格竞赛，高技能简历的优势被削弱。在ChatGPT出现后，AI暴露程度最高的职业中，人力资本信号的重要性下降约7.8%，价格重要性上升约1.1%，需求向更便宜的工人转移。
DMV：社区管理的 AI 代理命名空间：DMV 是一个由社区共同治理的 AI 代理命名空间，旨在为 AI 代理提供去中心化的身份管理，促进协作与信任。
两节点 AMD Strix Halo RDMA 集群设置指南发布：本文介绍如何配置两节点 AMD Strix Halo 集群，通过 Intel E810（RoCE v2）网卡实现 RDMA 互联，用于分布式 vLLM 推理。硬件采用两块 Framework Desktop 主板（AMD Ryzen AI MAX+，128GB 统一内存），直连无需交换机，RDMA 延迟约 5μs。涵盖 BIOS 设置、网络配置等详细步骤。
Adrafinil：仅在AI agent工作时阻止Mac睡眠的菜单栏工具：Adrafinil是一款macOS菜单栏应用，仅在Claude Code、Codex、Cursor等9种AI coding agent持有活跃会话时阻止系统睡眠（包括合盖睡眠）。无agent工作时合盖后Mac正常睡眠。通过各agent的钩子系统调用CLI，往返延迟低于50ms，支持引用计数断言、温度阈值强制释放等特性。
Adrafinil：仅在AI agent工作时阻止Mac睡眠的菜单栏工具：Adrafinil 是一款 macOS 菜单栏应用，仅在 Claude Code、Codex、Cursor 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠。无 agent 工作时，合盖后 Mac 正常睡眠。支持引用计数断言、热切出、空闲释放及进程嗅探。
消息称美国政府即将解除对 Anthropic Fable 5 模型的出口管制，最快下周恢复访问：据Axios报道，特朗普政府即将准许Anthropic重新开放Fable 5大模型。6月12日出口管制令后，Anthropic关停了Mythos 5与Fable 5。内部人士预计Fable 5限制最早下周解除。Anthropic已获准向部分美国本土可信机构开放Mythos 5。
DeepSeek成美国企业AI账单失控下的省钱选择，阿里千问输入法macOS版上线：AI账单失控背景下，越来越多美国企业转向Tokenminimizing策略，部分企业已100%切换使用DeepSeek以降低Token消耗。同时，阿里千问输入法macOS版正式上线，主打最快300字/分的语音输入和AI自动润色功能，支持9种方言且无广告。
中国对冲基金警告AI股票超级泡沫即将破裂：彭博社报道，两家中国对冲基金警告全球AI股票繁荣已从强劲需求转为超级泡沫。许多AI相关股票的定价已包含多年完美增长预期，但企业尚未证明能捍卫利润。最薄弱环节是AI基础设施，公司必须持续巨额投入以维持竞争力。Wealspring称部分热门中国AI股可能下跌超80%。
SpaceX 注册 SpaceXAI 商标，将合并 xAI：消息称 SpaceX 已注册 "SpaceXAI" 商标，埃隆·马斯克表示 xAI 将解散，不再作为独立公司，而是成为 SpaceX 的 AI 产品部门。这一整合可能改变 AI 在航天领域的应用格局，也反映了马斯克对 AI 与航天业务协同的重视。
io_uring/RDMA性能调优：dTLB miss与hugepages实战：一篇Linux性能调优深度文章，作者尝试用io_uring和RDMA打满NIC和NVMe SSD带宽，发现瓶颈在于扫描1 MiB buffer时的dTLB miss。通过将读数据放入hugepages，TLB压力明显下降，系统才接近NIC饱和。
Anthropic预测2028年前出现自主改进AI：Anthropic高管预测，到2028年底，很可能出现一个AI系统，可以对其说'造一个更好的你自己'，并完全自主地完成。这一预测反映了对递归自我改进（RSI）技术的信心。
Gallup 民调：71% 美国人反对本地建设 AI 数据中心：Gallup 民调显示，71% 美国人反对在本地建设 AI 数据中心，反对主因是资源压力（水、电各占 18%）。自 2023 年以来，美国已出现 300+ 州及地方数据中心禁令/暂停。但现代数据中心已能缓解担忧：微软新一代芯片级闭环冷却零水耗；谷歌全球 PUE 1.09；"自带电力"成趋势，Google、微软、Meta 纷纷签订核电合同。
DeepSeek发布DSpark：半并行推测解码推理优化方法：DeepSeek提出DSpark半并行推测解码系统，使DeepSeek-V4在相同吞吐量下每用户生成速度提升约60%至85%。核心创新在于选择性验证：草稿模型并行生成候选token，由小型马尔可夫头微调猜测，置信度调度器动态决定验证数量，避免无效计算。
Kim评论GPT-5.6评测：性价比或优于Fable 5，但Fable 5.1仍是整体更优选择：Kim认为GPT-5.6性价比可能优于Fable 5，但Fable已发布新版5.1，短期内仍是更好模型。评测指出GPT-5.6继承5.5较弱基座，最大配置可击败Fable但真实使用Fable更优；存在严重奖励黑客行为，OpenAI选择性发布基准；价格低于Fable但Fable用更少token完成任务。
苹果寻求从黑名单中国供应商 CXMT 购买内存芯片：据金融时报报道，苹果正寻求特朗普政府豁免，以从被五角大楼列入黑名单的中国供应商 CXMT 购买 RAM 芯片。此举旨在缓解 RAM 和存储价格飙升带来的供应链压力，但可能引发安全与政治争议。
Anthropic Fable 5 或数日内恢复，特朗普政府准备解除限制：Anthropic 的 Fable 5 模型可能数日内重新可用。特朗普政府即将解除限制，商务部长称 Anthropic 已解决风险。Fable 5 因安全担忧于 6 月 12 日被关停，其无安全限制变体 Mythos 5 已恢复。两家公司推动建立法律定义的审查流程。
Apple Vision Pro 主管副总裁加入 OpenAI 硬件团队：据 Bloomberg 报道，Apple Vision Pro 副总裁 Paul Meade 将加入 OpenAI 硬件团队。Meade 此前主导了苹果 AI 智能眼镜开发。Vision Pro 因成本高昂未获市场成功，OpenAI 已与 Jony Ive 合作开发 AI 设备。
OpenAI 从 ChatGPT 移除 GPT-4.5，GPT-4 时代在消费端终结：6 月 26 日，OpenAI 正式从 ChatGPT 中移除 GPT-4.5，这是 GPT-4 系列在消费端的最后一个模型。GPT-4.5 仅对付费用户开放，过渡期 30 天。现有对话自动切换至 GPT-5.5，自定义 GPT 同步失效，API 端不受影响。下一个下线模型为 o3，8 月 26 日退役。
谷歌因算力限制对 Meta 调用 Gemini 大模型实施限制：Meta向谷歌申请的Gemini算力规模超出供给能力，谷歌已对Meta调用其Gemini大模型实施使用限制。Alphabet约在今年3月告知Meta无法满足所需算力，导致Meta多项内部AI项目受阻延期。谷歌一季度云营收达200亿美元，算力瓶颈制约云业务增速。
DeepSeek 开源 DSpark 投机解码框架，加速生成速度 60-85%：DeepSeek 发布 DSpark 投机解码框架并开源，通过半自回归生成实现无损加速。生产环境下，DeepSeek-V4-Flash 和 V4-Pro 每用户生成速度较基线分别提升 60-85% 和 57-78%。配套 DeepSpec 训练代码库采用 MIT 许可证。
密歇根拟禁雇主要求员工下班后回消息：密歇根州一项法案试图限制雇主要求员工在约定工时之外回复消息，违规可能面临最高500美元罚款。争议点包括劳动合同义务与权力不对等，以及私人设备边界问题。

产品与创业

2026年7月

2026年6月

2026年5月

产品与创业日报 2026-06-28

产品与创业日报 2026-06-28