开发者工具日报:2026-06-25
昨日开发者工具领域迎来多项重磅发布:OpenAI 与 Broadcom 联合推出首款自研 LLM 推理芯片 Jalapeño,旨在降低推理成本并减少对 NVIDIA 的依赖;百度开源 Unlimited OCR 模型,基于 DeepSeek 架构实现高效长文档解析;Ornith-1.0 开源模型家族发布,专注智能体编程并达到开源顶尖水平。此外,Notion 通过 Cursor SDK 嵌入编码智能体,Google 将 Computer Use 功能集成至 Gemini 3.5 Flash,以及 Gartner 预测 AI 编程成本将在 2028 年超过人类开发者薪资等动态也值得关注。
开发者工具日报:2026-06-25
昨日重点
🚀 OpenAI 发布首款自研 AI 芯片 Jalapeño
OpenAI 与 Broadcom 合作推出首款定制推理处理器 Jalapeño,专为大语言模型推理设计,从设计到流片仅用 9 个月。早期测试显示其能效显著优于当前最先进方案,旨在降低对 NVIDIA GPU 的依赖并走向垂直整合。首批芯片计划于 2026 年底部署到数据中心,推理成本有望降低约 50%。
📄 百度开源 Unlimited OCR 模型
百度开源 Unlimited OCR 模型,总参数量 30 亿,推理时仅激活 5 亿。模型采用两级视觉编码与 16 倍 token 压缩,在 OmniDocBench v1.5 上得分 93.23,显著优于 DeepSeek OCR。GitHub 已获 6.8K Star。
🐦 Ornith-1.0 开源模型家族发布
DeepReinforce 发布 Ornith-1.0 开源模型家族,覆盖 9B 到 397B 参数规模,采用 MIT 许可。旗舰模型在 SWE-Bench Verified 上取得 82.4 分,超越 Claude Opus 4.7,专注智能体编程。
🤖 Notion 嵌入 Cursor 编码智能体
Notion 通过 Cursor SDK 在数周内将编码智能体嵌入产品,用户可在文档中 @Cursor 或指派任务,Cursor 端到端完成规划、构建、测试并自动创建 PR。
🖥️ Google Gemini 3.5 Flash 集成 Computer Use
Google 将 Computer Use 作为内置工具集成至 Gemini 3.5 Flash,使开发者能构建跨浏览器、移动端和桌面环境的智能体,在 OSWorld 基准测试中得分 78.4。
分主题观察
芯片与基础设施
- OpenAI Jalapeño:与 Broadcom 合作,专为 LLM 推理设计,集成 Broadcom Tomahawk 网络硅,未来八年承诺约 1.4 万亿美元计算投入。
- IBM 亚 1 纳米芯片:采用 NanoStack 架构,0.7 纳米节点,性能提升最多 50%,能效提高 70%。
- 高通 Dragonfly C1000:针对 AI 智能体优化的数据中心处理器,Meta 计划 2028 年起部署。
- 康宁 Glass Bridge:玻璃基光互连技术,用于共封装光学和玻璃芯半导体封装。
- 美光 Q3 营收创纪录:人形机器人存储需求是 L2+ 汽车的 10 倍。
开源模型与工具
- Unlimited OCR:百度开源,3B 参数 MoE,推理仅激活 500M,支持 32K 最大长度。
- Ornith-1.0:专注 Agentic Coding,全系列 MIT 开源,支持本地运行。
- GLM-5.2 魔改版:社区作者使 vLLM 支持推测性解码,速度飙升至 43 token/s。
- Unsloth 压缩 GLM-5.2:1-bit GGUF 量化版本在 Mac Studio 上本地运行,创意输出不逊闭源模型。
- Qwen-AgentWorld:原生语言世界模型,模拟 7 种 Agent 环境,超越 Claude Opus 4.8 和 GPT-5.4。
智能体与工程实践
- Agent 生产崩溃:80% 与模型无关,根源在上下文溢出、工具调错、子代理失控。Harness 与 Loop 是 2026 年分水岭。
- PostHog 重写 SQL 解析器:用多个并行 Claude Code 会话,速度提升 70 倍。
- GitHub Copilot 按量计费:切换后使用量激增,6 月创历史最佳业绩。
- Gartner 预测:到 2028 年 AI 编程成本将超过人类开发者平均薪资。
- 高盛预测:AI 智能体 token 使用量 2030 年增长 24 倍。
平台与生态
- 16 款国民级 App 开放 Skill/MCP:瑞幸、麦当劳、飞猪、滴滴等,Agent 化趋势不可逆。
- Figma 更新:新增 Code layers、Motion 动画、AI 着色器等功能。
- Anthropic Claude Tag:支持多用户与同一 AI 智能体协作,具备持久记忆。
- Google Play Store 开放外部支付:允许替代支付系统。
- Elastic 裁员 7%:称由 AI 驱动,但计划扩招销售。
研究与安全
- 大模型能力更强原因:容量保护弱学习信号,大模型遗忘更少。
- FP4 预训练格式选择:E1M2/INT4 配合 RHT 优于 E2M1。
- Anthropic 指控阿里千问蒸馏:用 2.5 万账号蒸馏 Claude。
- curl 发现 6 个新 CVE:含历史最悠久的已报告问题。
值得继续关注
- OpenAI Jalapeño 芯片部署进展:年底首批部署后的实际性能与成本数据。
- 百度 Unlimited OCR 社区应用:开源后社区如何利用其高效 OCR 能力。
- Ornith-1.0 在 Agentic Coding 中的表现:开源模型在真实开发场景中的竞争力。
- Notion + Cursor 集成效果:用户反馈与产品迭代方向。
- Gemini 3.5 Flash Computer Use 应用:开发者如何利用该能力构建智能体。
- AI 编程成本趋势:Gartner 预测的验证与行业应对。
- 开源模型与闭源模型差距缩小:GLM-5.2、Ornith-1.0 等开源模型的持续进步。