AI 动态

人工智能、AI Agent、大模型、开源模型、AI 产品、模型服务与生态变化。

2026年5月30日

AI 动态日报 2026-05-30

小米 MiMo-V2.5 系列 API 完成永久降价,最高降幅达 99%。技术基础是公开的推理系统全链路优化方案,包括 KVCache 管理、分级缓存、前缀缓存与调度策略等。优化后 KVCache 存储压缩至约 1/7,前缀缓存命中率平均达 93%,TTFT P90 降低 30%,多模态视频处理端到端延时从 156 秒降至 23 秒。