大语言模型产品发布周度追踪:五大厂商最新动态一览
追踪 OpenAI、Anthropic、Google、Mistral、Cohere 五大领先人工智能厂商的大语言模型产品发布动态,涵盖新模型上线、软件开发工具包更新及接口变更。二零二六年四月二十一日数据更新,新增 GPT-Rosalind 生命科学模型、Claude Opus 4.7 旗舰升级、Gemini Robotics-ER 1.6 机器人推理模型等二十二条发布记录,创下季度新高。
数据概览
- 最后更新:2026-04-21
- 更新频率:每周
- 数据范围:2026 年 3 月 26 日至 2026 年 4 月 21 日
- 主要来源:OpenAI 博客、Google AI 博客、GitHub SDK 发布订阅源、Releasebot.io 聚合
本追踪器监测主要大语言模型(LLM)厂商的产品发布、API 更新、模型上线和 SDK 变更,覆盖 OpenAI、Anthropic、Google、Mistral 和 Cohere。当前数据覆盖 4 周,共 35 条记录。
关键事实
- 厂商:OpenAI(8 条发布)、Google(7 条)、Mistral(7 条)、Anthropic(5 条)、Cohere(5 条)
- 内容:4 周内 35 条产品更新;13 个新模型、9 次 SDK 更新、8 次功能发布
- 时间:2026 年 3 月 26 日 - 4 月 21 日
- 影响:15 条高影响发布,包括 GPT-Rosalind、Claude Opus 4.7、Gemini Robotics-ER 1.6 和 Leanstral
方法论
数据采集遵循系统化方法:
- 来源:官方厂商博客(RSS 订阅源)、GitHub SDK 发布 API、Releasebot.io 聚合
- 采集:通过 curl、GitHub API 和 RSS 解析进行每周自动扫描
- 验证:每条记录均对照原始来源 URL 进行验证
- 分类:类别包括新模型、SDK 更新、API 更新、功能发布、价格变更、弃用和公司公告
- 影响评估:高(重大模型/政策变更)、中(功能增强)、低(小幅 SDK 修复)
最新数据(2026 年 4 月 14 日 - 21 日)
| 日期 | 厂商 | 产品/功能 | 类别 | 描述 | 影响 |
|---|---|---|---|---|---|
| 2026-04-19 | OpenAI | ChatGPT Business Workspace Analytics | 功能发布 | 更新后的分析体验”工作区分析”取代用户分析,提供更简洁的工作区级视图,帮助管理员了解整体采用情况和 Codex 在组织内的使用情况 | 中等 |
| 2026-04-18 | OpenAI | Codex Background Computer Use | 功能发布 | Codex 现可通过自己的光标查看、点击、打字来使用电脑上的所有应用。多个智能体可在 Mac 上并行工作而不干扰用户操作。最初支持 macOS | 高 |
| 2026-04-18 | Anthropic | Claude Code v2.1.101 | SDK 更新 | 为 Opus 4.7 添加 xhigh effort 等级,改进 Vertex/Bedrock 设置支持 1M 上下文选项,新增 OTEL_LOG_RAW_API_BODIES 调试选项,修复 LSP 诊断排序和 commit skill 调用问题 | 中等 |
| 2026-04-17 | OpenAI | Agents SDK Harness Update | SDK 更新 | Agents SDK harness 在文档/文件/系统操作方面能力增强。现支持可配置内存、沙箱感知编排、类似 Codex 的文件系统工具,以及与前沿智能体系统原语的标准化集成 | 高 |
| 2026-04-17 | Anthropic | Claude Design | 功能发布 | Anthropic Labs 推出的视觉输出新产品——设计稿、原型、幻灯片、单页文档。由 Opus 4.7 驱动。面向 Pro、Max、Team、Enterprise 订阅用户。支持设计系统集成、行内评论、交接至 Claude Code | 高 |
| 2026-04-17 | Anthropic | Claude Opus 4.7 | 新模型 | 正式发布升级版本,软件工程能力更强,视觉能力提升(支持更高分辨率图像),指令遵循更精准,长时间运行的智能体工作更可靠。定价与 Opus 4.6 相同(输入 $5/M,输出 $25/M) | 高 |
| 2026-04-17 | Personal Intelligence with Nano Banana 2 | 功能发布 | 个性化图像创建功能,结合用户偏好与 Gemini。可连接 Google Photos 使用用户和亲友的照片。面向美国地区 Google AI Plus/Pro/Ultra 订阅用户逐步推出 | 中等 | |
| 2026-04-17 | Gemini Robotics-ER 1.6 | 新模型 | 面向机器人的推理优先模型重大升级。增强空间推理、多视角理解,新增仪表读取能力(可读取压力表/液位计)。迄今最安全的机器人模型。通过 Gemini API 和 Google AI Studio 提供服务 | 高 | |
| 2026-04-17 | Gemini App for Mac | 功能发布 | 原生桌面体验,Option+Space 快捷键可在任意应用旁唤起 Gemini。支持窗口共享以理解上下文。全球免费提供,支持 macOS 15+ | 中等 | |
| 2026-04-16 | OpenAI | GPT-Rosalind | 新模型 | 研究预览版生命科学推理模型,专注于生物学、药物发现和转化医学。以罗莎琳德·富兰克林命名。在 BixBench 和 LABBench2 生物化学推理基准测试中取得领先成绩 | 高 |
| 2026-04-16 | OpenAI | Codex Research Plugin | 功能发布 | 新研究插件,将科学家连接到 50 多个工具和数据源,加速研究工作流。符合条件的 Enterprise 用户可结合 GPT-Rosalind 进行更深入的生物推理 | 中等 |
| 2026-04-15 | Gemini 3.1 Flash TTS | 新模型 | 文本转语音模型,语音质量提升,在 Artificial Analysis TTS 排行榜上获得 1211 Elo 分。支持 70 多种语言、原生多说话人对话、通过自然语言进行细粒度创意控制。所有音频均使用 SynthID 水印 | 高 | |
| 2026-04-14 | Gemini in Google Classroom Expansion | 功能发布 | Google Classroom 中的 Gemini 标签页现向所有 Google Workspace for Education 版本开放。扩展至高等教育学生。提供面向教育工作者和学生的入门提示 | 中等 | |
| 2026-04-10 | Mistral | Voxtral Realtime + Mini Transcribe V2 | 新模型 | Realtime:流式转录延迟低于 200ms,支持 13 种语言,Apache 2.0 权重。Mini Transcribe V2:FLEURS 上约 4% WER,$0.003/分钟,最佳性价比,支持说话人分离和上下文偏置 | 高 |
| 2026-04-08 | Mistral | Voxtral TTS | 新模型 | 基于 Ministral 3B 构建的文本转语音模型。语音仿真具有真实感和情感表现力。模型延迟 70ms,支持 9 种语言,零样本跨语言语音适配。API 价格 $0.016/千字符 | 中等 |
| 2026-04-08 | Mistral | Small 4 | 新模型 | 混合模型,在单一多模态模型中统一指令、推理和编码。256k 上下文窗口。Apache 2.0 许可。reasoning_effort 参数支持动态调整。NVIDIA Nemotron 联盟创始成员 | 高 |
| 2026-04-08 | Mistral | Leanstral | 新模型 | 首个面向 Lean 4 形式化证明工程的开源代码智能体。Apache 2.0 许可。在 FLTEval 上超越 GLM5-744B 和 Kimi-K2.5-1T。通过免费 API 端点 labs-leanstral-2603 提供 | 高 |
| 2026-04-06 | Mistral | Moderation 2603 | 功能发布 | 内容审核模型发布。通过 Mistral API 提供服务 | 中等 |
| 2026-04-04 | Cohere | Embed v2 Retirement | 弃用 | 弃用 embed-english-v2.0、embed-english-light-v2.0、embed-multilingual-v2.0 模型。用户应迁移至 embed-v3.0 或 embed-v4.0 | 中等 |
| 2026-04-03 | Cohere | Transcribe 03-2026 | 新模型 | 音频转录模型,通过 Audio Transcriptions API 端点提供服务。免费供实验使用,受速率限制 | 中等 |
| 2026-04-03 | Cohere | Rerank v4.0 | 新模型 | 两个变体:rerank-v4.0-pro(复杂场景的顶级质量)和 rerank-v4.0-lite(速度和效率优化)。通过 API 提供服务 | 高 |
历史数据(2026 年 3 月 26 日 - 4 月 2 日)
| 日期 | 厂商 | 产品/功能 | 类别 | 描述 | 影响 |
|---|---|---|---|---|---|
| 2026-04-02 | OpenAI | TBPN Acquisition | 公司 | OpenAI 收购 TBPN,加速 AI 全球对话,支持独立媒体 | 中等 |
| 2026-04-02 | OpenAI | Codex Flexible Pricing | 价格变更 | Codex 现为 ChatGPT Business 和 Enterprise 提供按量付费定价,为团队提供灵活的采用选项 | 高 |
| 2026-04-02 | Gemini API Flex/Priority Inference | API 更新 | 两种新的推理层级以平衡成本和延迟:Flex 用于成本优化,Priority 用于降低延迟 | 高 | |
| 2026-04-02 | Google Vids Lyria/Veo Integration | 功能发布 | Google Vids 获得 Lyria 3 和 Veo 3.1 驱动的视频生成功能,免费提供 | 中等 | |
| 2026-04-01 | Anthropic | Python SDK v0.88.0 | SDK 更新 | 消息响应的结构化 stop_details、Bedrock API 密钥认证、AWS 包准备 | 中等 |
| 2026-04-01 | Genai Python SDK v1.70.0 | SDK 更新 | 支持 TextAnnotationDelta 流式工具响应,service_tier 枚举修复 | 低 | |
| 2026-03-31 | OpenAI | $122B Funding Round | 公司 | OpenAI 以 7300 亿美元投前估值融资 1220 亿美元,用于全球扩展前沿 AI、投资计算基础设施 | 高 |
| 2026-03-31 | Veo 3.1 Lite | 新模型 | 最具性价比的视频生成模型,在 Gemini API 付费预览版和 Google AI Studio 中提供 | 高 | |
| 2026-03-31 | Anthropic | Python SDK v0.87.0 | SDK 更新 | APIStatusError 中的 error type 字段、indices 数组格式序列化、内存工具和 transform schema 的多项 bug 修复 | 中等 |
| 2026-03-31 | Mistral | Python SDK v2.2.0 | SDK 更新 | 主要版本,新增工作流 API:get_workflow、execute_workflow、工作流指标、执行、部署,以及对事件 API 的破坏性变更 | 中等 |
| 2026-03-31 | Cohere | Python SDK v5.21.2 | SDK 更新 | Fern 生成更新,包含小幅修复 | 低 |
| 2026-03-27 | Genai Python SDK v1.69.0 | SDK 更新 | Consent 音频字段、voice_consent_signature、FileSearchResult 的 custom_metadata、Veo 配置标签、mTLS 自动启用 | 中等 | |
| 2026-03-26 | Cohere | Python SDK v5.21.0 | SDK 更新 | 向 SDK 添加 Audio Transcriptions 端点 | 中等 |
厂商活动汇总
本周(2026 年 4 月 14 日 - 21 日)
| 厂商 | 发布数 | 高影响 | 类别 |
|---|---|---|---|
| Mistral | 6 | 3 | 新模型、功能发布 |
| OpenAI | 5 | 3 | 新模型、功能发布、SDK 更新 |
| 5 | 2 | 新模型、功能发布 | |
| Anthropic | 3 | 2 | 新模型、功能发布、SDK 更新 |
| Cohere | 3 | 1 | 新模型、弃用 |
类别分布(本周):
- 新模型:11 条(50%)
- 功能发布:7 条(32%)
- SDK 更新:2 条(9%)
- 弃用:1 条(4.5%)
- API 更新:0 条
- 价格变更:0 条
- 公司:0 条
历史汇总(2026 年 3 月 26 日 - 4 月 2 日)
| 厂商 | 发布数 | 高影响 | 类别 |
|---|---|---|---|
| 5 | 2 | 新模型、API 更新、功能发布、SDK 更新 | |
| OpenAI | 3 | 2 | 公司、价格变更 |
| Anthropic | 2 | 0 | SDK 更新 |
| Cohere | 2 | 0 | SDK 更新 |
| Mistral | 1 | 0 | SDK 更新 |
趋势与观察
本周亮点
- 领域专用模型涌现:OpenAI 的 GPT-Rosalind 瞄准生命科学领域的生物化学推理;Google 的 Robotics-ER 1.6 为工业机器人新增仪表读取能力;Mistral 的 Leanstral 攻克形式化证明工程
- 语音 AI 战场激化:Gemini 3.1 Flash TTS(1211 Elo)、Mistral 的 Voxtral 系列(70ms 延迟,$0.016/千字符)和 Cohere Transcribe 在两周内相继发布,显示音频 AI 领域的激烈竞争
- 桌面/原生应用崛起:Gemini Mac 应用支持 Option+Space 快捷键,Codex Background Computer Use 可操控电脑所有应用,标志着从浏览器优先向操作系统原生 AI 体验的战略转移
- 视觉/设计工具扩张:Claude Design(由 Opus 4.7 驱动)和 Google 的 Personal Intelligence with Nano Banana 2 均瞄准视觉内容创建工作流
- 模型弃用加速:Cohere 弃用 Embed v2.0 系列,继上周 OpenAI 移除 Codex 后,表明模型生命周期更替加快
周度对比
| 指标 | 4 月 14-21 日 | 4 月 7-13 日 | 3 月 31 日-4 月 6 日 |
|---|---|---|---|
| 总发布数 | 22 | 15 | 13 |
| 新模型 | 11 | 6 | 1 |
| 高影响 | 11 | 4 | 4 |
| 弃用 | 1 | 1 | 0 |
| SDK 更新 | 2 | 8 | 3 |
- 发布量增长 47%:本周 22 条发布 vs. 上周 15 条
- 新模型主导:50% 的发布为新模型,创下有记录以来最高比例
- SDK 活动转移:从上周 8 次 SDK 更新降至本周 2 次,厂商聚焦产品发布
- 高影响发布翻三倍:本周 11 条高影响发布 vs. 上周 4 条
厂商战略信号
| 厂商 | 战略方向 | 证据 |
|---|---|---|
| OpenAI | 垂直领域扩张(生命科学) | GPT-Rosalind + Codex Research Plugin 集成 |
| Anthropic | 视觉生产力 | Claude Design 与 Opus 4.7 编码改进同步发布 |
| 具身智能 + 音频 | Robotics-ER 1.6 + Gemini 3.1 Flash TTS + 原生 Mac 应用 | |
| Mistral | 开源生态 | 6 条发布包括 Apache 2.0 许可的 Leanstral 和 Voxtral |
| Cohere | 企业基础设施 | Rerank v4.0 + Transcribe + Embed v2 弃用 |
🔺 独家情报:别处看不到的洞察
置信度: 高 | 新颖度评分: 78/100
媒体聚焦于单个模型发布,但三重结构性转变被低估:首先,Mistral 一周内发布 6 款产品,包括 Voxtral TTS(70ms 延迟,$0.016/千字符)和 Leanstral(首个开源 Lean 4 证明智能体),将公司定位为封闭语音 AI 和形式化推理系统的开源替代方案。其次,OpenAI 的 GPT-Rosalind 是自 GPT-4 以来首个领域专用模型,标志着从通用大语言模型向垂直专业解决方案的转型——仅药物发现领域的生命科学市场就有 500 亿美元以上机会。第三,原生桌面应用(Gemini Mac、Codex Background Computer Use)显示从浏览器优先向操作系统集成 AI 的战略转移,降低企业用户的上下文切换延迟和摩擦。
关键启示:企业团队应立即评估语音 AI 厂商——Gemini TTS、Voxtral 和 Cohere Transcribe 在 10 天内相继发布,在市场整合前创造了罕见的性价比比较窗口。
重要变更
OpenAI GPT-Rosalind(4 月 16 日)
前沿实验室首个领域专用生命科学模型。以罗莎琳德·富兰克林命名,在 BixBench 和 LABBench2 生物化学推理基准测试中取得领先成绩。配套 Codex Research Plugin 连接 50 多个科学工具。
Anthropic Claude Opus 4.7 GA(4 月 17 日)
旗舰模型升级,软件工程能力更强,视觉能力提升(更高分辨率),长时间运行的智能体工作更可靠。定价与前代相同(输入 $5/M,输出 $25/M),性能提升可衡量。
Claude Design 发布(4 月 17 日)
Anthropic Labs 推出的视觉输出新产品——设计稿、原型、幻灯片、单页文档。集成设计系统、行内评论和交接至 Claude Code。Anthropic 首个重大视觉生产力工具。
Google Gemini Robotics-ER 1.6(4 月 17 日)
面向机器人的推理优先模型,增强空间推理、多视角理解和仪表读取能力(压力表/液位计)。定位为”迄今最安全的机器人模型”。
Mistral Leanstral(4 月 8 日)
首个面向 Lean 4 形式化证明工程的开源代码智能体。Apache 2.0 许可。在 FLTEval 上超越 GLM5-744B 和 Kimi-K2.5-1T。提供免费 API 端点。
Gemini 3.1 Flash TTS(4 月 15 日)
文本转语音模型,在 Artificial Analysis TTS 排行榜上获得 1211 Elo 分。支持 70 多种语言、原生多说话人对话,使用 SynthID 水印。
更新记录
| 日期 | 变更 | 详情 |
|---|---|---|
| 2026-04-21 | 更新 | 新增 2026 年 4 月 14-21 日周的 22 条记录 |
| 2026-04-21 | 更新 | 重构为最新数据和历史数据两部分 |
| 2026-04-21 | 更新 | 更新厂商活动汇总,添加周度对比 |
| 2026-04-21 | 更新 | 添加领域专用模型和语音 AI 战场的趋势与观察 |
| 2026-04-03 | 新增 | 追踪器初始发布,包含 2026 年 3 月 26 日 - 4 月 2 日的 13 条记录 |
| 2026-04-03 | 新增 | 厂商活动汇总和趋势分析 |
| 2026-04-03 | 新增 | 类别分布明细 |
信息来源
- OpenAI Blog RSS - OpenAI 公告的主要来源
- Google AI Blog RSS - Google AI 发布的主要来源
- Anthropic Python SDK Releases - GitHub API
- Mistral Python SDK Releases - GitHub API
- Google Genai Python SDK Releases - GitHub API
- Cohere Python SDK Releases - GitHub API
- Releasebot.io - 跨厂商发布追踪的聚合来源
大语言模型产品发布周度追踪:五大厂商最新动态一览
追踪 OpenAI、Anthropic、Google、Mistral、Cohere 五大领先人工智能厂商的大语言模型产品发布动态,涵盖新模型上线、软件开发工具包更新及接口变更。二零二六年四月二十一日数据更新,新增 GPT-Rosalind 生命科学模型、Claude Opus 4.7 旗舰升级、Gemini Robotics-ER 1.6 机器人推理模型等二十二条发布记录,创下季度新高。
数据概览
- 最后更新:2026-04-21
- 更新频率:每周
- 数据范围:2026 年 3 月 26 日至 2026 年 4 月 21 日
- 主要来源:OpenAI 博客、Google AI 博客、GitHub SDK 发布订阅源、Releasebot.io 聚合
本追踪器监测主要大语言模型(LLM)厂商的产品发布、API 更新、模型上线和 SDK 变更,覆盖 OpenAI、Anthropic、Google、Mistral 和 Cohere。当前数据覆盖 4 周,共 35 条记录。
关键事实
- 厂商:OpenAI(8 条发布)、Google(7 条)、Mistral(7 条)、Anthropic(5 条)、Cohere(5 条)
- 内容:4 周内 35 条产品更新;13 个新模型、9 次 SDK 更新、8 次功能发布
- 时间:2026 年 3 月 26 日 - 4 月 21 日
- 影响:15 条高影响发布,包括 GPT-Rosalind、Claude Opus 4.7、Gemini Robotics-ER 1.6 和 Leanstral
方法论
数据采集遵循系统化方法:
- 来源:官方厂商博客(RSS 订阅源)、GitHub SDK 发布 API、Releasebot.io 聚合
- 采集:通过 curl、GitHub API 和 RSS 解析进行每周自动扫描
- 验证:每条记录均对照原始来源 URL 进行验证
- 分类:类别包括新模型、SDK 更新、API 更新、功能发布、价格变更、弃用和公司公告
- 影响评估:高(重大模型/政策变更)、中(功能增强)、低(小幅 SDK 修复)
最新数据(2026 年 4 月 14 日 - 21 日)
| 日期 | 厂商 | 产品/功能 | 类别 | 描述 | 影响 |
|---|---|---|---|---|---|
| 2026-04-19 | OpenAI | ChatGPT Business Workspace Analytics | 功能发布 | 更新后的分析体验”工作区分析”取代用户分析,提供更简洁的工作区级视图,帮助管理员了解整体采用情况和 Codex 在组织内的使用情况 | 中等 |
| 2026-04-18 | OpenAI | Codex Background Computer Use | 功能发布 | Codex 现可通过自己的光标查看、点击、打字来使用电脑上的所有应用。多个智能体可在 Mac 上并行工作而不干扰用户操作。最初支持 macOS | 高 |
| 2026-04-18 | Anthropic | Claude Code v2.1.101 | SDK 更新 | 为 Opus 4.7 添加 xhigh effort 等级,改进 Vertex/Bedrock 设置支持 1M 上下文选项,新增 OTEL_LOG_RAW_API_BODIES 调试选项,修复 LSP 诊断排序和 commit skill 调用问题 | 中等 |
| 2026-04-17 | OpenAI | Agents SDK Harness Update | SDK 更新 | Agents SDK harness 在文档/文件/系统操作方面能力增强。现支持可配置内存、沙箱感知编排、类似 Codex 的文件系统工具,以及与前沿智能体系统原语的标准化集成 | 高 |
| 2026-04-17 | Anthropic | Claude Design | 功能发布 | Anthropic Labs 推出的视觉输出新产品——设计稿、原型、幻灯片、单页文档。由 Opus 4.7 驱动。面向 Pro、Max、Team、Enterprise 订阅用户。支持设计系统集成、行内评论、交接至 Claude Code | 高 |
| 2026-04-17 | Anthropic | Claude Opus 4.7 | 新模型 | 正式发布升级版本,软件工程能力更强,视觉能力提升(支持更高分辨率图像),指令遵循更精准,长时间运行的智能体工作更可靠。定价与 Opus 4.6 相同(输入 $5/M,输出 $25/M) | 高 |
| 2026-04-17 | Personal Intelligence with Nano Banana 2 | 功能发布 | 个性化图像创建功能,结合用户偏好与 Gemini。可连接 Google Photos 使用用户和亲友的照片。面向美国地区 Google AI Plus/Pro/Ultra 订阅用户逐步推出 | 中等 | |
| 2026-04-17 | Gemini Robotics-ER 1.6 | 新模型 | 面向机器人的推理优先模型重大升级。增强空间推理、多视角理解,新增仪表读取能力(可读取压力表/液位计)。迄今最安全的机器人模型。通过 Gemini API 和 Google AI Studio 提供服务 | 高 | |
| 2026-04-17 | Gemini App for Mac | 功能发布 | 原生桌面体验,Option+Space 快捷键可在任意应用旁唤起 Gemini。支持窗口共享以理解上下文。全球免费提供,支持 macOS 15+ | 中等 | |
| 2026-04-16 | OpenAI | GPT-Rosalind | 新模型 | 研究预览版生命科学推理模型,专注于生物学、药物发现和转化医学。以罗莎琳德·富兰克林命名。在 BixBench 和 LABBench2 生物化学推理基准测试中取得领先成绩 | 高 |
| 2026-04-16 | OpenAI | Codex Research Plugin | 功能发布 | 新研究插件,将科学家连接到 50 多个工具和数据源,加速研究工作流。符合条件的 Enterprise 用户可结合 GPT-Rosalind 进行更深入的生物推理 | 中等 |
| 2026-04-15 | Gemini 3.1 Flash TTS | 新模型 | 文本转语音模型,语音质量提升,在 Artificial Analysis TTS 排行榜上获得 1211 Elo 分。支持 70 多种语言、原生多说话人对话、通过自然语言进行细粒度创意控制。所有音频均使用 SynthID 水印 | 高 | |
| 2026-04-14 | Gemini in Google Classroom Expansion | 功能发布 | Google Classroom 中的 Gemini 标签页现向所有 Google Workspace for Education 版本开放。扩展至高等教育学生。提供面向教育工作者和学生的入门提示 | 中等 | |
| 2026-04-10 | Mistral | Voxtral Realtime + Mini Transcribe V2 | 新模型 | Realtime:流式转录延迟低于 200ms,支持 13 种语言,Apache 2.0 权重。Mini Transcribe V2:FLEURS 上约 4% WER,$0.003/分钟,最佳性价比,支持说话人分离和上下文偏置 | 高 |
| 2026-04-08 | Mistral | Voxtral TTS | 新模型 | 基于 Ministral 3B 构建的文本转语音模型。语音仿真具有真实感和情感表现力。模型延迟 70ms,支持 9 种语言,零样本跨语言语音适配。API 价格 $0.016/千字符 | 中等 |
| 2026-04-08 | Mistral | Small 4 | 新模型 | 混合模型,在单一多模态模型中统一指令、推理和编码。256k 上下文窗口。Apache 2.0 许可。reasoning_effort 参数支持动态调整。NVIDIA Nemotron 联盟创始成员 | 高 |
| 2026-04-08 | Mistral | Leanstral | 新模型 | 首个面向 Lean 4 形式化证明工程的开源代码智能体。Apache 2.0 许可。在 FLTEval 上超越 GLM5-744B 和 Kimi-K2.5-1T。通过免费 API 端点 labs-leanstral-2603 提供 | 高 |
| 2026-04-06 | Mistral | Moderation 2603 | 功能发布 | 内容审核模型发布。通过 Mistral API 提供服务 | 中等 |
| 2026-04-04 | Cohere | Embed v2 Retirement | 弃用 | 弃用 embed-english-v2.0、embed-english-light-v2.0、embed-multilingual-v2.0 模型。用户应迁移至 embed-v3.0 或 embed-v4.0 | 中等 |
| 2026-04-03 | Cohere | Transcribe 03-2026 | 新模型 | 音频转录模型,通过 Audio Transcriptions API 端点提供服务。免费供实验使用,受速率限制 | 中等 |
| 2026-04-03 | Cohere | Rerank v4.0 | 新模型 | 两个变体:rerank-v4.0-pro(复杂场景的顶级质量)和 rerank-v4.0-lite(速度和效率优化)。通过 API 提供服务 | 高 |
历史数据(2026 年 3 月 26 日 - 4 月 2 日)
| 日期 | 厂商 | 产品/功能 | 类别 | 描述 | 影响 |
|---|---|---|---|---|---|
| 2026-04-02 | OpenAI | TBPN Acquisition | 公司 | OpenAI 收购 TBPN,加速 AI 全球对话,支持独立媒体 | 中等 |
| 2026-04-02 | OpenAI | Codex Flexible Pricing | 价格变更 | Codex 现为 ChatGPT Business 和 Enterprise 提供按量付费定价,为团队提供灵活的采用选项 | 高 |
| 2026-04-02 | Gemini API Flex/Priority Inference | API 更新 | 两种新的推理层级以平衡成本和延迟:Flex 用于成本优化,Priority 用于降低延迟 | 高 | |
| 2026-04-02 | Google Vids Lyria/Veo Integration | 功能发布 | Google Vids 获得 Lyria 3 和 Veo 3.1 驱动的视频生成功能,免费提供 | 中等 | |
| 2026-04-01 | Anthropic | Python SDK v0.88.0 | SDK 更新 | 消息响应的结构化 stop_details、Bedrock API 密钥认证、AWS 包准备 | 中等 |
| 2026-04-01 | Genai Python SDK v1.70.0 | SDK 更新 | 支持 TextAnnotationDelta 流式工具响应,service_tier 枚举修复 | 低 | |
| 2026-03-31 | OpenAI | $122B Funding Round | 公司 | OpenAI 以 7300 亿美元投前估值融资 1220 亿美元,用于全球扩展前沿 AI、投资计算基础设施 | 高 |
| 2026-03-31 | Veo 3.1 Lite | 新模型 | 最具性价比的视频生成模型,在 Gemini API 付费预览版和 Google AI Studio 中提供 | 高 | |
| 2026-03-31 | Anthropic | Python SDK v0.87.0 | SDK 更新 | APIStatusError 中的 error type 字段、indices 数组格式序列化、内存工具和 transform schema 的多项 bug 修复 | 中等 |
| 2026-03-31 | Mistral | Python SDK v2.2.0 | SDK 更新 | 主要版本,新增工作流 API:get_workflow、execute_workflow、工作流指标、执行、部署,以及对事件 API 的破坏性变更 | 中等 |
| 2026-03-31 | Cohere | Python SDK v5.21.2 | SDK 更新 | Fern 生成更新,包含小幅修复 | 低 |
| 2026-03-27 | Genai Python SDK v1.69.0 | SDK 更新 | Consent 音频字段、voice_consent_signature、FileSearchResult 的 custom_metadata、Veo 配置标签、mTLS 自动启用 | 中等 | |
| 2026-03-26 | Cohere | Python SDK v5.21.0 | SDK 更新 | 向 SDK 添加 Audio Transcriptions 端点 | 中等 |
厂商活动汇总
本周(2026 年 4 月 14 日 - 21 日)
| 厂商 | 发布数 | 高影响 | 类别 |
|---|---|---|---|
| Mistral | 6 | 3 | 新模型、功能发布 |
| OpenAI | 5 | 3 | 新模型、功能发布、SDK 更新 |
| 5 | 2 | 新模型、功能发布 | |
| Anthropic | 3 | 2 | 新模型、功能发布、SDK 更新 |
| Cohere | 3 | 1 | 新模型、弃用 |
类别分布(本周):
- 新模型:11 条(50%)
- 功能发布:7 条(32%)
- SDK 更新:2 条(9%)
- 弃用:1 条(4.5%)
- API 更新:0 条
- 价格变更:0 条
- 公司:0 条
历史汇总(2026 年 3 月 26 日 - 4 月 2 日)
| 厂商 | 发布数 | 高影响 | 类别 |
|---|---|---|---|
| 5 | 2 | 新模型、API 更新、功能发布、SDK 更新 | |
| OpenAI | 3 | 2 | 公司、价格变更 |
| Anthropic | 2 | 0 | SDK 更新 |
| Cohere | 2 | 0 | SDK 更新 |
| Mistral | 1 | 0 | SDK 更新 |
趋势与观察
本周亮点
- 领域专用模型涌现:OpenAI 的 GPT-Rosalind 瞄准生命科学领域的生物化学推理;Google 的 Robotics-ER 1.6 为工业机器人新增仪表读取能力;Mistral 的 Leanstral 攻克形式化证明工程
- 语音 AI 战场激化:Gemini 3.1 Flash TTS(1211 Elo)、Mistral 的 Voxtral 系列(70ms 延迟,$0.016/千字符)和 Cohere Transcribe 在两周内相继发布,显示音频 AI 领域的激烈竞争
- 桌面/原生应用崛起:Gemini Mac 应用支持 Option+Space 快捷键,Codex Background Computer Use 可操控电脑所有应用,标志着从浏览器优先向操作系统原生 AI 体验的战略转移
- 视觉/设计工具扩张:Claude Design(由 Opus 4.7 驱动)和 Google 的 Personal Intelligence with Nano Banana 2 均瞄准视觉内容创建工作流
- 模型弃用加速:Cohere 弃用 Embed v2.0 系列,继上周 OpenAI 移除 Codex 后,表明模型生命周期更替加快
周度对比
| 指标 | 4 月 14-21 日 | 4 月 7-13 日 | 3 月 31 日-4 月 6 日 |
|---|---|---|---|
| 总发布数 | 22 | 15 | 13 |
| 新模型 | 11 | 6 | 1 |
| 高影响 | 11 | 4 | 4 |
| 弃用 | 1 | 1 | 0 |
| SDK 更新 | 2 | 8 | 3 |
- 发布量增长 47%:本周 22 条发布 vs. 上周 15 条
- 新模型主导:50% 的发布为新模型,创下有记录以来最高比例
- SDK 活动转移:从上周 8 次 SDK 更新降至本周 2 次,厂商聚焦产品发布
- 高影响发布翻三倍:本周 11 条高影响发布 vs. 上周 4 条
厂商战略信号
| 厂商 | 战略方向 | 证据 |
|---|---|---|
| OpenAI | 垂直领域扩张(生命科学) | GPT-Rosalind + Codex Research Plugin 集成 |
| Anthropic | 视觉生产力 | Claude Design 与 Opus 4.7 编码改进同步发布 |
| 具身智能 + 音频 | Robotics-ER 1.6 + Gemini 3.1 Flash TTS + 原生 Mac 应用 | |
| Mistral | 开源生态 | 6 条发布包括 Apache 2.0 许可的 Leanstral 和 Voxtral |
| Cohere | 企业基础设施 | Rerank v4.0 + Transcribe + Embed v2 弃用 |
🔺 独家情报:别处看不到的洞察
置信度: 高 | 新颖度评分: 78/100
媒体聚焦于单个模型发布,但三重结构性转变被低估:首先,Mistral 一周内发布 6 款产品,包括 Voxtral TTS(70ms 延迟,$0.016/千字符)和 Leanstral(首个开源 Lean 4 证明智能体),将公司定位为封闭语音 AI 和形式化推理系统的开源替代方案。其次,OpenAI 的 GPT-Rosalind 是自 GPT-4 以来首个领域专用模型,标志着从通用大语言模型向垂直专业解决方案的转型——仅药物发现领域的生命科学市场就有 500 亿美元以上机会。第三,原生桌面应用(Gemini Mac、Codex Background Computer Use)显示从浏览器优先向操作系统集成 AI 的战略转移,降低企业用户的上下文切换延迟和摩擦。
关键启示:企业团队应立即评估语音 AI 厂商——Gemini TTS、Voxtral 和 Cohere Transcribe 在 10 天内相继发布,在市场整合前创造了罕见的性价比比较窗口。
重要变更
OpenAI GPT-Rosalind(4 月 16 日)
前沿实验室首个领域专用生命科学模型。以罗莎琳德·富兰克林命名,在 BixBench 和 LABBench2 生物化学推理基准测试中取得领先成绩。配套 Codex Research Plugin 连接 50 多个科学工具。
Anthropic Claude Opus 4.7 GA(4 月 17 日)
旗舰模型升级,软件工程能力更强,视觉能力提升(更高分辨率),长时间运行的智能体工作更可靠。定价与前代相同(输入 $5/M,输出 $25/M),性能提升可衡量。
Claude Design 发布(4 月 17 日)
Anthropic Labs 推出的视觉输出新产品——设计稿、原型、幻灯片、单页文档。集成设计系统、行内评论和交接至 Claude Code。Anthropic 首个重大视觉生产力工具。
Google Gemini Robotics-ER 1.6(4 月 17 日)
面向机器人的推理优先模型,增强空间推理、多视角理解和仪表读取能力(压力表/液位计)。定位为”迄今最安全的机器人模型”。
Mistral Leanstral(4 月 8 日)
首个面向 Lean 4 形式化证明工程的开源代码智能体。Apache 2.0 许可。在 FLTEval 上超越 GLM5-744B 和 Kimi-K2.5-1T。提供免费 API 端点。
Gemini 3.1 Flash TTS(4 月 15 日)
文本转语音模型,在 Artificial Analysis TTS 排行榜上获得 1211 Elo 分。支持 70 多种语言、原生多说话人对话,使用 SynthID 水印。
更新记录
| 日期 | 变更 | 详情 |
|---|---|---|
| 2026-04-21 | 更新 | 新增 2026 年 4 月 14-21 日周的 22 条记录 |
| 2026-04-21 | 更新 | 重构为最新数据和历史数据两部分 |
| 2026-04-21 | 更新 | 更新厂商活动汇总,添加周度对比 |
| 2026-04-21 | 更新 | 添加领域专用模型和语音 AI 战场的趋势与观察 |
| 2026-04-03 | 新增 | 追踪器初始发布,包含 2026 年 3 月 26 日 - 4 月 2 日的 13 条记录 |
| 2026-04-03 | 新增 | 厂商活动汇总和趋势分析 |
| 2026-04-03 | 新增 | 类别分布明细 |
信息来源
- OpenAI Blog RSS - OpenAI 公告的主要来源
- Google AI Blog RSS - Google AI 发布的主要来源
- Anthropic Python SDK Releases - GitHub API
- Mistral Python SDK Releases - GitHub API
- Google Genai Python SDK Releases - GitHub API
- Cohere Python SDK Releases - GitHub API
- Releasebot.io - 跨厂商发布追踪的聚合来源
相关情报
ArXiv cs.AI 智能体论文周度追踪报告 — 2026年4月第三周数据汇总
本周收录30篇高质量智能体相关论文,涵盖多智能体系统、基准测试、检索增强生成等前沿方向。头名论文ReTAS首创Actor-Observer不对称性解决方案。基准测试论文周环比激增133%,RAG智能体论文跃升260%,小语言模型部署效率成为新焦点。
Hermes Agent 开源自进化框架发布,GitHub 星标突破 95,000 创增长纪录
Hermes Agent v0.10.0 正式发布,在短短 8 周内成功斩获 95,600 个 GitHub 星标,刷新开源智能体项目增长纪录。该框架内置 118 项技能包和三层记忆架构,具备从用户交互中自主创建新技能的核心能力。
GitHub AI 智能体仓库星标追踪器 — 本周数据更新与趋势分析
AutoGPT 以 18.35 万星标稳居榜首,Hermes-Agent 周度飙升 48.2% 逼近 10 万星标里程碑。低代码平台 Langflow(14.7 万星)与 Dify(13.8 万星)激烈争夺市场主导地位。系统提示透明度仓库作为全新类别首次跻身前十。