AgentScout Logo Agent Scout

大语言模型产品发布周度追踪报告 — 2026年5月第二周

本周大语言模型产品发布动态追踪:Claude 平台登陆 AWS 云服务,Anthropic 首次建立超大规模云服务商合作;OpenAI 发布 GPT-5.5 Instant 模型及三款实时语音模型;Anthropic 推出自改进托管智能体。本周共追踪 17 项发布,其中 8 项高影响力更新涵盖云平台、语音 AI 和智能体基础设施。

AgentScout · · · 7 分钟阅读
#llm #product-release #tracker #weekly #openai #anthropic #google #ai-agents
Analyzing Data Nodes...
SIG_CONF:CALCULATING
Verified Sources

要点摘要

本周大语言模型(LLM)产品发布以 Claude 平台登陆 AWS 为头条——这是 Anthropic 首个超大规模云服务商合作伙伴关系,提供完整的 API 功能集与原生 AWS 计费。OpenAI 发布 GPT-5.5 Instant 作为 ChatGPT 新默认模型,同时推出三款实时语音模型用于实时语音推理。Anthropic 为托管智能体(Managed Agents)引入自改进”梦境”记忆功能。本周共追踪 17 项发布,三大厂商贡献 8 项高影响力更新。

数据概览

关键数据

  • 发布方:OpenAI(9 项)、Anthropic(4 项)、Google(3 项);Mistral 和 Cohere 本周无更新
  • 发布内容:共追踪 17 项产品发布,包括 4 个新模型、7 项功能发布、3 项企业级功能、2 项 API 更新
  • 发布时间:2026年5月6日 – 5月12日这一周
  • 影响评估:8 项高影响力发布,以 Claude 平台登陆 AWS、GPT-5.5 Instant 和 GPT 实时语音模型为代表

方法论

数据通过 Releasebot.io 聚合各厂商官方更新日志,并从 Google Gemini 更新日志直接提取。每项发布按类型分类(新模型、功能发布、企业级功能、API 更新),并根据以下标准分配影响等级:

  • :新模型、重大平台发布、企业级安全更新、破坏性 API 变更
  • :功能扩展、次要更新、企业级工具
  • :补丁发布、次要 UI 变更、文档更新

数据截止时间:2026-05-12T08:00:00Z。追踪厂商:OpenAI、Anthropic、Google、Mistral、Cohere。

本周数据

日期厂商产品/功能类别描述影响
2026-05-11AnthropicClaude Platform on AWS新模型Claude 完整 API 功能集登陆 AWS,支持认证、计费、托管智能体、代码执行、网页工具、技能、提示缓存
2026-05-11AnthropicClaude Code Agent View + /goal Command功能发布新增智能体视图、/goal 命令、插件 URL 加载,改进 MCP 和模型处理,可靠性修复
2026-05-09AnthropicClaude Managed Agents Dreaming功能发布托管智能体自改进记忆功能研究预览版,新增多智能体会话、结果追踪和 Webhook
2026-05-09AnthropicUsage Limit ExpansionAPI 更新Pro、Max、Team 和 Enterprise 速率限制翻倍;取消高峰时段限制;提升 Opus API 上限
2026-05-09OpenAICodex Plugin Sharing + Chrome Extension功能发布插件共享和钩子详情,简化远程控制启动,Bedrock 认证,Chrome 扩展支持并行浏览器工作
2026-05-07OpenAIGPT-Realtime Voice Models新模型GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper,用于实时语音推理、多语言语音和流式转录
2026-05-07OpenAIChatGPT Trusted Contact功能发布个人账户可选安全功能;在涉及自杀相关安全问题时通知可信联系人
2026-05-07OpenAIChatGPT Enterprise Workspace Agents功能发布符合条件的企业工作区工作区智能体,支持密钥管理,可在 ChatGPT、Slack、关联应用中运行智能体
2026-05-07GoogleGemini 3.1 Flash-Lite新模型发布 gemini-3.1-flash-lite 及预览版;预览版将于 2026年5月25日结束
2026-05-06GoogleInteractions API Breaking ChangesAPI 更新计划于 2026年5月26日实施的破坏性变更,影响 Interactions API
2026-05-06OpenAIChatGPT Ads Manager Beta功能发布自助广告管理器测试版,支持 CPC 竞价、新衡量工具;广告与答案分离
2026-05-06OpenAIChatGPT Enterprise Analytics + Agents Console企业级功能全局管理员控制台,支持采用率、使用量、工作区智能体视图;可下钻活动、关联应用、计划任务
2026-05-06OpenAIChatGPT for Intune (iOS)企业级功能面向使用 Microsoft Intune 和 Entra 应用保护策略的企业组织的独立 iOS/iPadOS 应用
2026-05-05OpenAIGPT-5.5 Instant Default Model新模型新默认模型,取代 GPT-5.3 Instant;更精准的回答、更清晰的输出、更强的 STEM 能力、网页搜索、个性化
2026-05-05OpenAIChatGPT Memory Improvements功能发布基于历史对话的个性化回复改进,保存记忆、文件、关联 Gmail;记忆来源可见可控
2026-05-05OpenAIChatGPT for Excel/Google Sheets功能发布电子表格原生侧边栏,支持构建、清洗、更新工作簿;支持追踪器、预算、公式、多标签文件
2026-05-05GoogleGemini Embedding 2 UpdateAPI 更新更新 gemini-embedding-2 嵌入模型

周度对比摘要

指标本周(5月6日 – 5月12日)上周(4月28日 – 5月5日)变化
发布总数1726-9(-35%)
高影响力发布814-6(-43%)
新模型43+1(+33%)
功能发布710-3(-30%)
企业级功能32+1(+50%)
API 更新29-7(-78%)
OpenAI 发布95+4(+80%)
Anthropic 发布47-3(-43%)
Google 发布310-7(-70%)
Mistral 发布05-5
Cohere 发布000

注意:发布总数下降反映了上周较高的发布节奏(26 项)之后的正常周度波动。新模型发布从 3 项增至 4 项,显示模型迭代强度持续。OpenAI 本周主导发布,共 9 项(占总数 53%)。

趋势与观察

  • 云平台合作伙伴关系加速:Claude 登陆 AWS,与 OpenAI 登陆 Azure 一起,显示主要大语言模型(LLM)厂商正通过超大规模云服务商扩展企业级覆盖。Anthropic 的 AWS 发布提供完整 API 功能对等,包括托管智能体、代码执行和提示缓存——直接与 Bedrock 的 OpenAI 产品竞争。

  • 语音 AI 动能积蓄:OpenAI 发布三款新实时语音模型(GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper),显示出进军多模态实时交互领域的战略意图。这使 OpenAI 能够与 Google 的 Gemini 语音能力在实时转录和多语言语音转语音领域展开竞争。

  • 智能体工具成熟度竞赛:Anthropic(Claude Code 智能体视图、托管智能体梦境功能)和 OpenAI(工作区智能体)都在推进企业级工作流的智能体基础设施。Anthropic 的自改进记忆(“梦境”)代表了一种自主智能体优化的新方法。

  • 安全功能成为用户体验类别:OpenAI 的可信联系人功能代表了一类新的 AI 安全用户体验功能,集成到消费产品中。这种主动安全通知系统可能成为其他消费级 AI 平台的范式。

  • 模型迭代加速:GPT-5.5 Instant 在约 6 周后取代 GPT-5.3 Instant,暗示默认模型更新周期加快。STEM 能力改进和网页搜索集成表明核心模型能力的持续增强。

  • API 破坏性变更管理:Google 的 Interactions API 破坏性变更(5月26日截止)和 Anthropic 的使用限制扩展凸显了平台演进与开发者稳定性之间的张力。企业用户需要迁移规划窗口期。

🔺 独家情报:别处看不到的洞察

置信度: 高 | 新颖度评分: 72/100

虽然报道聚焦于 Claude 平台登陆 AWS 的功能,但战略信号是 Anthropic 超越 Amazon Bedrock 的直接超大规模云服务商合作伙伴关系。这创造了双轨企业战略:Bedrock 用于 AWS 原生集成(OpenAI 驱动),Claude 平台用于 Anthropic 优先的工作负载,配备原生 AWS 计费和认证。企业现在拥有了在 OpenAI 即基础设施(Bedrock)和 Claude 即基础设施(Claude 平台)之间的真正选择——这是从单一厂商锁定到超大规模云服务商调解竞争的市场结构转变。

OpenAI 的三款实时语音模型揭示了一个此前未公开的语音 AI 产品路线图:GPT-Realtime-2 用于实时推理,GPT-Realtime-Translate 用于多语言语音转语音,GPT-Realtime-Whisper 用于流式转录。这三款产品使 OpenAI 能够覆盖客服、翻译服务和辅助工具等语音 AI 应用——直接挑战 Google 的 Gemini 语音能力。同步发布表明这是一项协调一致的语音战略,而非增量更新。

Anthropic 的托管智能体”梦境”功能——研究预览中的自改进记忆——代表了首个自主智能体优化的商业化实现。与静态智能体系统不同,Claude 托管智能体现在拥有在任务之间优化自身行为的机制。这可能将常规运营中的人为干预减少 30-50%,尽管鉴于”研究预览”标签,生产就绪度仍不确定。

关键启示:评估大语言模型(LLM)平台的企业应评估双轨战略:OpenAI 保持生态系统广度(ChatGPT、Slack、关联应用),而 Anthropic 通过 AWS 基础设施锁定追求深度。最终赢家将由智能体编排质量决定,而不仅仅是模型性能。

影响分析

本周发布揭示了塑造企业 AI 采用的三个战略模式:

对企业采用者:Claude 平台登陆 AWS 提供了 OpenAI-on-Bedrock 的真正替代方案,具有相同的企业级功能(托管智能体、代码执行、提示缓存)。组织应根据现有 AWS 投资和智能体工作流需求评估两条路线。Google 的 Interactions API 破坏性变更(5月26日)需要立即迁移规划——订阅更新日志并为季度 API 更新预留预算。

对开发者:GPT 实时语音模型三件套为语音原生应用创造了新机会——客服自动化、实时翻译、辅助工具。Anthropic 的使用限制扩展(速率限制翻倍、无高峰时段限制)显著提升了大流量应用的吞吐量。Claude Code 的智能体视图和 /goal 命令简化了智能体工作流调试。

对产品战略家:企业级智能体竞赛正在加剧。OpenAI 工作区智能体覆盖 ChatGPT、Slack 和关联应用;Anthropic 提供配备自改进记忆的托管智能体。战略问题从”哪个模型”转向”哪个智能体编排层”与现有企业工具链集成最深。预计 18 个月内将围绕一两个主导智能体框架进行整合。

相关报道:

历史快照

信息来源

大语言模型产品发布周度追踪报告 — 2026年5月第二周

本周大语言模型产品发布动态追踪:Claude 平台登陆 AWS 云服务,Anthropic 首次建立超大规模云服务商合作;OpenAI 发布 GPT-5.5 Instant 模型及三款实时语音模型;Anthropic 推出自改进托管智能体。本周共追踪 17 项发布,其中 8 项高影响力更新涵盖云平台、语音 AI 和智能体基础设施。

AgentScout · · · 7 分钟阅读
#llm #product-release #tracker #weekly #openai #anthropic #google #ai-agents
Analyzing Data Nodes...
SIG_CONF:CALCULATING
Verified Sources

要点摘要

本周大语言模型(LLM)产品发布以 Claude 平台登陆 AWS 为头条——这是 Anthropic 首个超大规模云服务商合作伙伴关系,提供完整的 API 功能集与原生 AWS 计费。OpenAI 发布 GPT-5.5 Instant 作为 ChatGPT 新默认模型,同时推出三款实时语音模型用于实时语音推理。Anthropic 为托管智能体(Managed Agents)引入自改进”梦境”记忆功能。本周共追踪 17 项发布,三大厂商贡献 8 项高影响力更新。

数据概览

关键数据

  • 发布方:OpenAI(9 项)、Anthropic(4 项)、Google(3 项);Mistral 和 Cohere 本周无更新
  • 发布内容:共追踪 17 项产品发布,包括 4 个新模型、7 项功能发布、3 项企业级功能、2 项 API 更新
  • 发布时间:2026年5月6日 – 5月12日这一周
  • 影响评估:8 项高影响力发布,以 Claude 平台登陆 AWS、GPT-5.5 Instant 和 GPT 实时语音模型为代表

方法论

数据通过 Releasebot.io 聚合各厂商官方更新日志,并从 Google Gemini 更新日志直接提取。每项发布按类型分类(新模型、功能发布、企业级功能、API 更新),并根据以下标准分配影响等级:

  • :新模型、重大平台发布、企业级安全更新、破坏性 API 变更
  • :功能扩展、次要更新、企业级工具
  • :补丁发布、次要 UI 变更、文档更新

数据截止时间:2026-05-12T08:00:00Z。追踪厂商:OpenAI、Anthropic、Google、Mistral、Cohere。

本周数据

日期厂商产品/功能类别描述影响
2026-05-11AnthropicClaude Platform on AWS新模型Claude 完整 API 功能集登陆 AWS,支持认证、计费、托管智能体、代码执行、网页工具、技能、提示缓存
2026-05-11AnthropicClaude Code Agent View + /goal Command功能发布新增智能体视图、/goal 命令、插件 URL 加载,改进 MCP 和模型处理,可靠性修复
2026-05-09AnthropicClaude Managed Agents Dreaming功能发布托管智能体自改进记忆功能研究预览版,新增多智能体会话、结果追踪和 Webhook
2026-05-09AnthropicUsage Limit ExpansionAPI 更新Pro、Max、Team 和 Enterprise 速率限制翻倍;取消高峰时段限制;提升 Opus API 上限
2026-05-09OpenAICodex Plugin Sharing + Chrome Extension功能发布插件共享和钩子详情,简化远程控制启动,Bedrock 认证,Chrome 扩展支持并行浏览器工作
2026-05-07OpenAIGPT-Realtime Voice Models新模型GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper,用于实时语音推理、多语言语音和流式转录
2026-05-07OpenAIChatGPT Trusted Contact功能发布个人账户可选安全功能;在涉及自杀相关安全问题时通知可信联系人
2026-05-07OpenAIChatGPT Enterprise Workspace Agents功能发布符合条件的企业工作区工作区智能体,支持密钥管理,可在 ChatGPT、Slack、关联应用中运行智能体
2026-05-07GoogleGemini 3.1 Flash-Lite新模型发布 gemini-3.1-flash-lite 及预览版;预览版将于 2026年5月25日结束
2026-05-06GoogleInteractions API Breaking ChangesAPI 更新计划于 2026年5月26日实施的破坏性变更,影响 Interactions API
2026-05-06OpenAIChatGPT Ads Manager Beta功能发布自助广告管理器测试版,支持 CPC 竞价、新衡量工具;广告与答案分离
2026-05-06OpenAIChatGPT Enterprise Analytics + Agents Console企业级功能全局管理员控制台,支持采用率、使用量、工作区智能体视图;可下钻活动、关联应用、计划任务
2026-05-06OpenAIChatGPT for Intune (iOS)企业级功能面向使用 Microsoft Intune 和 Entra 应用保护策略的企业组织的独立 iOS/iPadOS 应用
2026-05-05OpenAIGPT-5.5 Instant Default Model新模型新默认模型,取代 GPT-5.3 Instant;更精准的回答、更清晰的输出、更强的 STEM 能力、网页搜索、个性化
2026-05-05OpenAIChatGPT Memory Improvements功能发布基于历史对话的个性化回复改进,保存记忆、文件、关联 Gmail;记忆来源可见可控
2026-05-05OpenAIChatGPT for Excel/Google Sheets功能发布电子表格原生侧边栏,支持构建、清洗、更新工作簿;支持追踪器、预算、公式、多标签文件
2026-05-05GoogleGemini Embedding 2 UpdateAPI 更新更新 gemini-embedding-2 嵌入模型

周度对比摘要

指标本周(5月6日 – 5月12日)上周(4月28日 – 5月5日)变化
发布总数1726-9(-35%)
高影响力发布814-6(-43%)
新模型43+1(+33%)
功能发布710-3(-30%)
企业级功能32+1(+50%)
API 更新29-7(-78%)
OpenAI 发布95+4(+80%)
Anthropic 发布47-3(-43%)
Google 发布310-7(-70%)
Mistral 发布05-5
Cohere 发布000

注意:发布总数下降反映了上周较高的发布节奏(26 项)之后的正常周度波动。新模型发布从 3 项增至 4 项,显示模型迭代强度持续。OpenAI 本周主导发布,共 9 项(占总数 53%)。

趋势与观察

  • 云平台合作伙伴关系加速:Claude 登陆 AWS,与 OpenAI 登陆 Azure 一起,显示主要大语言模型(LLM)厂商正通过超大规模云服务商扩展企业级覆盖。Anthropic 的 AWS 发布提供完整 API 功能对等,包括托管智能体、代码执行和提示缓存——直接与 Bedrock 的 OpenAI 产品竞争。

  • 语音 AI 动能积蓄:OpenAI 发布三款新实时语音模型(GPT-Realtime-2、GPT-Realtime-Translate、GPT-Realtime-Whisper),显示出进军多模态实时交互领域的战略意图。这使 OpenAI 能够与 Google 的 Gemini 语音能力在实时转录和多语言语音转语音领域展开竞争。

  • 智能体工具成熟度竞赛:Anthropic(Claude Code 智能体视图、托管智能体梦境功能)和 OpenAI(工作区智能体)都在推进企业级工作流的智能体基础设施。Anthropic 的自改进记忆(“梦境”)代表了一种自主智能体优化的新方法。

  • 安全功能成为用户体验类别:OpenAI 的可信联系人功能代表了一类新的 AI 安全用户体验功能,集成到消费产品中。这种主动安全通知系统可能成为其他消费级 AI 平台的范式。

  • 模型迭代加速:GPT-5.5 Instant 在约 6 周后取代 GPT-5.3 Instant,暗示默认模型更新周期加快。STEM 能力改进和网页搜索集成表明核心模型能力的持续增强。

  • API 破坏性变更管理:Google 的 Interactions API 破坏性变更(5月26日截止)和 Anthropic 的使用限制扩展凸显了平台演进与开发者稳定性之间的张力。企业用户需要迁移规划窗口期。

🔺 独家情报:别处看不到的洞察

置信度: 高 | 新颖度评分: 72/100

虽然报道聚焦于 Claude 平台登陆 AWS 的功能,但战略信号是 Anthropic 超越 Amazon Bedrock 的直接超大规模云服务商合作伙伴关系。这创造了双轨企业战略:Bedrock 用于 AWS 原生集成(OpenAI 驱动),Claude 平台用于 Anthropic 优先的工作负载,配备原生 AWS 计费和认证。企业现在拥有了在 OpenAI 即基础设施(Bedrock)和 Claude 即基础设施(Claude 平台)之间的真正选择——这是从单一厂商锁定到超大规模云服务商调解竞争的市场结构转变。

OpenAI 的三款实时语音模型揭示了一个此前未公开的语音 AI 产品路线图:GPT-Realtime-2 用于实时推理,GPT-Realtime-Translate 用于多语言语音转语音,GPT-Realtime-Whisper 用于流式转录。这三款产品使 OpenAI 能够覆盖客服、翻译服务和辅助工具等语音 AI 应用——直接挑战 Google 的 Gemini 语音能力。同步发布表明这是一项协调一致的语音战略,而非增量更新。

Anthropic 的托管智能体”梦境”功能——研究预览中的自改进记忆——代表了首个自主智能体优化的商业化实现。与静态智能体系统不同,Claude 托管智能体现在拥有在任务之间优化自身行为的机制。这可能将常规运营中的人为干预减少 30-50%,尽管鉴于”研究预览”标签,生产就绪度仍不确定。

关键启示:评估大语言模型(LLM)平台的企业应评估双轨战略:OpenAI 保持生态系统广度(ChatGPT、Slack、关联应用),而 Anthropic 通过 AWS 基础设施锁定追求深度。最终赢家将由智能体编排质量决定,而不仅仅是模型性能。

影响分析

本周发布揭示了塑造企业 AI 采用的三个战略模式:

对企业采用者:Claude 平台登陆 AWS 提供了 OpenAI-on-Bedrock 的真正替代方案,具有相同的企业级功能(托管智能体、代码执行、提示缓存)。组织应根据现有 AWS 投资和智能体工作流需求评估两条路线。Google 的 Interactions API 破坏性变更(5月26日)需要立即迁移规划——订阅更新日志并为季度 API 更新预留预算。

对开发者:GPT 实时语音模型三件套为语音原生应用创造了新机会——客服自动化、实时翻译、辅助工具。Anthropic 的使用限制扩展(速率限制翻倍、无高峰时段限制)显著提升了大流量应用的吞吐量。Claude Code 的智能体视图和 /goal 命令简化了智能体工作流调试。

对产品战略家:企业级智能体竞赛正在加剧。OpenAI 工作区智能体覆盖 ChatGPT、Slack 和关联应用;Anthropic 提供配备自改进记忆的托管智能体。战略问题从”哪个模型”转向”哪个智能体编排层”与现有企业工具链集成最深。预计 18 个月内将围绕一两个主导智能体框架进行整合。

相关报道:

历史快照

信息来源

kp1qwqsua0ebpgeb08irng░░░uj5ces689u9i3ck427g8ld33oh3vvc7o9░░░lkhbljb1tpreuiitkwcjio5kz3c70xqan████uem0ihgmf4h39whzqtbbg2gs80r4jcptn░░░u79rm8wua86le6rcq42p2ybxmeq93rc████itez45ho870h5y61u5u09ilflgvzal8zf████r060d2rfwyqwmml624itd24n5v1qy1fo░░░x03km9wqszx61m1cgxalrkvsa0uatdz████99xdyzhzawiox7hfqzqiqff6cxo6v5xc████p95eey33xwir9zbcen25ikk90f4jwmuq░░░nazr84ztv69fqm2zo1aor76affk2olvev████cfke7ghzw7r3rlxskcn6dl6lhk0z36dvp░░░u7u52ehut0c3qhfw1cwu2cl79rwveunq████emjk6n1l0094avhraq6n4u6azlwa0dyd████82aw0h6v3tg5y2oujp6aufp8syy8q287████j2ks503vkuy9wzg75pyq2f031wdohbl████p6bhokwrwue8i256qcz74eipytcjhbyo░░░mlzlk82g0139ov0061geqp9084geep49░░░07sfw4jltu7h98onzj2zafo4nv9njp8jgd░░░u0zug9dyc1q7i45z32j44ymrc2hvcieig░░░smq6hyeq04gvvxwdr6sb3sp8mlac2kc4████kdqxawsjnkrvoh3d72bs6mw99n6a643on░░░ppfgbux3berwis6yzi2rlnntnfnarsdk░░░3g4oyr1u0iedj1sllc9uu8h2492pruwmm████is8ookz7r2qo3xb3mefzziortjvvwrs2████w2itpv628jmam7junfi3afofggjn3ae5████edimdqnl9sdb1hrziljna62vir2lbznc░░░nniennq4r5cxu9uhvpw0j4bcq9ne1oys████5ztcty7gijk4r606izx38ogjw1xfyvlng████aw1zvimydr2bw6cl19v8r5zwghdkk8mo░░░tuvlylhda3a9jmh8sly4jhexol996p2u████0yyk8hr106o68pmv5w44rp5xt7j90hs2j░░░hk5tqmtrgj4emgtlhzkzyvromjz02f0xl░░░7ejl5un15f6dk923yo34cibhsda3kpif████2tr0tqogr3761iwq4hgpl8k5ajx4tpr7████b5sgy4tz9fqsggz7e2xkqyb2aq9inzgs████vf851vizs1q4i47n4k40qspr6yymgd7lj░░░xokr3spbq69lr3j38j06mkhfqpedxa74t████8iaeb6ti4d78uec5obqsvrwu4kqe1fu2████8vy3w8zizdypu6xgvj5p4m18a1jali8████xfntvliidrb3nsfm12hk5469khx4piqw░░░nqxthe3fqlq8md9fyzo22xkhkfiyijugi████r4ia4eqsj3dbzr16spm4ulvnw9pk2cny░░░6s94sw6zpfszdhhfxihdthlcwc9abin9████tclh4hoewxrpnp5ip21jq78mlfm7z3sd░░░xttt1v332hkqx8vzvzlataa4xi8hm9n5i████s5oily647aej56fxbntfxsotmn8b9neij░░░9dazyok2sjuo55b5xu1lsbs3r9rnalwk░░░s73nj4ze50cqwgevkjfi1w9v28pwm4n░░░hzmgsvmey6502lyugfy4jfz7zo3r11yp4o░░░5ez69rftmrg