OpenClaw 2026.5.22 正式发布,2026.5.24 Beta 带来语音实时控制与 Meeting Notes
OpenClaw 在 2026 年 5 月持续快速迭代。2026.5.22 作为最新稳定版已于 5 月 22 日发布,而 2026.5.24-beta.2 则在 5 月 24 日带来了语音通话实时控制、iMessage 审批反应、自适应图像压缩等一系列重磅功能。本文将从性能优化、新功能、开发者工具、质量保障四个维度,深度解读这两个版本的更新内容。
OpenClaw 是什么
OpenClaw 是一个开源的个人 AI 代理(Personal AI Agent)框架,支持通过多种通信渠道(Discord、Telegram、WhatsApp、iMessage、飞书等)与 AI 模型交互。它的核心定位是让用户拥有一个跨平台、可定制、高度可扩展的个人 AI 助手。
Gateway 性能大幅提升
2026.5.22 和 2026.5.24-beta.2 两个版本中,Gateway 性能优化是最显著的变化。开发团队在多个层面进行了深度优化:
- 通道目录缓存 — 复用进程级别的通道目录(channel catalog)读取,避免重复的 bundled-channel 边界检查,减少 JSON 和清单文件的反复读取
- 插件元数据快照 — 在启动、配置、模型、通道、设置和密钥元数据读取器之间复用不可变的插件元数据快照,避免重复的文件统计和注册表重载
- 延迟加载 — 启动时空闲的插件工作、核心 Gateway 方法处理器和嵌入式 ACPX 运行时改为延迟加载,Gateway 的 health 和 ready 信号不再等待未使用的处理器树
- 模型列表性能飞跃 — 在 Gateway 启动时预热 provider 认证状态映射,使
/models和每次模型列表调用的成本从约 20 秒降至约 5 毫秒(提升约 4100 倍) - 启动路径优化 — 缓存插件 SDK 公共表面别名映射,跳过无关的 macOS Linuxbrew PATH 探测,避免文件系统遍历和慢速缺失目录统计
性能优化覆盖了从启动到运行时全链路,模型列表 API 调用性能提升超过 4000 倍,Gateway 启动速度显著加快。
语音通话实时控制(Beta 新功能)
2026.5.24-beta.2 引入了一个令人兴奋的功能:Talk/realtime 允许 WebUI 和 Discord 语音呼叫者在咨询(consult)仍在运行时,实时查询 OpenClaw 的运行状态、取消当前任务、引导后续工作或排队新的任务。
这一功能通过 #84231 实现,由社区贡献者 @Solvely-Colin 完成。同时,Discord 语音增加了实时唤醒名称门控(wake-name gating)和 agent-name 默认值,并提高了 profile bootstrap 上下文预算以支持更长的 USER.md/SOUL.md 文件。
iMessage 审批反应支持
2026.5.24-beta.2 为 iMessage 频道新增了 thumb-approval reactions 功能:
- 👍(Like tapback)将审批解析为 allow-once(允许一次)
- 👎 将审批解析为 deny(拒绝)
- 显式审批者允许列表从
channels.imessage.allowFrom读取 - allow-always 模式保持手动
/approve allow-always文本回退
这一功能镜像了 WhatsApp 的审批行为(来自 #85477),使得 iMessage 用户可以用表情反应快速处理审批请求,无需输入文本命令。
自适应图像压缩
Image 工具新增了自适应模型感知的图像压缩功能,通过 agents.defaults.imageQuality 偏好设置,用户可以选择:
- token-efficient — 令牌高效模式,最小化 token 消耗
- balanced — 平衡模式
- high-detail — 高细节模式,保留更多图像信息
这让用户可以根据使用场景灵活控制图像处理的质量与成本。
Meeting Notes 插件
2026.5.22/2026.5.24-beta.2 引入了一个全新的 Meeting Notes 外部插件:
- 独立于核心 npm 包之外的 source-only 外部插件
- 支持 SDK source-provider 合约
- 自动启动捕获配置
- 手动转录导入
- 只读的
openclaw meeting-notesCLI 访问 - Discord 语音作为第一个实时音频源
Meeting Notes 的启动和关闭生命周期经过精心设计:在 Gateway 启动期间等待 Discord 语音管理器就绪,在通道账户启动后释放再开始自动捕获,在通道关闭前停止插件服务,确保语音捕获状态在启动和清理期间保持可用。
开发者工具与 Plugin SDK 改进
多个面向开发者的改进值得关注:
- Plugin SDK 通用轮询发送器 — 新增通用 channel-message poll sender,使通道插件可以暴露轮询投递功能,无需依赖通道特定的 SDK facade
- Cron 投递路由 — 通过现代目标解析器和出站会话路由 API 路由 cron 投递,弃用基于解析器的目标辅助工具
- 会话工作流辅助 — 新增行级别的会话工作流辅助工具,弃用
loadSessionStore,使插件可以读取和修补会话而无需依赖旧的整个存储结构 - embeddingProviders 能力 — 新增通用的 embeddingProviders 能力合约和注册 API,使嵌入向量可以成为可复用的 provider 表面
- CLI 模型认证 —
openclaw models auth login现在可以将单个返回的 provider 认证配置文件存储在请求的--profile-id下,并记录了命名 Codex OAuth 配置文件设置 - xAI/Grok 集成 — 复用 xAI OAuth 认证配置文件进行 Grok web_search,将活动代理认证贯穿 web search,新增 Grok 模型别名
子代理上下文隔离
2026.5.22 引入了重要的安全改进:默认子代理 bootstrap 上下文被限制为仅 AGENTS.md 和 TOOLS.md,将 persona、identity、user、memory、heartbeat 和 setup 文件默认排除在委派工作进程之外(#85283)。这意味着子代理不再自动继承主代理的敏感配置和记忆文件,提升了多代理场景下的安全性。
控制 UI 改进
Control UI 的聊天会话选择器新增了搜索和加载更多分页功能(#85237),保持初始会话加载有界的同时,使旧对话也可达。
诊断与可观测性
两个版本在诊断能力上也有显著增强:
- 密钥准备时间线 — 发出 sanitized 的
secrets.prepare时间线跨度,使操作员可以区分密钥启动延迟,而不暴露 provider 名称、密钥 ID 或密钥值(#83019) - 技能使用指标 — 导出有界的技能使用指标/跨度和工具来源/所有者标签,用于核心、插件、MCP 和通道工具执行,不暴露原始路径或会话标识符(#80370)
- OpenTelemetry 集成 — 扩展 OpenTelemetry smoke harness 以证明 trace、metric 和 log 导出,并新增一等 Prometheus 和可观测性 smoke 别名
依赖与安全更新
- 刷新 provider、plugin、UI 和 tooling 包
- 将 protobufjs 更新至 8.4.0 以清除当前 npm 安全建议
- 将 Claude ACP 完成补丁推进到
@agentclientprotocol/claude-agent-acp 0.36.1 - 发布 npm 包和 OpenClaw 拥有的 npm 插件时附带生成的 shrinkwrap,支持捆绑插件运行时依赖,并要求审查 lockfile/shrinkwrap 变更
包体积优化
npm tarball 现在排除了文档图片和资源文件,在不影响运行时文档搜索或 CLI 行为的前提下,减少了发布包的体积。
文档大幅完善
两个版本中,文档更新占据了大量变更内容,涵盖了:
- Signal configPath、Telegram 通配符主题默认值、Termux home 回退
- 模型使用可移植性、Codex 迁移先决条件、状态 bootstrap 措辞
- README 入门指南和 Gateway 启动路径、WhatsApp QR/408 恢复
- IPv4-only Gateway BYOH 绑定、Android 配对审批、macOS Accessibility 授权
- GLM 整合到 Z.AI、Upstash Box 安装指南、Gateway 暴露运行手册
- 浏览器 CDP 诊断、Plugin SDK 允许列表导入、Telegram 多代理群组
- Bitwarden SecretRef 设置、中文记忆导航、中文术语表
超过 30 位社区贡献者参与了文档改进。
QA-Lab 质量保障
QA-Lab 在两个版本中持续扩展:
- 新增精心策划的模拟 JSONL 回放 fixtures 和首次漂移报告,用于运行时一致性审计
- 新增 QA bus 工具追踪可见性场景,用于 sanitized 工具调用断言
- 在覆盖率报告中列出命名场景包,使个人代理隐私覆盖率在审计中保持可见
- 列出实时传输通道成员关系,使真实传输检查与种子 qa-channel 场景分开
- 新增个人代理故障恢复场景,检查诚实的部分状态、重试边界和本地恢复工件
- 包含可选的 100 轮运行时一致性浸泡测试,使长运行 Codex/Pi 转录漂移在默认门控之外保持可见
版本对比总结
| 特性领域 | 2026.5.22(稳定版) | 2026.5.24-beta.2(测试版) | | — | — | — | | Gateway 性能 | 缓存、延迟加载、模型列表 4100× 提升 | 新增进程稳定目录缓存、安装记录缓存 | | 语音控制 | — | WebUI/Discord 语音实时控制 | | iMessage | — | 表情审批反应 | | 图像压缩 | — | 自适应模型感知压缩 | | Meeting Notes | 基础插件 | Discord 语音源完善 | | 子代理安全 | 上下文隔离 | — | | Plugin SDK | 通用轮询、会话辅助 | Cron 投递路由重构 |
常见问题
我应该升级到 2026.5.24 Beta 吗?
Beta 版本包含尚未完全测试的新功能。如果你需要 iMessage 审批反应、语音实时控制或自适应图像压缩,可以尝试 Beta 版。对于生产环境,建议继续使用 2026.5.22 稳定版。
2026.5.22 的性能提升有多大?
最显著的提升是模型列表 API 调用从约 20 秒降至约 5 毫秒,提升约 4100 倍。Gateway 启动速度和运行时响应速度也有明显改善。
Meeting Notes 插件如何使用?
Meeting Notes 是一个独立的外部插件,不在核心 npm 包中。它支持自动启动捕获、手动转录导入,并以 Discord 语音作为第一个实时音频源。详细配置请参考 官方文档。
子代理上下文隔离会影响我的配置吗?
默认情况下,子代理现在只能访问 AGENTS.md 和 TOOLS.md,无法读取 persona、identity、user、memory 等文件。如果你的子代理需要这些文件,需要显式配置访问权限。这一变化提升了多代理场景的安全性。
如何查看完整的变更日志?
完整的变更日志可以在 OpenClaw GitHub Releases 页面查看,包含每个版本的所有 Changes 和 Fixes。
结论
OpenClaw 在 2026 年 5 月的这两个版本中展现了强大的开发活力。2026.5.22 稳定版以 Gateway 性能大幅优化和子代理安全隔离为核心,而 2026.5.24-beta.2 则带来了语音实时控制、iMessage 审批反应、自适应图像压缩等令人期待的新功能。无论是追求稳定性的生产环境用户,还是想体验前沿功能的早期采用者,都能在这两个版本中找到价值。
OpenClaw 的快速发展表明,个人 AI 代理框架正在从概念验证走向成熟的生产级工具。
© 版权信息:
作者:Mike
发布平台:PANGSHARE | 文章链接:https://www.pangshare.com/openclaw-2026-5-22-release-2026-5-24-beta-voice-control/
本文内容仅限非商业性使用,如需商用(包括但不限于广告投放、付费专栏、企业宣传等),请邮件联系原作者获得独家授权,违者将依法追究法律责任。
微信扫一扫