OpenClaw 是什么,为什么值得关注

OpenClaw 是一款开源 AI 助手框架,你可以把它理解为"AI 聊天机器人的底座"——它帮你处理多平台消息接入、对话管理这些脏活累活,你只需要专注于让助手变得更聪明。

关键在于,OpenClaw 的 TTS 配置块天然兼容 OpenAI 格式的接口。这意味着什么?任何提供 OpenAI 兼容 TTS 端点的服务,都可以即插即用。ListenHub 的 /v1/tts 恰好就是这样一个端点。

接入配置:五分钟搞定

在你的 openclaw.json 中,找到 messages 字段,加入以下配置:

{
  "messages": {
    "tts": {
      "auto": "always",
      "provider": "openai",
      "openai": {
        "baseUrl": "https://api.marswave.ai/openapi/v1",
        "apiKey": "$LISTENHUB_API_KEY",
        "model": "flowtts",
        "voice": "CN-Man-Beijing-V2"
      }
    }
  }
}

几个需要替换的地方:

  • $LISTENHUB_API_KEY:换成你在 ListenHub 账户设置中创建的 API Key
  • voice:换成你想要的音色 ID(后面会讲怎么选)
  • model 保持 flowtts 不变,这是 ListenHub 的 TTS 模型名称

前置条件也很简单:OpenClaw v2026.3.7 及以上版本,一个 ListenHub API Key,以及账户里有足够的积分。

先验证,再接入

在动 OpenClaw 配置之前,建议先用 curl 确认 API Key 是通的:

curl -X POST https://api.marswave.ai/openapi/v1/audio/speech \
    -H "Authorization: Bearer $LISTENHUB_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
      "input": "今天天气真不错,适合出去散步。",
      "voice": "chat-girl-105-cn",
      "response_format": "mp3",
      "model": "flowtts"
    }' \
    --output output.mp3

如果当前目录出现了一个能正常播放的 output.mp3,说明一切就绪。这个习惯很重要——把问题隔离在最小范围内排查,省得接入 OpenClaw 之后出了问题不知道该查哪边。

四种 auto 模式:按场景选择

auto 字段决定了什么时候触发语音转换,这是整个配置中最值得琢磨的部分:

行为
"always" 所有回复都转成语音
"inbound" 对方发语音时,才以语音回复
"tagged" 回复内容包含 [[tts]] 指令时才转换
"off" 关闭自动语音转换

哪种最实用?看你的场景。如果你的助手跑在 Telegram 上,"inbound" 模式堪称完美——对方发语音你回语音,对方打字你回文字,交互体验非常自然。如果你想让助手始终以语音形态存在(比如做一个语音陪伴类产品),那就选 "always""tagged" 模式则给了你最精细的控制权,适合在 prompt 层面决定哪些回复需要语音输出。

音色选择

ListenHub 提供多语言自然音色,几个常用的:

音色 ID 语言 性别
chat-girl-105-cn 普通话 女声
CN-Man-Beijing-V2 普通话 男声
EN-Man-General-01 英语 男声
EN-Woman-General-01 英语 女声

完整列表可以通过音色列表 API 查询。选音色这件事别小看——如果你的助手面向特定用户群体,音色的匹配度直接影响用户的信任感和使用意愿。

平台支持情况

不是所有平台都支持原生语音消息,接入前看清楚:

平台 支持情况
Telegram ✅ 圆形语音气泡
Discord ✅ 语音消息
WhatsApp ✅ 语音消息
飞书 / Lark ❌ 暂不支持
Slack ❌ 仅支持音频文件附件

Telegram 的支持最完整,如果你正在考虑在哪个平台部署语音助手,它是首选。

另外值得一提的

ListenHub 同时还上线了内容提取 API,支持从微信文章、YouTube 视频、X 平台帖子以及任意标准网页中提取摘要和全文。如果你正在搭建一个能"上网冲浪"的 AI 助手,这个能力和 TTS 搭配起来,想象空间就打开了——助手帮你读完一篇长文,然后用语音给你讲重点。

语音交互正在从"锦上添花"变成 AI 助手的标配能力。当你的竞争对手还在只做文字聊天的时候,一个会说话的助手能带来多大的体验差异?不妨先花五分钟接上试试,答案可能比你想象的更明显。