OpenClaw 是什么,为什么值得关注
OpenClaw 是一款开源 AI 助手框架,你可以把它理解为"AI 聊天机器人的底座"——它帮你处理多平台消息接入、对话管理这些脏活累活,你只需要专注于让助手变得更聪明。
关键在于,OpenClaw 的 TTS 配置块天然兼容 OpenAI 格式的接口。这意味着什么?任何提供 OpenAI 兼容 TTS 端点的服务,都可以即插即用。ListenHub 的 /v1/tts 恰好就是这样一个端点。
接入配置:五分钟搞定
在你的 openclaw.json 中,找到 messages 字段,加入以下配置:
{
"messages": {
"tts": {
"auto": "always",
"provider": "openai",
"openai": {
"baseUrl": "https://api.marswave.ai/openapi/v1",
"apiKey": "$LISTENHUB_API_KEY",
"model": "flowtts",
"voice": "CN-Man-Beijing-V2"
}
}
}
}
几个需要替换的地方:
$LISTENHUB_API_KEY:换成你在 ListenHub 账户设置中创建的 API Keyvoice:换成你想要的音色 ID(后面会讲怎么选)model保持flowtts不变,这是 ListenHub 的 TTS 模型名称
前置条件也很简单:OpenClaw v2026.3.7 及以上版本,一个 ListenHub API Key,以及账户里有足够的积分。
先验证,再接入
在动 OpenClaw 配置之前,建议先用 curl 确认 API Key 是通的:
curl -X POST https://api.marswave.ai/openapi/v1/audio/speech \
-H "Authorization: Bearer $LISTENHUB_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"input": "今天天气真不错,适合出去散步。",
"voice": "chat-girl-105-cn",
"response_format": "mp3",
"model": "flowtts"
}' \
--output output.mp3
如果当前目录出现了一个能正常播放的 output.mp3,说明一切就绪。这个习惯很重要——把问题隔离在最小范围内排查,省得接入 OpenClaw 之后出了问题不知道该查哪边。
四种 auto 模式:按场景选择
auto 字段决定了什么时候触发语音转换,这是整个配置中最值得琢磨的部分:
| 值 | 行为 |
|---|---|
"always" |
所有回复都转成语音 |
"inbound" |
对方发语音时,才以语音回复 |
"tagged" |
回复内容包含 [[tts]] 指令时才转换 |
"off" |
关闭自动语音转换 |
哪种最实用?看你的场景。如果你的助手跑在 Telegram 上,"inbound" 模式堪称完美——对方发语音你回语音,对方打字你回文字,交互体验非常自然。如果你想让助手始终以语音形态存在(比如做一个语音陪伴类产品),那就选 "always"。"tagged" 模式则给了你最精细的控制权,适合在 prompt 层面决定哪些回复需要语音输出。
音色选择
ListenHub 提供多语言自然音色,几个常用的:
| 音色 ID | 语言 | 性别 |
|---|---|---|
chat-girl-105-cn |
普通话 | 女声 |
CN-Man-Beijing-V2 |
普通话 | 男声 |
EN-Man-General-01 |
英语 | 男声 |
EN-Woman-General-01 |
英语 | 女声 |
完整列表可以通过音色列表 API 查询。选音色这件事别小看——如果你的助手面向特定用户群体,音色的匹配度直接影响用户的信任感和使用意愿。
平台支持情况
不是所有平台都支持原生语音消息,接入前看清楚:
| 平台 | 支持情况 |
|---|---|
| Telegram | ✅ 圆形语音气泡 |
| Discord | ✅ 语音消息 |
| ✅ 语音消息 | |
| 飞书 / Lark | ❌ 暂不支持 |
| Slack | ❌ 仅支持音频文件附件 |
Telegram 的支持最完整,如果你正在考虑在哪个平台部署语音助手,它是首选。
另外值得一提的
ListenHub 同时还上线了内容提取 API,支持从微信文章、YouTube 视频、X 平台帖子以及任意标准网页中提取摘要和全文。如果你正在搭建一个能"上网冲浪"的 AI 助手,这个能力和 TTS 搭配起来,想象空间就打开了——助手帮你读完一篇长文,然后用语音给你讲重点。
语音交互正在从"锦上添花"变成 AI 助手的标配能力。当你的竞争对手还在只做文字聊天的时候,一个会说话的助手能带来多大的体验差异?不妨先花五分钟接上试试,答案可能比你想象的更明显。