Mac 离线语音 AI 工具 RCLI：端到端延迟 200ms 以内，开源可用

RCLI 是一个完全离线运行的语音 AI 工具，核心能力是让你对着 Mac 说话就能操控系统、查询本地文档。它把语音识别（STT）、大语言模型（LLM）和语音合成（TTS）三个环节全部跑在本机，端到端延迟控制在 200ms 以内。更值得关注的是，它内置了 RAG 能力，支持用语音直接查询本地文件内容。

技术架构与硬件要求

RCLI 的性能表现高度依赖 Apple Silicon 的代际差异。M3 及以上芯片可以利用 MetalRT 硬件加速，获得最佳体验；M1/M2 机型则 fallback 到 llama.cpp 推理，功能可用但体验会有明显差距。从实际使用反馈来看，M1 Max 跑起来已经比较吃力，M3+ 才是这个工具的甜点配置。

这种架构选择背后的逻辑很清晰：把所有计算留在本地，意味着零网络依赖、零 API 费用、零数据泄露风险。对于处理敏感文档的独立开发者或小团队来说，这三个「零」的价值不需要多解释。

对一人公司的实际意义

语音操控 + 本地 RAG 这个组合，解决的是一个很具体的场景问题：当你手头有大量本地文档（技术文档、笔记、代码库说明），需要快速检索和交互时，不必再打开浏览器、登录某个 SaaS、等待 API 响应。对着电脑说句话就行。

从技术趋势看，RCLI 代表了一类正在成型的产品方向——端侧 AI Agent。随着 Apple Silicon 算力持续提升和开源模型不断小型化，越来越多原本需要云端支撑的 AI 能力正在向本地迁移。这对独立开发者意味着：构建 AI 产品的基础设施成本可以趋近于零。

快速上手

项目采用 MIT 协议开源，托管在 GitHub（RunanywhereAI/RCLI），目前已获得 1.2k Star。安装和使用门槛不高，但硬件是硬约束——如果你手上是 M3 Pro/Max 或更新的 Mac，值得花半小时跑起来体验一下端侧语音 AI 的实际表现。如果只有 M1/M2，建议先观望，等后续版本对低算力芯片的优化。

端侧 AI 不是未来，它已经在发生。问题只是你的硬件够不够用。