Google开源记忆代理：用轻量LLM让AI像人脑一样持续记住你

现有记忆方案为什么都差点意思

给AI加记忆这件事，业界已经尝试了好几种路线，但每条路都有明显的瓶颈。

向量数据库 + RAG：把信息存进去，需要时检索出来辅助回答。问题在于太被动——信息之间没有关联，系统不会主动发现新洞见。好比把所有书堆进图书馆，但从来没人整理分类。

对话总结：每次聊完让AI压缩一下重点。代价是细节必然丢失，而且不同对话之间完全割裂。十年后翻日记只看到"今天很开心"，但已经不记得为什么了。

知识图谱：用实体和关系构建一张大网。理论上很美，实践中搭建和维护成本极高，很容易膨胀到无法管理。

这些方案的共同问题是：只做了"存储"，没有做"整合"。而人类大脑的工作方式恰恰相反——我们在睡眠时，大脑会回放白天的经历，把新旧知识连接起来，保留重要的，压缩重复的。真正的记忆不是存储，而是理解、连接和整合。

这个项目的核心思路很直接：让AI像人脑一样，在后台持续处理和整合信息。整个系统由三个Agent协作完成。

支持27种格式的输入——文本、图片、音频、视频、PDF都行。系统自动提取结构化信息：摘要、实体、主题、重要程度。

比如你丢进去一段内容："Anthropic报告显示，62%的Claude使用与代码相关。AI代理是增长最快的类别。"系统会输出：

信息投喂有三种方式：把文件丢进 ./inbox 文件夹（5-10秒自动处理）、通过Streamlit界面上传、或用HTTP API提交。

这是整个系统最有意思的部分。默认每30分钟，系统会运行一次整合任务，把这段时间收集的记忆拿出来，寻找它们之间的关系，生成你可能没注意到的洞察。

举个例子，假设你积累了这四条记忆：

系统会发现：记忆1和3有关联——代理的可靠性问题本质上是记忆架构不行；记忆2和1有关——降低成本才能规模化部署代理；记忆3和4有关——智能收件箱正是重建式记忆的一个应用场景。

最终它会给出一个综合洞察："下一代AI工具的瓶颈，是从静态RAG到动态记忆系统的转变。"

这种跨信息的语义推理和连接能力，是单纯的向量相似度匹配做不到的。

直接用自然语言提问。系统会综合所有记忆和整合洞察给出答案，并且每个观点都标注来源——你知道AI不是在瞎编，每句话都有据可查。

比如问"我应该关注什么"，它会回答：

建议优先：1. 3月15日前上线API【来源：记忆2】；2. 代理可靠性问题【来源：记忆1】，可以用重建式记忆方案【来源：记忆3】来解决；3. 智能收件箱概念【来源：记忆4】验证了市场对持久AI记忆的需求。

这个系统设计为24小时后台运行，所以成本和速度比模型智商更重要。Gemini Flash-Lite延迟低、单次调用成本极低，7×24运行也花不了多少钱，而提取结构、找关系、综合答案这些任务它完全胜任。当然你也可以替换成其他模型，比如GLM、Kimi、MiniMax等，按自己的需求选择。

部署过程很简单。设置好API密钥后启动，系统会自动监控 ./inbox/ 文件夹处理新文件、每30分钟整合一次记忆、在 http://localhost:8888 提供查询服务。如果需要图形界面，项目还附带了一个Streamlit面板。

技术栈：Google ADK + Gemini Flash-Lite + SQLite + Streamlit，许可证为MIT。

大多数AI工具都是一次性的——问完即忘。但对于一人公司或独立开发者来说，真正有价值的信息往往散落在碎片化的对话、文档和笔记里。如果你的AI助手能记住这些碎片，并且主动发现它们之间的联系，它的价值就从"回答问题"升级到了"发现洞见"。

这个项目的实际意义在于：它把一个"会遗忘的问答工具"变成了"会思考的记忆系统"。如果你正在搭建自己的AI工作流，把记忆层从被动检索升级到主动整合，可能是投入产出比最高的一步。值得花半小时clone下来跑一跑，感受一下主动记忆和被动检索之间的差距。