让Obsidian笔记库自己长出知识网：AI驱动的笔记自维护方案

我猜你肯定有过这种瞬间：明明记得自己存过一篇好文章，真要引用的时候翻遍整个笔记库就是找不到，最后还是乖乖打开了 Google。公众号文章、知乎收藏、网页剪藏、PDF、视频转写、跟 AI 的对话截图……收藏夹越来越满，三个月后想不起标题，也搜不出关键词。

更尴尬的是，你也看过别人晒的 Obsidian 知识图谱，节点密密麻麻、连线纵横交错，特别炫。但你自己打开 Obsidian，里面还是一堆散落的文件，图谱上稀稀拉拉几根线，根本串不起来。

问题不在于你记得少，而在于——你记完之后，再也没人管过这些东西。

传统笔记的卡点：只进不出

传统笔记最大的毛病就是「只进不出」。

文件夹要求你提前判断分类，标签要求你持续手动打标。刚开始还行，资料一多，维护成本就开始爆炸。你存的不是知识库，是一个越来越大的仓库——东西都在，但没人整理，没人索引，没人告诉你哪些互相关联、哪些已经过时。

AI 时代这事只会更糟，信息只会越来越多。旧的笔记系统没法满足「持续整理、长期调用、跨资料提问」这些需求。这时候你真正需要的，是一个能帮你持续维护这套东西的人——或者，一个 AI。

为什么 AI 知识库现在才真正成立

过去笔记软件主要解决一件事：把东西存下来。Notion、Obsidian、Bear、飞书文档，各有所长，但本质都是容器。

现在真正难的不是存，而是资料太多、来源太散、更新太快，回头找不到，找到了还要重新理解一遍。

AI 知识库跟传统笔记的核心区别，不在「存」，在「维护」。说实话这事我用了之后才知道好在哪——你用 AI 不是为了多一个输入框，而是让它把资料重新组织成可提问、可追溯、可持续更新的结构。你问一个问题，AI 从你已经存过的笔记里找素材、找依据、找相关概念，而不是从互联网重新搜。

把「我存过什么」变成「我现在能从已有笔记里找到什么、组合出什么」——这才是 AI 知识库真正值钱的地方。

个人使用别一上来追求企业级系统，先把自己的资料变成一个能被 AI 读懂和维护的 wiki，就已经跑通了最关键的一步。下面这套方法默认你用 Codex 或 Claude Code 操作文件，用 Obsidian 阅读和检索，没装的话先去装好。

AI 在知识库里到底干什么

AI 维护知识库，核心就五件事。

持续编译。新资料进来，AI 读完之后把关键信息整合进已有的概念页、索引和日志。它持续往已有的结构里加东西，而不是每次从头翻一遍。

跨资料连接，挖出潜在线索。三个月前存了一篇讲提示词的文章，上周记了一段跟 AI 协作的复盘——两个文件在文件夹里隔得很远，但 AI 能看出它们讲的是同一件事，帮你连起来。有些笔记单独看只是片段，放一起才会出现共同主题、相互印证或者冲突的判断，AI 能把这些散落的点串成线。

问答回流。你问了一个复杂问题，AI 翻遍资料库拼出一个答案。这个答案如果不存下来，下次还得重新问。AI 可以帮你把答案落成文件，下次直接调用。

巩固知识网。每篇新资料进来，AI 把它挂回旧概念、旧项目和旧问题上。知识库不会越用越散，反而越用越清楚。

健康检查。定期扫描整个库：哪些页面缺来源？哪些概念互相矛盾？哪些页面是孤岛没人链向它？哪些判断可能过期了？这不是高阶玩法，是让知识库结构保持健康的基本维护。

五件事加起来一句话：你的知识库从死的变成活的。

LLM Wiki：让 AI 像维护代码仓库一样维护笔记

前面这套方法有个名字叫 LLM Wiki，不是某个产品，也不是什么插件，是 Karpathy 提出的一种模式。

用人话讲：让 AI 像维护代码仓库一样维护你的知识库。

具体长这样，三层结构对应三个角色：

raw/ 像仓库。不负责漂亮，只负责保留原始证据。文章、论文、网页剪藏、AI 对话记录，扔进去就别动它。
wiki/ 像书架。AI 把原始资料整理成能反复阅读、链接和更新的页面。有目录（index.md）、有日志（log.md）、有概念页（concepts/）、有实体页（entities/）、有综合页（syntheses/）、有来源摘要（sources/）。
outputs/ 像工作台。每次提问、研究、健康检查得到的结果都落在这里。问答归 qa/，检查报告归 health/。

还有一个关键文件：AGENTS.md（Codex 用）或 CLAUDE.md（Claude Code 用），这是给 AI 的说明书。告诉它以后维护这个库要遵守什么规矩：raw/ 不能改、每个判断要指向来源、每次整理完要更新 index 和 log、不确定的信息要标「待核验」。

Obsidian 在这里不是 AI 本体，而是知识库的 IDE。你用它来看 raw、浏览 wiki、检索、查看链接关系。AI 负责维护文件，你负责阅读、判断方向、投喂新资料。

AI 把资料持续整理进一套可读、可链接、可追溯的 wiki，这个动作就叫「编译」。

跟 RAG 比，差在哪

传统笔记是你自己维护，AI 偶尔来读一下。

RAG 提到的人比较多。简单来说：你提问时，系统先去你的资料堆里搜相关内容，把搜到的片段和你的问题一起塞给 AI，AI 再生成答案。它像一个给 AI 接的搜索引擎。

RAG 有用，但它更偏技术方案，通常会牵扯检索算法、文本切块、向量数据库、权限控制这些东西。LLM Wiki 更适合个人起步：文件就是 Markdown，人能读，AI 能改，能备份，能追溯。

对个人知识库来说，第一步就上 RAG，相当于还没学会走路先研究跑步力学。RAG 不是没用，只是顺序问题——先把知识库跑通，资料规模上去了、搜索确实不够用了，再考虑更强的检索方案。

第一步：让 AI 把架子搭起来

强烈建议不要直接动你的主笔记库。单独建一个文件夹，在里面跑通整个流程，确认顺手了再迁移。这个坑我建议你信我一次。

新建仓库之后，把搭架子的提示词丢给 Codex 或 Claude Code，让它生成完整的目录结构、index.md、log.md 和 AGENTS.md/CLAUDE.md 维护规则。跑完之后用 Obsidian 把这个文件夹作为新仓库打开，你能看到完整结构。

第二步：第一次放资料进去

架子有了，现在放资料。

先收集 5 到 10 篇同主题的内容——网页剪藏、公众号文章、PDF、视频转写、AI 对话记录都行，扔进 raw/ 对应目录。然后把编译提示词丢给 AI。

第一次编译不要追求完美。AI 生成的摘要可能漏了重点，概念归类可能不对，链接可能不全。没关系，先跑通，后面逐步修。

编译完之后回到 Obsidian，花 10 分钟翻一遍：来源摘要页有没有保留原文链接？概念页的逻辑通不通？index 有没有把所有新资料列进去？你不需要自己动手改，把问题记下来，下一轮让 AI 修。

第三步：让知识库像结网一样长大

第一次跑通之后，骨架就有了。日常只需要做四件事：

投喂。看到好文章、做完项目复盘、跟 AI 聊出有价值的结论，扔进 raw/，然后让 AI 编译。
提问。遇到问题先问你的知识库，而不是从零开始搜互联网。复杂问题的答案让 AI 存到 outputs/qa/。
回流。阶段总结、对比表、研究结论，这些都不应该只留在聊天窗口里。落成文件放回知识库。有价值的 AI 对话本身也是 raw 输入。
检查。每周跑一次健康检查，让 AI 扫一遍：哪些孤岛页面、哪些矛盾判断、哪些过期信息。

我自己踩过的坑

这几个雷你绕开就行：

别一上来搭 RAG。先把 LLM Wiki 跑通，资料规模上去了再说。
别只存正文不存来源。没有来源链接，后面想追溯原始信息就无从下手，AI 编译出来的内容也没法核验真实性。
别把 raw 和 wiki 混在一起。raw 是原始资料区，wiki 是整理区。混在一起，AI 生成的 wiki 内容会污染你的原始资料。
别让 AI 覆盖原始资料。raw 里的东西只新增、不删除、不覆盖，这条要写进 AGENTS.md。
别把问答留在聊天记录里。有价值的答案、对比、结论，统统存到 outputs/。
别信 AI 编译一次就完事。编译一定会漏东西，所以要持续维护，健康检查也别省。

最后

有了这套系统，你就不再是一个人在维护一座越来越大的仓库。每次新增资料，拆解、归类、挂链接都自动完成。每次提问，答案从你已经积累的资料里长出来，而不是从聊天窗口的空白处重新开始。

我自己用了一段时间最大的变化是：想写点东西、做个判断的时候，第一反应不再是打开 Google，而是在 Obsidian 里让 AI 从我自己的素材里找答案。你的知识网每多一个节点，下一次提问的回答质量就高一点——这是复利。

今天就花一小时新建一个测试仓库，丢 5 篇文章进去跑一次编译，你会很快明白这套东西的价值在哪。