核心结果

  • 13000+ 程序化页面上线
  • 周自然点击:971 → 5500(+466%,5.7倍增长)
  • 全量生成耗时:不到3小时
  • 目前仅约50%页面被Google索引,增长远未见顶
  • Google「有用内容」更新未产生任何负面影响

六大内容品类:远不止「对比页」

多数人做程序化SEO只想到排行榜、地区页、对比页。这套系统覆盖了6个品类,共13000+页面:

  • 资源页(Resource Pages):占比最大。涵盖创意清单、检查表、日历、指南、模板等34种内容类型,覆盖309个细分领域,仅此一类就产出7600+页面
  • 免费工具页(Free Tools):不是纯文本页,而是真正可用的在线工具,每个工具都包含领域特定的示例和上下文,全部程序化生成
  • 博客创意页
  • 替代方案页(Alternatives)
  • 顶级列表页(Top Lists)
  • 对比页(Comparisons):仅占1%——看似最显而易见的品类反而是最小的机会

关键洞察:「显而易见的打法」往往竞争最激烈、空间最小。资源页和工具页才是真正的流量引擎。

系统架构:JSON Schema + 渲染器,内容与展示彻底分离

这套系统的核心原则只有一条:永远不让AI自由写作,只让AI填充严格的JSON Schema。

整体流程:

  1. 领域上下文(Niche Context):309个细分领域,每个都预定义了受众画像、痛点、变现策略
  2. Gemini Flash 生成:AI按照严格的JSON Schema填充领域感知的结构化内容
  3. JSON 校验:13000+ 类型安全的内容文件
  4. 20+ 专用渲染器:每种内容类型对应一个专门的React组件负责展示

AI只负责生成数据,前端组件负责呈现。两个层级永不混合。

为什么必须用Schema而非自由生成:

自由生成的问题 Schema解决方案
结构不一致 每个页面严格遵循相同结构
输出质量不可预测 质量稳定可控
无法大规模校验 类型安全,自动校验

Schema示例的关键约束:

  • 每个章节必须包含15-20个条目
  • 每个条目必须包含难度等级和潜力评分
  • 没有这些约束,AI可能在一个页面生成8条、另一个页面生成40条

内容与设计分离的实际好处:内容是JSON文件,设计是React组件。团队已经多次更新页面布局,没有重新生成过任何一份内容文件。这意味着可以随时改版而不碰内容层。

20+专用组件的实例:

  • 博客创意页:支持按类别和难度筛选
  • SEO检查表页:交互式勾选框
  • 工具对比页:结构化表格

最关键的环节:领域分类体系(Niche Taxonomy)

这是整个系统中投入时间最多、也最容易被低估的部分。

为309个细分领域构建了结构化上下文,每个领域包含:

  • 目标受众
  • 核心痛点
  • 变现策略
  • 高效内容格式
  • 关键子主题

这些上下文会注入到生成过程中,让同一个Schema在不同领域产出完全不同的内容实质。

具体案例——同样是「SEO检查表」:

  • 健康博主的检查表侧重:E-E-A-T权威信号、YMYL合规性
  • 旅行博主的检查表侧重:季节性关键词规划、目的地竞争分析、Google酒店搜索结果优化

同一个Schema,完全不同的实质内容。这就是领域分类体系的价值——它把程序化SEO从「换个名字的模板灌水」变成了「大规模生成真正有用的内容」。

建议时间分配:约60%的时间花在领域分类体系上。

大规模生成的工程细节

生成系统本身出人意料地简单:

  • 模型选择:Gemini Flash。在这个规模下,最重要的因素不是模型的峰值能力,而是成本与质量的比值。Gemini Flash支持原生结构化JSON输出,模型直接返回合法JSON,而非把结果包裹在文本或Markdown中,从根本上消除了解析问题
  • 并发策略:100个并发Worker。多数AI API能处理的并行请求量远超人们预期。在这个并发水平下,13000+页面不到3小时全部生成完毕
  • 主要瓶颈:不是模型速度,而是API速率限制
  • 标题不用AI生成,而是用确定性模板,例如:100 Blog Post Ideas for Travel Bloggers in 2026。模板化标题的优势:一致、可预测、搜索优化。实践证明,精心设计的模板比AI生成的标题效果更好

上线后的真实表现

页面分批上线,持续监控索引和流量:

四个核心发现:

  1. 资源页贡献了最多流量。博客创意、SEO检查表、内容指南是流量主力,这些页面瞄准的是信息类长尾查询——搜索量大、竞争低
  2. 免费工具页表现极其突出。工具页的用户参与度显著高于纯内容页,用户使用工具后会继续浏览网站其他页面——不同的搜索意图,漏斗的不同位置
  3. 索引仍是最大瓶颈。仅约50%的页面被索引,系统远未释放全部潜力
  4. Google未发出任何负面信号。页面正常索引、凭实力排名、排名稳定

为什么Google没有惩罚这些AI生成页面

面对「13000页AI内容不会被打击吗」这个问题,关键区别在于:

1. 页面不只是文本

传统程序化SEO的页面是薄内容——模板页、变量替换、换几个词的相同内容。这套系统的页面是结构化的、功能性的:

  • 「100个金融博客创意」页面包含:结构化分区、按类别和难度筛选、一键复制功能
  • SEO检查表页有交互式勾选框
  • 工具页包含真正可用的工具

这些页面的行为更像产品页,而非博客文章。

2. 展示层的投入至关重要

每种内容类型都有专门构建的React组件,提供:

  • 筛选和搜索功能
  • 结构化表格
  • 完整的UX设计
  • Schema标记(结构化数据)
  • 面包屑导航
  • FAQ Schema

这不是把Markdown塞进通用模板,而是为特定用途设计的完整页面。

3. 检验标准

对每个页面问两个问题:

  • 「如果搜索引擎不存在,这个页面还有用吗?」
  • 「如果有人收藏了这个页面过几天回来看,它还能提供价值吗?」

大多数页面的答案是肯定的。传统程序化SEO通常无法通过这个检验。

4. 系统能通过检验的根本原因

  • Schema确保内容完整性
  • 领域上下文创造相关性
  • 专用组件创造可用的用户体验

结果:不是大规模生成的文本,而是大规模生成的真正有用的页面

复盘:五个改进方向

  1. 从分类体系开始:领域上下文是地基,应该把约60%的时间花在这里
  2. 多建内容类型:对比页看似显而易见,但最终占比极小;资源页和工具页才是流量引擎
  3. 分批上线:渐进式发布可以监控索引情况,在大规模铺开前做调整
  4. 使用原生JSON输出:结构化响应消除解析问题,让大规模生成变得可靠
  5. 投入前端:专用组件是让程序化页面真正有用的关键

真正的飞轮:数据反馈闭环

13000+页面不是终点,真正的优势在于反馈循环。每周都能学到:

  • 哪些领域表现最好
  • 哪些内容类型吸引流量
  • 长尾关键词的真实分布在哪里

这些数据反哺回领域分类体系,进而优化下一轮生成。系统在规模化的同时自我进化。

核心理念:AI内容应该被「构建」,而非被「写作」

AI在约束中运作时表现最好——不是自由写作,而是填充人类设计的结构化系统。整套方法论可以概括为一句话:AI content should be built, not written。


对一人公司的启示:你不需要一个内容团队,你需要一套系统——花时间设计好Schema和领域分类体系,让AI在严格约束下生成结构化数据,用组件化前端呈现,这套架构一个人就能驾驭万级页面的规模。