什么是查询扩展,为什么它重要
简单来说,查询扩展就是帮用户"把话说全"。你在搜索框里输入"苹果怎么吃",系统自动帮你扩展成"苹果的食用方法、苹果料理食谱、生吃还是熟吃"——让搜索引擎能找到更多相关结果。这个技术在 RAG(检索增强生成)系统中尤其关键,因为大模型能不能给出好答案,很大程度上取决于它检索到的上下文质量。
换句话说,查询扩展是 RAG 管线里最前端的一环,做好了,后面的检索和生成都会受益。
Tobi 遇到了什么问题
他在 GitHub Issue #247 中列出了三个具体的技术难题:
- 基准测试(Benchmarks):怎么客观衡量查询扩展模型的效果好不好,需要建立一套可靠的评估体系
- 数据平衡(Data Balance):训练数据的分布不均,某些类型的查询样本过多或过少,影响模型的泛化能力
- 过拟合(Overfitting):模型在训练集上表现很好,换到真实场景就拉胯——这是微调中最常见的坑
这三个问题其实是所有做模型微调的人都会遇到的经典挑战。Tobi 作为一个技术型 CEO,能做到这一步已经相当深入,但他很清醒地意识到自己在机器学习工程方面需要专业支援。
对独立开发者的启发
这件事有几个值得注意的点。
第一,qmd 本身是一个适合独立开发者参与的开源项目。Tobi 明确表示"这是一个有趣的项目",并且主动邀请社区贡献。对于想积累 ML 实战经验、或者想在简历上添一笔知名开源项目贡献的开发者来说,这是个不错的机会。
第二,查询扩展 + 微调这条技术路线,正好处在当前 AI 应用开发的热区。如果你在搭建任何涉及搜索、问答、知识库的产品,查询扩展几乎是绕不开的环节。理解它的原理和微调方法,对构建高质量的 AI 产品非常有帮助。
第三,连 Shopify 这种体量公司的创始人都在亲自写代码、亲自调模型,并且不介意公开承认自己能力的边界。这种态度本身就说明:在 AI 时代,动手能力比头衔重要,知道自己不知道什么比什么都懂更有价值。
如果你正在做 RAG 相关的产品,不妨去看看 qmd 的代码库,尤其是查询扩展这部分的实现。就算不提交 PR,理解别人怎么做微调、怎么踩坑,也能帮你在自己的项目里少走弯路。