Shopify创始人在GitHub上公开求助：查询扩展模型微调遇到瓶颈，寻ML工程师支援

什么是查询扩展，为什么它重要

简单来说，查询扩展就是帮用户"把话说全"。你在搜索框里输入"苹果怎么吃"，系统自动帮你扩展成"苹果的食用方法、苹果料理食谱、生吃还是熟吃"——让搜索引擎能找到更多相关结果。这个技术在 RAG（检索增强生成）系统中尤其关键，因为大模型能不能给出好答案，很大程度上取决于它检索到的上下文质量。

换句话说，查询扩展是 RAG 管线里最前端的一环，做好了，后面的检索和生成都会受益。

他在 GitHub Issue #247 中列出了三个具体的技术难题：

这三个问题其实是所有做模型微调的人都会遇到的经典挑战。Tobi 作为一个技术型 CEO，能做到这一步已经相当深入，但他很清醒地意识到自己在机器学习工程方面需要专业支援。

这件事有几个值得注意的点。

第一，qmd 本身是一个适合独立开发者参与的开源项目。Tobi 明确表示"这是一个有趣的项目"，并且主动邀请社区贡献。对于想积累 ML 实战经验、或者想在简历上添一笔知名开源项目贡献的开发者来说，这是个不错的机会。

第二，查询扩展 + 微调这条技术路线，正好处在当前 AI 应用开发的热区。如果你在搭建任何涉及搜索、问答、知识库的产品，查询扩展几乎是绕不开的环节。理解它的原理和微调方法，对构建高质量的 AI 产品非常有帮助。

第三，连 Shopify 这种体量公司的创始人都在亲自写代码、亲自调模型，并且不介意公开承认自己能力的边界。这种态度本身就说明：在 AI 时代，动手能力比头衔重要，知道自己不知道什么比什么都懂更有价值。

如果你正在做 RAG 相关的产品，不妨去看看 qmd 的代码库，尤其是查询扩展这部分的实现。就算不提交 PR，理解别人怎么做微调、怎么踩坑，也能帮你在自己的项目里少走弯路。