跟通用聊天模型的本质区别

MiroThinker 跟 GPT、Claude 这类通用模型走的是完全不同的路线。它不做日常对话,只做一件事:深度研究。

核心机制是多轮自主搜索与交叉验证。你给它一个问题,它会先去全网搜资料,根据搜到的内容判断还需要找什么,再搜下一轮,不同来源的信息互相验证,发现矛盾了继续查。一次研究任务里,它最多能连续调用 300 次工具——搜索引擎、网页爬取、代码执行、API 调用、数据分析,全程自动,不需要人一步步指挥。

这个 Agent 工作流的设计思路值得关注:不是单次推理,而是把"搜索-阅读-提取-验证-再搜索"串成一个闭环,让模型自己决定什么时候信息足够充分可以停下来。

三个版本,各有定位

本次一共发布三个版本:

  • MiroThinker-1.7:开源(Apache 2.0),2350 亿参数,BrowseComp 研究能力评分 74.0。开发者可以直接下载部署,适合有算力资源的团队做二次开发。
  • MiroThinker-1.7-mini:同样开源,300 亿参数,中文研究能力在同级别开源模型中排名第一。算力有限优先选这个,部署门槛低得多。
  • MiroThinker-H1:闭源,研究能力评分 88.2,所有 AI 模型(包括闭源)中排名第一。它在 1.7 的基础上加了一套验证机制——每做一步自查结果是否合理,做完整个任务还会回头审查所有证据链,确保最终结论有最充分的支撑。

实际能力拆解

从 Agent 能力的角度看,MiroThinker 集成了以下工具链:

全网搜索与信息整合——通过 Google 搜索找到相关网页,用 Jina 爬虫抓取页面内容,再用小模型提取关键信息。中英文都支持,且会根据搜索结果动态调整下一步搜索策略,不是搜一次就完。

代码执行与运算——内置 E2B 代码执行沙盒,可以直接写 Python 跑数据处理、统计分析、可视化。遇到需要计算的场景,模型自己写代码解决,不需要人工介入。

多格式文档解析——支持上传 PDF、Word、PPT、Excel、图片等文件,基于文档内容做分析。比如丢一份财报进去,它能提炼关键数据并整合进研究结论。

结构化报告生成——调研完成后自动输出一份有章节、有引用、有结论的深度研究报告,支持在线预览和分享。

金融分析与事件预测——这是 MiroMind 的主打方向。模型在金融搜索基准 FinSearchComp 上拿了最高分,在字节跳动 FutureX 预测榜单上连续两周排名第一。

预测案例:用数据说话

三个事前公开、事后可验证的案例:

  • 黄金价格:2 月 10 日预测 2 月 25 日金价 $5,185/盎司,实际 $5,181,误差 $4,偏差 0.08%,提前 15 天。
  • 超级碗冠军:1 月 6 日判断西雅图海鹰队最可能夺冠,2 月 8 日海鹰队 29-13 击败爱国者队,提前 1 个月命中。
  • 格莱美最大赢家:提前 3 周预测成功。

预测能力本身不是重点,重点是背后的方法论——通过大规模自主信息采集和交叉验证来做概率判断,这个 Agent 架构思路对搭建任何需要"先调研再决策"的工作流都有参考价值。

对独立开发者的实践意义

MiroThinker-1.7-mini 开源且参数量只有 300 亿,这意味着在消费级硬件上部署是可行的。Apache 2.0 协议也意味着可以商用。如果你正在做需要深度信息整合的产品——竞品监控、行业研究助手、自动化尽调工具——这个模型的 Agent 架构和工具调用链路值得深入研究。不一定要直接用它的模型,但它把"搜索-验证-再搜索"做成闭环自动执行的设计,是当前 AI Agent 落地最务实的范式之一。