它跟 GPT、Claude 这类通用聊天模型完全不是一个路子。你给它一个复杂问题,它会自己去全网搜资料,根据搜到的内容再决定下一步搜什么,把不同来源的信息交叉验证,发现矛盾了再查,反复几十甚至上百轮,最后给你一份有理有据的研究报告。整个过程全自动,不需要你一步步指挥。
一次研究任务里,它最多能连续调用 300 次工具:执行代码、搜索引擎、API 调用、网页爬取、数据分析,一路搜、一路验证、一路修正。这不是"能聊天的 AI",这是"能干活的 AI Agent"。
三个版本怎么选
这次一共发布了三个版本,定位很清晰:
- MiroThinker-1.7:免费开源(Apache 2.0),2350 亿参数,研究能力评分 74.0(BrowseComp 榜单)。开发者可以直接下载部署,想自己搭研究型 Agent 的可以从这个入手。
- MiroThinker-1.7-mini:轻量版,300 亿参数,同样免费开源。中文研究能力在所有同级别开源模型里排第一。算力有限的话优先考虑这个,对个人开发者更友好。
- MiroThinker-H1:最强版本,闭源。研究能力评分 88.2,在所有 AI 模型里排名第一,开源闭源都算上。它在 1.7 基础上加了一套验证机制——模型每做一步都会自查对不对,做完整个任务还会回头审查所有证据,确保最终答案是证据最充分的那个。
它到底能干什么
说几个我觉得对一人公司特别有价值的能力:
全网搜索和信息整合。 通过 Google 搜索找到相关网页,用 Jina 爬虫抓取页面内容,再用小模型提取关键信息。不是搜一次就完,而是根据搜到的内容决定下一步搜什么,反复迭代。一个复杂任务可能要搜几十上百轮,模型始终在判断"我还需要找什么信息"。中英文都能搜,中文研究能力在开源模型里目前最强。
写代码和运算。 自带 E2B 代码执行沙盒,可以直接写 Python 跑运算,处理数据、做统计分析、画图。遇到需要数据处理的任务不用你手动介入,这点对做产品调研、竞品分析的独立开发者来说太实用了。
读文档。 支持上传 PDF、Word、PPT、Excel、图片等各种格式。丢一份财报给它,能帮你提炼关键数据。做市场调研、分析竞品报告的时候,这个能力直接省掉大量人工阅读时间。
生成研究报告。 做完调研后,把所有发现整合成结构化的深度研究报告,支持在线预览和分享。不是一段话的简单回答,而是有章节、有引用、有结论的正式报告。
金融分析和事件预测。 这是 MiroMind 的主打方向。在金融搜索基准 FinSearchComp 上拿了最高分,在字节跳动的 FutureX 预测榜单上连续两周拿第一。
预测能力到底多准
这几个案例都是事前公开发布、事后可以对照验证的:
- 黄金价格:2月10日预测2月25日金价 $5,185/盎司,实际 $5,181,差了 $4,误差 0.08%,提前15天。
- 超级碗冠军:1月6日判断西雅图海鹰队最可能赢,2月8日海鹰队 29-13 击败爱国者队夺冠,提前1个月命中。
- 格莱美最大赢家:提前3周精准预测。
对一人公司的实际意义
说实话,对大部分独立开发者来说,H1 闭源版可能更适合直接用。但如果你想自己搭一套研究型 Agent 工作流,1.7 和 1.7-mini 的开源协议是 Apache 2.0,商用完全没问题。
我觉得最值得关注的不是某个具体预测有多准,而是它展示的这套 Agent 范式:让 AI 自己规划研究路径、自己调用工具、自己验证结果。如果你正在做需要大量信息收集和分析的产品——比如行业报告生成、竞品监控、市场情报——MiroThinker 的架构思路非常值得参考。算力有限的话,先从 1.7-mini 跑起来试试,30B 参数量对个人服务器来说还算友好。