小米直接送 16 亿 Token,Mistral 每月免费 10 亿 Token,DeepSeek 一天的代码生成成本只要几毛钱——这不是营销话术,是真实在发生的价格战。今天把国内国外能薅的羊毛、能用的低价 API 一次性盘清楚,按需取用。

国内免费档:先把额度领回来再说

小米 MiMo 100T 是当下最值得动手的一个。直接送 Token,最高 16 亿额度,旗舰模型 MiMo V2.5 覆盖推理、多模态、语音合成。活动从 2026 年 4 月 28 日跑到 5 月 28 日,只剩二十多天的窗口。流程也简单:去 100t.xiaomimimo.com 填表申请,等三天评估,邮件通知后 24 小时内到账,平台地址是 platform.xiaomimimo.com。撒钱拉生态的红利期,错过就没了。

阿里云百炼给新用户准备了 qwen3.6-max-preview 和 qwen3.6-flash 各 100 万 Token 的免费额度,90 天有效,注册入口在 bailian.console.aliyun.com。中文场景的对话、内容创作、编程辅助都够用。

硅基流动 SiliconFlow 是国产聚合平台里的常青树,DeepSeek-V3、Qwen2.5 全系列、Llama 3.3 都有部分模型完全免费调用,地址 cloud.siliconflow.cn。如果你在意延迟,这是国内白嫖党的快乐老家。

智谱 AI 的 GLM-4-Flash 一直是免费档的稳定选择,Air 版本价格也极低,新用户有赠送,入口 open.bigmodel.cn。中文写作和对话场景,这是平替之王。

国内低价档:DeepSeek 把价格打到了离谱

DeepSeek V4 已经发布,旧的 deepseek-chat 和 deepseek-reasoner 会在 2026 年 7 月 24 日下线,记得提前迁移。新模型 deepseek-v4-flash 和 deepseek-v4-pro 的价格依然感人——输入 1 元/百万 tokens,输出 2 元/百万 tokens。一天写几万字代码,成本可能也就几毛钱。兼容 OpenAI 和 Anthropic 格式,迁移几乎零成本,注册去 platform.deepseek.com

MiniMax M2.7 是订阅制的全模态选手,文本、语音、视频、图像、音乐一锅端。按量计费输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens;也可以买 Token Plan,按请求次数计费、5 小时滚动重置,地址 platform.minimaxi.com。多模态产品的最佳搭档。

阿里千问的按量计费版本(qwen3-max、qwen3.6-plus)输入 2.5 元、输出 10 元每百万 tokens,支持思考模式,中文能力扎实,依然在百炼平台。

国外免费档:Mistral 的 10 亿 Token 是 2026 最大方的羊毛

Mistral 法国队这次卷得相当凶——免费额度 10 亿 tokens 每月,限制是 1 请求/秒、500K tokens/min,覆盖全模型(包括闭源),需要手机号验证,注册入口 console.mistral.ai。这个量级足够支撑一个中等规模 SaaS 的核心调用,不薅简直对不起自己。

Google AI Studio 的免费层覆盖 Gemini 3 Flash、Gemini 2.5 Flash 和 Gemma 系列,250K tokens/min、20 请求/天,多模态(文本+图片+音频)能力都有,地址 aistudio.google.com/apikey。日常对话、轻量编程、内容理解都够用。

Groq 自研 LPU 芯片,推理速度是普通 GPU 的 5-10 倍。Llama 4 Scout 免费 1000 请求/天,30K tokens/min,还有 GPT-OSS-120B 和 Llama 3.3 70B 可选,注册 console.groq.com。如果你做实时对话或者需要极低延迟的应用,这是首选。

Cerebras 提供 GPT-OSS-120B 的免费推理,30 req/min、60K tokens/min,地址 cloud.cerebras.ai。OpenAI 开源模型 + Cerebras 加速,等于免费享受 GPT 级体验。

OpenRouter 是模型界的拼多多。一个 API Key 切 30+ 免费模型(带 :free 后缀),免费额度每天 50 请求,充值 10 美元后涨到 1000 请求/天。热门免费列表里能找到:

  • Gemma 4 31B / Gemma 3 系列
  • Llama 3.3 70B / Llama 3.2 3B
  • OpenAI GPT-OSS-120B
  • MiniMax M2.5
  • Qwen3 Coder
  • GLM-4.5 Air
  • NVIDIA Nemotron 系列

注册地址 openrouter.ai,对比模型效果或需要灵活切换的场景,没有比它更顺手的。

NVIDIA NIM 提供各种开源模型的免费推理,40 req/min,地址 build.nvidia.com,作为备选很合适。

国外低价档:GPT-OSS 系列让一切都不一样

OpenAI 终于开源了 GPT-OSS-120B 和 GPT-OSS-20B。免费渠道覆盖 Cerebras、Groq、OpenRouter,低价渠道在各种云平台按量计费就能用。如果你需要 GPT 级别能力但预算有限,这条路径值得花时间布线。

OpenRouter 的低价模型也别错过——很多低于 1 元/百万 tokens 的选项,统一接口、切换方便。

把这些排列组合起来

到这里你大概会问:这么多选择,到底该用哪个?我的经验是按场景分层:

  • 生产环境主力:DeepSeek V4 做核心推理,价格稳定可控
  • 多模态/语音:MiniMax M2.7 一站式解决
  • 极速响应:Groq 处理实时对话和搜索补全
  • 免费实验额度:小米 MiMo 100T 拿来跑大批量测试和数据合成
  • 开发调试:Mistral 10 亿额度足够覆盖整个开发周期
  • 模型对比:OpenRouter 用一个 Key 跑 A/B 测试

几个必须注意的点:限时活动要抓紧,小米的窗口只到 5 月 28 日;免费 ≠ 无限,速率限制对商用场景影响很大;API Key 千万别提交到 GitHub,这是血泪教训;部分平台免费层的数据会用于训练,敏感业务请绕开;价格战还在打,今天便宜的明天可能更便宜。

回到最开始那个问题——AI 创业的成本门槛真的高吗?当一年前还要按美金计费的能力,今天可以免费薅、明天还能更便宜的时候,真正的瓶颈早就不是 API 账单了。问题变成了:你打算用这些近乎免费的算力,做出什么样的产品?