背景

NVIDIA 提供了一批免费的 AI 模型 API(通过 integrate.api.nvidia.com),不需要付费就能调用。但免费的东西稳不稳?高峰期能不能用?我做了两轮实测。

测试方法

  • 每个模型调用 3 次,提示词固定为"只回复OK两个字"
  • 超时设为 30 秒
  • 分别在凌晨(低峰)和下午 5 点(高峰)各测一轮

测试结果

模型凌晨成功率高峰成功率高峰平均响应结论
mistral-small-4-119b3/32/30.69s⭐ 最快,首选
nemotron-3-super-120b3/33/310.1s✅ 最稳,但慢
qwen3.5-122b3/32/36.9s✅ 可用,偶尔超时
kimi-k2.52/30/3全超时❌ 高峰废了
deepseek-v3.20/30/3全超时❌ 两轮全挂
glm-4.70/30/3404❌ 端点不存在

结论

高峰期能打的只有 3 个:

  1. Mistral Small 4 — 0.69 秒响应,速度碾压,适合需要快速回复的场景
  2. Nemotron 3 Super — 3/3 全通过,最稳定,但响应慢(7-14 秒),带推理能力
  3. Qwen 3.5 — 可用但不稳,偶尔超时

其余三个(Kimi、DeepSeek、GLM)高峰期完全不可用,别指望。

使用建议

如果你在搭建 AI 应用想用免费模型:

  • 主力用 Mistral,速度快用户体验好
  • Nemotron 做 fallback,稳定兜底
  • 不要把 Kimi 和 DeepSeek 放在生产环境里

免费的东西,够用就行,别贪。