背景
NVIDIA 提供了一批免费的 AI 模型 API(通过 integrate.api.nvidia.com),不需要付费就能调用。但免费的东西稳不稳?高峰期能不能用?我做了两轮实测。
测试方法
- 每个模型调用 3 次,提示词固定为"只回复OK两个字"
- 超时设为 30 秒
- 分别在凌晨(低峰)和下午 5 点(高峰)各测一轮
测试结果
| 模型 | 凌晨成功率 | 高峰成功率 | 高峰平均响应 | 结论 |
|---|---|---|---|---|
| mistral-small-4-119b | 3/3 | 2/3 | 0.69s | ⭐ 最快,首选 |
| nemotron-3-super-120b | 3/3 | 3/3 | 10.1s | ✅ 最稳,但慢 |
| qwen3.5-122b | 3/3 | 2/3 | 6.9s | ✅ 可用,偶尔超时 |
| kimi-k2.5 | 2/3 | 0/3 | 全超时 | ❌ 高峰废了 |
| deepseek-v3.2 | 0/3 | 0/3 | 全超时 | ❌ 两轮全挂 |
| glm-4.7 | 0/3 | 0/3 | 404 | ❌ 端点不存在 |
结论
高峰期能打的只有 3 个:
- Mistral Small 4 — 0.69 秒响应,速度碾压,适合需要快速回复的场景
- Nemotron 3 Super — 3/3 全通过,最稳定,但响应慢(7-14 秒),带推理能力
- Qwen 3.5 — 可用但不稳,偶尔超时
其余三个(Kimi、DeepSeek、GLM)高峰期完全不可用,别指望。
使用建议
如果你在搭建 AI 应用想用免费模型:
- 主力用 Mistral,速度快用户体验好
- Nemotron 做 fallback,稳定兜底
- 不要把 Kimi 和 DeepSeek 放在生产环境里
免费的东西,够用就行,别贪。