NVIDIA 免费 AI 模型实测：高峰期只有 3 个能打

背景

NVIDIA 提供了一批免费的 AI 模型 API（通过 integrate.api.nvidia.com），不需要付费就能调用。但免费的东西稳不稳？高峰期能不能用？我做了两轮实测。

模型	凌晨成功率	高峰成功率	高峰平均响应	结论
mistral-small-4-119b	3/3	2/3	0.69s	⭐ 最快，首选
nemotron-3-super-120b	3/3	3/3	10.1s	✅ 最稳，但慢
qwen3.5-122b	3/3	2/3	6.9s	✅ 可用，偶尔超时
kimi-k2.5	2/3	0/3	全超时	❌ 高峰废了
deepseek-v3.2	0/3	0/3	全超时	❌ 两轮全挂
glm-4.7	0/3	0/3	404	❌ 端点不存在

高峰期能打的只有 3 个：

其余三个（Kimi、DeepSeek、GLM）高峰期完全不可用，别指望。

如果你在搭建 AI 应用想用免费模型：

免费的东西，够用就行，别贪。