NVIDIA
NVIDIA
NVIDIA 在 https://integrate.api.nvidia.com/v1 提供一个与 OpenAI 兼容的 API,用于 Nemotron 和 NeMo 模型。请使用来自 NVIDIA NGC 的 API key 进行认证。
CLI 设置
先导出 key,然后运行新手引导并设置一个 NVIDIA 模型:
如果你仍然使用 --token,请记住它会出现在 shell 历史记录和 ps 输出中;如果可能,优先使用环境变量。
配置片段
模型 ID
nvidia/llama-3.1-nemotron-70b-instruct(默认)meta/llama-3.3-70b-instructnvidia/mistral-nemo-minitron-8b-8k-instruct
说明
- 使用与 OpenAI 兼容的
/v1端点;请使用来自 NVIDIA NGC 的 API key。 - 当设置了
NVIDIA_API_KEY时,提供商会自动启用;使用静态默认值(131,072-token 上下文窗口,4,096 最大 tokens)。