🧠 支持的模型

通过NVIDIA NIM API提供的AI模型列表

对话模型 / Chat

LLaMA 3.1 405B
meta/llama-3.1-405b-instruct
LLaMA 3.1 70B
meta/llama-3.1-70b-instruct
LLaMA 3.1 8B
meta/llama-3.1-8b-instruct
Mixtral 8x22B
mistralai/mixtral-8x22b-instruct-v0.1
Mixtral 8x7B
mistralai/mixtral-8x7b-instruct-v0.1
Mistral Large 2
mistralai/mistral-large-2-instruct
Qwen2.5 72B
qwen/qwen2.5-72b-instruct
DeepSeek R1
deepseek-ai/deepseek-r1

代码模型 / Code

CodeLlama 70B
meta/llama-3.1-405b-instruct

嵌入模型 / Embedding

Nemotron 70B
nvidia/llama-3.1-nemotron-70b-instruct
EmbedQA 4
nvidia/embed-qa-4

兼容性说明

所有模型均兼容OpenAI Chat Completions API格式,设置 base_url 为平台API地址即可使用。