Nemotron

NVIDIA推出的开源大语言模型系列，开放权重和训练数据用于构建专用AI代理

大语言模型

https://developer.nvidia.cn/nemotron

前往官网

深度报告

NVIDIA Nemotron是一系列最开放的AI大语言模型，配备开放的权重、训练数据和方案，提供业内领先的效率和准确性，用于构建专用的AI代理。
Nemotron系列的核心创新在于开放性，训练数据和模型权重完全开放，可在Hugging Face免费下载。架构上采用混合Mamba-Transformer MoE架构，支持高达100万token的上下文窗口。在部署方面支持vLLM、SGLang、Ollama、llama.cpp等开源框架，提供超高吞吐量推理，降低推理成本。
Nemotron产品线分为多个型号满足不同需求：Nemotron 3 Nano 30B定位高性价比，适用于目标任务的最高准确性和效率；Nemotron 3 Super 120B在效率和准确性之间取得平衡，适合多智能体环境处理复杂任务；Llama Nemotron Ultra 253B提供最高准确率，适用于多智能体企业工作流；Nemotron Nano VL 12B专注视觉语言，适用于文档智能和视频理解；Nemotron RAG提供检索增强功能，包括提取、嵌入和重排序；Nemotron Safety提供安全审核功能，包括越狱检测、内容审核、PII检测；Nemotron语音提供完整语音AI能力，包括ASR、TTS和语音翻译。
Nemotron的多模态能力涵盖视觉理解、信息检索、语音处理和安全功能，支持RAG和智能体应用等场景。
当前页面未提供具体的定价信息。可用的部署和试用方式包括通过OpenRouter免费试用部分模型，NVIDIA NIM提供推理端点API服务，以及第三方推理提供商包括Baseten、DeepInfra、Fireworks AI、FriendliAI、Together AI等。

用户评论

孙飞

—

Nemotron开源确实香，权重完全开放，可以随便下载部署。

Austin.Gonzalez168

—

100万token上下文也太猛了，之前用过的模型都没这么夸张。

6AOKO

—

混合Mamba-Transformer架构有点东西，推理速度确实快。

Teresa.Bell_702

—

用Ollama部署很方便，Mac上就能跑起来，就是内存需求太大。

xJosephineElliott_x

—

Nano 30B性价比很高，个人开发者用这个就够了。

FlamingoFi910

—

Super 120B效果确实强，就是显存要求感人。

浮生_17

—

Safety模型单独分离出来好评，安全审核很需要。

JWright_77

—

RAG能力比想象中强，检索增强这块做得很扎实。

4feqow

—

支持vLLM推理，部署方案选择很多，很灵活。

宋艳

—

语音模型出来了，ASR+TTS一条龙，很方便。

Paul.Edwards_77

—

Hugging Face上直接能下载，这开放性没谁了。

CAkim

—

视觉理解模型VL 12B够用，文档分析效果不错。

RuthMooreSr

—

MoE架构确实省推理成本，吞吐量很高。

Julie_Watson_Max35

—

对比闭源模型，Nemotron免费使用太香了。

兰花_20

—

企业级应用选Ultra确实香，准确率高。

SvetlanaBajević

—

和多模态结合得很好，视觉语音都能处理。

Grace_ThomasJr

—

第三方推理提供商很多，选择灵活。

SecretGardenHill

—

NVIDIA做开源模型确实靠谱，生态也完善。

clPER

—

NIM服务出来了，API调用更方便。

Nemotron

深度报告

用户评论

相关链接

同类产品