近日,NVIDIA悄然推出了一款名为Nemotron-70B的AI模型,该模型在多个基准测试中表现出色,超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在内的140多个开闭源模型,其性能仅次于OpenAI的最新模型o1。
AI社区对此反应热烈,纷纷惊叹新的开源王者是否已经到来。业内人士更是高度评价,认为用Llama 3.1训出的小模型能超越GPT-4o,实属神来之笔。
Nemotron-70B基于Llama-3.1-70B开发,它能够在没有专门提示和额外推理token的情况下,正确回答复杂的推理问题,例如“草莓有几个r”的经典难题。
业内人士指出,NVIDIA在Llama 3.1基础上训练出的这个相对不大的模型,能够超越GPT-4o和Claude 3.5 Sonnet,这标志着一次技术上的重大飞跃。
目前,Llama-3.1-Nemotron-70B-Instruct已经可以在线体验,为用户提供了直接感受这款强大模型的机会。
除了推出Nemotron-70B模型,英伟达还开源了用于训练该模型的数据集HelpSteer2。该数据集包含21362个提示响应,旨在使模型更符合人类偏好,同时也更有帮助、更符合事实、更连贯。该数据集还包含20324个用于训练的提示响应和1038个用于验证的提示响应。