NVIDIA выпустила серию моделей ИИ, способных к логическому выводу и решению задач по математике, наукам и программированию. Все модели можно запускать локально — без облаков и дорогостоящих серверов, на обычных игровых видеокартах.
В линейку OpenReasoning-Nemotron входят четыре модели с числом параметров 1,5, 7, 14 и 32 млрд. Все они были созданы методом дистилляции из масштабной модели DeepSeek R1 0528 (671 млрд параметров) с использованием архитектуры Qwen 2.5. NVIDIA применила пайплайн NeMo Skills, сгенерировала 5 млн решений и провела обучение исключительно в режиме supervised fine-tuning — без использования RLHF. Это дало заметные результаты: старшая модель с 32 млрд параметров набирает 89,2 балла на AIME24 и 73,8 на HMMT, а младшая 1,5‑модель — 55,5 и 31,5 соответственно.
Все четыре модели опубликованы на платформе Hugging Face и могут использоваться как база для дальнейших исследований, включая обучение с подкреплением и адаптацию под прикладные задачи. Поддерживается также режим GenSelect, позволяющий генерировать сразу несколько ответов на один вопрос и выбирать лучший. В таком режиме 32B‑модель демонстрирует результаты, сравнимые с o3‑high от OpenAI на ряде математических и программных бенчмарков.
Главная особенность Nemotron — доступность. Даже без облачной инфраструктуры, при наличии домашнего ПК с современной игровой видеокартой среднего класса эти модели пригодны для локальных вычислений, научной работы и создания собственных ИИ-систем.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Источник: habr.com