Компания Nvidia, известная своими графическими процессорами, недавно объявила о выпуске новой большой языковой модели с открытым исходным кодом, которая, по утверждениям, конкурирует с ведущими моделями от OpenAI, Anthropic и Google.
Новое семейство моделей, названное NVLM 1.0, было представлено в официальном документе. Ведущей моделью этой серии является NVLM-D-72B, содержащая 72 миллиарда параметров. Nvidia заявляет, что NVLM 1.0 — это мультимодальная модель, которая демонстрирует передовые результаты в задачах, связанных с текстом и визуальными данными, конкурируя как с проприетарными, так и с открытыми моделями, такими как GPT-4o.
Особенности модели NVLM 1.0:
Мультимодальность. Новые модели уже могут выполнять задачи «производственного уровня», такие как обработка текстов и визуальных данных, а также давать улучшенные текстовые ответы.
Интеграция данных. Для достижения высокого уровня производительности Nvidia использует мультимодальные данные, включая текст, математические задачи и рассуждения, что позволяет моделям лучше работать с задачами по математике и программированию.
Улучшение точности. Благодаря мультимодальному обучению модели удалось повысить точность текстовых откликов на 4,3 балла в тестах, что значительно улучшает её возможности по сравнению с базовыми моделями.
Применение NVLM 1.0:
Модель способна объяснять сложные концепции, например, почему мем смешной, и одновременно решать сложные математические уравнения шаг за шагом. Это подчёркивает её способность справляться с задачами, требующими как понимания языка, так и аналитических навыков.
Nvidia Прозрачность и открытость
Nvidia демонстрирует серьёзное отношение к открытости своего проекта. Компания не только делает публично доступными веса обучающих моделей, но и планирует выпустить исходный код NVLM в ближайшее время. Это резко контрастирует с подходом конкурентов, таких как OpenAI и Google, которые тщательно охраняют свои модели.
Важно отметить, что Nvidia позиционирует NVLM не столько как прямого конкурента ChatGPT-4o или Gemini 1.5 Pro, а скорее как основу для сторонних разработчиков, которые могут использовать её для создания собственных приложений на базе искусственного интеллекта.
Nvidia делает значительный шаг в сторону открытого ИИ, предлагая мощные инструменты для разработчиков и предоставляя доступ к своим технологиям для создания новых решений на базе больших языковых моделей.
Источник: habr.com