Nvidia выпустила LLM с открытым исходным кодом с 72 миллиардами параметров

Компания Nvidia, известная своими графическими процессорами, недавно объявила о выпуске новой большой языковой модели с открытым исходным кодом, которая, по утверждениям, конкурирует с ведущими моделями от OpenAI, Anthropic и Google.

Новое семейство моделей, названное NVLM 1.0, было представлено в официальном документе. Ведущей моделью этой серии является NVLM-D-72B, содержащая 72 миллиарда параметров. Nvidia заявляет, что NVLM 1.0 — это мультимодальная модель, которая демонстрирует передовые результаты в задачах, связанных с текстом и визуальными данными, конкурируя как с проприетарными, так и с открытыми моделями, такими как GPT-4o.

Особенности модели NVLM 1.0:

Мультимодальность. Новые модели уже могут выполнять задачи «производственного уровня», такие как обработка текстов и визуальных данных, а также давать улучшенные текстовые ответы.

Интеграция данных. Для достижения высокого уровня производительности Nvidia использует мультимодальные данные, включая текст, математические задачи и рассуждения, что позволяет моделям лучше работать с задачами по математике и программированию.

Улучшение точности. Благодаря мультимодальному обучению модели удалось повысить точность текстовых откликов на 4,3 балла в тестах, что значительно улучшает её возможности по сравнению с базовыми моделями.

Применение NVLM 1.0:

Модель способна объяснять сложные концепции, например, почему мем смешной, и одновременно решать сложные математические уравнения шаг за шагом. Это подчёркивает её способность справляться с задачами, требующими как понимания языка, так и аналитических навыков.

Nvidia Прозрачность и открытость

Nvidia демонстрирует серьёзное отношение к открытости своего проекта. Компания не только делает публично доступными веса обучающих моделей, но и планирует выпустить исходный код NVLM в ближайшее время. Это резко контрастирует с подходом конкурентов, таких как OpenAI и Google, которые тщательно охраняют свои модели.

Важно отметить, что Nvidia позиционирует NVLM не столько как прямого конкурента ChatGPT-4o или Gemini 1.5 Pro, а скорее как основу для сторонних разработчиков, которые могут использовать её для создания собственных приложений на базе искусственного интеллекта.

Nvidia делает значительный шаг в сторону открытого ИИ, предлагая мощные инструменты для разработчиков и предоставляя доступ к своим технологиям для создания новых решений на базе больших языковых моделей.

Источник: habr.com

0 0 голоса
Рейтинг новости
1769
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии