«Яндекс» представил YandexGPT 3 Lite — облегчённую версию генеративной нейросети третьего поколения. Она подходит для интеграции в чат-боты, способна быстро генерировать ответы на вопросы, проверять тексты и анализировать данные.
Доступ к YandexGPT 3 Lite получат клиенты облачной платформы Yandex Cloud через API в сервисе Foundation Models. Коммерческая модель подойдёт для разных типов бизнеса. Она позволит оптимизировать задачи консультирования клиентов, создания маркетинговых материалов и многое другое.
Модель превосходит YandexGPT 2 Lite. Так, в тесте YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU) она даёт на 6 п.п. больше верных ответов, чем модель предыдущего поколения.
В методике Side by Side с экспертной оценкой ответов YandexGPT 3 Lite отвечала лучше в 68% случаев.
Вот как выглядят оценки модели в задачах классификации, генерации контента, ответов на вопросы и других типах бизнес-задач:
Наконец, она допускает меньше орфографических и фактических ошибок, чем модель второго поколения.
Разработчики улучшили все этапы обучения, от отбора данных для предобучения и до обработки данных. Так, на первом этапе теперь используется технология curriculum learning для поэтапного усложнения данных. При выравнивании модели и обучении с подкреплением внедрена улучшенная модель для оценки качества ответов нейросети. Наконец, в архитектуру YandexGPT 3 Lite добавили технологию Grouped Query Attention, которая ускоряет обработку данных без потери качества.
Новая модель заменит предшественника в течение месяца, но опробовать её можно уже сейчас. YandexGPT 3 Lite стоит 20 копеек за тысячу токенов. Новые пользователи Yandex Cloud могут бесплатно протестировать её в демо-режиме.
В марте «Яндекс» представил линейку нейросетей YandexGPT 3. Они лучше работают со сложными запросами и точнее следуют заданному формату ответов, благодаря чему будут особенно полезны при решении реальных задач пользователей и компаний.
Источник: habr.com