Яндекс представляет обновленную линейку генеративных текстовых моделей. Новая версия демонстрирует значительный прогресс в качестве ответов. В реальных сценариях использования, где требуется обработка как пользовательских запросов, так и сложных бизнес-задач, YandexGPT 5 Pro показывает превосходство над предыдущей версией в 67% случаев YandexGPT 4 Pro. Особенно стоит отметить успехи модели в задачах создания и краткого изложения текстов. Здесь YandexGPT 5 Pro достигает уровня ведущих мировых решений, таких как GPT-4o от OpenAI и Qwen от Alibaba.
Какие есть модели нового поколения и где их попробовать?
Яндекс расширил линейку генеративных моделей пятого поколения, представив две версии с поддержкой контекста до 32 000 токенов: профессиональную YandexGPT 5 Pro и оптимизированную YandexGPT 5 Lite.
YandexGPT 5 Pro доступна в интерактивном чате с Алисой для конечных пользователей и интегрирована в облачную платформу Yandex Cloud AI Studio для корпоративных решений. Модель ориентирована на сложные задачи, требующие анализа длинных текстов, таких как анализ документов или мультимодальные запросы.
YandexGPT 5 Lite , в свою очередь, представлена в опенсорсном формате на платформе Hugging Face. Эта версия предназначена для быстрого старта разработчиков: она уже предобучена и позволяет создавать базовые решения без дополнительной настройки.
Обе модели поддерживают работу с расширенными контекстами, что увеличивает объём обрабатываемой информации за один запрос. Разделение на форматы Pro и Lite позволяет охватить как профессиональные задачи требующие ресурсов, так и начальные этапы разработки с минимальными затратами.
Чем хороша YandexGPT 5 Pro?
Согласно данным внутреннего слепого A/B-тестирования, новая модель Яндекса демонстрирует значительный прогресс:
Превосходство над предыдущей версией : YandexGPT 5 Pro эффективнее решает задачи в 67% случаев по сравнению с YandexGPT 4 Pro.
Конкуренция с мировыми лидерами : В ключевых сценариях модель показывает результаты, сопоставимые с GPT-4o от OpenAI, что подтверждает её релевантность для сложных запросов.
Тестирование проводилось на реальных пользовательских сценариях, включая обработку длинных текстов и мультимодальные запросы. Это делает YandexGPT 5 Pro универсальным инструментом как для повседневных задач, так и для профессиональных решений, доступных через Алису и Yandex Cloud.
YandexGPT 5 Pro против GPT-4o
YandexGPT 5 Pro против GPT-4o
YandexGPT 5 Pro против Qwen 2.5 32b
Все запросы (% побед)
67%
54%
64%
Классификация информации
70%
51%
61%
Выделение информации из текста
71%
48%
67%
Переформулировки
58%
51%
66%
Суммаризация
74%
56%
68%
Генерация текстов
65%
53%
62%
Процент успешно выполненных заданий:
Изображение взято из источника
Новая модель демонстрирует улучшенные результаты в решении сложных задач, критичных для корпоративных сценариев. Для объективной оценки использовался комплекс тестов, включающий реальные кейсы из сервисов Яндекса и типовые задачи бизнеса:
Суммаризация документов
Автоматизация клиентской поддержки
Анализ специфических данных
Особое внимание уделялось сценариям, где требуется работа с привязкой к источникам — например, использование внутренних баз знаний компании. Эта технология, известная как RAG (Retrieval Augmented Generation) , позволяет модели генерировать ответы на основе актуальной информации из заданных источников.
Преимущества YandexGPT 5 Pro :
Превосходит предыдущую версию (YandexGPT 4 Pro) и GPT-4o в задачах с RAG
Обеспечивает точность в сценариях, где критически важна связь с проверенными данными
Адаптирована для интеграции в корпоративные системы через Yandex Cloud
Интеграция с внешними инструментами : Модель умеет взаимодействовать с API для получения актуальной информации — например, проверять статус заказа или наличие товара, а затем использовать эти данные в ответах. По стандартному бенчмарку BFCL доля успешно решённых задач такого типа выросла с 54% до 66%.
YandexGPT 5 Pro
YandexGPT 4 Pro
GPT-4o
Qwen 2.5 32b
RAG-сценарии (ответ с опорой на источники)
68%
55%
BFCL v4
66%
54%
71%
61%
Что за модель YandexGPT 5 Lite?
Новая предобученная модель (YandexGPT 5 Lite Pretrain) демонстрирует расширенные возможности за счет двухэтапного обучения:
Базовый этап : Обучение на 15 трлн токенов (русский, английский, код, вычисления) — эквивалентно 2,5 млрд веб-страниц.
Финальная настройка : Доработка на 320 млрд токенов, включая образовательные материалы. Использован улучшенный метод отбора данных для повышения качества.
Ключевые особенности :
Универсальность : Готова к адаптации в разработке, бизнесе и науке.
Компактность: Минимальные требования к ресурсам — оптимальна для задач с ограниченной инфраструктурой.
Преимущества :
Рост качества в решении математических задач и программировании по сравнению с YandexGPT 4 Lite Pretrain.
Превосходит зарубежные аналоги (LLaMa3.1-8B, Qwen-2.5-7B-base) в большинстве сценариев.
Источник изображения — пресс-центр Яндекса
Яндекс представил обновлённые языковые модели пятого поколения, сочетающие высокую производительность, гибкость и доступность. YandexGPT 5 Pro демонстрирует превосходство над предыдущими версиями (в 67% случаев) и конкурирует с GPT-4o, особенно в задачах суммаризации, анализа данных и работы с RAG (использование внутренних источников компаний). Модель интегрирована в Алису и Yandex Cloud, что делает её удобной для бизнеса.
YandexGPT 5 Lite Pretrain — компактная open-source-версия на Hugging Face — обучена на 15 трлн токенов, превосходит аналогов (LLaMa, Qwen) в коде и математике, а её двухэтапное обучение гарантирует универсальность.
Ключевые преимущества:
Поддержка контекста до 32 тыс. токенов.
Рост эффективности в автоматизации поддержки, анализе документов и интеграции с API (успешность задач по BFCL выросла с 54% до 66%).
Открытые инструменты Яндекса (120+ решений, включая YaFSDP для ускорения обучения LLM).
Какие возможности YandexGPT 5 Pro/Lite вы считаете наиболее ценными для вашего проекта — работа с RAG, компактность Lite-версии или интеграция с внешними API? Мне лично подходит компактная версия Lite, чтобы сильно не тратиться на вычислительные мощности в своих проектах.
P.S. Чтобы вы были в теме до того, как что-то станет мейнстримом , приглашаю в свой Телеграм-канал «Охота за технологиями» — там я делюсь о технологиях и бизнесах, которые меняют мир и завоёвывают миллионы сердец. А ещё — эксклюзивными инсайдами, читами и лайфхаками по ИИ, которые вы не найдёте больше нигде. Нет, это не спам и не пиар ради пиара — просто хочу делиться полезной информацией для тех, кто ценит время и хочет ловить дропы знаний раньше других.
Источник: habr.com