«Яндекс» открыл доступ к Instruct-версии собственной модели YandexGPT 5 Lite. Как отмечают в компании, её можно использовать как в некоммерческих, так и в коммерческих целях. Правда, при условии, что объём выходных токенов не превышает 10 млн в месяц. Такого числа токенов хватит для создания и поддержки чат-ботов на небольших и средних сайтах, для генерации описаний товаров в интернет-магазинах с ограниченным ассортиментом, для автоматизации ответов клиентам в сервисных центрах или для анализа отзывов пользователей на площадках с умеренным трафиком. Instruct-модель, по словам разработчиков, не слишком требовательна к вычислительным ресурсам, и её можно протестировать на личном компьютере без спецоборудования. Помимо предварительного этапа обучения на больших объёмах данных, новая модель прошла дополнительный этап настройки — alignment (с англ. — выравнивание). В результате она научилась решать конкретные задачи по промптам — запросам или инструкциям. Instruct-версия имеет базовые этические настройки. Разработчики могут улучшить их, чтобы модель соответствовала конкретным требованиям.
По результатам международных тестов и их адаптаций для русского языка (MMLU, IFEval, RuFacts и других), YandexGPT 5 Lite Instruct вплотную приблизилась к аналогу — китайской модели Qwen2.5-7B-Instruct — и превосходит её в таких сценариях, как задачи классификации и разметки текстов, знание русской культуры и фактов, умение отвечать в заданном формате. По данным замеров «Яндекса» методом слепого сравнения (Side by Side, SBS), модель в 62% случаев превосходит Qwen2.5-7B-Instruct и сравнима по качеству ответов с GPT-4o Mini в решении стандартных задач сервисов «Яндекса».
Источник: mobile-review.com