Российский AI против мировых лидеров: GigaChat 2 MAX обходит DeepSeek и GPT

Флагманская модель GigaChat 2 MAX стала мощнее и уверенно опережает конкурирующие зарубежные решения в задачах, связанных с обработкой русского языка, сообщили в пресс-службе Сбера. Версия GigaChat 2 Pro сохранила уровень производительности предыдущей флагманской модели, но при этом стала менее ресурсоемкой. Она оптимально подходит для задач, где важны креативный подход и точность формулировок. Базовая версия GigaChat 2 Lite, предназначенная для более простых задач, теперь по качеству сопоставима с предыдущей версией Pro.

Пользователи могут работать с моделями первого поколения, что дает возможность протестировать новую версию перед переходом на обновленную линейку. Вся серия доступна через облачный API, а также может быть развернута в локальной инфраструктуре компании (on-premise).

GigaChat 2.0 дает компаниям возможность создавать более интеллектуальных AI-агентов, которые могут анализировать сложные данные, рассуждать и принимать самостоятельные решения. Это стало возможным благодаря расширению знаний моделей в области математики, естественных и гуманитарных наук, а также усовершенствованию алгоритмов программирования. Теперь модели не только лучше пишут код, но и совместимы с популярным SDK LangChain, который позволяет разрабатывать AI-решения на Python и JavaScript. Необходимые пакеты совместимости можно найти в публичном репозитории GigaChain.

Новое поколение моделей значительно лучше удерживает контекст разговора, способно анализировать большие объемы информации и давать развернутые ответы на сложные вопросы. Например, если раньше модель могла обработать запрос, содержащий около 48 страниц текста формата A4 (при шрифте 14 pt), то теперь этот объем увеличен почти в четыре раза — до 200 страниц. То есть GigaChat 2.0 дает возможность создавать продвинутых чат-ботов.

Дополнительно новые модели стали в два раза точнее следовать пользовательским инструкциям и на 25% лучше отвечают на запросы, четко соблюдая заданные форматы и стилистику ответов. Это позволяет эффективнее решать профессиональные задачи: готовить юридические документы, анализировать клиентские обращения и многое другое.

По показателям международных тестов MMLU, оценивающих работу нейросетей на английском и русском языках, модель не уступает ведущим мировым разработкам, а в некоторых аспектах даже превосходит их. Так, GigaChat 2 MAX лучше справляется с фактологическими вопросами на русском языке, точнее следует заданному формату по сравнению с DeepSeek-V3, Qwen2.5 (версия Qwen-2.5-75b), GPT4o и LLaMA 70B. Модель демонстрирует высокий уровень в области программирования, что подтверждают результаты HumanEval. Также модель показывает более глубокое понимание точных наук.

По словам старшего вице-президента Сбербанка, руководителя направления «Технологическое развитие» Андрея Белевцева, 15 тысяч клиентов используют GigaChat в своих процессах. В компании рассчитывают на значительный рост числа клиентов. Читайте также Как организовать корпоративное удаленное обучение? Советы и подводные камни IT-World расскажет, как эффективно организовать дистанционные курсы для коллектива, используя три глобальных инструмента для удаленного корпоративного обучения — онлайн-платформы, LMS-системы и видеоконференции. И разберемся, как их следует применять, а с какими задачами они не справятся.

Источник: www.it-world.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии