Специалисты из Центра искусственного интеллекта Т-банка открыли доступ к новой языковой модели в весовой категории 7-8 миллиардов параметров. Согласно внутренним и индустриальным бенчмаркам, модель обходит все существующие в своем классе аналоги.
Сравнение бенчмарков
Модель T-lite была представлена в рамках первой конференции Т-Банка по машинному обучению Turbo ML Conf. T-lite — это инструмент разработки, с помощью которого компании смогут создавать LLM-приложения для собственного использования без передачи данных третьим лицам. В частности, это могут быть ассистенты поддержки для обработки запросов, ответов на вопросы и т.д. Пример работы LLM для голосового заказа.
Сравнение на офлайн бенчмарках
На тестах данная модель уже обогнала по показателям зарубежные llama3-8b-instruct и chat-gpt 3.5. При этом T-lite создана с использованием всего 3% вычислительных ресурсов, которые обычно требуются для такого типа моделей.
Сравнение на продуктовых бенчмарках
Сравнение на продуктовых бенчмарках T-lite является частью Gen-T — семейства языковых моделей, разработанных «Т-Банком». Они специализированы под задачи бизнеса.
Тут T-lite тоже в топе
Следите за крутыми AI новинками в моем телеграм канале — Data Feeling.
Источник: habr.com