«Вокруг больших языковых моделей в мире возник некоторый пузырь. Люди слишком верили в технологию и вложили в нее слишком много денег и усилий, а отдача от инвестиций получилась не такой значимой, и акции многих компаний начали падать», отметил директор по искусственному интеллекту «Т-Банка» Виктор Тарнавский в интервью порталу Kept. По его мнению, большую модель можно сравнить с огромным неповоротливым мозгом: во время работы она съедает очень много ресурсов и поэтому много тормозит. Небольшие модели под конкретные задачи работают быстрее, и стоимость на единицу запроса тоже значимо ниже, подчеркнул собеседник портала.
В результате «Т-Банк» делает не одну модель, а семейство моделей, каждая из которых заточена под свою доменную область, и ее результат в конкретной области превосходит результат большой модели и по качеству, и по возврату инвестиций. «Если посмотреть, что делают крупные компании на основе огромных моделей, станет ясно, что они пытаются дистиллировать модели — создавать маленькие и более эффективные модели из больших. Мы этот этап уже прошли. Все компании идут примерно к одному, копая этот тоннель с разных сторон. Индустриальные модели начнут появляться, просто это займет время», — сказал собеседник Kept. Как сообщил Виктор Тарнавский, цель его направления в построении решений для малого и среднего бизнеса, а не для других технологических компаний.
Источник: mobile-review.com