Google представила Gemini 2.5 Flash-Lite: самую быструю и доступную модель в семействе

Вчера, 22 июля, компания Google официально представила стабильную версию Gemini 2.5 Flash-Lite — самой быстрой и наиболее доступной в финансовом плане модели искусственного интеллекта в семействе Gemini 2.5. Представители поискового гиганта заявили, что Lite-версия обходится всего в 10 центов (0,10 доллара) за 1 миллион входящих токенов, тогда как базовая Flash-модель за тот же миллион токенов ввода требует 30 центов, а Gemini 2.5 Pro обходится вовсе в 1,25 доллара, то есть в 12,5 раза дороже Gemini 2.5 Flash-Lite. Но куда важнее, что информация «на выходе» в данном случае тоже стоит существенно ниже. Telegram-канал создателя Трешбокса про технологии Изображение: Google for Developers, Logan Kilpatrick, Zach Gleicher

К примеру, если стоимость одного миллиона токенов Gemini 2.5 Pro (в случае с Output price) составляет целых 10 долларов, то с Gemini 2.5 Flash-Lite цена генерации составляет всего 40 центов. Это предоставляет возможность обрабатывать большие объёмы различных запросов по относительно доступной для пользователей стоимости (с момента запуска предварительной версии данной модели компании Google удалось снизить стоимость аудиовыхода на 40%). Более того, что немаловажно, новая компактная версия модели справляется с поставленными задачами гораздо быстрее старших версий того же семейства.

В официальном блоге указано, что 2.5 Flash-Lite имеет более низкую задержку, чем 2.0 Flash-Lite и 2.0 Flash при выполнении широкого спектра запросов. Правда, хотя Google называет 2.5 Flash-Lite «самой быстрой моделью» и указывает наивысшую скорость в свежей таблице производительности (в разделе Speed («Скорость») у 2.5 Flash-Lite изображено три иконки ракеты против одной у 2.5 Pro), никаких точных данных, позволяющих предметно сравнить параметр скорости, разработчик не сообщает. И, что самое интересное, новинка при всех своих преимуществах имеет бонус в виде высокого качества ответов на поставленные вопросы.

Компания заявила, что 2.5 Flash-Lite обходит 2.0 Flash-Lite по вопросам программирования, математики, науки, рассуждений и мультимодального восприятия. И эти преимущества уже используются небольшими стартапами для выполнения реальных сценариев — например, Satlyt применяет новую модель для обработки и использования спутниковых данных, дабы оперативно обобщать телеметрию с орбиты, анализировать спутниковую связь и не только. Компактная модель 2.5 Flash-Lite позволила компании сократить потребление энергии на 30%, снизив задержку на 45%.

Источник: trashbox.ru

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии