Gemini 2.5 Flash-Lite — самая быстрая и экономичная модель в линейке Gemini от Google

Компания Google официально выпустила стабильные версии своих моделей Gemini 2.5 Flash и Pro, отметив их готовность к использованию после успешного этапа предварительного тестирования.

Обе модели уже показали высокие результаты в отраслевых тестах, и, согласно неофициальным данным, эти показатели сохраняются и при использовании в реальных условиях.

Наряду с этими релизами Google представляет новый вариант: Gemini 2.5 Flash-Lite. Компания описывает Flash-Lite как самую быструю и экономичную модель в линейке Gemini 2.5.

Теперь разработчики могут получить доступ к Flash-Lite в Google AI Studio и Vertex AI, а также к стабильным моделям Flash и Pro на этих платформах и в приложении Gemini. Google Search также использует собственные версии Flash и Flash-Lite.

Flash-Lite: скорость и эффективность по более низкой цене

По данным Google, Gemini 2.5 Flash-Lite превосходит своего предшественника (2.0 Flash-Lite) в тестах на программирование, математику, естественные науки, логическое мышление и мультимодальные задачи. В таких тестах, как GPQA (естественные науки), AIME (математика) и LiveCodeBench (генерация кода), Flash-Lite набирает значительно больше баллов, чем предыдущие модели Lite, и даже в некоторых областях сокращает разрыв с более крупными моделями.

Стоимость Flash-Lite одинакова как для стандартного режима, так и для режима «Мышление»: 0,10 доллара за миллион входных токенов и 0,40 доллара за миллион выходных токенов. Однако модели «Мышление» генерируют значительно больше токенов — так называемых логических цепочек — для улучшения результатов, а значит, их фактическая стоимость использования обычно выше.

По словам Google, Gemini 2.5 Flash-Lite особенно хорошо подходит для задач с большим объёмом данных и низкой задержкой, таких как перевод и классификация. Результаты тестов подтверждают это: Flash-Lite набрал 86,8% в тесте FACTS Grounding и 84,5% в многоязычном MMLU. Визуальные тесты также показали хорошие результаты: 72,9% в MMMU и 57,5% в распознавании изображений.

Flash-Lite предлагает низкие цены и быстрое время отклика, в то время как Pro лидирует по сложности и точности

Как и другие модели Gemini 2.5, Flash-Lite поддерживает мультимодальный ввод, интеграцию с такими инструментами, как Google Search и выполнение кода, а также контекстные окна с количеством токенов до миллиона.

Всё семейство Gemini 2.5 предназначено для гибридных вычислений, которые обеспечивают баланс между высокой производительностью, низкой стоимостью и задержкой. Google позиционирует эти модели на границе Парето, оптимизируя их как по эффективности, так и по возможностям.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

Источник

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии