Gemini 2.5 Flash-Lite — самая быстрая и экономичная модель в линейке Gemini от Google

Компания Google официально выпустила стабильные версии своих моделей Gemini 2.5 Flash и Pro, отметив их готовность к использованию после успешного этапа предварительного тестирования.

Обе модели уже показали высокие результаты в отраслевых тестах, и, согласно неофициальным данным, эти показатели сохраняются и при использовании в реальных условиях.

Наряду с этими релизами Google представляет новый вариант: Gemini 2.5 Flash-Lite. Компания описывает Flash-Lite как самую быструю и экономичную модель в линейке Gemini 2.5.

Теперь разработчики могут получить доступ к Flash-Lite в Google AI Studio и Vertex AI, а также к стабильным моделям Flash и Pro на этих платформах и в приложении Gemini. Google Search также использует собственные версии Flash и Flash-Lite.

Flash-Lite: скорость и эффективность по более низкой цене

По данным Google, Gemini 2.5 Flash-Lite превосходит своего предшественника (2.0 Flash-Lite) в тестах на программирование, математику, естественные науки, логическое мышление и мультимодальные задачи. В таких тестах, как GPQA (естественные науки), AIME (математика) и LiveCodeBench (генерация кода), Flash-Lite набирает значительно больше баллов, чем предыдущие модели Lite, и даже в некоторых областях сокращает разрыв с более крупными моделями.

Стоимость Flash-Lite одинакова как для стандартного режима, так и для режима «Мышление»: 0,10 доллара за миллион входных токенов и 0,40 доллара за миллион выходных токенов. Однако модели «Мышление» генерируют значительно больше токенов — так называемых логических цепочек — для улучшения результатов, а значит, их фактическая стоимость использования обычно выше.

По словам Google, Gemini 2.5 Flash-Lite особенно хорошо подходит для задач с большим объёмом данных и низкой задержкой, таких как перевод и классификация. Результаты тестов подтверждают это: Flash-Lite набрал 86,8% в тесте FACTS Grounding и 84,5% в многоязычном MMLU. Визуальные тесты также показали хорошие результаты: 72,9% в MMMU и 57,5% в распознавании изображений.

Flash-Lite предлагает низкие цены и быстрое время отклика, в то время как Pro лидирует по сложности и точности

Как и другие модели Gemini 2.5, Flash-Lite поддерживает мультимодальный ввод, интеграцию с такими инструментами, как Google Search и выполнение кода, а также контекстные окна с количеством токенов до миллиона.

Всё семейство Gemini 2.5 предназначено для гибридных вычислений, которые обеспечивают баланс между высокой производительностью, низкой стоимостью и задержкой. Google позиционирует эти модели на границе Парето, оптимизируя их как по эффективности, так и по возможностям.

Пользуясь случаем, хочу порекомендовать BotHub — платформу, где можно протестировать все популярные модели без ограничений. Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и уже сейчас начать работать!

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”