Подразделение Google DeepMind представило Gemini 2.5 Flash Light — самую легкую и дешевую модель в семействе Gemini 2.5. Она доступна в Gemini API, Google AI Studio и Vertex AI и предназначена в первую очередь для сервисов, где нужны быстрые и недорогие ответы на не сложные вопросы. Цена модели в API: 10 центов за миллион входящих токенов (50 центов — за миллион входящих аудио-токенов) и 40 центов за миллион исходящих токенов. В приложение Gemini App модель добавлять не планируется. На данный момент модель находится в preview-статусе.
Также компания присвоила «стабильный» (general availability) статус версиям Gemini 2.5 Flash и Pro. При этом сами модели не изменились: сняв preview-статус, Google подтвердила, что довольна работой текущих версий. Напомню, что Gemini 2.5 Flash в последний раз обновлялась 20 мая, а 2.5 Pro — 6 июня. Компания продолжает работать над режимом Deep Think для 2.5 Pro, который аналогичен ChatGPT o3-Pro: в нем модель может тратить значительное (до десятков минут) время на решение особенно сложных задач, что повышает результаты. Режим будет доступен только в API и для 250-долларовой подписки Ultra, а дата его запуска пока не раскрывается. Также присвоение стабильного статуса линейке Gemini 2.5 указывает на то, что компании уже начали работу над Gemini 3.0.
P.S. Поддержать меня можете подпиской на телеграм-канал «сбежавшая нейросеть», в котором я рассказываю про ИИ с творческой стороны.
Источник: habr.com