Новость о релизе появилась позавчера в соцсетях. Там же предлагается ознакомиться с таблицей с Livebench.ai:
livebench.ai
Контекстное окно: 2М.
Можно пользоваться в AI Studio
и через АПИ: gemini-exp-1206
Я попробовал на своей задаче с которой сейчас упражняюсь (200тыс.токенов) — на первый взгляд показалось что работает в разы быстрее чем gemini-1.5-flash. Качество пока не оценивал.
UPDATE: Например, на задачах написания кода прогресс новой версии Gemini по сравнению с предыдущими по рейтингу Livebench выглядит так:
livebench.ai
Собственно, это, на мой взгляд, и есть основная часть этой новости: Если раньше пользователи могли считать Gemini не самым оптимальным выбором для написания кода, то новая версия дает повод пересмотреть ранее сложившееся отношение.
В целом напомню в чем «профит» от использования Gemini:
Большое контекстное окно (input): 1 или 2 миллиона токенов, в зависимости от модели
Большой лимит бесплатного использования модели Flash: Миллион токенов в минуту, 1500 запросов в день.
Источник: habr.com