Лучше GPT o3 и Grok 4. Google выпустила Gemini 2.5 Deep Think

Компания Google сообщила о выпуске Gemini 2.5 Pro Deep Think — своей самой мощной языковой модели, которая ранее взяла золотую медаль Международной математической олимпиады 2025 (IMO 2025). Новинка будет доступна подписчикам плана Gemini Ultra, который стоит 250 долларов в месяц. Также компания предоставила доступ к модели группе математиков, а в ближайшее время планирует начать тестирование версии для API.

Режим Deep Think базируется на модели Gemini 2.5 Pro, но обладает рядом собственных особенностей. Во-первых, это увеличенный вычислительный ресурс рассуждений, что важно для задач, требующих длительного решения. Во-вторых, режим Deep Think включает в себя несколько ИИ-агентов, которые, работая параллельно, пробуют разные подходы к решению задачи. В итоге модуль-критик или выбирает лучшее решение, или комбинирует финальный ответ из нескольких решений.

В Google сравнили работу Gemini 2.5 Deep Think с другими версиями Gemini 2.5 при создании воксельной сцены:

В компании поделились результатами Deep Think в бенчмарках без использования инструментов:

Стоит отметить, что Google не стала включать в таблицы результаты GPT o3 Pro и Grok 4 Heavy, что, вероятно, объясняется разной методикой тестирования — xAI и OpenAI дали своим моделям доступ к инструментам.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”