Google представила Gemini 3.0 Deep Think — мощный ИИ для сложных задач

Одновременно с запуском Gemini 3.0 Pro в Google рассказали про режим Gemini 3.0 Deep Think, который сейчас проходит финальное тестирование. Это экспериментальный режим параллельных глубоких рассуждений, в котором модель специально заточена под самые сложные задачи в математике, программировании и научном анализе. Отметим, что предыдущая версия — Gemini 2.5 Deep Think — смогла показать результат уровня золотой медали в международной математической олимпиаде.

Google держит все подробности режима Deep Think в секрете, но известно, что в нем под капотом работают сразу несколько версий Gemini 3 Pro, которым дано дополнительное время на решение задачи. Каждая модель готовит свой вариант ответа, а в финале отдельная модель собирает из всех вариантов лучший.

Google уже показала, как это отражается на бенчмарках. В Humanity’s Last Exam, который проверяет академическое мышление на 2500 сложных вопросов, Gemini 3 Deep Think набирает 41%, тогда как Gemini 3 Pro — 37,5%, а GPT-5.1 — 26,5 %. В научном тесте GPQA Diamond режим Deep Think выходит на 93,8 % против 91,9% у Gemini 3 Pro и 83,4% у Claude Sonnet 4.5. Наконец, в визуальном бенчмарке ARC-AGI-2, который считается одним из самых жестких тестов на абстрактное мышление, Gemini 3 Deep Think достигает 45,1%, тогда как Gemini 3 Pro ограничивается 31,1%, а GPT-5.1 — 17,6 %. Отметим, что цифры Gemini 3 Pro сами по себе считаются высокими, но режим Deep Think ставит планку еще выше.

Сейчас Google завершает тестирование Gemini 3 Deep Think, а после этот режим планируется включить в тарифный план Google AI Ultra ценой в 250 долларов в месяц.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”