Новый режим исследует несколько вариантов решения одновременно и показал беспрецедентные 45,1% на тесте абстрактного рассуждения ARC-AGI-2, где большинство моделей не преодолевают планку в 30%.
Google запустила режим Deep Think для нейросети Gemini 3 — специальный формат работы, который дает модели больше времени на размышления и позволяет решать сложные математические, научные и логические задачи, с которыми не справляются обычные ИИ. Функция доступна подписчикам тарифа Google AI Ultra в приложении Gemini.
Ключевое отличие Deep Think от стандартного режима это параллельное рассуждение. Обычные языковые модели генерируют ответ последовательно: выбирают следующее слово на основе предыдущих, двигаясь от начала к концу без возможности «передумать». Если на каком-то этапе модель сделала неверное предположение, то весь дальнейший ответ строится на ошибочной базе.
Deep Think работает иначе: модель прорабатывает несколько гипотез одновременно, исследует разные пути решения и выбирает наиболее обоснованный вариант. Это похоже на то, как человек решает сложную задачу, пробует несколько подходов, отбрасывает тупиковые ветки, возвращается к развилкам и находит правильный маршрут. Такой метод критичен для задач, где один неверный шаг в логической цепочке уводит к полностью ошибочному выводу.
На тесте Humanity’s Last Exam (дословно «последний экзамен человечества»), который состоит из набора экстремально сложных задач, созданных чтобы «завалить» даже топовые ИИ — Gemini 3 Deep Think показала 41.0% без использования дополнительных инструментов. Это топовый результат среди существующих моделей.
Источник: hi-tech.mail.ru