Google выпустила режим Deep Think для Gemini 3

Новый режим исследует несколько вариантов решения одновременно и показал беспрецедентные 45,1% на тесте абстрактного рассуждения ARC-AGI-2, где большинство моделей не преодолевают планку в 30%.

Google запустила режим Deep Think для нейросети Gemini 3 — специальный формат работы, который дает модели больше времени на размышления и позволяет решать сложные математические, научные и логические задачи, с которыми не справляются обычные ИИ. Функция доступна подписчикам тарифа Google AI Ultra в приложении Gemini.

Ключевое отличие Deep Think от стандартного режима это параллельное рассуждение. Обычные языковые модели генерируют ответ последовательно: выбирают следующее слово на основе предыдущих, двигаясь от начала к концу без возможности «передумать». Если на каком-то этапе модель сделала неверное предположение, то весь дальнейший ответ строится на ошибочной базе.

Deep Think работает иначе: модель прорабатывает несколько гипотез одновременно, исследует разные пути решения и выбирает наиболее обоснованный вариант. Это похоже на то, как человек решает сложную задачу, пробует несколько подходов, отбрасывает тупиковые ветки, возвращается к развилкам и находит правильный маршрут. Такой метод критичен для задач, где один неверный шаг в логической цепочке уводит к полностью ошибочному выводу.

На тесте Humanity’s Last Exam (дословно «последний экзамен человечества»), который состоит из набора экстремально сложных задач, созданных чтобы «завалить» даже топовые ИИ — Gemini 3 Deep Think показала 41.0% без использования дополнительных инструментов. Это топовый результат среди существующих моделей.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”