Сегодня, 1 августа, компания Google официально сообщила о внедрении Deep Think («Глубокое размышление») в приложение Gemini (правда, пока что данное нововведение будет доступно только владельцам платной подписки Google AI Ultra). Представители поискового гиганта заявили, что новая версия этого инструмента была существенно улучшена на основе обратной связи от участников закрытого тестирования и результатов научных исследований. Например, старая вариация модели завоевала золотую медаль на Международной математической олимпиаде, но потратила часы на решение сложных математических задач. Новая модель добралась до бронзовой медали, но работает гораздо быстрее.
Разработчики из Google сравнивают работу Deep Think с тем, как сложные задачи решают люди, уделяя время изучению различных точек зрения, взвешиванию возможных решений и уточнению окончательного ответа. Новая модель тоже применяет технологию параллельного мышления, расширяя границы мыслительных возможностей искусственного интеллекта. Это позволяет Gemini одновременно генерировать и рассматривать сразу несколько идей, изучая различные возможности, чтобы в итоге перейти к наилучшему ответу. Более того, компания теперь даёт Gemini больше времени на изучение различных гипотез и поиск креативного решения сложной задачи (время на размышления и вывод были увеличены). Изображение: Google
Примечательно, что Deep Think отлично себя зарекомендовал в задачах, которые требуют поэтапной разработки сложных объектов. Например, инструмент существенно улучшает эстетическую и функциональную составляющую в задачах, связанных с веб-разработкой. Кроме того, система продемонстрировала высокую эффективность в науке и математике — в Google считают, что благодаря поддержке глубокого рассуждения ИИ сможет решать сложные задачи и выступит мощным инструментом в рамках различных исследований. Ещё Deep Think предоставляет возможность проанализировать сложную техническую литературу, а также сформулировать и исследовать математические гипотезы, что, теоретически, ускорит путь к новым открытиям в будущем. Изображение: Google
Естественно, без бенчмарков не обошлось — производительность Deep Think в области программирования, математики и рассуждений оказалась довольно высокой (выше конкурентов вроде Grok 4 или OpenAI 3o). Правда, учитывая всё вышесказанное, было бы интересно посмотреть на стоимость работы этого инструмента в реальных задачах — к сожалению, Google информацию об этом не предоставляет.
Источник: trashbox.ru