Новый ИИ Claude Sonnet 4.5 может программировать до 30 часов подряд

После вчерашнего запуска Claude Sonnet 4.5, который по большинству бенчмарков стал лучшим ИИ для программирования, многие СМИ отдельно выделили его возможность долго работать без перерывов. Anthropic заявляет, что в одном из внутренних тестов Claude Sonnet 4.5 создал чат-приложение уровня Slack/Teams, написав 11 тысяч строк кода и самостоятельно завершив задачу. На задачу ушло около 30 часов, что примерно в 4 раза дольше, чем предыдущий рекорд автономной работы для ИИ Anthropic.

TechCrunch со ссылкой на исследователя Anthropic Дэвида Херши отмечает, что в корпоративных тестах Sonnet 4.5 до 30 часов не только писала код, но и поднимала службы баз данных, покупала доменные имена, проходила аудит по стандарту операционного контроля (SOC 2). Участвовавшие в бета-тесте специалисты Canva хвалят новинку за «сложные, длинноконтекстные задачи — от инженерных правок в нашей кодовой базе до продуктовых функций и исследований».

Эксперт по ИИ Рохан Паул рассказал в X, как Anthropic удалось достичь такой продолжительности работы. По его словам, к этому привели следующие решения: редактирование контекста на лету и отдельный инструмент памяти, который хранит рабочие заметки вне окна диалога. Также в списке контрольные точки автономного режима Claude Code с возможностью отката; более устойчивые циклы “план → действие → проверка” и улучшенные навыки “компьютерного пользования” (OSWorld — 61,4%), благодаря чему агент умеет восстанавливаться после мелких сбоев и продолжать сессию без человека. Плюс запуск в управляемых облаках (Amazon Bedrock, Google Vertex AI, Snowflake) с изоляцией окружения и наблюдаемостью — это делает длинные прогоны практичными в реальных компаниях

До Claude Sonnet 4.5 рекорд непрерывной работы составлял 7 часов. Именно такое время недавно заявляла OpenAI для своего GPT-5-Codex, а также аналогичную цифру получали в Anthropic на тестировании Claude Opus 4 в мае.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”