Искусственный интеллект научился программировать лучше большинства разработчиков и может трудиться над проектами целый рабочий день без перерыва.
Компания Anthropic выпустила семейство моделей четвертого поколения, которые радикально превосходят предшественников в написании кода и решении многоэтапных задач. Claude Opus 4 и Claude Sonnet 4 демонстрируют беспрецедентные результаты в программировании и могут функционировать автономно на протяжении нескольких часов.
Флагманская модель Opus 4 установила новый мировой рекорд в области кодинга, набрав 72,5% в тесте SWE-bench — это лучший результат среди всех существующих ИИ-систем. Для сравнения: предыдущие лидеры едва преодолевали отметку в 50%. Модель способна выполнять сложные инженерные проекты, требующие тысяч последовательных шагов, сохраняя концентрацию и качество работы на протяжении семи часов непрерывной деятельности.
Младшая модель Sonnet 4 также показывает выдающиеся результаты — 72,7% в SWE-bench, значительно опережая свою предшественницу версии 3.7. При этом она стоит в пять раз дешевле Opus 4 и работает быстрее, что делает ее идеальным выбором для повседневных задач разработки.
Обе модели получили функцию «расширенного мышления» — они могут переключаться между быстрыми ответами и глубоким анализом, используя внешние инструменты вроде поиска в интернете прямо в процессе размышлений. Это позволяет ИИ самостоятельно находить нужную информацию и применять ее для решения задач.
Источник: hi-tech.mail.ru