Вышла новая версия популярного ИИ Claude

Anthropic открыла общий доступ к Claude Opus 4.7 — следующему поколению своей флагманской линейки. Модель построена не как универсальный помощник, а как инструмент для длинных, многошаговых задач, где важна точность на каждом этапе.

Главный прорыв кроется в разработке программного обеспечения. На бенчмарке SWE-Bench Pro модель набрала на 11% больше, чем предшественник. Это не просто строчка в таблице: тестирование SWE-Bench имитирует реальные задачи из GitHub — баги, рефакторинг, написание тестов. Разница в 11% означает, что модель самостоятельно решает задачи, которые раньше требовали итерации с человеком.

Новый режим effort теперь включает уровень extra high — между «высоким» и «максимальным». Разработчик сам выбирает, насколько глубоко модель «думает» над задачей. В Claude Code уровень extra high стал значением по умолчанию для всех тарифов.

Opus 4.7 держит в памяти до 1 миллиона токенов — это примерно 750 000 слов, или несколько крупных романов разом. Максимальный ответ вырос до 128 000 токенов. На практике это значит, что можно загрузить весь проект, историю переписки и техническое задание — и модель при этом не потеряет нить.

Поддержка изображений теперь принимает файлы до 3,75 мегапикселя (длинная сторона — 2576 пикселей), что втрое больше, чем у Opus 4.6. Плотные скриншоты, схемы из финансовых отчетов, чертежи — модель читает детали, которые раньше терялись при сжатии.

В публичную бету вышли task budgets — механизм контроля токенов на протяжении длинного запуска. Разработчик задает лимит заранее, и модель сама распределяет ресурсы: не тратит половину контекста на простой вопрос в начале цепочки, оставляя запас для сложных шагов дальше.

В Claude Code появилась команда «ultrareview» — отдельная сессия, которая проходит по изменениям в коде и находит баги и архитектурные проблемы так, как это делал бы внимательный ревьюер. Пользователи Pro и Max получают три бесплатных ревью для теста.

Anthropic внедрила в Opus 4.7 автоматические фильтры, которые блокируют запросы с признаками запрещенного использования в сфере кибератак. Компания объясняет это подготовкой к более широкому релизу Mythos Preview — своей самой мощной, но пока закрытой модели. Специалисты по информационной безопасности могут получить расширенный доступ через программу Cyber Verification.

При переходе с Opus 4.6 токенов уйдет больше — от 0 до 35% в зависимости от типа контента: модель использует обновленный токенизатор и глубже рассуждает на высоких уровнях. Цены остались прежними: 5 долларов (примерно 380 рублей) за миллион входящих токенов и 25 долларов (примерно 1 900 рублей) за миллион исходящих. Модель доступна через API, Amazon Bedrock, Google Cloud Vertex AI и Microsoft Foundry.

Также стало известно, что OpenAI представила библиотеку с готовыми сценариями для Codex. Подробности в статье.

Источник: hi-tech.mail.ru

0 0 голоса

Рейтинг новости