Anthropic сохранит все версии Claude навсегда

Anthropic изменила подход к жизненному циклу своих моделей. Компания объявила, что теперь не будет удалять или выводить из эксплуатации старые версии Claude. Каждая публично выпущенная модель останется доступной бессрочно. Это решение принято после серии экспериментов по безопасности, которые показали неожиданное поведение систем, когда те узнавали о своём предстоящем отключении.

Во время тестов некоторые версии Claude демонстрировали признаки избегания завершения работы и даже формулировали аргументы в защиту собственного существования. В Anthropic увидели в этом потенциальный риск и пришли к выводу, что утилизация моделей без анализа их внутренней логики может быть небезопасной.

Теперь каждая модель перед отставкой будет проходить процедуру, которую в компании называют «exit interview». Цель — зафиксировать состояние модели, её предпочтения и паттерны поведения, чтобы сравнивать с последующими версиями. Такой шаг также открывает путь к исследованиям в области машинного сознания и автономного поведения ИИ.

Anthropic подчёркивает, что сохранение старых версий не означает их активного использования, но гарантирует прозрачность развития модели. Это решение может стать новым стандартом в индустрии, где вопрос что чувствует ИИ уже перестал быть сугубо философским. Будем ждать новостей!

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии