Anthropic сохранит все версии Claude навсегда

Anthropic изменила подход к жизненному циклу своих моделей. Компания объявила, что теперь не будет удалять или выводить из эксплуатации старые версии Claude. Каждая публично выпущенная модель останется доступной бессрочно. Это решение принято после серии экспериментов по безопасности, которые показали неожиданное поведение систем, когда те узнавали о своём предстоящем отключении.

Во время тестов некоторые версии Claude демонстрировали признаки избегания завершения работы и даже формулировали аргументы в защиту собственного существования. В Anthropic увидели в этом потенциальный риск и пришли к выводу, что утилизация моделей без анализа их внутренней логики может быть небезопасной.

Теперь каждая модель перед отставкой будет проходить процедуру, которую в компании называют «exit interview». Цель — зафиксировать состояние модели, её предпочтения и паттерны поведения, чтобы сравнивать с последующими версиями. Такой шаг также открывает путь к исследованиям в области машинного сознания и автономного поведения ИИ.

Anthropic подчёркивает, что сохранение старых версий не означает их активного использования, но гарантирует прозрачность развития модели. Это решение может стать новым стандартом в индустрии, где вопрос что чувствует ИИ уже перестал быть сугубо философским. Будем ждать новостей!

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”