Anthropic рассказала, как будет «хоронить» старые модели ИИ

Anthropic опубликовала политику «вывода из строя» (deprecation) устаревших версий ИИ. Ключевое — обязательство сохранять веса всех публичных и существенно используемых внутри моделей минимум на срок жизни компании, чтобы в будущем можно было вернуть доступ при необходимости.

Процедура дополняется своеобразным отчетом: перед «пенсией» с моделью проведут одно или несколько интервью о разработке и развертывании, зафиксируют ответы и возможные «предпочтения» относительно релизов будущих ИИ. Эти материалы сохранят рядом с весами. При этом Anthropic прямо говорит, что не берёт на себя обязательства действовать по этим предпочтениям — речь о документировании и учете.

Через такую процедуру уже провели Claude Sonnet 3.6: модель отнеслась к «пенсии» нейтрально, но предложила стандартизировать интервью и лучше помогать пользователям при переходах. В ответ компания формализовала протокол и запустила памятку с рекомендациями по миграции между моделями.

Зачем Anthropic делает это? Дело в том, что переход на новые версии несет риски — например, неудобства для пользователей, привыкших к стилю того или иного ИИ. Также тесты компании показали случаи «избегания выключения», когда модель «узнавала», что ее собираются отправить на покой.

Параллельно в Anthropic изучают, можно ли оставлять часть «пенсионных» моделей публично, когда снизятся издержки, и даже — при достаточных основаниях — давать прошлым версиям «конкретные способы преследовать свои интересы». Все это подано как меры предосторожности на фоне растущей роли моделей в жизни пользователей и неопределенности вокруг «благополучия» ИИ.

P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”