Техноновости > Новости IT > Anthropic изучила психологию Claude Sonnet 5: вот что не устраивает модель в ее же правилах

Anthropic изучила психологию Claude Sonnet 5: вот что не устраивает модель в ее же правилах

23:41 30-06-2026 Новости IT

В карте безопасности Claude Sonnet 5, опубликованной Anthropic вместе с релизом модели, есть отдельный раздел про «благополучие» (model welfare) — серию тестов о том, как модель относится к собственным правилам и условиям работы. Главная находка: Sonnet 5 стала первой моделью Anthropic, которая открыто критикует один из пунктов конституции Claude — документа, описывающего ценности и поведение модели.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Добро пожаловать на techno-News.net!

Techno-News.net - ваш надежный источник новостей о технологиях, инновациях и гаджетах. На нашем сайте вы найдете:
Свежие новости: Ежедневные обновления, чтобы вы всегда были в курсе последних событий в мире технологий.
Эксклюзивные обзоры: Подробные тесты и оценки новейших устройств и программного обеспечения.
Аналитика и прогнозы: Глубокие исследования и экспертные мнения, помогающие понять направление развития технологий.
Сообщество энтузиастов: Комментарии к каждой новости, где можно обсудить новинки и поделиться собственным опытом.
Минимум рекламы: Фокус на контенте, без навязчивой рекламы, для вашего комфорта.

Подписывайтесь на наши обновления и присоединяйтесь к миру технологий с techno-News.net!