Техноновости > Новости IT > С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках из-за новых фильтров

С 86 до 26 баллов в отладке кода: Claude Fable 5 обвалилась в бенчмарках из-за новых фильтров

16:41 02-07-2026 Новости IT

Команда BridgeMind перепрогнала вернувшуюся Claude Fable 5 на своем бенчмарке BridgeBench — и июльская версия модели показала результаты в разы хуже июньских. В отладке кода Fable 5 упала с 86,2 до 25,9 балла, опустившись с 9-го на 41-е место рейтинга. В рефакторинге результат снизился с 73,6 до 38,4, в тесте на устойчивость к галлюцинациям при анализе кода — с 75,9 до 61,7. «Это не та модель, которую банили. Anthropic должна объясниться», — написали авторы бенчмарка.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Добро пожаловать на techno-News.net!

Techno-News.net - ваш надежный источник новостей о технологиях, инновациях и гаджетах. На нашем сайте вы найдете:
Свежие новости: Ежедневные обновления, чтобы вы всегда были в курсе последних событий в мире технологий.
Эксклюзивные обзоры: Подробные тесты и оценки новейших устройств и программного обеспечения.
Аналитика и прогнозы: Глубокие исследования и экспертные мнения, помогающие понять направление развития технологий.
Сообщество энтузиастов: Комментарии к каждой новости, где можно обсудить новинки и поделиться собственным опытом.
Минимум рекламы: Фокус на контенте, без навязчивой рекламы, для вашего комфорта.

Подписывайтесь на наши обновления и присоединяйтесь к миру технологий с techno-News.net!