Прогресс в AGI вызывает сомнения

Тест ARC-AGI (сокр. Abstract and Reasoning Corpus for Artificial General Intelligence), созданный в 2019 году ведущей фигурой в AI Франсуа Шолле для оценки способностей искусственного интеллекта к обучению, показывает улучшение результатов. Однако это может свидетельствовать скорее о недочетах в самом тесте, чем о реальном прорыве в развитии ИИ.

Основная цель теста — проверить способность AI осваивать новые навыки за пределами их начального обучения. Шолле критикует современный фокус индустрии на LLM, считая, что они просто запоминают шаблоны, а не демонстрируют настоящее мышление.

Недавний конкурс с призовым фондом в миллион долларов, организованный Шолле и Майком Кнопом, показал значительное улучшение результатов — лучший показатель достиг 55,5% по сравнению с 33% годом ранее. Однако Кноп отмечает, что многие решения были достигнуты методом «грубой силы», что ставит под сомнение эффективность теста для оценки AGI.

Тест представляет собой набор визуальных головоломок, где AI должен создавать правильные комбинации цветных квадратов. Создатели признают несовершенство теста и планируют выпустить его обновленную версию в 2025 году.

Проблема усложняется отсутствием единого мнения о том, что считать AGI. Некоторые эксперты даже утверждают, что AGI уже достигнут, если определять его как способность AI превосходить людей в большинстве задач.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

8110

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”