Институт Аллена запускает OLMoTrace: инструмент для отслеживания источников ответов языковых моделей в обучающих данных

Институт Аллена намерен декодировать поведение языковой модели с помощью своего нового инструмента OLMoTrace. Институт Аллена по искусственному интеллекту (Ai2) запустил OLMoTrace — новую функцию, которая позволяет исследователям отслеживать выходные данные языковой модели вплоть до их обучающих данных. В настоящее время инструмент доступен через Ai2 Playground и работает с несколькими моделями OLMo.

OLMoTrace стремится сделать операции с большими языковыми моделями более прозрачными. Пользователи могут определить, исходит ли ответ модели из запомненных знаний, творческих комбинаций или чистой галлюцинации. Ai2 утверждает, что этот подход может как продвинуть исследования, так и укрепить общественное доверие к генеративному AI, подкрепленное приверженностью команды полностью открытым моделям, наборам данных и исходному коду.

Инструмент ищет длинные уникальные последовательности слов, которые дословно встречаются в обучающих данных. Эти разделы выделяются разными цветами и ссылаются на соответствующие фрагменты документов на боковой панели. Пользователи могут щелкнуть любой текстовый отрывок или документ, чтобы сфокусировать просмотр, а цветовые вариации указывают на релевантность каждого совпадения.

Процесс выбора состоит из нескольких этапов. Во-первых, OLMoTrace учитывает только те последовательности слов, которые полностью появляются в обучающих данных без предложений или переносов строк. Затем он оценивает редкость токенов, чтобы выделить особенно конкретные отрывки. Для каждой последовательности слов отображается до десяти документов, а перекрывающиеся последовательности объединяются для поддержания чистоты отображения.

Примеры команды демонстрируют несколько практических приложений: в одном случае OLMoTrace показал, как неверная информация о пределе знаний модели исходила из примеров в данных тонкой настройки. В другом случае он показал, что математическое решение задачи было запомнено. Пользователи также могут проверить, исходят ли ответы из творческих комбинаций или общих знаний. Инструмент черпает данные обучения, содержащие приблизительно 4,6 триллиона токенов в пяти наборах данных.

Инструмент можно опробовать на игровой площадке Ai2.

Источник

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”