ИИ, который не ждёт датасетов: MIT представляет SEAL — фреймворк для мгновенного самоапдейта

Лаборатории MIT выкатили фреймворк под названием Self‑Adapting Language Models (SEAL). Это не просто ещё один инструмент для тренировки моделей, SEAL позволяет ИИ… учиться самому у себя. Языковая модель, оснащённая SEAL, получает новую инфу, и, вместо того чтобы её проглотить и забыть, она запускает процесс саморедактирования.

Модель сама:

Реконструирует полученную информацию разными способами.

Генерирует на её основе свои собственные данные для дообучения (fine‑tuning).

Прописывает себе инструкции по оптимизации.

Применяет аугментацию данных и обновления на основе градиентов.

Затем, используя эти самоcгенерированные учебные материалы, модель применяет обучение с подкреплением (reinforcement iearning) — с помощью алгоритма ReST^{EM}, разработанного ребятами из Google DeepMind. Суть ReST^{EM} — в запуске множества циклов обучения и отборе лучшего результата. Иишник учится эффективно, отбирая топовые апдейты для себя.

А работает ли это на практике?

Команда MIT проверила SEAL на модели Qwen2.5-7B от Alibaba. Результаты — просто огонь. Изначально «голый» Qwen2.5-7B (красная линия на графике) отставал от матёрого GPT-4.1 (зелёная линия), но стоило применить SEAL и дать модели пройти всего два цикла самообучения — как она не просто догнала, а обошла GPT-4.1 по эффективности усвоения новых знаний.

Внедрение знаний из единичного источника. Красная линия (SEAL на Qwen2.5-7B) после 2 итераций поднимается выше зелёной (GPT-4.1)Но есть нюанс, куда же без него

Хотя кажется, что можно гонять самообучение бесконечно, в реальности начал проявляться эффект катастрофического забывания (catastrophic forgetting). Проще говоря, после многих циклов апдейта модель начинала забывать то, что знала раньше. Исследователи признают: нужен механизм, чтобы иишник не терял старые навыки, приобретая новые.

Ссылки:

Официальный пост и детали: Self‑Adapting Language Models (SEAL);

Статья на arXiv: 2506.10943 Self‑Adapting Language Models;

Исходники на GitHub: Continual‑Intelligence/SEAL.

Подписывайся на наш телеграм‑канал BotHub AI News, чтобы быть в курсе новостей из мира IT.

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”