Исследователи из Shanghai Jiao Tong, Zhejiang University и других ведущих вузов Китая представили MemOS: Memory OS for AI System — первую в своём роде ОС для управления памятью моделей ИИ. Заявлено, что MemOS призвана устранить фундаментальное ограничение, мешающее ИИ-моделям стать ещё более похожим на человеческий мозг и повысить способность к обучению на основе опыта.
Система MemOS рассматривает память как ключевой вычислительный ресурс, управляемый аналогично ЦП и хранилищу в классических ОС. Исследование, опубликованное 4 июля на arXiv, демонстрирует значительный прирост производительности по сравнению с существующими подходами — включая 159% улучшение в задачах временного (temporal) рассуждения по сравнению с системами памяти OpenAI.
Современные ИИ сталкиваются с проблемой «изолированной памяти» — архитектурным ограничением, которое мешает им поддерживать связные, долгосрочные отношения с пользователями. Каждая сессия начинается с чистого листа: модели не способны запоминать предпочтения, накопленные знания или поведенческие шаблоны между взаимодействиями. Это ухудшает пользовательский опыт — например, ИИ может забыть о диетических ограничениях пользователя, озвученных ранее, при следующем запросе рекомендаций по ресторанам. Это особенно заметно в корпоративных сценариях, где от ИИ требуется сохранять контекст в сложных процессах, длящихся неделями.
Некоторые решения вроде генерации с дополнением через извлечение (RAG) пытаются компенсировать это, подтягивая внешнюю информацию во время сессии. Однако исследователи считают, что такие методы остаются неэффективными костылями. Проблема не в извлечении информации — речь о создании систем, способных действительно учиться и эволюционировать на опыте, подобно человеческой памяти.
Новая система обеспечивает резкий рост качества рассуждений
MemOS предлагает принципиально иной подход с использованием так называемых «MemCubes» — стандартизированных блоков памяти, способных содержать различные типы информации, мигрировать, объединяться и развиваться. Они охватывают как текстовые знания, так и адаптации параметров и состояния активации внутри модели, создавая единый каркас управления памятью — чего раньше не существовало.
При тестировании на бенчмарке LOCOMO, оценивающем задачи, требующие памяти, MemOS последовательно обошёл все существующие методы. Система показала улучшение в 38.98% по сравнению с реализацией памяти от OpenAI, особенно в задачах сложного логического рассуждения, где нужно соединять информацию из разных частей диалога.
Кроме того, система показала до 94% снижения задержки (время до первого токена) благодаря новому механизму внедрения памяти KV‑cache.
Эти достижения свидетельствуют о том, что узкое место — память — было более значимым ограничением, чем предполагалось ранее. Относясь к памяти как к вычислительному ресурсу, MemOS добавляет способности к рассуждению, ранее «сдерживаемые» архитектурой.
Архитектура в стиле ОС с тремя уровнями
Архитектура MemOS вдохновлена классическими ОС: три уровня — интерфейсный (API), операционный (планирование и управление памятью), инфраструктурный (хранение и управление доступом).
Основной компонент — MemScheduler — динамически управляет временной и постоянной памятью, выбирая стратегии хранения и извлечения в зависимости от задач и паттернов использования. Это резко отличается от современных подходов, где память либо статична (в параметрах модели), либо эфемерна (в рамках текущего контекста).
Фокус смещается с вопроса, сколько модель знает, к тому, может ли она превратить опыт в структурированную память и воспроизводить его многократно. Это предпосылка к архитектурной перестройке ИИ — от предобучения к обучению на опыте.
Команда опубликовала код MemOS на GitHub, предусмотрев интеграцию в HuggingFace, OpenAI и Ollama. На данный момент MemOS поддерживает Linux, но планируется добавление Windows и macOS.
Спасибо за внимание, ваш Cloud4Y. Читайте нас здесь или в Telegram‑канале!
Источник: habr.com