Вышел Evo 2: ИИ генерирующий ДНК

А если быть точным: ДНК/РНК и белковые структуры. И не только генерирующий, но и умеющий анализировать геном, предсказывать мутации, etc.

Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.

Теперь ученые всего мира могут воспользоваться Evo 2 – новой мощной фундаментальной моделью, понимающей генетический код всех форм жизни (звучит очень громко, но это взято из официального анонса). Представленная сегодня ИИ-модель, которая заявляется как крупнейшая модель в открытом доступе для генетических данных, Evo 2 была разработана на платформе NVIDIA DGX Cloud в сотрудничестве с некоммерческим биомедицинским исследовательским институтом Arc Institute и Стэнфордским университетом. Evo 2 доступна для разработчиков по всему миру через платформу NVIDIA BioNeMo, включая NVIDIA NIM – микросервис для развертывания ИИ.

Обученная на массиве данных объемом почти 9 трлн нуклеотидов (строительных блоков ДНК и РНК), Evo 2 применяется в биомолекулярных исследованиях. Она способна:

предсказывать структуру и функцию белков на основе их генетической последовательности,

идентифицировать новые молекулы для медицины и промышленности,

анализировать влияние мутаций на функции генов.

Evo 2: Архитектура и параметры модели

Модель была обучена на 2 048 NVIDIA H100 GPUs на NVIDIA DGX Cloud.

Основные характеристики:

Данные для обучения: Все домены жизни + бактериофаги (9T нуклеотидов)

Параметры модели: 7B + 40B

Контекстное окно: до 1 048 576 токенов

Модальности: ДНК, РНК, белки

Безопасность: Исключены вирусы эукариот

Применение: Широкие кросс-видовые задачи, продвинутое биологическое моделирование

Прогнозирующие возможности Evo 2 превосходят специализированные модели в различных задачах:

Анализ влияния мутаций: модель достигает передовой точности (SotA) в предсказании функциональных эффектов мутаций у разных видов, включая человека, без дополнительного обучения (zero-shot).

Определение жизненно важных генов: объединяя молекулярную и системную биологию, выявляет ключевые гены в прокариотических и эукариотических геномах, что подтверждено экспериментальными данными.

Генеративные возможности: позволяет создавать сложные биологические системы, такие как геномы прокариот и эукариот, или механизм доступности хроматина. Это открывает новые возможности в биологическом моделировании с практическим применением.

Новая эра генеративной геномики

«Evo 2 – это важный шаг вперед в области генеративной геномики. Глубже понимая фундаментальные строительные блоки жизни, мы сможем разрабатывать решения для медицины и экологии, которые раньше казались невозможными.»

– Патрик Хсу, соучредитель Arc Institute, ведущий исследователь и доцент биоинженерии Калифорнийского университета в Беркли.

«Создание новых биологических систем традиционно требовало сложных, длительных и непредсказуемых процессов. С Evo 2 мы делаем биологический дизайн сложных систем доступнее, ускоряя процесс разработки новых решений в разы.»

– Брайан Хи, доцент химической инженерии в Стэнфорде и исследователь Arc Institute.

Применение в биомолекулярных науках

Evo 2 анализирует ДНК, РНК и белки. Модель обучена на множестве видов, включая растения, животных и бактерии, и применяется в медицине, агробиотехнологиях и материаловедении.

Она использует новую архитектуру, обрабатывая генетические последовательности длиной до 1 млн токенов. Это позволяет находить связи между удаленными участками генома и понимать механизмы работы клеток, экспрессии генов и заболеваний.

«Ген человека содержит тысячи нуклеотидов, и для его анализа ИИ-модель должна одновременно обрабатывать максимально длинные последовательности», – пояснил Хсу.

В медицине Evo 2 может помочь определять мутации, связанные с болезнями, и разрабатывать новые молекулы для их лечения. Например, в тестах с геном BRCA1, связанным с раком молочной железы, Evo 2 предсказала влияние ранее неизвестных мутаций с точностью 90%.

В сельском хозяйстве модель может помочь разрабатывать устойчивые к климату и более питательные сорта растений. В других сферах науки Evo 2 способна создавать биотопливо или белки, разлагающие пластик и нефть.

«Запуск Evo 2 – это как отправка мощного нового телескопа в глубины вселенной», – отметил Дэйв Берк, технический директор Arc, «Мы знаем, что перед нами безграничные возможности, но еще не представляем, какие открытия нас ждут.»

Ссылки

Детальный обзор в блоге NVidia

Детальный отчет Arc Institute

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии