Nvidia показала новый графический процессор Rubin CPX, созданный специально для работы с языковыми моделями и мультимодальными системами, которым требуется обрабатывать огромные объёмы информации. Чип оптимизирован под контексты свыше 1 миллиона токенов — это в разы больше, чем способны удерживать в памяти даже самые передовые модели сегодня.
Главное новшество Rubin CPX — поддержка архитектуры disaggregated inference. Суть её в том, что разные GPU берут на себя разные части задачи, а затем объединяют результаты в единый ответ. Такой подход позволяет ускорить обработку длинных запросов, снизить задержки и повысить эффективность использования ресурсов. Это особенно актуально для сценариев, где требуется глобальная связность: от генерации видео и работы с большими кодовыми базами до анализа документов и ведения длительных диалогов.
Появление Rubin CPX важно не только для разработчиков ИИ, но и для целых отраслей. Миллионный контекст открывает новые возможности в юриспруденции, где нужно анализировать сотни страниц законов; в медицине, где критично сопоставлять большой объём данных; в IT, где модели смогут работать сразу с целыми проектами, а не с отдельными файлами. В творческой сфере это позволит системам генерировать длинные и цельные видеоролики или сложные мультимедийные проекты.
Rubin CPX ориентирован не столько на обучение, сколько на оптимизацию инференса, то есть на ускорение работы уже готовых моделей. Nvidia уверена, что этот чип станет ключевым элементом для масштабирования ИИ следующего поколения и сделает их внедрение в реальный бизнес заметно дешевле и быстрее.
Выход Rubin CPX намечен на конец 2026 года. И хотя до старта продаж ещё больше года, уже понятно: этот процессор может задать новый стандарт для всей индустрии, где работа с длинным контекстом перестанет быть экспериментом и станет нормой.
Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!
Подробнее
Источник: habr.com