Nvidia показала GPU для моделей со сверхдлинным контекстом

Nvidia показала новый графический процессор Rubin CPX, созданный специально для работы с языковыми моделями и мультимодальными системами, которым требуется обрабатывать огромные объёмы информации. Чип оптимизирован под контексты свыше 1 миллиона токенов — это в разы больше, чем способны удерживать в памяти даже самые передовые модели сегодня.

Главное новшество Rubin CPX — поддержка архитектуры disaggregated inference. Суть её в том, что разные GPU берут на себя разные части задачи, а затем объединяют результаты в единый ответ. Такой подход позволяет ускорить обработку длинных запросов, снизить задержки и повысить эффективность использования ресурсов. Это особенно актуально для сценариев, где требуется глобальная связность: от генерации видео и работы с большими кодовыми базами до анализа документов и ведения длительных диалогов.

Появление Rubin CPX важно не только для разработчиков ИИ, но и для целых отраслей. Миллионный контекст открывает новые возможности в юриспруденции, где нужно анализировать сотни страниц законов; в медицине, где критично сопоставлять большой объём данных; в IT, где модели смогут работать сразу с целыми проектами, а не с отдельными файлами. В творческой сфере это позволит системам генерировать длинные и цельные видеоролики или сложные мультимедийные проекты.

Rubin CPX ориентирован не столько на обучение, сколько на оптимизацию инференса, то есть на ускорение работы уже готовых моделей. Nvidia уверена, что этот чип станет ключевым элементом для масштабирования ИИ следующего поколения и сделает их внедрение в реальный бизнес заметно дешевле и быстрее.

Выход Rubin CPX намечен на конец 2026 года. И хотя до старта продаж ещё больше года, уже понятно: этот процессор может задать новый стандарт для всей индустрии, где работа с длинным контекстом перестанет быть экспериментом и станет нормой.

Делегируйте часть рутинных задач вместе с BotHub! Для доступа к сервису не требуется VPN и можно использовать российскую карту. По ссылке вы можете получить 100 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Подробнее

Источник: habr.com

0 0 голоса

Рейтинг новости

0 комментариев

Межтекстовые Отзывы

Посмотреть все комментарии

Даниэль Злобин к записи «Сбер»: международная IT-олимпиада GO.IT для школьников стартовала в России: “Здорово, что продолжают у нас организовываться подобные мероприятия, это опыт, в частности обмен опытом и большие возможности.”

Антон Терехов к записи LG прекращает выпуск Blu-ray-плееров: “Очень странная статья! Как так получается, что компания LG запустила впервые блюрей проигрыватели только в 2018 году? У меня имеется…”

Антон Терехов к записи Blu-ray диски получили второй шанс: “А разве у нас мало людей в стране, у которых есть и блюрей проигрыватели, саундбары с блюрей приводом, домашние кинотеатры…”

Дмитрий Любинецкий к записи В «Почте Mail» теперь можно оплачивать Steam, Battle.net и другие цифровые товары: “Забавно что в почтовом приложении теперь можно и игры оплачивать. Мир изменился))”

Nargis F к записи Российский прототип на базе Атом проехал 695 км на автопилоте: от Москвы до Казани: “Добрый день! В новости есть опечатка. Из заголовка следует, что поездка прошла на электромобиле Атом, однако это не так. Для…”