IBM выпустила мэйнфрейм для эпохи ИИ

IBM выпускает последнюю версию мэйнфрейма z17, включающую обновления для ускорения внедрения ИИ. Этот полностью зашифрованный мэйнфрейм работает на процессоре IBM Telum II и предназначен для более чем 250 вариантов использования ИИ, включая агентов и генеративный искусственный интеллект.

Центр ИИ-ускорителей новой системы были задуманы и совместно разработаны в IBM Research: это встроенное ядро ​​ИИ-ускорителя процессора Telum II и ускоритель Spyre, который будет доступен в четвёртом квартале 2025 года.

Чипы IBM Telum II (слева) и Spyre (справа)

Для z17 32-ядерный ускоритель Spyre будет доступен в качестве дополнительной карты PCIe, и при необходимости можно будет добавлять другие карты. Spyre использует низкоточные вычисления и архитектуру, ориентированную на ИИ, для вывода с малой задержкой.

Telum II и Spyre достигают своих возможностей вывода ИИ посредством совместного проектирования программного и аппаратного обеспечения. В основе z17 лежит целый программный стек. В ходе ранних испытаний прототип Spyre обрабатывал в три раза больше изображений в секунду на ватт потребляемой электроэнергии, чем высокопроизводительные графические процессоры.

«Мы создали комплексный ускоритель. Это чип-система на кристалле, карта PCIe, компилятор, среда выполнения и драйвер устройства — и так далее», — говорит Джефф Бёрнс, директор центра оборудования ИИ IBM Research. По его словам, эти функции позволяют специалистам по работе с данными использовать Spyre, не делая ничего особенного.

В настоящее время мэйнфреймы используют 71% компаний из списка Fortune 500. По оценкам консалтинговой фирмы Market Research Future, в 2024 году этот рынок оценивался в $5,3 млрд.

z17 может обрабатывать 450 млрд операций вывода в день, что на 50% больше, чем у его предшественника z16, выпущенного в 2022 году и работавшего на оригинальном процессоре Tellum. Система разработана для полной интеграции с другим оборудованием, программным обеспечением и инструментами с открытым исходным кодом.

Вице-президент по управлению продуктами и дизайну IBM Тина Тарквинио рассказала TechCrunch, что модернизация мэйнфрейма длится уже пять лет и началась задолго до нынешнего ажиотажа вокруг ИИ.

Исследователи IBM работали более 2000 часов, чтобы собрать отзывы от более чем 100 клиентов. «Было дико знать, что мы представляем ускоритель ИИ, а затем видеть, особенно во второй половине 2022 года, все изменения в отрасли в отношении ИИ», — сказала Тарквинио. 

По её словам, z17 настроен на адаптацию к тому, куда движется рынок ИИ. Мейнфрейм будет поддерживать 48 чипов IBM Spyre AI accelerator после выпуска, и в течение 12 месяцев планируется довести это число до 96.

«Мы намеренно наращиваем запас мощности и намеренно наращиваем гибкость ИИ. Поэтому по мере появления новых моделей следим за тем, чтобы у нас был запас мощности для более крупных моделей — которым, возможно, потребуется больше локальной памяти для взаимодействия друг с другом. Мы встроили эту возможность, потому что знаем, что подход действительно изменится. Новые модели будут приходить и уходить», — говорит Таркинио.

z17 более энергоэффективен, чем его предшественник и, предположительно, конкуренты. «На чипе мы увеличиваем ускорение ИИ в семь с половиной раз, но тратится в пять с половиной раз меньше энергии, чем потребовалось бы, например, для мультимоделирования на другом типе ускорителя или платформы в отрасли», — отмечает Тарквинио.

Мейнфреймы z17 поступят в продажу 8 июня.

В 2022 году IBM продемонстрировала z16, который был спроектирован на базе микрочипа Telum. Процессор был оптимизирован для обработки 300 млрд финансовых транзакций в сутки. z16 устойчив к квантовым компьютерам, способным взламывать шифрование, благодаря криптографической решётке и аппаратному модулю безопасности Crypto Express 8S (CEX8S).

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии