К2Тех создал вычислительный кластер для крупной машиностроительной компании

К2Тех совместно с К2 НейроТех реализовали комплексный проект «под ключ» для крупной машиностроительной компании: спроектировали и построили высокопроизводительный кластер и обеспечили бесперебойную работу вычислительного оборудования за счет тонко настроенных инженерных систем.

Заказчику требовалось создать безопасную и надежную ИТ-инфраструктуру для выполнения расчетных конструкторских задач в сфере проектирования. Предыдущий вычислительный кластер, находившийся в эксплуатации, устарел и значительно уступал в производительности и функциональности современному оборудованию. 

Эксперты К2 НейроТех создали новый HPC-кластер на базе двухпроцессорных серверов и внедрили систему параллельного хранения дисков для достижения высокой плотности хранения данных. Использование СХД на базе открытого ПО Сeph, с полезным объемом более 600 ТБ позволило реализовать многоуровневое хранение данных и оптимизировать кэширование. Команда К2 НейроТех интегрировала имеющееся у заказчика расчетное ПО с программной инфраструктурой кластера. 

Святослав Смирнов, руководитель подразделения К2 НейроТех отметил: «По итогам проекта заказчик получил новый вычислительный кластер, который в 3-4 раза превосходит по мощности предыдущий в расчете на вычислительный узел. Перед нашей командой стояли амбициозные задачи: повысить производительность системы, без простоев в работе интегрировать существующий кластер и созданный, заменить устаревшие проприетарные решения на новые и обеспечить их совместимость с ИТ-системами. Нам удалось создать единое пространство, которое позволит качественно и с меньшими временными затратами осуществлять сложные расчеты при проектировании агрегатов».

Инженеры К2Тех разработали и запустили системы экстренного корректного отключения и автоматического включения оборудования, а также внедрили комплексную систему мониторинга для ИТ и инженерной инфраструктуры.

Для непрерывной работы вычислительного оборудования специалисты К2Тех с нуля оборудовали помещение инженерными системами: системой бесперебойного энергоснабжения (СБЭ), автоматической установкой газового пожаротушения (АУГП) для обнаружения возгорания и оперативного тушения, системой кондиционирования технологических помещений (СКТП), монтажными конструктивами для размещения серверов и системой кабельных каналов для организации слаботочных и силовых коммуникаций инфраструктуры кластера. 

Установленные источники бесперебойного питания способны обеспечить получасовую автономную работу при полном отключении электроснабжения. На случай более длительных перебоев инженеры К2Тех настроили систему корректного отключения и последовательного ввода оборудования в рабочее состояние при возобновлении питания.

СКТП обеспечивает оптимальные условия эксплуатации в широком диапазоне вычислительных нагрузок. Для этого специалисты К2Тех применили схему с изолированным горячим коридором и «открытым» холодным. Такая концепция позволяет использовать объем помещения как буфер, чтобы система кондиционирования успела отреагировать на резкий рост нагрузки на кластер. 

Сергей Махлин, руководитель центра экспертизы по ЦОД К2Тех подчеркнул: «Поскольку серверы задействуют до 100% вычислительных мощностей, разница в тепловыделении кластера при максимальной загрузке и в режиме простоя достигает 400% – подобный разброс затрудняет стабильную работу кондиционеров. Мы изучили спектр нагрузок и произвели тонкую настройку параметров, чтобы СКТП работала в штатном режиме без лишних переключений во всем диапазоне вычислительной нагрузки. Это позволит увеличить ресурс эксплуатации оборудования заказчика».

Источник: habr.com

0 0 голоса
Рейтинг новости
1
0
Подписаться
Уведомить о
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии