BIG MONITORING MEETUP — конференция, посвященная технологиям мониторинга, настройке и эксплуатации, объединяет SRE, DevOps-инженеров, системных администраторов, IT-директоров, руководителей отделов разработки и других IT-специалистов. Доступно оффлайн и онлайн участие.
➤ Бесплатная регистрация: https://monhouse.tech/big-monitoring-meetup13/
ПРОГРАММА
10:30 — Начало регистрации участников на BMM 13, БЦ “Калибр”, Москва, ул. Годовикова, дом 9, стр. 17
11:00 — Открытие тринадцатой конференции по мониторингу. Приветственное слово от организаторов сообщества
11:10 — Как система визуализации помогла нам одновременно решить три ключевые задачи в управлении ИТ-инфраструктурой: инвентаризацию, анализ мощностей и мониторинг.В докладе мы расскажем на реальном примере, как настраивать такие системы как Графана или Графиня, чтобы они эффективно помогали ИТ-руководителям и инженерам в их повседневных задачах связанных с управлением ИТ-инфраструктурой.
Докладчик: Дмитрий Унтила. Руководитель продукта «Пульт», «Лаборатория Числитель»12:00 — Жизненные ��иклы и машины состояний. Докладчик: Константин Михайлов, Генеральный директор SAYMON.
14:00 — DCIM для тех, кому лень читать мануал. Все мы знаем, что классические DCIM-системы — это как ERP для ЦОДов: тяжело, долго и только для “взрослых”. А если у тебя — небольшая площадка, филиал или серверная на краю географии?Мы решили, что с этим надо что-то делать — и сделали. Расскажу, как из кучи заявок “а можно что-то попроще?” родился Smart Site: компактный, злой и адекватный мониторинг для небольших объектов.Покажу, как мы отказались от лишнего, на что сделали ставку, чем он реально полезен и почему его можно поставить за день, а не за квартал.
Докладчик: Константин Струлев. Ранее работал директором по эксплуатации в сотовом операторе, в эксплуатации дата-центров, в текущий момент директор компании ЦОДУМ14:50 — Эволюция культуры инцидент-менеджмента: от реактивного реагирования к проактивной инженерии надежности.
Каждый инцидент — это не сбой, а бесплатная лаборатория по изучению собственной надежности. Расскажу, как SRE-команды превращают проблемы в конкурентные преимущества. 40% команд до сих пор работают в режиме “тушения пожаров” — покажу путь к проактивной инженерии надежности. Chaos Engineering, Error Budget и автоматизация: от теории к практике.
Докладчик: Кирилл Борисов. VK. В IТ более 13 лет. SRE. Ночной траблшутер, чиню проблемы по фотографии. Инцидент-менеджер и лучший друг SLO/SLA/SLI. Планировал и развертывал инфраструктуру для крупных проектов с нуля. Превышенное наличие DevOps в крови. Лучший друг — мониторинг. Спикер конференций и автор курсов в Слерме.16:20 — DR большого кластера Zabbix — как сделать и с чем вы столкнетесь.В докладе мы расскажем можно ли построить отказоустойчивый кластер Zabbix в катастрофоустойчивой конфигурации для большой инсталляции. C какими проблемами при этом придется столкнуться и какие есть пути их решения.
Докладчик: Волотов Михаил. Директор центра компетенций мониторинга. Инфосистемы Джет17:10 — Дорожная карта внедрения SRE-практик в большой компанииЧто происходит с надёжностью, когда компания с богатой историей начинает продуктовую трансформацию? Как не уронить доступность сервисов банка в условиях перемен? Как изменить инженерную культуру и стать прозрачными для бизнеса? Как внедрить SRE-подходы, не раздувая бюджет? Мы поделимся своим опытом и инсайтами, опишем сценарии внедрения практик надёжности.
Докладчики: Максим Емельянов. Начальник управления поддержки информационных систем. Дмитрий Стюков. Руководитель дирекции надёжности и автоматизации ИТ — процессов. Уралсиб
➤ Бесплатная регистрация: https://monhouse.tech/big-monitoring-meetup13/
Источник: habr.com