Уже через неделю, 25 апреля, мы соберемся в конгресс‑центре Ленполиграфмаш на одиннадцатой конференции BigMonitoringMeetup, посвященной технологиям мониторинга — разработке, настройке и эксплуатации. Сообщество Monhouse приглашает всех, кто пользуется мониторингами, от инженеров, до IT директоров, вход свободный, но лучше заранее зарегистрироваться. Онлайн отрансляция будет доступна на Youtube.
🔹 Бесплатная регистрация на конференцию Big Monitoring Meetup 11
[ ПРОГРАММА ]
10:30 — Начало регистрации и приветственный кофе
11:00 — Открытие конференции
11:10 — Дмитрий Соловьев [ Нота. Холдинг Т1 ]: «Ранее предупреждение сбоев в бизнес‑сервисах»
С увеличением количества бизнес‑сервисов и роста нагрузки особенно актуальным становится ранее автоматическое предупреждение о возможных сбоях. В идеале требуется на основе анализа исторических данных по эксплуатации сервисов прогнозировать наступление инцидентов и аварий. Для решения такой задачи предназначен инструмент Платформы производства Сфера — Интеллектуальный анализ событий. С использованием адаптивных алгоритмов выявления аномалий в метриках работы бизнес‑сервисов инструмент предупредит о возможных сбоях и предоставит важную диагностическую информацию. При этом динамические пороги внимания формируются с учетом трендов, сезонности, производственных календарей, а гибкие правила алертинга позволяют снизить шум за счет выбора зоны и длительности аномалий. В ходе сессии будут рассмотрены возможности и перспективы развития продукта, а также подходы к выявлению аномалий в работе бизнес‑сервисов, не требующие экспертной настройки и разработанные на основе анализа более 150 тысяч метрик за 3 года.
12:00 — Владимир Гурьянов [ Флант ]: «Вчера было много метрик, но по пять, а сегодня мало — но по три»
Часто считается, что Prometheus чрезмерно потребляет ресурсы. Однако проблема часто кроется не в самом Prometheus, а в способе использования метрик. Многие неправильно используют метрики, пытаясь включить в них излишнюю информацию, например, полные URL и данные user‑agent. Это приводит к неоправданному расходу ресурсов. Ключевой вопрос — как сохранить баланс между детальностью метрик и эффективностью мониторинга? Мой доклад сфокусирован на методах оптимизации хранения данных в Prometheus и лучших практиках Observability для разрешения этого парадокса. Мы рассмотрим, как работает база данных временных рядов (TSDB) и как выбор метрик влияет на ресурсоемкость. Также будут представлены инструменты и подходы для повышения эффективности Prometheus. Во второй части доклада я поделюсь обзором общих методов Observability, обсудив различные типы данных, помимо метрик. Вы узнаете, какие данные стоит собирать и как они помогают в диагностике инцидентов. По окончании доклада у вас будет полное представление о создании сбалансированной системы мониторинга с использованием Prometheus.
12:50 — Обед. Время для пиццы!
13:40 — Александр Калошин [ Last.Backend/3L Group ]: «Мониторинг в стартапах и небольших проектах — миф или всё таки реальность?»
Все мы на конференциях слышим как гиганты нашей отрасли находят решения как оптимизировать мониторинг и как принимать миллиарды алертов и метрик в наносекунду, но что делать когда у тебя и команда небольшая и ресурсов всего чуть чуть, а хочется SLA в 99,995%. Мой доклад расчитан на такие проекты и команды и посвящен минимальному мониторингу который необходим проектам такого уровня. Отсечем лишнее и оставим только необходимое.. Поговорим про стек и реагирование и по‑экономим денежки
14:20 — Константин Климчев [ SAYMON ]: «Раскрываем сетевые секреты c Netscan»
Что такое Netscan и как помогает сетевым инженерам в обнаружении, определении оборудования, мониторинге и построении топологии. Пройдем по методам обнаружения и какую помощь при этом оказывает шаблонизация.
15:00 — Антон Жбанков [ BeerPanda ]: «Мониторинг. Контр‑интуитивный подход»
Архитектор по вычислительной инфраструктуре, автор техноблога «BeerPanda. Органично недоразвитый DevOps»
Операционный мониторинг и бенчмаркинг на самом деле имеют много общего. И то и другое делается зачастую не с того конца и измеряется не то, что нужно. Оба проекта зачастую контр интуитивны и требуют серьезного проектирования. «Ну я поставил прометеус и графану» часто даже хуже, чем ничего. Потому что это не мониторинг, а его иллюзия. И да, SLA не то чем кажется.
15:40 — Вечерний кофе
16:20 — Дмитрий Хандыго [ Inline Technologies ]: «Дискаверинг и мониторинг сетевого оборудования в системе мониторинга Saymon»
Реализация дискаверинга сетевого оборудования, автоматическая настройка объектов мониторинга
Реализация сбора данных с оборудования, настройка в рамках интерфейса системы мониторинга Saymon: сбора данных по протоколу SNMP сбора данных с использованием запросов к api
17:00 — BMM Talks: Мониторинг больших данных.Андрей Синицын:
Happy Devops, ex‑VK, ex‑Lazada, SRE TeamLead. DevOps‑infected, профессионал эксплуатации, поклонник больших систем и высоких нагрузок. Фанат автоматизации и правильных SRE‑практик. В индустрии с 2003 года.
Андрей Сухоруков:
Антикризисный DevOps Team Lead, Лаборатория Касперского, специалист по кризисным проектам, поклонник вменяемых систем в автоматизации и процессах. Знает, как сделать из хаоса в конфетку с запахом. В индустрии с 2013 года. Соавтор Секретной Службы его величества DevOps
Обсудим, сколько можно потратить денег просто так, стоит ли свободное ПО столько, чтобы писать свое и как не сломать ногу об эти метрики:
Мониторинг, как бездонная бочка данных для данных
Сколько стоит и как правильно тратить
Свободное ПО или собственный очередной кровавый энтерпрайз
Предиктивная аналитика мониторинга- старая песня про сокращение труда (и отключение мозга)
Приглашаем всех присоединяться к беседе, можно заранее подготовить свои истории или вопросы.
19:00 — Afterparty в баре
[ КАК ДОБРАТЬСЯ ]
Конгресс‑центр ЛПМ, пр. Медиков 3, лит А «К». М. Петроградская
Схема проезда/прохода
Остались вопросы? Задавайте в нашем телеграм чате: https://t.me/monhouse_tech
Источник: habr.com