17 и 18 сентября 2024 года в Москве прошла ежегодная конференция, посвященная управлению данными – DataTalks.
На одной площадке собрались ведущие специалисты в сфере управления данными из России, главные директора по данным (CDO) крупнейших компаний, а также представители бизнеса.
На конференции выступили эксперты из Ростелекома, Т2, представители банка ВТБ, Московского кредитного банка, ЕВРАЗа, Wildberries, X5 Retail Group, Альфа-Банка, МТС, Бургер Кинг и других компаний представили свои доклады, освещая ключевые тренды и решения, актуальные для индустрии.
Материалы конференции уже доступны в открытом доступе на сайте, а также в каналах конференции на Rutube и в Telegram. В этой новости мы поделимся краткими выжимками докладов, которые показались нам наиболее интересными.
Материалы конференции на сайте, а также в каналах конференции на Rutube и в Telegram
Первый день был посвящен бизнес-проблематике по работе с данными и искусственным интеллектом и проходил в очном формате, что позволило обсудить подходы по работе с данными и ИИ в различных индустриях и обменяться опытом в этой области.
Михаил Комаров, Директор по развитию бизнеса в области работы с данными дата-кластера Ростелекома рассказал о роли дата-кластера в цифровой трансформации:
Управление данными становится основополагающим элементом цифровой трансформации, где успешные организации используют дата-кластеры для повышения эффективности и безопасности своих операций. Технологические решения TData и IQMen, помогают бизнесу оптимизировать работу с данными и становятся неотъемлемыми инструментами для организаций, стремящихся повысить свою операционную эффективность и безопасность данных. Реальные примеры внедрения данных решений в таких компаниях, как Ростелеком и Татнефть, наглядно иллюстрируют преимущества, которые могут быть достигнуты через инвестиции в современные платформы управления данными
Андрей Буланов рассказал о технологиях компании Спутник для обезличивания персональных и других конфиденциальных данных:
Сохранение конфиденциальности данных теперь как никогда актуально, особенно в свете возросших угроз утечки информации. Современные методы защиты, такие как дифференциальная приватность, играют критически важную роль в минимизации рисков, связанных с раскрытием персональных данных. Инновационные подходы, включая синтетические данные, подчеркивают необходимость внедрения новых решений для обеспечения защиты личных данных в цифровом мире
Тимур Меджидов рассказал про возможности IQPlatform для сбора и обработки внешних данных:
Открытые источники информации (OSINT) становятся важным инструментом в разнообразных отраслях, начиная от обеспечения кибербезопасности и заканчивая управлением кадровыми ресурсами. Эффективный анализ данных из открытых источников становится ключом к более информированным бизнес-решениям. Адаптация технологий анализа под специфические запросы пользователей делает их более доступными для применения в широком круге задач, расширяя возможности бизнеса
В рамках конференции состоялось 3 интерактивных дискуссии о современных архитектурах управления данными, использовании внешних данных и барьерах внедрения искусственного интеллекта.
В рамках дискуссии о концепции современных архитектурах участники обсудили значимость подхода DataMesh для эффективного управления данными в организациях. Переход на DataMesh требует изменений в корпоративной культуре и развитии технических возможностей, что делает этот подход особенно актуальным для динамично развивающихся компаний. В отличие от более централизованного решения — Data Warehouse, DataMesh позволяет лучше адаптироваться к современным условиям и требованиям бизнеса. Однако успех его внедрения зависит от качества данных и наличия эффективного управления ими (Data Governance). Участники дискуссии отметили, что переход к этой модели может потребовать значительных финансовых и человеческих ресурсов, поэтому организациям важно учитывать свою зрелость и готовность к таким изменениям, прежде чем принимать решение о переходе.
Компания Platforma в рамках DataTalks организовала дискуссию о том, как внешние данные могут существенно улучшить бизнес-процессы и способствовать более информированным решениям. Спикеры заметили, что внешние данные стали ключевым элементом в управлении операционными процессами и оценке рисков, а их использование открывает новые горизонты для персонализации услуг и продуктов. Также в рамках дискуссии обсуждался важный аспект сезонных и погодных факторов, которые могут значительно влиять на спрос и необходимые ресурсы бизнеса. Участники согласились, что эффективность использования внешних данных следует оценивать через финансовые показатели и влиянием на P&L, что подчеркивает необходимость оптимизации бизнес-процессов. Кроме того, важным фактором в этом контексте является сотрудничество с партнерами и обмен данными, что усиливает аналитические возможности и точность предлагаемых решений.
Финальная дискуссия первого дня была посвящена проблемам, с которыми сталкивается индустрия искусственного интеллекта, включая образовательные аспекты, монополизацию и кадровый дефицит. Образование и доступ к необходимым данным стали ключевыми факторами в поисках решения существующих проблем. Участники выразили обеспокоенность по поводу монополизации отрасли крупными игроками, что может подорвать уровень доверия и прозрачности в области AI. Важной темой также стала необходимость постоянного обучения сотрудников в области Data Science, а также развитие систем управления искусственным интеллектом, включая обучение топ-менеджеров. Конкуренция на рынке ИИ, наряду с вызовами, способна стимулировать создание новых продуктов и бизнес-моделей, что в итоге приведет к более качественному предложению на рынке
Второй день проходил в онлайн формате и был посвящен техническим и практическим вопросам реализации проектов в области управления данными.
Андрей Телюков в рамках своего доклада рассказал, как современные подходы к архитектуре управления данными формируют эффективную экосистему для сбора, хранения и обработки информации, а также оптимизируют бизнес-процессы. Основное внимание было уделено концепции LakeHouse, которая помогает компаниям лучше интегрировать свои данные и легче управлять ими. LakeHouse предлагает гибридный подход, объединяющий преимущества хранилищ данных и озер данных, что обеспечивает более простой доступ к данным и их обработку в реальном времени. Это позволяет специалистам быстрее принимать решения на основе актуальной информации.
На конференции обсуждалось множество актуальных вопросов, связанных с ИИ, среди которых особое внимание привлекла тема применения больших языковых моделей (LLM) в разработке программного обеспечения. Кирилл Пихтовников в рамках своего доклада подчеркнул важность выбора между облачными и локальными решениями, так как это влияет на производительность, безопасность данных и стоимость. А также отметил, что локальные модели могут оказаться не менее эффективными, чем облачные, благодаря возможностям настройки и контроля над данными, что особенно важно для корпоративных пользователей.
В рамках второго дня были презентованы также практические кейсы применения ИИ. Например, Марк Попов представил практический опыт компании Ростелеком в автоматизации разбора банковских выписок с использованием ИИ. А Владимир Шатшнайдер рассказал о применении искусственного интеллекта в сфере аудита и о том, как новые технологии могут повысить качество и эффективность проверок.
Участники конференции в этом году сошлись во мнении, что будущее управления данными и искусственного интеллекта зависит от активного сотрудничества между компаниями, обмена знаниями и использования современных технологий. DataTalks 5.0 остается открытой площадкой для обмена опытом среди профессионалов в области управления данными и искусственного интеллекта. Материалы конференции публикуются в открытом доступе на сайте, а также в каналах конференции на Rutube и в Telegram.
Источник: habr.com