Известный исследователь в области искусственного интеллекта бьет тревогу по поводу надвигающегося кризиса воспроизводимости в науке о данных (Data Science). В отличие от машинного обучения, в науке о данных отсутствует стандартизированная академическая дисциплина, что приводит к огромному разбросу в навыках и знаниях среди практиков.
Исследователь выделяет несколько проблем, в том числе недостаточные методы разработки программного обеспечения, пробелы в статистических и вычислительных знаниях, а также тенденцию отдавать предпочтение шумихе перед научной строгостью.
Предупреждение подчеркивает необходимость повышения ответственности и научной строгости в проектах. Исследователи рекомендуют в обязательном порядке проводить эксплораторный анализ данных (EDA), чтобы направлять разработку функций и выбор моделей. Кроме того, поощрение использования понятных методов ИИ может дать более глубокое представление о работе алгоритмов, чем базовые показатели точности.
Чтобы смягчить эти проблемы, исследователь выступает за то, чтобы ученые, занимающиеся изучением данных, придерживались тех же стандартов, что и инженеры-программисты, подчеркивая важность проверки кода, документации и надежных архитектурных решений.
Поскольку область продолжает развиваться, установление этих норм крайне важно для поддержания целостности и воспроизводимости результатов науки о данных, пишет эксперт.
Источник: www.ferra.ru