Лучшие вопросы
Таймлайн
Чат
Перспективы
CRISP-DM
Из Википедии, свободной энциклопедии
Remove ads
CRISP-DM (англ. Cross-Industry Standard Process for Data Mining[1]) — наиболее распространённая[2][3][4] методология по исследованию данных.
Модель жизненного цикла исследования данных в методологии состоит из шести фаз, а стрелки обозначают наиболее важные и частые зависимости между фазами. Последовательность этих фаз строго не определена. Как правило в большинстве проектов приходится возвращаться к предыдущим этапам, а затем снова двигаться вперед[5].
Первая версия этой методологии была представлена на четвёртом по счёту мероприятии CRISP-DM SIG Workshop в Брюсселе в марте 1999 года[6], а пошаговая инструкция была опубликована годом позже[7].

Фазы цикла исследования данных:
- Понимание бизнес-целей (Business Understanding)
- Начальное изучение данных (Data Understanding)
- Подготовка данных (Data Preparation)
- Моделирование (Modeling)
- Оценка (Evaluation)
- Внедрение (Deployment)
Последовательность фаз не является строгой и перемещается вперед и назад между различными фазами, как это всегда требуется. Стрелки на диаграмме процесса указывают на наиболее важные и частые зависимости между фазами. Внешний круг на диаграмме символизирует циклический характер самого интеллектуального анализа данных. Процесс интеллектуального анализа данных продолжается после развертывания решения. Уроки, извлеченные в ходе процесса, могут вызвать новые, часто более целенаправленные бизнес-вопросы, а последующие процессы интеллектуального анализа данных извлекут пользу из опыта предыдущих.
Remove ads
Примечания
Ссылки
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads