본문 바로가기
DATA Science

CRISP-DM 란?

by Rainbound-IT 2021. 8. 19.
반응형

CRISP-DM으로 알려진 데이터 마이닝을 위한 산업 간 표준 프로세스는 데이터 마이닝 전문가가 사용하는 일반적인 접근 방식을 설명하는 개방형 표준 프로세스 모델입니다. 가장 널리 사용되는 분석 모델입니다.

2015년에 IBM은 CRISP-DM을 개선하고 확장하는 데이터 마이닝/예측 분석을 위한 분석 솔루션 통합 방법(ASUM-DM이라고도 함)이라는 새로운 방법론을 발표했습니다.

 

현재 연구에 따르면 CRISP-DM은 데이터 마이닝 산업의 기존 문제를 해결한 다양한 장점으로 인해 가장 널리 사용되는 데이터 마이닝 모델입니다. 이 모델의 단점 중 일부는 프로젝트 관리 활동을 수행하지 않는다는 것입니다. CRISP-DM의 성공 이면에 있는 사실은 이것이 산업, 도구 및 응용 프로그램에 중립적이라는 것입니다.

 

 

처리 과정

CRISP-DM의 여러 단계 간의 관계를 보여주는 프로세스 다이어그램
CRISP-DM은 데이터 마이닝 프로세스를 6가지 주요 단계로 나눕니다.

 

  • 비지니스 이해
  • 데이터 이해
  • 데이터 준비
  • 모델링
  • 평가
  • 전개

단계의 순서는 엄격하지 않으며 항상 필요하므로 다른 단계 사이를 앞뒤로 이동합니다. 프로세스 다이어그램의 화살표는 단계 간의 가장 중요하고 빈번한 종속성을 나타냅니다. 다이어그램의 바깥쪽 원은 데이터 마이닝 자체의 순환적 특성을 상징합니다. 솔루션이 배포된 후에도 데이터 마이닝 프로세스가 계속됩니다. 이 과정에서 배운 교훈은 새롭고 더 집중적인 비즈니스 질문을 촉발할 수 있으며 후속 데이터 마이닝 프로세스는 이전 경험의 이점을 활용할 수 있습니다.

반응형

'DATA Science' 카테고리의 다른 글

[pyspark] Struct Type  (0) 2022.12.12

댓글