더보기

데이터 분석 순서

  1. 문제 정의
  2. 데이터 수집
  3. 데이터 전처리
  4. 데이터 모델링
  5. 데이터 시각화 및 탐색

 

1. 문제 정의

: 분석하고자 하는 분야를 이해하고, 해결해야 할 문제를 객관적이고 구체적으로 정의하며 분석의 목적 설정

2. 데이터 수집

: 분석에 필요한 데이터를 확보하는 과정 (크롤링)

3. 데이터 전처리 (preprocessing)

: 데이터 셋 확인 - 중복값 제거 및 결측값 보정 - 이상치 처리 - Feature Engineering (기존의 변수를 사용하여 데이터에 정보를 추가하는 일련의 과정. 새로 관측치나 변수를 추가하지 않고도 기존의 데이터를 보다 유용하게 만드는 방법론) 

4. 데이터 모델링 

: 하나의 테이블(데이터셋)이 아닌 다수의 테이블을 이용하여 분석. 테이블을 쪼개고 관계 설정

5. 시각화 및 탐색

: 다양한 도구를 이용하여 데이터를 시각화하고, 탐색을 통해 문제 해결

 

 

 

 

 

참고 : https://brunch.co.kr/@data/10

+ Recent posts