[데이터 분석] 데이터 분석 절차
2021. 12. 17. 14:41
더보기
데이터 분석 순서
- 문제 정의
- 데이터 수집
- 데이터 전처리
- 데이터 모델링
- 데이터 시각화 및 탐색
1. 문제 정의
: 분석하고자 하는 분야를 이해하고, 해결해야 할 문제를 객관적이고 구체적으로 정의하며 분석의 목적 설정
2. 데이터 수집
: 분석에 필요한 데이터를 확보하는 과정 (크롤링)
3. 데이터 전처리 (preprocessing)
: 데이터 셋 확인 - 중복값 제거 및 결측값 보정 - 이상치 처리 - Feature Engineering (기존의 변수를 사용하여 데이터에 정보를 추가하는 일련의 과정. 새로 관측치나 변수를 추가하지 않고도 기존의 데이터를 보다 유용하게 만드는 방법론)
4. 데이터 모델링
: 하나의 테이블(데이터셋)이 아닌 다수의 테이블을 이용하여 분석. 테이블을 쪼개고 관계 설정
5. 시각화 및 탐색
: 다양한 도구를 이용하여 데이터를 시각화하고, 탐색을 통해 문제 해결
'Python > 데이터분석' 카테고리의 다른 글
[데이터 분석] 데이터 시각화 - 워드 클라우드 (0) | 2021.12.18 |
---|---|
[데이터 분석] 데이터 전처리 방법 (0) | 2021.12.17 |
[데이터분석] Matplotlib 데이터 시각화 그래프 (0) | 2021.12.12 |
[데이터분석] 데이터 조작 및 분석을 통한 pandas 심화 (0) | 2021.12.09 |
[데이터분석] 데이터 조작 및 분석을 위한 pandas 기본 (0) | 2021.11.29 |