[머신러닝] 지도학습, 비지도학습, 강화학습
2021. 12. 25. 23:27
1. 머신러닝
- 머신러닝은 빅데이터를 분석할 수 있는 도구로 기존 통계학 및 시각화 방법의 한계를 해결
- 명시적으로 프로그래밍 하지 않고도 컴퓨터가 학습할 수 있는 능력을 갖게 하는 것
2. 지도학습 (Supervised Learning)
- 정답이 있는 데이터를 활용해 학습
- 입력 값(X data)이 주어지면 입력 값에 대한 Label(Y data)로 학습시킴
- 대표적으로 분류, 회귀 문제가 있음
2.1 분류 (Classifiaction)
- 주어진 데이터를 정해진 카테고리(label)에 따라 분류하는 문제
- True/False 두가지로 분류하는 이진 분류와 두가지 이상의 카테고리로 분류하는 다중 분류 문제가 있음
2.2 회귀 (Regression)
- 어떤 데이터들의 feature(label)를 기준으로 연속된 값(그래프)을 예측하는 문제
- 주로 어떤 패턴이나 트렌드, 경향을 예측할 때 사용
- 분류와 달리 딱 떨어지는 것이 아닌 어떤 수나 실수로 예측
3. 비지도학습 (Unsupervised Learning)
- 정답 label이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
- 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하므로 지도학습 보다 어려움
- 지도학습 에서 적절한 feature를 찾아내기 위한 방법으로 이용하기도 함
- 대표적으로 클러스터링(clustering)이 있고, 이외에 Dimentionality Reduction, Hidden Markov Model, GAN(Generative Adversarial Network) 등이 있음
4. 강화학습 (Reinforcement Learning)
- 분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 따로 정해져 있지 않으며
- 강화학습 개념 : 에이전트(Agent), 환경(Environment), 상태(State), 행동(Action), 보상(Reward)
- 대표적인 알고리즘으로 DQN, A3C가 있음
- 예시 : Agent가 게임 Environment에서 현재 State에서 높은 Reward를 얻는 방법을 찾아가며 Action하는 학습 방법으로 특정 학습 횟수를 초과하면 높은 Reward를 획득할 수 있는 전략이 형성된다. 단, Action을 위한 행동 목록(방향키, 버튼) 등은 사전에 정의가 되어야 한다.
'Python > 머신러닝' 카테고리의 다른 글
[머신러닝] 딥러닝 구현 - 텐서플로우 (0) | 2022.01.04 |
---|---|
[머신러닝] 분류 알고리즘 - 의사결정나무 (Decision Tree) & 혼동 행렬 (Confusion Matrix) (0) | 2022.01.02 |
[머신러닝] 단순 선형 회귀, 다중 선형 회귀 (0) | 2022.01.02 |
[머신러닝] 데이터 전 처리 (0) | 2021.12.29 |
[머신러닝] 수치형 자료, 범주형 자료 (0) | 2021.12.27 |