1. 머신러닝

  • 머신러닝은 빅데이터를 분석할 수 있는 도구로 기존 통계학 및 시각화 방법의 한계를 해결
  • 명시적으로 프로그래밍 하지 않고도 컴퓨터가 학습할 수 있는 능력을 갖게 하는 것

2. 지도학습 (Supervised Learning)

  • 정답이 있는 데이터를 활용해 학습
  • 입력 값(X data)이 주어지면 입력 값에 대한 Label(Y data)로 학습시킴
  • 대표적으로 분류, 회귀 문제가 있음

2.1 분류 (Classifiaction)

  • 주어진 데이터를 정해진 카테고리(label)에 따라 분류하는 문제
  • True/False 두가지로 분류하는 이진 분류와 두가지 이상의 카테고리로 분류하는 다중 분류 문제가 있음

2.2 회귀 (Regression)

  • 어떤 데이터들의 feature(label)를 기준으로 연속된 값(그래프)을 예측하는 문제
  • 주로 어떤 패턴이나 트렌드, 경향을 예측할 때 사용
  • 분류와 달리 딱 떨어지는 것이 아닌 어떤 수나 실수로 예측

 

3. 비지도학습 (Unsupervised Learning)

  • 정답 label이 없는 데이터를 비슷한 특징끼리 군집화하여 새로운 데이터에 대한 결과를 예측하는 방법
  • 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하므로 지도학습 보다 어려움
  • 지도학습 에서 적절한 feature를 찾아내기 위한 방법으로 이용하기도 함
  • 대표적으로 클러스터링(clustering)이 있고, 이외에 Dimentionality Reduction, Hidden Markov Model, GAN(Generative Adversarial Network) 등이 있음

 

4. 강화학습 (Reinforcement Learning)

  • 분류할 수 있는 데이터가 존재하는 것도 아니고 데이터가 있어도 정답이 따로 정해져 있지 않으며 
  • 강화학습 개념 : 에이전트(Agent), 환경(Environment), 상태(State), 행동(Action), 보상(Reward)
  • 대표적인 알고리즘으로 DQN, A3C가 있음
  • 예시 : Agent가 게임 Environment에서 현재 State에서 높은 Reward를 얻는 방법을 찾아가며 Action하는 학습 방법으로 특정 학습 횟수를 초과하면 높은 Reward를 획득할 수 있는 전략이 형성된다. 단, Action을 위한 행동 목록(방향키, 버튼) 등은 사전에 정의가 되어야 한다.

 

 

 

 

 

 

 

 

 

참고 : https://ebbnflow.tistory.com/165

+ Recent posts