새소식

컴퓨터공학 💻/Orange3

머신러닝 - 머신러닝 분류 학습

  • -

컴퓨터를 학습시키면 컴퓨터는 그것의 모델을 만들어낸다.

데이터가 많을수록, 그리고 정확할수록 좋은 모델이 나올 수 있다. 머신러닝은 공식의 대중화이다.

 

 

1. 지도학습(Supervised Learning)

과거의 데이터(독립변수와 종속변수와의 관계)를 학습하여 결과를 예측하는 것에 사용하는 것에서 역사와 비슷하며

정답이 있는 문제를 해결하는 것.

지도학습은 분류와 회귀로 나뉜다.


1-1. 회귀(Regressison)
숫자를 예측하고 싶다면 회귀를 사용해야 한다.
즉 종속변수가 양적 데이터라면 회귀를 사용해야 한다.
= 지도학습의 회귀로 해결하라.

1-2. 분류(Classification)
어떤 문제에서 추측하고자 하는 것이 숫자가 아닌 문자나 이름이라면 분류를 사용해야 한다. 

즉 종속변수가 범주형 데이터라면 분류를 사용해야 한다.
= 지도학습의 분류로 해결하라.

 

 

2. 비지도학습(Unsupervised Learning)

무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것에서 탐험 혹은 탐색이라고 볼 수 있다.

비지도학습에는 군집화, 연관규칙, 변환이 있다.

비지도학습의 중요한 목적은 데이터를 정리정돈해서 그 표에 담긴 데이터의 성격을 파악하는 것이다. 

2-1. 군집화(Clustering)

비슷한 것들을 찾아서 그룹을 만드는 것. 비슷한 행을 그룹핑하는 것.
어떤 대상들을 구분해서 그룹을 만드는 것이 군집화라면
어떤 대상이 어떤 그룹에 속하는 지를 판단하는 것이 분류이다.
즉 관측치(행)를 그룹핑 해주는 것이 군집화이다.

2-2. 연관규칙(Association rule learning)

서로 관련이 있는 특성을 찾아주는 머신러닝 기법. 특성을 그룹핑 해주는 것.
즉 특성(열)을 그룹핑 해주는 것이 연관 규칙이다.

2-3. 변환

기존의 데이터를 더 쉽게 해석할 수 있도록 새롭게 표현하는 알고리즘. 대표적인 예로 차원 축소(Dimensioonallity reduction)가 있다. 차원 축소는 고차원 데이터를 저차원 형태로 줄이면서, 필요한 특징은 포함되도록 하는 분야.

3차원 이하로 줄어들면 시각화도 가능하게 되며, 전체적인 연산량 또한 줄어든다는 점에서 상당히 의미있는 알고리즘이다. 변환은 수많은 텍스트 문서에서 주제를 추출하는데에도 활용될 수 있다.

 

 

3. 강화학습(Reinforcement Learning) : 더 좋은 보상을 받기 위해서 수련하는 것.

강화학습은 게임과 비슷하다.

강화학습의 목적은 상태(state)에 따라서 더많은 보상(reward)을 받을 수 있는 행동(action)을 에이전트(agent)가 할수있도록 하는 정책(policy)을 만드는 것이다.

 

 

 

 

 

이글은 오픈튜토리얼스(https://opentutorials.org/course/4548) 머신러닝 야학에서 배운 내용을 개인적인 기록을 위해 재가공하여 작성한 글입니다.
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.