새소식

컴퓨터공학 💻/Orange3

Orange3 (03) - Linear regressions, Predictions

  • -

 

data type에 따라 연산 방법이 달라지기 때문에 분명히 설정을 해야한다.

Role은 각각의 Column이 어떤 역할을 하는지를 지정해줄 수 있다. Role에는 4개의 항목이 있는데 data type에 따라 2개만 나올수도 있다.

 

 

Skip : data 분석작업에서 해당 data를 무시한다.

meta : 실제 분석작업에 사용되진 않으나 정보성으로 남겨두어야 하는 것들을 표시한다.

taget : 예측하고자 하는 Column을 지정한다. (종속변수)

feature : 예측에 사용되는 독립변수.

 

왼쪽에서 data type과 role에 따라 오른쪽 data table의 형태가 바뀐 것을 볼 수 있다.

 

 

위와 같은 방식으로 컴퓨터를 학습시켜 모델을 만들어낼 수 있다. 그전에 어떤 방식으로 모델을 만들어야 될지는 정해야 한다. 

 

 

위 데이터에서는 머신러닝의 분류중 지도학습 - 회귀(regression)의 방법을 사용하게 되는데 그중 Linear regression이라는 방법을 통해 문제를 해결할 모델을 만들어야 한다. 

 

머신러닝 분류 : https://yjg-lab.tistory.com/68?category=881984

 

Linear regression(선형 회귀)을 사용하면 위 train_data에 들어있는 온도에 따른 판매량의 결과를 대조하여 모델을 만든다. 

새로운 모델이 만들어졌으므로 이것에 새로운 독립변수, 가령 온도 22.5를 넣어보면 모델을 통해 판매량이 45라고 예측을 할 수 있을 것이다. 

 

 

이것을 위해 Predictions를 사용할 수 있다. 이 위젯은 2개의 입력이 필요하다. 하나는 Linear regression을 통해 만든 모델, 다른 하나는 예측하고 싶은 data이다. 

 

그리고 prediction_data File 위젯에 들어가서 각각의 Columns의 Role을 지정해주어야 한다. 온도를 feature로 설정하는 이유는 온도라는 독립변수가 어떤 결과를 가져오는 지를 Predictions 위젯에 요청하는 것이다. 

 

 

predictions가 처리한 data table(2)를 살펴보면 미래의 날짜의 온도(독립변수) data를 이용해 각각의 판매량을 예측해낸 것을 볼 수 있다. 

 

 

 

 

 

 

이글은 오픈튜토리얼스(https://opentutorials.org/course/4548) 머신러닝 야학에서 배운 내용을 개인적인 기록을 위해 재가공하여 작성한 글입니다.
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.