Box plot Box plot을 사용하면 데이터 수치를 구체적으로 표현해준다. 중앙의 가로 수직선 위 44는 판매량의 5개 행의 평균값을 나타내며 아래 44는 5개 행의 중앙값을 나타낸다. 42와 46은 각각 1분위 수, 3분위 수 라고하며 중앙값을 2분위 수라고 한다. 가로선 파란 막대는 표준편차의 크기이며 표준편차란 각각의 값들이 평균값으로부터 얼마나 떨어져 있는지를 평균을 낸 값으로 보면 된다. Scatter plot(산점도) 만약 판매량과 상관의(==영향을 주는)관계가 있는 Column을 찾고 싶다면 어떻게 해야할까. 위 표에서 온도가 판매량과 상관관계에 있다는 것을 알아볼 수 있겠지만 데이터가 많지않아 쉽게 상관관게에 있다고 단정하기엔 위험하다. Scatter plot은 상관관계에 있는 col..
Orange3 (02) - Box Plot, Scatter Plot
Box plot Box plot을 사용하면 데이터 수치를 구체적으로 표현해준다. 중앙의 가로 수직선 위 44는 판매량의 5개 행의 평균값을 나타내며 아래 44는 5개 행의 중앙값을 나타낸다. 42와 46은 각각 1분위 수, 3분위 수 라고하며 중앙값을 2분위 수라고 한다. 가로선 파란 막대는 표준편차의 크기이며 표준편차란 각각의 값들이 평균값으로부터 얼마나 떨어져 있는지를 평균을 낸 값으로 보면 된다. Scatter plot(산점도) 만약 판매량과 상관의(==영향을 주는)관계가 있는 Column을 찾고 싶다면 어떻게 해야할까. 위 표에서 온도가 판매량과 상관관계에 있다는 것을 알아볼 수 있겠지만 데이터가 많지않아 쉽게 상관관게에 있다고 단정하기엔 위험하다. Scatter plot은 상관관계에 있는 col..
2020.08.25