본문 바로가기

수학/통계

회귀분석(Regression analysis)?

회귀분석(Regression analysis)?

  • 인과관계 - 영향 : 독립변수가 종속변수에 영향을 미치는가?
  • 회귀(回歸, regression) : 한 바퀴 돌아서 다시 제자리로 돌아온다.

출처:http://www.datamarket.kr/xe/board_mXVL91/6771

1. 단순회귀(Simple regression) : 독립변수 & 종속변수 = 각각 1개씩

2. 다중회귀(Multiple regression) : 독립변수 2개 이상 & 종속변수 1개

 

회귀분석의 목적

  • 주어진변수(독립변수)의 특정 값에 따른 종속변수의 값을 예측.
  • 에어컨 판매랑이 100대 일때 아이스크림 판매량을 얼마가 될까?(예측)
  • 예측에 필요한 것 : 추세선 = 점들을 잘 설명하는 선.

"우리가가진 데이터(점)을 통해서 데이터(점)를 가장 잘 설명하는 선(추세선)을 찾는 것."

 

HOW? 합리적으로 추세선을 찾을 수 있을까?

출처:https://www.youtube.com/watch?v=dcMvKmkNn8w

  • 선과 점사이에 오차(Error)가 발생.
  • 오차 = 측정값 - 예측값
  • 오차에 + , - 가 혼재 = 그냥 더하면 값들이 뭉개진다.

오차를 어떻게 줄일수 있을까?

 

최소제곱법(OLS : Ordinary Least Squares)

  • 관찰이나 실험으로 얻은 적은 수의 자료를 분석해 상황을 설명하기 위해서는 자료를 잘 표현할 수 있는 방정식을 예측해야한다.
  • 원래의 자료와의 오차를 가장 적게 만드는 것이 자료를 잘 설명하는 방정식이라 할 수 있다.
  • 가장 합리적인 추세선은 오차가 가장 작은 추세선이지만 오차에는 +, -가 같이 존재한다.
  • 그냥 더하는 경우 +와 -가 섞여 값이 뭉개져버리지만 오차의 제곱합을 이용하면 오차가 최소화된 추세선을 이용할 수 있다. 이러한 방법이 최소제곱법이다.

출처

www.youtube.com/watch?v=dcMvKmkNn8w

ko.wikipedia.org/wiki/%ED%9A%8C%EA%B7%80_%EB%B6%84%EC%84%9D

www.datamarket.kr/xe/board_mXVL91/6771

www.youtube.com/watch?v=zPG4NjIkCjc&feature=youtu.be

'수학 > 통계' 카테고리의 다른 글

자료의 종류  (0) 2021.01.27
통계학의 기본용어  (0) 2021.01.27
통계, 통계학(statistic, statistics)  (0) 2021.01.27
가설 검정 (Hypothesis Test)  (0) 2021.01.27
기술통계, 추정통계  (0) 2021.01.09