회귀분석(Regression analysis)?
- 인과관계 - 영향 : 독립변수가 종속변수에 영향을 미치는가?
- 회귀(回歸, regression) : 한 바퀴 돌아서 다시 제자리로 돌아온다.
1. 단순회귀(Simple regression) : 독립변수 & 종속변수 = 각각 1개씩
2. 다중회귀(Multiple regression) : 독립변수 2개 이상 & 종속변수 1개
회귀분석의 목적
- 주어진변수(독립변수)의 특정 값에 따른 종속변수의 값을 예측.
- 에어컨 판매랑이 100대 일때 아이스크림 판매량을 얼마가 될까?(예측)
- 예측에 필요한 것 : 추세선 = 점들을 잘 설명하는 선.
"우리가가진 데이터(점)을 통해서 데이터(점)를 가장 잘 설명하는 선(추세선)을 찾는 것."
HOW? 합리적으로 추세선을 찾을 수 있을까?
- 선과 점사이에 오차(Error)가 발생.
- 오차 = 측정값 - 예측값
- 오차에 + , - 가 혼재 = 그냥 더하면 값들이 뭉개진다.
오차를 어떻게 줄일수 있을까?
최소제곱법(OLS : Ordinary Least Squares)
- 관찰이나 실험으로 얻은 적은 수의 자료를 분석해 상황을 설명하기 위해서는 자료를 잘 표현할 수 있는 방정식을 예측해야한다.
- 원래의 자료와의 오차를 가장 적게 만드는 것이 자료를 잘 설명하는 방정식이라 할 수 있다.
- 가장 합리적인 추세선은 오차가 가장 작은 추세선이지만 오차에는 +, -가 같이 존재한다.
- 그냥 더하는 경우 +와 -가 섞여 값이 뭉개져버리지만 오차의 제곱합을 이용하면 오차가 최소화된 추세선을 이용할 수 있다. 이러한 방법이 최소제곱법이다.
출처
www.youtube.com/watch?v=dcMvKmkNn8w
ko.wikipedia.org/wiki/%ED%9A%8C%EA%B7%80_%EB%B6%84%EC%84%9D
'수학 > 통계' 카테고리의 다른 글
자료의 종류 (0) | 2021.01.27 |
---|---|
통계학의 기본용어 (0) | 2021.01.27 |
통계, 통계학(statistic, statistics) (0) | 2021.01.27 |
가설 검정 (Hypothesis Test) (0) | 2021.01.27 |
기술통계, 추정통계 (0) | 2021.01.09 |