[2018/07/24] 회귀분석

관측치 (observation)
독립변수
종속변수

데이터의 종류
이산형 (범주형) 자료
-명목형 자료
-순위형 자료: 순서가 있다

연속형 자료
-구간형 자료
-비율형 자료

독립 변수 범주형 연속형
종속 변수
범주형 분할표 분석 로지스틱
연속형 분산 분석 선형회귀

회귀분석
단순회귀분석
-한개의 독립변수, 종속변수 간의 선형 관계

-회귀분석에는 여러 가정들이 있다.
-해석을 하는 게 중요하다

yi = B0 + B1*xi + ei
B0, B1을 구하는 게 목표!

ei는 정규분포를 따른다고 가정한다.

모집단 & 표본집단:

표본집단에서 나온 회귀선
y^ = b0 + b1x

B0, B1을 추정하는 방법 중 하나: 최소제곱법
그 후에 미분 써서 구한다.
오차항이 정규분포를 따르지 않을 때도 적용 가능

최우추정량이라는 방법도 있음
오차항 e이 정규분포를 따른다는 가정이 있을 때만 적용가능

측도: 정도 (precision) 측정해야 한다.
1.
평균제곱오차 (MSE)
-오차에 제곱에 평균을 취한 값
-값이 작을수록 참값을 잘 설명한다고 할 수 있음
2.
결정계수 (R^2)
-총 변동 중에서 회귀선에 의해 설명되는 비율
-0과 1 사이의 값을 갖는다
-1에 가까워질수록 데이터를 잘 대변하는 값

잔차 분석
1.
독립성
2.
등분산성
3.
정규성

회귀 분석을 하고난 다음에 꼭 해야한다.