[수학]/[통계학]

[통계학] T-검정(T-test)

딥러닝 도전기 2021. 5. 29. 00:44

MIT open courseware의 를 공부한 내용을 정리해보았습니다.

 

이전 포스팅에서 Z-검정(Z-test)에 대해 소개 했습니다.

딥러닝 도전기 [통계학] Z-검정(Z-test)

 

이번 포스팅에서는 가설 검증을 위해 사용되는 방법인 T-검정(T-test)에 대해 다루어 보겠습니다.


우선 T-test와 Z-test의 차이점에 대해 말씀드리겠습니다.

 

T-test는 평균과 표준편차를 모를 때 사용하고, Z-test는 평균을 모를 때 사용합니다.

 

정리하자면 평균을 모를 때, 표준편차를 알고 있으면 Z-test를, 표준편차도 모른다면 T-test를 사용합니다.

 

 T-test와 Z-test의 공통점은 sample $x_1,x_2,\cdots,x_n$이 정규분포 $N(\mu,\sigma^2)$을 따를 때 사용한다는 점이 공통점입니다.

 

이제 T-test에 대해 소개하겠습니다.

 

위에 설명드렸듯 T-test는 sample이 정규분포 $N(\mu,\sigma^2)$을따를 때, $\mu$와 $\sigma$를 모를 때 사용합니다.

 

Z-test에서 z-value가 있었듯, T-test에는 같은 역할을 하는 Student's t-distribution이 있습니다.

 

Student's t-distribution 은 $t=\frac{\bar{x}-\mu_0}{\frac{s}{\sqrt{n}}}$으로 정의됩니다.

 

여기서 $s$는 표본표준편차로, 표본의 표준편차를 의미합니다. 표준편차를 모르기 때문에 sample에서 표준편차를 유추를 하는 것 입니다.

 

표본분산인$s^2$은 다음과 같이 정의됩니다.

 

$s^2=\frac{1}{n-1}\Sigma_{i=1}^{n}{(X_i-\bar{X})}^2 $

 

여기에서 사용된 n-1은 크기가 n인 표본의 관측값의 자유도라고 합니다.

 

MATLAB으로 그려본 t distribution 입니다.

 

 

반응형