두 모비율의 차이를 검정할 때는 z분포를 이용한다. [예제1]1년에 전후반기에 각 1번씩 실시되는 시험에서 전반기 수험생들의 합격률은 56%이고, 후반기 수험생들의 합격률은 62%라고 할 때, 전반기의 합격률이 후반기의 합격률보다 낮은지를 유의수준 5%에서 검정하시오. (단, 전반기의 수험생은 5215명, 후반기 수험생은 4852명이었다고 한다.) ① 가설을 설정한다. 주장하고 입증하려는 가설 즉, 대립가설은 "전반기 합격률은 후반기 합격률보다 낮다"가 된다. 귀무가설은 전반기 합격률과 후반기 합격률에는 차이가 없다가 된다. ② 유의수준 ③ 검정통계량 ④ P-value를 구해야 한다. 좌측 단측검정이다. 엑셀 수식을 이용하면 =NORM.S.DIST(E8,1)이 된다. 0.01보다 작은 값이다. ⑤ P-v..
중심극한정리에 의해, 한 번 시행할 때 성공확률이 인 이항분포를 번 시행한 는 시행횟수가 충분히 크면, 평균이 이고, 분산이 에 근사한다. 또, 모집단에서 추출된 개의 표본집단 가운데 개가 확률이 인 특성을 보인다고 하면, 표본비율 이다. 예를 들어, 100명으로 구성된 표본집단에서 흡연자 수를 조사했더니 이었다고 하면, 흡연율의 표본비율 이다. 에서 중심극한정리에 의해 이므로,이다. 또, 에서 중심극한정리에 의해 이므로,이다. 따라서, 가 성립한다. 위 식을 정리하면, 표본비율을 이용한 모비율의 신뢰구간은 다음과 같다. 그런데, 모비율을 추정하기 위해 모비율을 사용한다는 것은 모순된다. 위의 모비율은 표본비율로 수정하여 사용할 수 있다.즉, 가 성립한다. [예제1]우리나라 국민 가운데 1200명을 뽑아..
n이 충분히 클 때 모비율과 표본비율에 관한 다음의 식이 성립한다. 이 때, 를 n에 관해 정리하면, 필요한 최소 표본크기를 구할 수 있다. 허용오차를 d라고 하면 다음의 식이 성립한다. Z값을 좌변으로 넘겨 정리하면, 가 된다. 위 식의 양변을 제곱하면, 이 된다. 다시 위 식을 정리하면, 가 된다. 그런데 이 때, 모비율 를 정확히 특정할 수 없으므로 0.5로 설정한다. 왜냐하면 다른 모든 조건(신뢰수준과 허용오차)이 같다면, 모비율 p=0.5로 설정해야 가 0.25로 최대값을 갖고, p=0.5가 아닌 다른 모든 값에 대해서도 성립하기 때문이다. 즉, 모비율을 추정할 때 필요한 최소 표본크기를 구하는 식은 최종적으로, 가 된다. [예제1]지방선거의 지지도를 알아보기 위해 95% 신뢰수준에서 허용오차를..
정규성 가정과 등분산 가정을 충족하는 두 집단의 모평균 차이를 검정하는 데는 t분포를 이용한다. 이 때, 는 합동표준편차로서 합동분산(pooled variance)의 제곱근이다. 두 모집단이 등분산 가정을 충족한다면, 두 집단의 표본분산의 가중평균으로 합동분산을 구할 수 있다.즉, 이다. 등분산 검정에는 F검정 등이 이용되는데, 간략하게는 두 표본표준편차의 비율의 비율을 이용할 수도 있다. 즉, 가 성립하면 등분산 가정이 성립한다고 본다. 분모와 분자를 바꾼 의 경우도 같다. 왜냐하면, 좌변과 우변도 모두 역수가 되는데, 2분의1의 역수는 2, 2의 역수는 2분의 1이기 때문에 결과적으로 두 부등식은 차이가 없기 때문이다. [예제1]A학과 학생 30명의 영어 성적을 조사했더니 평균이 75.3점, 분산이 ..
-
알림
- 본 블로그는 해상도 1536×864와 엣지에서 최적화 되어있습니다.
- Since 2008.09.15.
- Total
- Today
- Yesterday