Chap 2. 평균과 비율에 대한 추론 _ 2.4 짝 자료에서 평균 차이 추론

Date:     Updated:

카테고리:

태그:

짝 자료에서 평균 차이 추론

동일한 실험 개체를 두 가지 다른 조건에서 측정한 데이터는 으로 주어졌다고 말한다. 데이터가 짝으로 주어졌을 때 평균 차이에 대한 추론을 다룬다. (이전 게시물처럼 두 개의 개별 표본(두 그룹)에 대한 평균 차이 비교가 아니다!)

예시

수영복 소재에 따른 기록 차이가 있다고 가설을 세워본다. 특수 수영복을 입었을 때랑 일반 수영복을 입었을 때를 비교하기 위하여 12명의 수영선수가 각자 두 번 최고 속도로 1500m를 수영했는데, 한 번은 특수 수영복, 한 번은 일반 수영복을 입었다. 이런 조건을 토대로 두 그룹 평균 차이 추론 방법과 짝 자료 평균 차이 추론 방법을 비교하고 왜 짝 자료 평균 차이 방법으로 해야하는지 검증하라.

image

통계값

특수 수영복 평균 속도 = \(\mu_w\), 일반 수영복은 \(\mu_n\)이라고 하자.

가설은 \(H_0 : \mu_w = \mu_n\) 그리고 \(H_\alpha : \mu_w \neq \mu_n\)이다.

특수 수영복 \(\rightarrow \bar x_w = 1.507, s_w = 0.136, n_w = 12\)
일반 수영복 \(\rightarrow \bar x_n = 1.429, s_n = 0.141, n_n = 12\)

t-분포의 정규분포 조건 충족함.

두 그룹 평균 차이 추론 방법을 쓰면 안되는 이유

image

자유도 11인 t-분포에서 1.38보다 큰 쪽의 면적은 0.00975이다. 양측검증이므로 p값은 0.00975 x 2 = 0.195이다. 영가설을 채택한다.

?? 그런데 데이터를 자세히 보면 모든 수영 선수의 기록은 특수 수영복을 입었을 때 더 빨리 수영했다는 것을 알 수 있다. 검증 결과가 무언가 잘못된 것 같다.

짝 자료임을 고려하지 않음, 위 공식을 사용하려면 서로 독립적인 두 그룹의 데이터에만 적용해야함. 독립적이지 않은 짝 데이터에 사용하면 표준오차가 너무 높게 계산된다.

위 실험에서 수영 선수는 성별, 경기별로 매우 다양하였다. 즉, 속도별로 많은 변동이 있다. 이 변동이 오직 수영복과 관련된 차이인지 다른 변동과 관련된 차이인지 구별하기 어렵다. (데이터가 독립이면 여러 변동 특성이 무작위로 무력화 될 수 있음, 데이터간의 연관이 없음)

여담이지만 위의 변동성 때문에 무작위 추출을 하는 것이다. 인간은 많은 변수에 대해 조작을 할 수 없으니 무작위를 통해 무력화 하는 것이다.

짝 데이터 평균 차이 추론 방법

변동 사항(특성)과 상관 없이 특수 수영복과 일반 수영복의 기록 차이만을 비교하는 방법은 각 데이터의 짝의 차이를 계산하여 0과 비교하는 것이다.

image

짝으로 주어진 데이터는 원 데이터의 평균, 표준편차로 계산하는 것이 아닌 각 짝의 차이를 계산한다. 서로 다른 실험 단위(다른 수영선수들)에 따른 변동을 없애고 관심있는 변수에만 초점을 맞출 수 있다.

차이 값의 표본은 1개이다.
차이 값의 평균은 두 평균 값의 차이와 같다. \(\bar x_d = \bar x_w - \bar x_n\)이다.
차이 값의 표준오차는 차이에 대한 표본 표준편차를 표본 크기의 제곱근으로 나눈다. \(\frac{s_d}{\sqrt{n_d}}\)

신뢰구간 및 가설검증 공식

우선 표본 크기에 따른 정규분포 조건 충족 여부를 판단한다. (표본이 정규분포에 근사하거나 표본크기가 30 이상으로 클 때)

신뢰구간 공식

\[통계량 \pm t^* * SE = \bar x_d \pm t^*\frac{s_D}{\sqrt{n_d}}\]

\(t^*\)는 자유도 \(n_d -1\)인 t-분포에서 구한 백분위수이다.

가설검증 방법

영가설 \(H_0 : \mu_d =0\)을 검증할 때 t-통계량을 사용한다.

\[t = \frac{통계량 - 영가설의 모수값}{SE} = \frac{\bar x_d - 0}{s_d/\sqrt{n}}\]

검증 통계량의 p-값은 자유도가 \(n_d -1\)인 t-분포에서 구한다.

Stat-basic 카테고리 내 다른 글 보러가기

댓글 남기기