-

Chapter 7. Sampling Dist and the Central Limit Theorem(표본분포과 중심극한정리) - (1) 소개

Patti Smith 2021. 11. 1.

$$ Y_1, Y_2 ... Y_n : Random  Sample for population \leftrightarrow iid $$

이때 \( iid \)는

\( i : Y_i \) 's independent 

\( id : Y_i \) have indentical dist(동일분포)

 

여기서 우리는 왜 R.S을 찾는가? unknown parameter(알려지지 않은 모수)를 estimate(추정)하기 위해서이다.

 

모평균을 추정하기 위해서 모집단으로부터 랜덤 샘플을 받고, 관측 후 데이터에 의해 y값들이 확정이 된다.

이때 표본 평균의 경우도 마찬가지. 

관측가능한 랜덤 표본들의 함수를 통계량이라고 말하는데, 관측할 수 없을 땐 통계량이라고 말할 수 없다.

(a function of observable random variable in a sample) 

 

통계량의 의미를 알면 자주 쓰던 개념들이 대부분 통계량이었다는 걸 알 수 있다.

 

$$ \bar{Y}=\frac{1}{n}\sum_{i=1}^n Yi $$

표본평균은 모평균의 추정량(통계량)

 

$$ S^2=\frac{1}{n-1}\sum_{i=1}^n (Y_i-\bar{Y})^2 $$

표본분산은 모분산의 추정량(통계량)

 

 

 

$$ R=Y_lef

 

순서 통계량은 이름부터 통계량이 붙여져 있다.

 

위와 같은 예시로 통계량을 더 정확하게 정의할 수 있는데,

 

1. statistic is random.variable (a function of \( Y_1,Y_1\cdotsY_n \)

통계량은 랜덤 표본의 함수라는 것

2. statistic used to estimate unknown parameter 

/make inference about population

통계량은 모수를 추론/추정하고 모수를 대체하여 쓰기도 한다.

3. Sampling dist : dist of statistic 

표본 분포는 통계량의 분포이다

 

 

다음처럼 표본 평균이 통계량의 분포이기에 표본 분포의 평균과 분산을 통해 표본평균의 평균과 분산을 구할 수 있다.

 

(표본 분포를 이용하여 표본 평균의 평균과 분산을 구하는 수식)

 

일전에 배웠다시피 표본평균의 평균과 분산이 다음과 같이 나오는데,

 

(표본평균의 평균과 분산을 나타낸 수식)

 

표본 평균의 분포는 정확하게 구하기가 몹시 번거롭다. 

(정확하게 표본 평균을 구하는 수식)

 

이때 n이 커질 때 분포가 정규분포를 따른다는 중심극한정리를 이용하면 표본 평균의 분포를 정확히 구할 필요가 없어진다. 일일이 구하는 경우도 없으며, 옛날이면 모를까 지금같이 컴퓨터로 숫자를 다루는 분위기에 n이 얼마나 커질지 두려워하지 않아도 됨.

 

 

 

 

'-' 카테고리의 다른 글

구조체  (0) 2021.11.16
자바스크립트 - 연산자, 조건문  (0) 2021.11.12
문자/문자열 처리함수  (0) 2021.11.09
자바스크립트  (0) 2021.11.01
수업 (수정전)  (2) 2021.05.14

댓글