[통계] 기댓값과 분산

제가 공부하면서 느낀 내용을 게시하기 때문에 이론이 실제와 다를 수 있습니다. 문제점과 틀린점이 있다면 댓글로 말해주시면 감사하겠습니다.

kook의 AI 공부 블로그 주인장

기댓값


$$E(X)=\sum_{i=1}^{n}x_i P(x_i) $$

이산확률변수 \(X\)에 대하여, 각 값 \(x_i\)가 나타날 확률을 \(P(x_i)\)라고 할 떄 기댓값 \(E(X)\)는 위와 같이 나타낼 수 있다.


기댓값의 뜻은 이렇지만 나는 늘 기댓값이 평균이라고 생각해왔다.
하지만 평균과 기댓값은 계산하는 식 자체가 다르기 때문에 처음 통계를 공부할때 헷갈리는 부분이였다.

평균의 식은 국어 60점 수학 80점 영어 70점 이럴때

$$ \bar{x}=\frac{60 + 80 + 70}{3} $$

이 식처럼 모두 더하고 더한 수만큼 나누는 것으로 알고 있었다.
이제 두 식의 뜻을 파악해보자 !

아 그전에 \(x_i, P(x_i)\) 에 대해 설명해주겠다.

이전 글에 있던 이산확률변수의 주사위 사건을 가져와 보겠다.

주사위의 이산확률분포

각 눈이 나올 확률은 \(P(X=x) = 1/6 \approx 0.167 \)로 모두 동일합니다.

\(X\) : 값이 정해지지 않은 상태의 확률변수. 즉, 주사위 눈이 1~6까지 나올 수 있는 상황.
\(x_i\) : 우리가 사건을 숫자로 대응시킨 값. ex. 주사위 1이 나오는 사건을 1이라. 지정 또는 주사위 1이 나오는 사건을 10이라 지정
\(P(x_i)\): \(x_i\)가 발생할 확률. ex. 주사위에서 1이 나오는 사건(\(x_i\))을 1이라 정했으니 \(x_i\)가 1이 나올 확률은 1\6

다시 본론으로 들어와서

\( E(X) = \sum_{i=1}^{n}x_iP(x_i) \) 기댓값 식을 다시보면 \( x_i \)와 \( P(x_i) \) 곱하여 전부 더한 것을 볼 수 있다.
주사위 예제로 기댓값을 구해보자.

$$ E(X) = 1\cdot \frac{1}{6} + 2\cdot \frac{1}{6} + 3\cdot \frac{1}{6} + 4\cdot \frac{1}{6} + 5\cdot \frac{1}{6} + 6\cdot \frac{1}{6} = 3.5 $$

평균으로 학교 점수 평균점수를 매겨보자

$$ \bar{x}=\frac{60 + 80 + 70 + 80 + 90}{5} $$

기댓값과 평균의 차이가 보이는가 !!

잘 안 보인다고? 사실 바로 차이가 보이는건 진짜 천재들 같고
기댓값의 예제와 똑같이 주사위를 통해 비교를 해보자.

이번엔 주사위의 각 눈이 나올 확률을 모르고 직접 주사위를 20번, 25번 던졌을때 얘기를 해보자.

$$ \frac{1+1+1+2+2+2+3+3+3+3+3+4+4+4+5+5+5+6+6}{20}=3.15 $$
$$ \frac{1+1+1+1+1+2+2+2+2+3+3+3+3+3+4+4+4+4+5+5+5+5+6+6+6}{25}=3.28 $$

기댓값의 결과랑은 조금 다르다.
하지만 시행횟수를 늘리니 점점 기댓값의 결과인 3.5에 가까워지는 것을 볼 수 있다.
아래를 통해 실제로 여러번 던졌을때 평균이 기댓값(3.5)에 가까워지는지 살펴보자.

던지는 횟수(size)를 입력하고 확인해보세요!

30, 100, 1000 점점 시행할수록 3.5에 가까워지는 것을 봐보자.

이제 기댓값과 평균의 차이가 보이는가 !

몰라도 괜찮다 ! 느낌만이라도 있으면 좋다. 그리고 느낀 그 뭉텅이 같은 것을 파고 파다보면 의미를 알 수 있을때가 올거다 !
내가 느낀건 뭔가 사건이 일어날 확률을 알고 있냐없냐 차이 같았다.
더 나아가 기댓값은 일어날 사건의 확률을 통해 계산하는 반면 평균은 일어난 사건을 종합하여 계산한다는 점까지 생각하면 좋을 거 같다.


기댓값과 평균의 차이에 대해서 정리를 해보자.

기댓값은 미래의 일어날 사건을 예측한다고 보면 된다.
주사위를 굴렸을때 ‘각 눈은 1/6 확률로 나오겠구나’ 같은 느낌이다.

평균은 이미 일어난 일을 종합해서 결과를 나타내는 것이다.


수식의 의미를 파악해보자.

$$ \mu, \bar{x}, E(X) $$

\( \mu \) (뮤) : 신이 알고있는 수 라고 해서 전체 모집단의 평균이다. 예를들어, 이 세상 사람 모두의 몸무게를 구해서 나온 평균이라고 생각하면 된다. 구할 수 없는 것 !

\( \bar{x}\) (표본평균) : \( \mu \)를 추정하기 위해서 표본을 뽑고 그 표본에서의 평균을 나타낸 것.
가끔씩 표본평균의 평균이란 말도 들릴텐데 이건 무슨 뜻이냐면 표본을 한 그룹만 사용하는게 아니고 여러개의 표본 그룹을 만들어서 여러개의 표본평균을 만들고 그 여러개의 표본평균의 평균을 구한다고 보면 된다. !

\( E(X) \) (기댓값) : 알고있는 확률정보를 통해 \( \mu \)를 예측하는 것. 이론적으로 결과가 이럴것이다를 볼 수 있다.

결국에 우리가 알고싶은 것은 모집단의 모수인 \( \mu \) 라는 점이고 통계는 이 \( \mu \)를 찾아가는 방향이라고 생각한다.

분산


$$ (1) \ Var(X) = \frac{1}{n}\sum_{i=1}^{n}(x_i – \mu)^2 $$

$$ (2) \ Var(X) = E[(X-E(X))^2] $$


분산의 의미

수식에 제곱도 있고 기댓값표시도 있고 시그마도 있어서 복잡해보이지만
분산은 흩어진 정도에 평균의 제곱이다.

(1) 식에 \( (x_i – \mu)^2 \) 부분을 봐보자. \( x_i \) 는 각각의 값이고 그 값에서 평균 \( \mu \)를 뺀 것의 제곱이다.
그 후, \( \frac{1}{n}\sum_{i=1}^{n} \)를 통해 평균 계산을 진행한 것이다.

(2) 식은 갑자기 E(X)가 들어왔는데 평균을 계산해주는 함수라고 보면 된다. \( f(x) = x^2 \) 같은 !

(1) 식과 (2) 식의 차이
둘의 가장 큰 차이는 \( X \) 와 \( x_i \)의 차이일거다.
\( x \)의 값이 정해지고 관측이 가능하여 계산할 수 있을 때는 (1) 식을 사용하고,
값이 정해지지 않고 추상적이고 이론적으로 식을 나타낼때 (2) 식을 사용한다.

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다