'수학의 비밀'에서 표본분산과 관하여 질문드립니다.
게시글 주소: https://orbi.kr/0003696779
수학의 비밀 p344에서
FAQ) 왜 표본표준편차(표본분산)를 구할 때에는 1/n 이 아닌 1/n-1로 나누는 건가요?
A) 원래 '표준편차'이란, ~~ 평균으로부터 퍼진 정도를 판단할 때에는 평균값에 해당하는 모집단은 제거를
하는 것이 상식적으로 더 평균으로부터 퍼진 정도라는 정의에 더 정확히 들어맞겠죠? 따라서 1/n 이 아닌
1/ n-1 로 나누는 것이 좋습니다.
라고 명시되어 있는데, 빨간글자로 표시한 부분이 이해가 잘 안되네요 ㅠ
'평균값에 해당하는 모집단'의 의미를 잘 모르기 때문인 것 같은데...
p135 에 나오는 예시를 통해 질문 마저 드리자면
(ex) 크기가 3인 표본 1,3,5 에 대하여 표본평균, 표본분산 및 표본표준편차의 값을 구하시오.
표본평균 : 1 x (1+3+5) / 3 = 3
표본분산 : 1 x {(1-3)^2 + (3-3)^2 + (5-3)^2} / 3-1 = 4
표본표준편차 : root4 = 2
라는 예시에서,
'평균값에 해당하는 모집단'이 표본 1,3,5의 '3'인가요?
그렇게 생각했을 때 p134의 FAQ와 예시를 종합해서 이해하면
표본평균에 해당하는 3이 표본 속에 속해있으므로
그에따라, 실질적으로 분산에서 유효한 값은 (3-3)^2을 제외한 (1-3)^2 과 (5-3)^2 2개뿐이므로
3이 아닌 2로 나눠주는 게 바람직하다.
이렇게 이해할 수 있긴한데... 제 개인적인 추측일 뿐이라 올바른 이해인지 모르겠네요 ㅠㅠ
그리고, 위의 제 이해가 맞다면,
크기가 3인 표본 1,2,6에서처럼 표본평균에 해당하는 값이 표본 속에 속해있지 않을 때도
왜 n-1로 나눠야 하죠..?ㅠㅠ
머릿 속에 온갖 오개념이 박혀있는 것 같아서 걱정되네요...
추가로 질문드리면 자잘한 질문 한가지만 더 하자면,
표본분산(표본표준편차)에서 1/n-1 하는 이유를
'자유도'로 이해하거나 표본분산의 값을 모분산의 값에 가깝게 하기 위해서라고
표면적으로 이해해도 무방하나요?
아시는 분은 꼭 좀 답변 부탁드려요 ㅠ
0 XDK (+0)
유익한 글을 읽었다면 작성자에게 XDK를 선물하세요.
통계도 잘 모르고, 고등학교 과정에서 어떻게 가르치는지 모르지만..
가장 큰 이유는 저렇게 정의해야 표본표준편차의 평균(기댓값)이 모표준편차가 되기 때문인 듯 합니다. 표본평균의 평균(기댓값)이 모평균인 것 처럼요.
이제야 확인했네요 감사합니다:)