중학교 수학시간에 분산(및 표준편차)을 계산할 때
하나의 값을 알고 있기 때문에
그 하나를 제외한 나머지 n-1개에 대한 평균을 구하는 것이어서
n-1로 나눠준다고 배웠습니다
여러분도 그렇게 배우셨을겁니다
당시 저는 의아했습니다
이게 뭔 헛소리지?
완전 비논리적인 설명이라고 생각했습니다
표본이 n개면 당연히 n개에 대한 통계량을 계산해야하니 n개로 나누는게 맞는거 아닌가?
아무리 생각해도 n-1로 나누는 이유를 받아들이지 못했습니다
선생님의 설명도 이상했고요
아무리 고민하고 생각해봐도 답답함을 해결하지 못한채 고등학교에 올라갔고
고등학생이 되어서야 발견하였습니다
그 설명은 비논리적인 잘못된 설명이고 n-1로 나누는 이유는 그게 아니라 따로 있다는 것이라는걸요.
어떻게 발견하게 되었는지 그 일화를 안내해드립니다
고등학교 수학시간에 모평균의 추정이란걸 배웁니다(지금 교육과정에도 있는지는 모르겠네요 제가 고등학교시절엔 배웠습니다)
이게 무엇이냐면 말그대로 표본평균으로 모평균을 추정하는 것입니다.
모집단을 전수조사 할 수 없기 때문에 표본집단의 통계량으로부터 모집단의 통계량이 어떨지 추정하는 개념인 것이죠.
수학적으로 표본평균의 기대값은 모평균에 수렴한다는 것을 고등학교 교육과정에서 배웁니다.
이걸 배우고 나서 떠오른 것이 바로
아, 그럼 비슷한 방법을 사용해서 표본집단의 분산으로 모집단의 분산을 추정할 수 있지 않을까?라는 생각이었습니다.
그래서 곧바로
표본분산의 기대값을 계산해보았습니다. 과연 모분산에 수렴하는지요
우선 계산에 들어가기 앞서 필요한 보조정리를 먼저 소개하겠습니다(이건 이미 고등학교때 배우는 내용입니다)
표본의 크기를 n, 모집단의 크기를 N이라 할 때,
보조정리1: 표본평균의 기대값은 모평균에 수렴한다(고등학교때 배웁니다)

보조정리2 (고등학교때 배웁니다)

보조정리3: 표본평균의 분산은 모분산의 1/n배에 수렴한다(고등학교때 배웁니다)

여기서 μ는 모평균입니다.
자 이제 보조정리의 준비는 끝났습니다
본격적으로 제가 궁금해했던 모분산의 추정을 위해
표본분산의 기대값이 어떻게 되는지에 대해 계산을 시도해봤습니다.
표본평균은 m이라고 하겠습니다


보시다시피 표본분산의 기대값은 모분산의 (n-1)/n 배에 수렴하는 것을 알 수 있습니다.
따라서 모분산은 표본분산에서 분모를 n-1로 바꿔 기대값을 취하면 나온다는 걸 알 수 있습니다.
그래서 n-1로 나누는 것이라는걸 발견하게 되었습니다
하나를 알기때문에 하나는 빼고 계산한다는 뭔 말같지도않은 이상한 헛소리는 틀린거였다는 것이죠
저는 이걸 고등학교때 발견했습니다. 그래서 저는 이 사실을 알리고 싶어서 어디 논문으로 제출해야될까 싶어 알아봤는데
웬걸? 이미 있는 내용이더군요? 그럼 이미 있는 내용이었으면 첨부터 이렇게 가르치든지 해야지 왜 이상하게 하나를 알기때문에 하나는 빼고 계산한다는 개소리를 하고 다녔던 건가요? 선생님들에게 따져 물어봤더니 자기들도 학창시절에 그렇게 배워서 그렇게 가르쳤을 뿐이다라는 변명만 늘어놓더군요.
그래서 도대체 최초에 누가 그딴 헛소리를 했는지를 찾아 그 당사자에게 따지려고 했습니다
그래서 세상에 있는 웬만한 수리통계학 교재를 찾아보았습니다 그딴 개소리 하는 교수가 누군지 찾아 잘못된 설명이라고 알려주려고요.
그런데 아무리 찾아봐도 그 어떤 수리통계학 교재에서도 그런 개논리로 설명하는 책은 단 한 권도 없었습니다. 다 제가 증명한 방식대로 설명할 뿐이었습니다. 그럼 도대체 범인은 누구인가, 누가 그런 개소리를 한것일까.. 찾다 찾다 발견하였습니다. 그건 바로 수학교수가 집필한 수리통계학 교재가 아니라, 비전공자가 집필한 경영통계 경제통계 그딴 책들이었습니다. 아... 수학을 못해서 왜 n-1로 나누는지 이해를 못하니까 뭐라도 설명을 위해서 말을 지어 붙였구나 역시 문돌이 답다 싶더군요.
------------------------------------------------------------------------------------------------------------------------------
분산(표준편차)의 분모가 n-1인 이유를 자유도로 설명하는건 틀렸다는걸 발견한 썰
https://gall.dcinside.com/mathematics/408321
한의학이 비과학적이어도 상관없는 이유
https://gall.dcinside.com/oriental_medicine/297154
분산구할때 제곱하는 이유를 발견한 썰(편차합이 0되기 때문인게 아님. 그건 잘못된 설명이고 다른 올바른 설명을 발견)
https://gall.dcinside.com/mathematics/408212
피타고라스 정리 배우기도 전에 발견한 썰
https://gall.dcinside.com/mathematics/408080
상대성이론 비슷한거 생각해낸적 있었던 썰
https://gall.dcinside.com/physicalscience/190058
0.999...=1인 이유
https://gall.dcinside.com/mathematics/408032
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.