질문의 요지는 이렇다.
의혹제기 하기위한 기보조사를 할 때, 오래된 기보의 일치율까지 조사하면
아무래도 예전의 기보는 인공공부 덜 된 기사들이 둔 바둑이라 일치율이 떨어질테니
의혹제기를 당하는 입장에서 불리하지 않겠느냐는 지적으로 해석했다.
당연히 지적 할 수 있는 부분이고, 이에 대한 고민도 예전부터 하면서 기보조사를 진행 했다는 부분 말씀드린다.
그래서 '기보조사 경험상' 최근의 기보가 보여주는 일치율과 크게 다르지 않는 범위 - 내 기준에선 2019년 이후 - 에서 기보조사를 한다고
간략하게 답변했는데
약간 더 추가해서 설명 드리려고 한다.
우선, 오늘까지 368개의 기보조사를 마쳤다.
오유진, 김채영, 조승아, 김경은, 송혜령, 오정아, 허서현, 김혜민까지
의혹제기 대상보다 바둑을 못두진 않는 여자기사를 대상으로 최근 50국의 80수 일치율을 체크했다.
송혜령 같이 2019년 이후 지금까지 기록된 기보가 50국이 안될 땐 그냥 안되는대로 2019년 이후 기보만 조사했다.
2019년 이후 80수 (=38번의 착수) 에 대한 최근 50국의 평균적인 인공일치횟수는
약 24.22회로 나타났다.
38번의 착수 중 24.22826회를 적중시킨다는 뜻이고,
표준편차는 약 3.53으로 나타났다.
그리고
2020년 이후 80수 (=38번의 착수) 에 대한 최근 50국의 평균적인 인공일치횟수는
약 24.48회로 나타났다.
그러니까, 2019년까지 통계에 넣어서 일치율 조사하는 것보다 2020년의 기보만 갖고
80수 일치율 조사했을시 일치율이 약간 더 높게 나온다는 뜻이다.
퍼센테이지로는 약 0.7%p 더 높게 나온다.
평균 일치율만 보면 최근의 기보만 넣어서 의혹제기 하는 것이 의혹제기 대상에게 좀 더 보수적인 접근이고, 합당하지 않겠냐 할지도 모르겠지만
문제는 표준편차다.
2020년의 기보만 갖고 일치율 통계를 냈을 땐
표준편차는 약 3.44로 나타나는데, 이는 2019년 이후를 기준으로 최근 50국의 일치율을 조사 한 경우의 표준편차보다
약 0.09 작게 나온다.
즉, 80수 일치율이 0.7%p 올랐으나 인공추천수를 맞히는 분포가 더욱 오밀조밀하게 됐다는 의미다.
정규분포 상의 확률을 구하는데에는 평균도 물론 영향을 끼치지만 표준편차가 더욱 큰 영향을 끼친다.
정규분포 그래프에서 x는 평균의 개념이고, 시그마가 표준편차의 개념인데
그래프를 보면 어떤 확률을 나타낼 때, 평균에다가 표준편차에 상수를 곱한 값으로 계산된다.
80수 일치율 의혹제기를 위한 사전조사에서는, 그래서 평균보다 표준편차가 작아질수록 의혹제기 대상이 불리해지는거다.
계산으로 보여주면...
왜도와 첨도는 0에 가까운 마이너스니까 왜도, 첨도 무시하고
그냥 정규분포 계산식으로 확률 구하면 아래와 같다.
평균과 표준편차를 저기 위의 짤과 비교해보면 알겠지만
2019년 이후 최근 50국 기준의 데이터로 뽑은 80수 일치율 100% 확률이다.
20197분의 1로 나온다.
아래는 2020년 기보만 갖고 80수 일치율 100% 뜰 확률인데
22555분의 1로 나온다.
2020년 기보만 갖고 조사하는게 80수 일치율의 평균은 38회 중 24.48996회로
2019년 기보까지 포함하는 것보다 약간 더 인공추천수의 일치횟수 평균이 올라가지만
2020년 기보만 갖고 조사하면 기사들이 80수까지 일치율이 60~70%대에서 집중되는 경향을 보이게되어
표준편차가 떨어져버려서 오히려 의혹제기 대상에게 불리한 자료가 되어버린다.
그래서 2019년의 기보까지 포함해서 일치율을 알아보는게 좀 더 보수적인 사전조사가 되는 이유다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.