디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[일반] NC 다이노스 데이터 분석 팀장님 강연 내용 복기.txt (스압)

ㅇㅇ(119.196) 2017.11.22 10:00:02
조회 10082 추천 68 댓글 24

매우 기니까 주의해라 ㅋㅋ



일단 세미나 진행하신 분 소개를 하자면

 

NC 다이노스 데이터분석팀 임선남 팀장님

 

서울대 공대를 다니시다가 미학과로 전과하시고 경제학을 부전공하심

 

NC 소프트에 입사해서 일하시다가 다이노스 창단되면서 다이노스로 가시게 됨

 

가장 먼저 청중들의 야구 이해도에 대해서 조사하셨는데, 그래도 타출장이나 방어율, WHIP 정도 스탯은 안다는 가정하에 설명하겠다고 하심

 

가장 먼저 말하신건 Henry Chadwick이라는 사람. 이 사람은 야구의 아버지로 불림

 

야구의 기본적인 규칙을 만든 인물이라서, 야구 초창기에는 이 분이 경기장에 와있으면 심판이 경기 진행하다가 헷갈리면 가서 물어보기도 함

 

원래 이 사람 직업은 기자였음. 그런데 매우 옛날이다보니 TV는 물론이고 컬러 사진조차 없었음. 그래서 야구 기록을 어떻게 사람들에게 전달할지 고민하다가 박스 스코어 라는 것을 만들어냄

 

이 분은 삼진을 K로 표기한 최초의 인물임 (strucK out). 또한, 야구를 고상한 시민 스포츠로 정착시키고자 노력하심. 요즘도 뭐 다 도박하고 음주운전하고 말이 많지만 저 때는 더 심했기 때문에..

 

그런데 이 사람은 야구가 선수들이 뛰고 부딪히는 것에 매력이 있다고 생각해서, 걸어나가는 볼넷에는 관심이 없었음. 그래서 출루율이 공식 기록으로 인정된 것은 한참 뒤인 1984

 

기타 등등 여러 야구 얘기 알고 싶으면 blog.ncsoft.com 방문 ㄱ

 

이제부터 세이버메트릭스 얘기 시작

 

SabermetricsSABRmeasurement의 합성어

 

SABRSociety for American Baseball Research의 줄임말. 여러분도 몇백불 내면 회원이 될 수는 있는데, 학회 한번 가려면 비행기 값이 더 많이 들어서 사실상 한국에서는 할 수 있는 것이 없음

 

Bill JamesSabermetricsThe Search for objective knowledge about baseball 이라고 정의함

 

MLB의 경우, 미국은 사람도 많고 땅도 넓어서 일일히 경기를 다 보러갈 수가 없음. 그러다보니 기록을 분석하는 것이 매우 발달함

 

반면 한국의 경우 프로 선수 크게 잡아야 1000명 정도. 고교 야구 선수도 얼마 안됨. 그래서 직접 다 보러갈 수 있고, 특히 중요 대회의 경우 그냥 목동 가서 앉아 있으면 됨. 그래서 세이버 발전이 느림

 

고전 스탯의 목적은 야구 경기 정보의 전달이었음

 

그러다가 빌 제임스 시대가 됨. 처음에는 많은 스탯이 직관에서 출발함. 컴퓨터도 없이 손으로 계산하다보니 복잡한 계산이 불가능함 (그리고 RC에 대해 짧게 설명)

예를 들면 공격기여도는 출루 * 진루 / 기회

(득점은 출루한 뒤에 출루한 주자를 득점시키는 것이기 때문에)

 

엄청난 계산이 들어가는 스탯으로는 SIERA (Skill Interactive ERA) 가 있음. 이건 투수의 모든 스탯을 회귀분석해서 만든 ERA Estimator. 복잡하다는걸 설명하기 위해 보여주심

 

야구는 기본적으로 점수를 더 많이 낸 팀이 이김. 이기려면 가능한 많이 득점하고 적게 실점해야 함

 

그래서 득점, 실점으로 팀 승률을 나타내고 싶어짐

 

그래서 빌 제임스가 고안한게 피타고리안 기대 승률. 원래는 득점, 실점에 붙는 지수를 2로 하다가 노가다 끝에 1.83이 가장 잘 들어맞아서 1.83을 쓰자고 함

 

더 많은 계산 끝에 요즘에는 RPG 0.29승으로 함 (RPG는 경기당 평균 득점과 실점의 합)

 

Steven J. Miller라는 사람은 2006년에 피타고리안 기대 승률을 증명하기도 함

 

그렇다면 피타고리안 승률과 실제 승률은 왜 다를까?

 

가장 중요한 것은 일단 운. 야구는 운이 많이 개입함..

 

그리고 또 중요한 것은 1점차 상황에서의 승률. 여기서는 불펜, 작전, 기본기 등이 중요함

 

그리고 1회에 큰 점수를 내주면 경기를 포기해서 더 많은 실점을 하게 되어 순수한 실력 측정을 방해하게 됨

 

장기 레이스에 강한 팀은 두터운 전력과 자원의 적절한 배분이 필요함

 

포스트시즌에 강한 팀은 일단 운이 좋은 팀, 1~3 선발이 좋은 팀, 불펜이 강한 팀, 컨택, 수비, 주루가 좋은 팀

 

그래도 본인이 생각하기에는 전자가 더 중요한데, 일단 포스트시즌에 진출을 해야 뭐라도 하니까.. 라고 하심

 

정확히는 일단 가을야구에 참가할 능력을 만드세요 라고 하심

 

특히 한국 야구는 50%나 가을 야구를 하니까 리빌딩이라는 개념이 없음

 

그냥 막 꼴찌하면서 유망주 모으고 키우고 이러다간 팬들한테 욕먹음. 반이나 가을야구를 하는데..

 

그렇다면 득점을 몇 점 늘리고, 실점을 몇 점 줄이면 기대 승수가 1승 증가할까?

 

여기서 RPW 라는 개념이 등장함. (Runs Per Win)

 

13년까지는 RPW 8~9점대였다가 14년 이후에는 10~11점대로 증가함 (타고투저가 극심해짐)

 

그래서 득점이 쉬워지고 1점의 가치가 낮아져서 작전의 가치가 하락함

 

실제로 현장에서도 이걸 숫자로 따져보지 않아도 체감하고 있어서 희번 개수도 매우 줄어들게 됨

 

그 다음 소개해주신 것은 Year to Year Correlation

 

작년 스탯과 올해 스탯과의 연관성. 작년의 기록과 올해의 기록을 비교해서 그 능력이 이어질 확률을 얘기함

 

여기서 각 스탯마다 Year to Year Correlation을 보여주셨는데 (검색 잘하면 나오니까 검색해보셈)

 

투수의 승리는 바빕 만큼이나 시즌 간의 관련성이 없음. 작년에 20승해도 올해 몇 승할지와는 관계가 적음

 

ERA, WHIP도 그닥 높지는 않은데, 기억에 남는건 K/9는 매우 높았음

 

타자의 경우에는 BB% K%가 값이 높았고, 타율은 당연히 가치가 떨어짐

 

사실 어디까지가 선수의 ㄹㅇ 실력인지는 알기 어려움. 샘플이 충분하지 않고 노이즈가 많음

 

예를 들어서 신인은 감독 눈에 들려고 아파도 참고 뜀. 그러다보니 실제 실력보다 스탯이 낮게 나오기도 하고..

 

이제 이 스탯을 실제로 어떻게 활용하시는지 말하심

 

당연히 잘 치면 칭찬 받고 못 치면 욕먹음 (1단계)

 

과거 스탯을 바탕으로 올해 스탯 예상 정도는 가능 (2단계)

 

스탯을 통해 선구안 / 컨택 or 삼진 / BABIP, Hard Hit% 등의 능력을 알아내서 왜 이런 기록이 나오는지에 대한 근본적인 원인을 찾음 (3단계)

 

선구안 개선 훈련이나, Hitting Mechanics (Swing Path, Bat Speed, Launch Angle) 등을 고쳐서 개선을 추구함 (4단계)

 

한국에서는 3단계 정도까지만 이루어짐. 미국은 당연히 4단계..

 

(강연 초기부터 강연자분이 박석민 부진 얘기를 종종 꺼내셔서 ㅋㅋ 여기서 누가 박석민은 왜 못했냐고 질문함)

 

-> 컨택이 잘 안됐다고 답변

 

외국인 선수에 대해서도 말씀해주심

 

1단계는 외국인 선수 발굴. 데이터를 분석하고 일부는 현장에 직접 가서 경기를 보기도 함. 우선 80명 정도로추려내고, 요즘에는 트리플 A도 중계가 돼서 한국과 미국에서 스카우터들이 실시간으로 의견을 교환함. 그렇게 선수를 추리고 그 중에서 인성 안 좋은 선수를 또 걸러냄. 예를 들면 야수가 실책한 뒤에 제스쳐 하고 이런거..

 

아담이 뭐 잘하긴 했는데 이런 쪽에서 문제가 있었음. 한국 문화에도 잘 적응 못함 (물건 같이 쓰고 그런거)

 

그 다음에는 외국인 선수와 계약을 해야 함. 예전에는 미국 못가면 일본 가고, 일본 못가면 한국 갔음. 그래서 한국 리그에서는 그냥 연봉 후려쳐도 계약하게 됨. 실제로 해커, 아담, 찰리.. 그 당시에 30만불이라고 발표했는데 진짜 그 가격에 계약했음 ㄹㅇ임.

 

그런데 요즘에는 미국, 일본 쩌리 시장이랑, 한국 시장이랑 통합돼서 몸값이 올라감

 

(여기서 누가 해커에 대해 질문)

 

해커는 일단 비즈니스적으로.. 좀 그런게 있었고, 잘하긴 하는데, 100만불 이상 주고 쓰기에는 좀.. 다른 선수 쓰는게 나을 것 같았음. 그리고 부상으로 2년동안 조금 쉬어서.. 현장에서 내구성 좋은 선수를 원함

 

찰리나 해커 못했으면 이거 그만두고 다른 일 알아볼 뻔 했는데 둘 다 잘해서 다행이라고 하심 ㅋㅋ

 

외국인 선수 영입 이후에는 외국인 선수 코디네이터가 관리해줌. NC의 경우 실제 미국인을 코디네이터로 두고 있음

 

11월이 되면 바쁨.. 새로 선수 뽑아야 됨

 

야구는 다른 사람의 영향이 너무 많음. 투수가 못 던져도 외야수가 다 잡아버리면..

 

기록은 선수 본인의 기여 + 환경 (구장 등) + + 다른 선수의 기여가 다 합쳐짐

 

그래서 실제로는 기여 수준을 계산하는 것 뿐 아니라, 구단의 철학이나 방침을 반영함 (뛰는 야구를 한다던지..)

 

그래서 일부 팬들은 왜 WAR대로 연봉 안주냐고 하는데, 그러면 다들 평범하게 안전한 플레이를 하려고 할 것 (도루도 잘 안하고..)

 

현장에서 선수를 평가하는 경우에는 정성평가를 정량화 해야 됨

 

그래서 본인이 스카우트가 눈으로 본 것을 숫자로 바꿀 수 있도록 기준을 만들었음

 

실제 야구는.. 퓨쳐스 리그만 봐도 기록 신뢰 불가

 

여기 퓨쳐스 리그 한 번이라도 보신 적 있으신 분? 물어보심

 

몇 명 손들자 거기 퓨쳐가 있습니까? 라고 하심 ㅋㅋㅋㅋㅋ

 

그 안에서도 너무 잘하는 선수가 있는 반면에 너무 못하는 선수도 있음. 편차가 큼

 

미국은 리그가 8단계로 구성되어 있는데, 한국은 2군이 끝. 3군도 의미 없음. 그래서 2군 보다보면 정말 1군 될거같은데 아쉬운 선수도 있고, 얘는 왜 야구할까 싶은 선수도 있고, 은퇴 직전 베테랑도 있고, 부상당해서 컨디션 관리하는 선수도 있고.. 그래서 이런 데이터는 믿는게 불가능

 

, 퓨쳐스 기록은 1군에서 적용이 절대 불가능

 

게다가 아마추어 리그는 2군보다도 10배 이상 편차가 심해서 아마추어 기록을 믿을 수 없음. 그래서 기준을 만들어서 어떻게든 현장의 정성평가를 정량화해야 함

 

(니퍼트 자료 보여주심. 이번 플옵 준비할 때 만드신거라고)

 

니퍼트는 좌타자 상대할 때 몸쪽은 직구, 바깥쪽은 변화구인게 확실히 드러남. 이제 이걸 가지고 뭐 예를 들어서 몸쪽 직구만 치라고 알려줌. (분석해줘도 니퍼트 공은 치기 어려운데.. 라고 하심)

 

이승엽 스윙 빈도 그래프도 보여주심. 이승엽은 평소엔 스윙 잘 안하다가 2스트 되면 삼진 안 먹으려고 스윙 많이 함. 다른 선수들도 보통 그럼

 

, 데이터 분석을 하고, 결론까지 만들어줘야 함 (니퍼트는 몸쪽 직구 상대, 이승엽은 2스트 만들면 헛스윙 유도)

 

실제로 데이터 분석 팀에서 하는 일이 많음

 

나눔스퀘어">해외 연구자료 검색 및 공유 / 구단 내 시험 도입 계획 수립 및 시행 등도 함

 

나눔스퀘어">선구안 개선을 위한 프로젝트를 해서, 2군 선수들 대상으로 모바일 게임도 시키고 함

 

나눔스퀘어">구단 내 각종 자료의 누적 관리 / 구단 내 IT System 설계, 개발, 관리

 

이걸 다 팀원 3명 데리고 하려니 힘들다고 하심 ㅠㅠ

 

실제로 이런 기록에 대해서 야구인들에게 얘기하면

 

야구 해봤냐? or 그래서 어쩌라고? 이런 얘기 많이 들음

 

NC 소프트 있을 때는 어려운 얘기 해도 다 알아듣는데,

 

야구단 가니까 일차식 몇 개 나열해도 아무도 말을 안함. 대화가 안됨

 

그래서 현장의 언어를 쓰면서 내용은 짧되, 결론은 명확하게, 현실과 연결지어서 얘기해야 됨

 

 

 

이렇게 강연은 마무리 됐고 질문 몇 개 받음

 

<!--[if !supportLists]-->1.      <!--[endif]-->투구추적 장비

카메라로 찍는 것과, 레이더를 이용해서 도플러 효과로 측정하는 방식이 있음

카메라 방식은 전 구장에 설치되어 있음

레이더 방식은 고척 제외 전 구장에 장비는 있는데, 잘 안씀. 구단들이나 미디어가 필요성을 못 느낌

시청률은 좋은 장비보다는 그냥 인기 구단 중계하면 올라서.. 굳이 비싼걸..

 

<!--[if !supportLists]-->2.      <!--[endif]-->연봉조정협상 (이대호 7천만원 그거)

자료를 KBO에 내긴 하는데, KBO에서 그걸 가지고 뭘 어떻게 하는지는 모름

그래도 선수는 자료가 없으니까 어차피 구단이 이김 ㅋ

 

<!--[if !supportLists]-->3.      <!--[endif]-->심판이 개노답인데, 선수 기록 분석할 때 심판도 고려?

심판마다 특성이 다양한 것은 맞는데, 그렇게 분석하다보면 샘플이 너무 적어져서 신뢰도가 떨어짐

 

 

 

 

더 물어보고 싶었는데 교수님 한 분이 끊으심 (교수님은 LG 팬이라고 하셨다 ㅎ)

 

이대호 150, 강민호 80억 등등 누가 물어보려는데 그 교수님이 다 끊음;;

 

강연 내용 다 적어서 너무 길다 미안..

 

ㅠㅠ



출처: 두산 베어스 갤러리 [원본 보기]

추천 비추천

68

고정닉 2

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
128104 일반 [T갤] 얼굴이 빵같아서 가리고 싶었던 쯔위.. [23] 틋바라기둥갤로그로 이동합니다. 17.11.22 3413 75
128103 일반 [러갤] 171118 신촌 팬싸 소울 지애 미주 명은 예인 10장 [22] 양궁여우갤로그로 이동합니다. 17.11.22 1518 49
128102 일반 [주갤] 도쿄 시부야, Bar CAOL ILA [10] 이치로몰트갤로그로 이동합니다. 17.11.22 2178 14
128101 일반 [프갤] 갠갤에서 1장씩 훔쳐왔다.jpg [13] 유정이이쁘다갤로그로 이동합니다. 17.11.22 992 22
128100 일반 [프갤] 아스카의 '카나' 시절.jpg [9] 112(124.50) 17.11.22 4253 18
128099 일반 [기갤] 돈꽃 EP04 여기저기 텐션쩌는 필주.gif [24] #가나다갤로그로 이동합니다. 17.11.22 2020 24
128098 일반 [사갤] 사랑의온도° [27] ㅇㅇ갤로그로 이동합니다. 17.11.22 3032 87
128096 일반 [워갤] 도새쿠스)입문자의 리자드맨 도색 [10] HellCross갤로그로 이동합니다. 17.11.22 1431 20
128095 일반 [걸갤] 171020 안산,171029 인천공항 출국 은하 by 은하수닷컴 [16] be예린갤로그로 이동합니다. 17.11.22 1820 66
128094 일반 [동기] ♡심쿵주의♡ 우램 간다 [6] ㅇㅇ(116.126) 17.11.22 1082 15
128093 일반 [믹갤] 사진 퍼옴 싸게싸게 믹추 좀 -1 [11] ㅇㅇ(124.54) 17.11.22 2923 33
128092 일반 [기음] 멕시코 처묵 - 1 [16] heeeeya갤로그로 이동합니다. 17.11.22 3444 19
128091 일반 [연뮤] ㅇㅇㅁㄱㅁㅇ 아마도이자람밴드 공연 보니 자람신이 왜 자람신인지 알겠어 [17] ㅇㅇ(61.80) 17.11.22 2279 63
128090 일반 [물갤] 안녕 [31] 문어。◕‿◕。갤로그로 이동합니다. 17.11.22 1456 22
일반 [두갤] NC 다이노스 데이터 분석 팀장님 강연 내용 복기.txt (스압) [24] ㅇㅇ(119.196) 17.11.22 10082 68
128088 일반 [토갤] 오택 오버워치 디바 스태츄 [23] 유동이싫다갤로그로 이동합니다. 17.11.22 4245 14
128087 일반 [기음] 15만원짜리 일식코스로 저녁먹었습니다 [28] 맛나요맛나갤로그로 이동합니다. 17.11.22 4231 16
128086 일반 [방갤] 미친 반도 인기급상승 3위 + 순위권에 7개 오름ㅋㅋ [13] ㅇㅇ(121.177) 17.11.22 4133 132
128085 일반 [철갤] ⑪[1일1철] 발렛전문 2100호대, 4400호대 [12] 브런즈윅갤로그로 이동합니다. 17.11.22 1009 27
128084 일반 [문갤] 데이터폭탄)필사 가요옷! [15] 소따소따갤로그로 이동합니다. 17.11.22 958 19
128083 일반 [프갤] ⚘최유정 15pic [10] B1A4갤로그로 이동합니다. 17.11.22 1242 34
128082 일반 [카연] 흡연충 여고생 망가 -3- [完] [54] TEXUS갤로그로 이동합니다. 17.11.22 12675 111
128081 일반 [기음] 일본인일반가정에서 저녁 식사 조리☆규슈 여행 식사 13☆ [39] 友人帳갤로그로 이동합니다. 17.11.22 4303 38
128080 일반 [철갤] 씹덕철 [10] Asakusa갤로그로 이동합니다. 17.11.22 1275 18
128079 일반 [K갤] 171121 최형우와 함께하는 U-12 전국 유소년 야구대회 [53] 매력퉁이갤로그로 이동합니다. 17.11.22 5420 171
128078 일반 [과빵] 만들어 둔 마카롱 먹었어ㅎㅎ [6] 박하피갤로그로 이동합니다. 17.11.22 1397 26
128076 일반 [T갤] 171117 목동팬싸 채영 4p by.시간은금! [11] 아그거뭐였지그거갤로그로 이동합니다. 17.11.22 1711 55
128075 일반 [철갤] 2017년 10월 부산도시철도 승하차량 [16] 마레나하레갤로그로 이동합니다. 17.11.22 2573 12
128074 일반 [걸갤] 아귀축제 후기 2, 스압주의 [13] .티이몬도(219.107) 17.11.22 1731 17
128073 일반 [등갤] 계룡산 다녀온 짤입니다 [4] ㅇㅇ(118.45) 17.11.21 2712 15
128072 일반 [동기] 햄) 자다가 깬 뚱땡이 [7] 뚱땡이야요(211.109) 17.11.21 2617 19
128071 일반 [황갤] 백번봐도 설레는 지안♥도경 [12] 7(211.36) 17.11.21 2622 31
128069 일반 [과빵] 오늘 저녁과 학교 디저트 [13] 근빵이갤로그로 이동합니다. 17.11.21 4119 42
128068 일반 [워갤] 옹 분위기 존좋인 뉴과질 모아옴 +직캠 [73] ㅇㅇ갤로그로 이동합니다. 17.11.21 2539 169
128066 일반 [해갤] 이승우 vs 볼로냐 하이라이트.gif [36] 시발람갤로그로 이동합니다. 17.11.21 9456 116
128064 일반 [기음] 자취생...수능보기전 최후의만찬 [8] 함대줘(59.25) 17.11.21 8729 49
128063 일반 [냥갤] 이게대체 무슨표정이죠 [19] 소울 스큐어갤로그로 이동합니다. 17.11.21 4446 80
128062 일반 [사갤] 뽀뽀로 깨울줄알았어 [22] 안녕갤로그로 이동합니다. 17.11.21 3396 39
128060 일반 [워갤] 라이클란트를 방문한 툼 킹 이야기 [21] P이너O서클W갤로그로 이동합니다. 17.11.21 4073 39
128059 일반 [워갤] 큰 여우과질 [51] ㅇㅇ(220.119) 17.11.21 3288 173
128058 일반 [동기] 햄스터 붕어빵 적응기 (스압) [13] O0ㅇ갤로그로 이동합니다. 17.11.21 5002 42
128057 일반 [냥갤] [대륙냥] 포도 - 동거 1년기념 짤 왕창 모아 털기 (100장 넘음) [17] SeedLesS갤로그로 이동합니다. 17.11.21 3091 74
128056 일반 [기음] 개인적으로 매겨보는 미국 햄버거 순위 (2/3) [28] Nitro갤로그로 이동합니다. 17.11.21 15394 78
128055 일반 [주갤] 알바니아 티라나 Radio 바 후기 [5] ㅇㅇ(80.90) 17.11.21 1832 11
128054 일반 [믹갤] 주인님이 친히 제조해주신 약 먹을시간이다 ㄹㅇ ; [15] 주인님만쇄이(211.210) 17.11.21 2674 16
128053 일반 [카연] 기자촌 표류기 - 산 下편 [30] 미스터리갤로그로 이동합니다. 17.11.21 3626 52
128052 일반 [냥갤] 2교대 공장아재.... 경축 타꼬 첫1승 [41] 변희재듣보잡갤로그로 이동합니다. 17.11.21 4290 145
128051 일반 [박갤] 김공 과질 뉴짤 [19] ㅇㅇ(211.105) 17.11.21 3609 146
128050 일반 [사갤] 화좀 수구러드니 정선이 윙크씬 자꾸 생각나 [14] ㅇㅇ (175.223) 17.11.21 2285 29
128049 일반 [동기] 초겨울 찰스터 일상 [8] 찰이찰찰(120.142) 17.11.21 1985 22
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2