특집 | 야구와 통계의 만남, 세이버메트릭스

지난 24일(토) 2018 프로 야구의 막이 올랐다. 국내 최고 인기 스포츠 종목인 야구의 매력은 언제, 누가, 무슨 상황을 만들어낼지 모른다는 데 있다. 하지만 우연성과 예측 불가능함이 야구의 전부는 아니다. ‘세이버메트릭스’(SABERmetrics, The Society for American Baseball Research+metrics)란 이같은 야구의 우연성을 비교 가능한 수치로 정량화하려는 모든 시도를 일컫는다. 예를 들어 세이버메트릭스를 즐기는 사람들은 “A선수가 B선수보다 공을 잘 친다”는 말 대신 “A선수가 B선수보다 특정 지표가 더 높기 때문에 실력이 좋다”는 말로 선수들을 평가한다. 그들에게 통계는 더 이상 복잡하고 머리 아픈 학문이 아니라 야구를 더 깊게 즐기기 위한 놀이도구가 됐다.

통계의 눈으로 바라본 야구

세이버메트릭스는 그 이름에서도 알 수 있듯 미국의 야구팬들을 중심으로 태동했다. 1970년대에 미국에서 야구를 즐기던 사람들은 기존 언론이나 프로 야구팀에서 사용하던 선수 평가론보다 객관적이고 정확하게 선수들의 능력을 평가하기 위한 방법을 고민했다. 오랜 고민의 과정에서 세이버메트릭스에 사용되는 여러 지표가 탄생하게 됐고 이 지표들은 선수 개개인의 기량을 효과적으로 나타냈다. 이현우 야구 칼럼니스트는 “과거의 경기 현장에선 타율이 가장 중시됐지만 팬들은 타율만으로 선수의 능력을 평가할 수 없다고 주장했다”며 “그들은 단순히 타자가 안타를 칠 확률을 나타낸 타율보단 팀의 득점으로 직접 연결되는 OPS*와 같은 지표들을 만들어냈다”고 설명했다. 이에 대해 한국야구학회장 장원철 교수(통계학과)는 “세이버메트릭스는 경기 현장에서 감에 의존해 직관적으로 선수를 평가하던 방법에서 나아가 경기 이후 팬들이 객관적인 데이터를 토대로 선수들의 기량을 평가하는 측정법이 됐다”고 말했다.

이후 컴퓨터의 대중화로 인해 방대한 데이터를 저장하고 가공할 수 있는 환경이 만들어지면서 1990년대부터 국내에서도 세이버메트릭스가 본격적으로 사용되기 시작했다. 야구팬들은 PC 통신을 중심으로 온라인커뮤니티에서 토론하며 국내 세이버메트릭스의 기틀을 다져나갔다. 이현우 칼럼니스트는 “국내의 야구팬들은 활발한 토론을 통해 기존에 국내에서 사용되던 몇몇 선수 평가 지표를 비판했다”며 “그들은 이를 보완하기 위해 능동적으로 선수를 평가하는 해외의 세이버메트릭스 지표들을 국내에 도입할 것을 주장했다”고 말했다. 이런 야구팬들의 목소리로 인해 세이버메트릭스의 지표들이 점차 국내 야구계에 알려졌으며, 현재는 스포츠 기사에도 평가 지표들이 자연스럽게 등장해 선수들의 특성을 설명하기도 한다. 현재 국내의 세이버메트릭스는 팬들이 즐기는 야구 분석의 차원을 넘어서 프로 구단에서 팀 전력 분석을 위해 이용되고 있다. 장원철 교수는 “‘NC 다이노스’를 시작으로 각 국내 프로야구팀은 데이터 분석팀을 둬 전문적으로 통계를 이용해 팀의 전력을 분석하고 있다”고 말하기도 했다.

야구에 깊이를 더하다

◇객관적인 선수 평가를 위해=세이버메트릭스의 여러 지표는 선수들의 특성을 수치로 나타내 구단이 효율적으로 선수를 평가할 수 있도록 한다. 세이버메트릭스의 본고장인 미국에선 신인 선수를 선발할 때 선수를 일일이 대면해 평가하는 대신 기록된 선수의 데이터를 주로 활용하고 있다. 국내에서도 세이버메트릭스는 이와 유사한 목적으로 사용된다. 특히 전문가들은 직접 만나서 평가하기 어려운 외인 선수를 영입할 때 세이버메트릭스를 통한 선수 분석은 필수적이라고 입을 모은다. NC 다이노스 데이터분석팀의 임선남 팀장은 “선수들의 데이터를 분석해 팀의 부족한 부분을 보완해 줄 수 있는 선수를 뽑을 수 있다”며 “이런 작업을 몇 차례 거쳐 최종 후보로 남는 선수만을 만나서 평가한다면 모든 후보를 만나는 방식보다 경제적”이라고 현재 NC 다이노스가 채택하고 있는 선수 선발 방식을 설명했다. 이에 덧붙여 장원철 교수는 “최근엔 (고정된 카메라 세 대를 이용해) 공의 속도와 궤적을 추적하는 ‘Pitch f/x’를 통해 타구 각도와 타구 속도 등 자세한 평가 지표에 접근할 수 있어 선수 분석이 용이해졌다”며 “단순히 경제적 측면만을 비교했을 때 외인 선수를 영입하기 위해 드는 비용이 막대하므로 데이터 분석이 필수적”이라고 말했다.

◇양질의 플레이를 위해=이외에도 세이버메트릭스는 이전의 경기에서 축적된 데이터를 바탕으로 선수와 팀의 경기력을 향상하는 데 쓰이기도 한다. 2010년대 중반 이후 세이버메트릭스의 관점은 개개인의 기량을 평가하는 것에서 양질의 플레이에 대한 논의까지 확장됐다. 신동윤 데이터분과장은 “2016년 메이저리그를 휩쓸었던 ‘플라이볼 혁명’ 역시 이런 흐름의 일환”이라 설명했다. 플라이볼 혁명이란 ‘타자가 타구를 높이 띄웠을 때 더 좋은 결과를 만들어낸다’는 메이저리그의 새로운 트렌드다. Pitch f/x를 통해 공의 궤적을 추적한 결과 실제로 타구를 높이 띄울수록 득점에 도움이 된다는 사실이 확인돼 새로운 타격 이론이 정립됐고, 이는 곧 새로운 훈련방법을 이끌어냈다. 신동윤 데이터 분과장은 “세이버메트릭스가 더 이상 선수 개개인의 기량을 평가하는 수준에 머무르지 않고 선수들이 역량을 강화하는 방법을 제시하면서 선수들의 관심을 받게 됐다”고 평가했다. 이에 대해 야구 경기 현장에서 세이버메트릭스를 사용하고 있는 임선남 팀장은 “실제로 선수들이 원하는 부분은 이전까지의 역량 분석이 아니라 앞으로의 발전을 위한 가이드라인”이라며 “세이버메트릭스는 예년까지의 기록을 바탕으로 그 해 선수들의 퍼포먼스를 예상해 경기력을 향상하기 위한 방법을 제시하기도 한다”고 말했다.

◇공정한 플레이를 위해=세이버메트릭스는 야구와 관련된 모호한 문제들에 통계라는 정밀한 방법으로 다가감으로써 공정한 야구 경기를 가능하게 한다. 한국야구학회는 공정한 경기를 위해 통계를 이용한 여러 연구를 진행해왔다. 장원철 교수는 2016년 한국프로야구 심판 매수 의혹이 불거졌을 당시 세이버메트릭스를 이용해 수사에 도움을 주기도 했다. 그는 “애매모호한 ‘심판매수’라는 문제를 심판이 설정한 스트라이크 존의 범위를 통계적으로 구해 해당 경기의 스트라이크 존과 비교하는 문제로 치환했다”고 말했다. 이어 장 교수는 “수많은 데이터 중 가설을 증명하는 데 필요한 데이터를 선별적으로 이용할 때 세이버메트릭스가 학문적으로도 이용될 수 있다”고 덧붙였다. 또한 한국야구학회는 과거 공식 야구 경기에 사용되는 공의 표준 형태인 ‘공인구’에 관한 논란이 일었을 때도 통계학을 이용해 해당 문제에 접근하고자 했다. 당시 한국 프로 야구 리그는 다른 국가 리그에 비해 경기당 득점이 많다는 지적이 있었다. 장원철 교수는 “공의 반발계수가 높다면 같은 힘으로 공을 쳐도 공이 더 멀리 날아간다”며 “공이 갖는 반발계수를 통해 경기당 득점이 전체적으로 높은 문제의 원인을 밝힐 수 있을 것”이라고 설명했다.

모두의 세이버메트릭스를 위해

야구와 통계의 이색적인 만남은 야구를 대하는 새로운 접근법을 제시했지만 아직 여러 부분에서 아쉬움을 남기기도 한다. 우선, 미국에서 들여온 세이버메트릭스의 평가지표가 본격적으로 국내에서 사용될 당시 국내 프로 야구 리그와 메이저리그의 수준 차이를 고려하지 못했다는 논란이 있다. 이현우 야구 칼럼니스트는 “미국에서 사용되는 세이버메트릭스 평가 지표들은 선수들의 수준이 굉장히 높다는 가정에서 출발한다”며 “이를 그대로 국내에 도입하기엔 다소 무리가 있다”고 설명했다. 그는 “예를 들어 투수의 기량이 뛰어난 미국의 경우 항상 30%로 수렴하는 BABIP*가 국내에선 37~38%까지 증가한다”며 “이 경우 평가 지표가 갖는 의미가 퇴색된다”고 말했다.

세이버메트릭스의 이론적 부분이 보완된다 하더라도 이를 현장에 바로 적용하기 어렵다는 문제도 있다. 세이버메트릭스는 하나의 정립된 이론이 아닌 여러 사람들이 제시한 평가 방법의 집합체이므로 평가 지표들을 매개로 소통하는 데 한계가 있기 때문이다. 신동윤 데이터분과장은 “아직 세이버메트릭스를 사용하는 사람들 사이에서도 여러 단어가 혼용되기도 하고, 뜻이 정확히 정립되지 않은 용어도 있다”며 “세이버메트릭션과 현장에서 직접 야구를 하는 사람들끼리도 원활한 소통이 이뤄지지 않는다”고 설명했다. 임선남 팀장은 “아직도 야구 경기 현장엔 세이버메트릭스 평가 지표에 대해 회의론적 시각을 갖는 소수의 사람들이 존재한다”며 “짧고 간결한 언어로 명확한 결론을 전달해야 할 뿐만 아니라 어느 정도 현실성을 고려하는 의사소통을 지향해야 한다”고 설명했다. 이어 이현우 칼럼니스트는 “세이버메트리션들은 전문 용어를 사용하기 때문에 청자를 고려해 최대한 쉽게 설명해야 한다”고 현장과 소통할 수 있는 방안에 대해 덧붙이기도 했다.

야구 데이터에 대한 접근이 제한돼있다는 점 역시 세이버메트리션 사이에서 문제점으로 꼽힌다. 미국과 달리 국내의 야구 데이터는 대중들에게 공개돼 있지 않기 때문이다. 장원철 교수는 “국내의 모든 야구 데이터는 계약상의 문제로 복잡하게 얽혀 구단에 귀속된다”고 그 이유에 대해 말했다. 이를 두고 이현우 칼럼니스트는 “국내 세이버메트릭스가 더 나은 수준으로 발전하기 위해 데이터의 오픈소스화가 필수적”이라며 “더 많은 사람들이 가공 전의 원자료(raw data)에 접근할 수 있다면 데이터를 바라보는 시선이 다양해질 것”이라고 설명했다. 한편 정보를 대중에게 공개하는 것은 의무가 아닌 선택이라는 의견도 있다. 야구 팬 김초흔 씨(국어국문학과·16)는 “원자료에 대한 팬들의 갈증은 이해하지만 구단 역시 이익을 추구하는 사업체기 때문”이라고 자신의 의견을 제시했다. 이런 팬들의 갑론을박에 대해 임선남 팀장은 “비교적 가치가 낮거나 과거에 중요하게 생각됐던 데이터들을 선별적으로 공개한다면 구단은 전략을 노출하지 않을 수 있고, 팬은 더 많은 자료에 접근할 수 있다”고 절충안을 제시하기도 했다.

영화를 본 후 영화 평론을 보며 그 맛을 곱씹어 보듯 세이버메트릭스는 야구의 맛을 더욱 깊게 즐길 수 있게 한다. 세이버메트릭스를 통해 야구를 분석하는 것은 야구 경기 자체를 관람하는 것과는 또 다른 즐거움을 안겨주기도 한다. 올 시즌 프로야구 개막을 맞아 당신에게 야구의 새로운 세계에 대해 일깨워 줄 세이버메트릭스에 입문해보는 것은 어떨까.

*OPS: 출루율(타석에 나왔을 때 살아남을 수 있는 확률)과 장타율(장타의 개념까지 포함할 수 있는 타율)을 합한 값

*BABIP : 인플레이로 이어진 타구에 대한 타율을 계산하는 용어, 즉 투수가 던진 공이 타자의 배트에 맞아 파울되지 않는 경우의 안타 확률을 나타낸다.

삽화: 손지윤 기자 unoni0310@snu.kr

저작권자 © 대학신문 무단전재 및 재배포 금지