구단 데이터 분석가 이야기: 축구계의 조용한 데이터 혁명 [디 애슬레틱]
Premier League

구단 데이터 분석가 이야기: 축구계의 조용한 데이터 혁명 [디 애슬레틱]

728x90
2020년 11월 19일 기존 블로그에 포스팅했던 글을 겨온 것입니다.

 

축구에서 분석의 개념과 실질적인 존재감은 이제 엘리트 축구계에서는 종목의 일부분이라고 할 수 있을 정도다. 갈수록 많은 클럽들이 통계의 가치를 깨닫기 시작한 몇 년 전만 해도, 데이터는 이 업계에서 아주 미미한 영향력만을 행사했다.

 

먼저, analysis analytics에는 근본적인 차이가 존재한다는 점부터 짚고 넘어가보자(역주-번역하면 둘 다 분석이다). 두 용어는 자주 혼용되지만, 실제 경기에서 둘의 차이는 꽤나 크다.

 

축구에서 전통적인 analysis는 비디오와 베이직한 기록들에 많은 초점을 맞춘다. 반면, analytics는 다수의 리그와 여러 시즌의 방대한 통계에서 비롯된 고찰과 이해를 다룬다.

 

아직 축구계에는 야구와 농구에서 일었던 분석(역주-이하 분석은 본문의 analytics를 뜻함) 열풍이 발생하지 않았다. 농구계의 3점슛 혁명이  모르는 사람들을 위해 설명하자면, 최근 몇 시즌 안에 3점슛의 비율이 매우 크게 증가했다  아마 데이터가 한 스포츠에 가장 큰 영향을 끼친 사례일 것이다.

 

프리미어리그 팀들이 매 시즌의 골들을 자세히 들여다보고 감독들은 대부분의 장거리 슛이 의미 없는 노력이라는 걸 알아차리기 시작하면서, 비슷한 트렌드가 축구에서도 생겨나고 있다. 이러한 흐름은 최근 축구계가 기대 골 수치  팀이나 선수가 가졌던 기회의 질을 객관적으로 측정해주는 기록  라는 통계를 채택한 것과 밀접한 관계가 있다.

 

몇 년 전만 해도, 기대 골 수치는 트위터의 소수 그룹에서나 통용되는 단어였다. 이제 xG는 현대 축구 통계의 대표주자로 거듭났다. 지난 2017년 매치 오브 더 데이가 경기 후 스탯에 처음으로 xG를 포함했고, 다른 방송국들도 그 뒤를 따랐다. 대다수의 트위터 분석 그룹에 속해 있던 분석가들도  당시에는 분석 커뮤니티라고 불리웠다  그 즈음부터 클럽에서 일하거나 데이터 관련 조언을 제공하고, 스스로 통계 회사를 차려 써드 파티로 구단들과 작업하거나 미디어에서 통계 분석 관련 업무를 맡기 시작했다.

 

분석팀을 보유하고 있는 프리미어리그 클럽은 많지 않다. 몇몇 해외 구단들은 여러 데이터를 취합해 팀에 어떤 영향을 끼칠지 판단하는 데에 더 많은 시간과 돈, 인력을 투자하기 시작했다. 이 또한 분석(analytics)을 하는 팀의 수를 한 손으로 셀 수 있었던 불과 5년 전과 비교하면 엄청난 변화가 생겼음을 보여준다.

 

이 글은 한 클럽에서 영입과 임대 업무에서 조금이라도 우위를 점하기 위해 노력하고, 궁극적으로는 그들의 팀이 더 많은 승점을 따낼 수 있도록 돕는 분석가, 과학자, 스포츠 기술자들의 이야기다.


구단에 들어가는 루트가 정형화되어 있다고 말하긴 힘들다. 어떤 이들은 공개 모집 광고를 통해 입사 신청을 하는 간단한 과정을 거쳤다. 다른 이들은 자신의 기량이 클럽에 더해줄 가치를 말하며 스포츠 디렉터나 영입 팀장을 설득해야 하기도 했다  블로그를 통해 써온 글이나 다른 클럽에게 했던 컨설팅을 근거로 하는 것이다. 또 다른 사람들은 저녁이나 주말, 직장에서 필수적인 통계적 지식과 코딩 기술들을 습득하면서 아카데미 분석가부터 차근차근 길을 밟아가고 있다.

 

클럽에서 근무하는 분석가들의 뒷배경은 훨씬 다양하다. 일부는 경제학, 철학, 퍼포먼스 분석, 생물학 등의 학위를 딴 능력자들도 있다. 물리학이나 인지 신경과학 박사 학위를 취득한 극소수의 사람들도 존재한다. 이렇게 다양한 사람들을 연관짓는 단 하나의 실마리는 그들이 과거에 공부했던 것이 아닌 중요한 점을 짚어내는 생각을 해내는 능력이다. 모든 사람들이 통일적으로 따르는 정해진 길은 없다  축구는 언제나 주요 목표 그 옆에 놓여진 프로젝트였다.

 

그들이 수행하는 역할 역시 상당히 다양하다. 어떤 분석가들은 코칭스태프들의 질문에 답하는 데에 하루를 다 써버리기도 한다. 몇몇 사람들에게는 일주일에 7일을 일하는 게 업무의 일부분일 뿐이기도 하다.

 

그러나 전반적으로 보면, 장기적인 팀 전략과 이적 작업에 집중하는 사람들보다 퍼포먼스 분석에 힘을 쏟는 사람들이 구조적으로 더 체계적인 역할을 맡는 것처럼 보인다. 퍼포먼스 분석팀에는 상대팀에 관한 보고서가 필요한 시기를 결정하는 일정과 코칭스태프들이 선호하는 준비 과정, 비디오를 통해 분석하는 스태프 등이 잘 짜여져 있다.

 

경기 전 분석에서 데이터의 사용은 상대의 전형, 선수들의 기용과 쓰임새, 세트피스에서의 접근법 등을 빠르게 알기 위한 용도로 사용된다. 이제는 유명한 마르셀로 비엘사의 스파이게이트 세미나에서, 그는 분석가들이 한 경기를 분석하는 데에 4시간이 걸린다는 것을 체크했고, 리즈는 2018-19 시즌이 시작되기 전 더비의 51경기를 모두 시청했다. 이 방대한 작업은 총 360시간을 소모했는데, 그저 다가오는 한 경기만을 위한 시간이었다.

 

비엘사의 코치들은 데이터 분석가에게 자동 시스템을 돌리도록 하면서 많은 양의 업무를 덜어낼 수 있었을 것이다. 미국 축구협회의 데이터 과학자 조리스 베커스는 최근 트위터에 분석가로 합류한 직후 시간이 오래 걸리는 수작업들을 자동화하면서 입지를 확보했다는 점을 언급했다. 베커스는 미국 전 연령대의 남자와 여자 국가대표 팀의 데이터를 퍼포먼스 이해에 더욱 광범위하게 사용할 수 있도록 도왔다.

 

그러나 그들의 일의 전부가 자동화인 건 아니다. 일부 분석가들은 다가오는 경기를 준비하는 신선한 방법을 도입하면서 통계를 사용하기도 한다. 우리는 내부 분석 모델을 통해 상대의 어떤 경기를 보면서 대비할지 결정해요. 한 유력 데이터 분석가는 말했다. 스코어는 경기 저변에 깔린 훌륭한 퍼포먼스를 가려버릴 수 있어요. 심지어 기대 골 수치도 전반적인 양상을 완벽히 제공하진 못하죠. 우리는 상대가 어떻게 볼을 전진시키고 준비해온 것들을 얼마나 잘 해내는지 봅니다.

 

이는 과거 많은 분석가들이 그들과 비슷한 축구를 하는 팀과의 경기가 아닌 최근 다섯 번의 홈과 원정 경기를 골라 지켜보면서 상대를 분석하던 것과는 매우 다른 모습이다.

 

통계 분석가들은 종종 보다 체계적인 프로젝트를 기반으로 한 업무에 참여하기도 한다. 상위권 클럽의 유명 통계 과학자가 선수, 수석코치와 직접 대화하며 어떻게 선수가 더 많은 골을 넣을 수 있을지 이해하는 시간을 가졌던 사례도 있다. 선수의 슈팅 위치와 그의 결정력을 돌아본 결과, 문제는 그의 마무리 능력이 아닌 침투 타이밍과 방향이었다. 결과는? 득점이 급격하게 상승하는 것이었다.

 

이적의 경우, 대개 클럽 스카우트들이 관찰할 선수들의 리스트를 제작하는 것이 분석 팀원들의 일이다. 에이전트나 감독의 추천 선수들이 팀에 정말 맞는지, 혹은 진짜 좋은 선수인지 평가하는 것 역시도 많은 시간과 노력을 요한다. 나는 yes라고 말하기보다 no라고 말하면서 클럽의 돈을 많이 아껴줬죠. 한 이적 데이터 분석가가 거들었다.

 

몇몇 클럽의 애널리스트들은 특정 포지션에서 감독이 특히 원하는 스타일의 선수를 선별해야 한다. 그들이 마주하는 문제는 한정된 예산과 필요한 선수에 대한 묘사가 변화무쌍하다는 것이다. 여름이면 그들이 원하는 선수는 거의 날마다 바뀌죠. 한 분석가가 말했다.

 

새로운 센터백을 원하는 팀의 감독과 장황한 대화를 나눴던 다른 분석가에게도 비슷한 이야기를 들을 수 있었다. 그 한 줌의 선수 리스트를 뽑아내기 위해 각종 통계와 비디오를 보면서 적지 않은 시간을 쓰고 난 후, 감독은 그에게 리스트에 있는 선수들이 자신의 설명과 어떻게 다른지 설명할 뿐이었다.

 

그 감독이 원하는 특별한 능력이 무엇인지에 대해 엇갈린 방향으로 이해하는 바람에 이적시장 개막을 앞두고 영입팀이 귀중한 시간을 허비하긴 했지만, 앞으로도 비슷한 처지에 자주 놓일 감독과 분석가는 좋은 교훈을 얻었을 것이다. 이 업계에서 많은 사람들이 공감하는 부분은 바로 같은 언어로 소통하는 것이었다.

 

영입 부서에 몸을 담는 데이터 분석가들도 클럽 내부 정치에 좌우된다. 만약 스포츠 디렉터가 피지컬적으로 선수를 평가하는 걸 매우 좋아한다면  활동량이나 스프린트 속력 같은 지표들을 좋아하는 사람 말이다  선수를 영입하려 할 때 그런 내용이 보고서의 많은 부분을 차지할 것이다. 이와 유사하게, 몇몇 팀들은 전성기는 영원한 게 아니라는 분석가들의 경고를 무시한 채 무모하게 나이든 선수들을 영입하기도 한다.

 

이적에 관여하는 대부분의 통계 분석가들이 수행하는 업무는 보통 지켜볼 만한 선수들의 리스트를 제공하고 인기있는 선수들에도 체크를 해 두는 것이다. 더욱 진보적인 팀들은 그들을 스카우트가 아닌 앱 개발자로 여긴다  선수들을 클럽 내부 통계 시스템을 통해 분류하고, 대부분의 팀들이 사용하는 옵타나 스탯밤 같은 외부 소스는 쓰지 않는 것이다. 이러한 발상은 만약 우리가 다른 팀들과 같은 툴을 이용한다면, 같은 생각을 하게 된다는 데에서 나왔다  그러면 시장에서 우위를 점할 수 없다.

 

클럽이 분석을 한다고 해서 그 팀이 특별히 앞서가거나 잘 돌아가는 팀이라는 뜻은 아니라는 이야기가 모든 사람들의 입에서 나왔다는 점은 주목할 만한 부분이다. 모범적인 프로젝트도 보편화되는 걸 막는 내부의 정치는 어디에나 있기 마련이다.

 

하지만  코치들의 끊임없는 질문 세례에 답하고 한 번도 변한 적이 없는 감독이 정말로 원하는 센터백에 대해 이야기해온 긴 시간 동안  축구계 전반은 서서히, 그리고 조용히 변해가고 있다. 클럽에서 영향력을 행사하는 사람들도 데이터가 더해줄 수 있는 가치를 깨닫고 점점 현명해지고 있다. 분석의 혁명은 축구라는 스포츠의 중심이나 간판에서 이뤄지지 않을지도 모른다. 그러나 경기장 밖에서는, 뭔가 일이 벌어지고 있다.

 

추천과 댓글은 큰 힘이 됩니다.

 

원문 링크: Tom Worville 2020.11.15

(사진: 디 애슬레틱)

728x90