독일•스페인이 가장 강력한 우승후보? '빅데이터 분석'의 한계...무수한 변수 통제 불가
독일•스페인이 가장 강력한 우승후보? '빅데이터 분석'의 한계...무수한 변수 통제 불가
  • 김수정
  • 승인 2018.07.08 10:28
  • 댓글 0
이 기사를 공유합니다

주말 밤과 새벽 잉글랜드가 스웨덴을 격파하고 크로아티아가 러시아를 승부차기로 물리치면서 러시아 월드컵 4강전 대진이 확정됐다.


흥미로운 사실은 4강전에 독일, 브라질, 스페인, 아르헨티나가 빠졌다는 점이다. 4나라 중 한 나라도 4강에 오르지 못한 것은 월드컵 사상 처음이다.


그런데 더더욱 흥미로운 점은 몇몇 기관이나 대학연구소에서 수십만 자료를 집어 넣어 각자 인공지능(AI)을 통해 분석한 결과, 독일 브라질 스페인을 이론의 여지가 없는 가장 강력한 우승후보로 꼽혔다.


언제부터인가 스포츠도 첨단 IT기술 경연장이 됐다. 특히 빅데이터 분석이 경기력 향상의 핵심 요소로 꼽히고 있다.


미국 프로야구에선 데이터 분석을 기반으로 한 극단적인 수비 시프트를 자주 볼 수 있다. 2루 베이스 위를 타고 넘어가는 안타성 타구가 수비 시프트에 걸려 평범한 타구로 바뀌는 경우도 적지 않다. '머니볼'로 대표되는 데이터 분석 야구의 힘이다.


월드컵 축구도 예외는 아니다. 빅데이터 분석 능력은 독일의 브라질 월드컵 우승 원동력 중 하나로 꼽혔다. 일찌감치 독일 SAP의 빅데이터 분석 기술을 활용한 것이 긍정적인 성과로 이어졌다는 평가가 적지 않았다.


승부 예측에도 빅데이터가 많이 동원된다. 러시아 월드컵 시작 전 인공지능(AI)가 꼽은 유력한 우승 후보는 스페인과 독일이었다. 독일 도르트문트와 뮌헨공대, 벨기에 겐트대학 연구팀 연구 결과다.

인공지능이 꼽은 최고 우승후보였던 스페인이 16강전에서 개최국 러시아에 막혀 탈락했다.


■ 데이터로 잡아내기 힘든 외생 변수에도 주목해야


연구팀들은 AI로 10만회 이상 시뮬레이션 한 결과 스페인이 17.8% 우승 확률을 갖고 있다는 결과가 나왔다고 밝혔다. 독일도 17.1%로 스페인과 함께 유력한 우승 후보로 꼽혔다. 영원한 우승후보 브라질은 12.3%로 우승확률 3위를 기록했다.


하지만 두껑이 열리자 이런 예상과는 완전히 다른 방향으로 전개되고 있다. AI가 꼽은 양대 우승후보 중 독일은 예선에서 탈락했다. 우여곡절 끝에 16강에 진출한 ‘무적함대’ 스페인도 개최국 러시아에 무너졌다.


물론 월드컵 같은 대형 스포츠 대회 우승 후보를 점치는 건 쉽지 않다. AI 뿐 아니라 (사람) 전문가들의 예상도 늘 빗나간다. 축구의 신이라는 펠레가 꼽은 우승후보들은 제대로 실력 발휘를 해 본 적이 없을 정도다. ‘펠레의 저주’란 말까지 생길 정도였다.


따라서 AI와 빅데이터 분석 실패가 특별히 놀라운 건 아니다. 그럼에도 불구하고 AI와 빅데이터의 월드컵 예측 실패는 한번 따져볼 가치가 있다. ‘빅데이터’에 대해 비판적으로 접근할 계기가 될 수도 있기 때문이다.


도르트문트공대 등이 주축이 된 이번 분석팀은 인구 수, 국내총생산(GDP), 클럽 수 같은 정형 데이터와 각종 비정형 자료를 결합해서 분석했다. 발달된 기술 덕분에 과거에는 처리하기 힘들었던 방대한 데이터를 활용할 수 있었다. ‘과거의 자료’를 토대로 미래를 예측하는 방식이다.
 

그런데 과거 자료를 바탕으로 미래를 예측하는 건 생각처럼 쉬운 일이 아니다. 실제 경기에선 다양한 변수들이 발생하기 때문이다.


예를 들어 스페인 팀의 우승을 점친 AI 분석팀은 스페인이 대회 직전 감독을 교체해버린 변수는 고려하지 못했다. 스페인이 16강전에서 맞붙은 러시아가 개최국이란 점, 그래서 묘한 개최국 프리미엄이 작용할 수도 있다는 점도 반영되기 힘든 외부 변수였다.


독일 역시 간판 선수인 뫼수트 외질 등이 대회 직전 터키 대통령과 함께 찍은 사진이 공개되면서 분위기가 뒤숭숭했다. 직전 대회 우승 이후 명확한 목표를 상실한 부분 역시 겉으로 드러나지 않은 데이터다.


그렇다고 해서 빅데이터 분석이 스포츠에선 무의미하다는 의미는 아니다. 프로야구에선 정교한 수비 시프트가 놀랄 정도로 정확하게 맞아 떨어진다. 우익수 앞에서 수비하고 있는 2루수에게 라인드라이브성 타구가 정확하게 날아가는 걸 보면 놀라울 정도다.



■ 빅데이터 분석도 만능 아냐…비판적 읽기 필요


빅데이터 분석을 읽으려면 그 두 가지 현상의 차이를 주목할 필요가 있다. 프로야구의 수비 시프트는 외부 변수 통제 작업이 함께 들어간다. 극단적인 당겨치기 타자를 공략할 땐 투수는 타자 몸쪽으로 찔러넣어야 한다. 외야로 깊숙하게 날리지 못하도록 낮은 코스로 공략하는 것도 중요한 포인트다.


어차피 월드컵 개막 전 빅데이터 분석으로 우승팀을 예측하는 건 재미가 가미된 이벤트였다. 따라서 혹자는 이 글을 두고 ‘재미로 한 이벤트’에 지나치게 정색하며 달려드는 것 아니냐고 비판할 지도 모르겠다.


그 비판은 충분히 의미 있다고 생각한다. 다만 빅데이터에 대해서도 비판적인 읽기가 필요하다는 얘기는 꼭 덧붙이고 싶다. 이번 이벤트는 그런 점에서 우리들에게 좋은 읽을 거리를 준다고 생각한다.


또 하나. 난 AI가 꼽은 월드컵 우승 후보가 줄줄이 탈락한 걸 천만다행이라고 생각한다. 승부를 쉽게 짐작하기 힘들다는 게 스포츠의 또 다른 매력이기 때문이다. 제 아무리 첨단 분석의 시대라 하더라도 AI와 빅데이트는 인간의 조력자로 남아 있을 때 더 큰 매력이 있다.


그래서 독일과 스페인의 조기 탈락에서 희열을 느끼는 독자들이 많았을 것이다. AI가 스포츠 영역에까지 절대신으로 군림하는 ‘슬픈 현실’을 보지 않아도 됐기 때문이다.


FINTECHPOST



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.