A influência tática do Analytics no futebol
A partir da métrica de "Controle do Espaço", uma análise sobre os gols do Liverpool e a influência que o analytics pode ter no futebol
*Por Hugo Rios Neto
Durante a quarentena, David Sumpter, um professor inglês que é pesquisador na Universidade de Uppsala, na Suécia, montou um grupo de especialistas em analytics aplicado ao futebol para, através de um canal de YouTube chamado Friends of Tracking, tornar as técnicas utilizadas em pesquisas em algo acessível ao público em geral.
Alguns dos membros do grupo são William Spearman (cientista de dados chefe do Liverpool), Javier Férnandez (cientista de dados chefe do Barcelona), Sudarshan Gopaladesikan (cientista de dados chefe do Benfica), Ravi Ramineni (diretor de analytics do Seattle Sounders), Devin Pleuer (cientista de dados chefe do Toronto FC), Laurie Shaw (professor no Instituto para Teoria e Computação de Harvard), Jan Van Haaren (pesquisador da KU Leuven, universidade na Bélgica), entre outros.
Todos eles são referência na área de analytics aplicada ao futebol, uma área interdisciplinar que combina técnicas de ciência da computação, estatística, matemática e física. Em comparação aos esportes americanos, o futebol ainda está em posição de atraso em termos do desenvolvimento de analytics e um dos objetivos dessa iniciativa é trazer mais pessoas para o ecossistema.
Após algumas semanas de conteúdo no canal, David Sumpter propôs um desafio: preparar uma análise quantitativa sobre como o Liverpool faz gols, utilizando alguma das técnicas ensinadas por eles no canal. Foram disponibilizados dados de rastreamento óptico de 19 gols do Liverpool durante o ano de 2019.
Há dois principais tipos de dados que podem ser coletados em partidas de futebol: dados de eventos (“event data”, em inglês) e dados de rastreamento óptico (“optical tracking data”, em inglês).
Os dados de eventos são aqueles que representam eventos que ocorrem durante a partida (passe, chute, bloqueio, etc.). Isso significa que, para todo evento que ocorre, é registrado o tipo de evento, a localização e o jogador que o realizou, entre outros. Quanto maior o detalhamento desse dado, maior será a capacidade de análise. Dados de eventos são os mais comuns atualmente no futebol, com uma boa quantidade de fornecedores e uma cobertura que abrange diversas ligas ao redor do mundo. No entanto, eles possuem uma enorme limitação, uma vez que as anotações são restritas ao agente da ação. Com isso, muita informação relevante à análise é perdida, pois uma tomada de decisão no futebol envolve interpretar tudo que ocorre no campo naquele momento.
O segundo tipo de dado, o de rastreamento óptico, resolve exatamente esse problema, pois ele registra a localização de todos jogadores em campo a cada instante da partida. Esse registro é feito através de técnicas de visão computacional, área da ciência da computação que lida com reconhecimento de imagem. Assim, é possível fazer uma análise quantitativa, sem perder o contexto do que está ocorrendo em campo. Diferentemente dos dados de eventos, os dados de rastreamento ainda não possuem cobertura muito grande. Algumas ligas, como a MLS (Major League Soccer), possuem provedores próprios para esse tipo de dado, mas, na maioria dos casos, o próprio clube tem que buscar o serviço. Acredito que nenhum clube brasileiro faça uso dessa tecnologia ainda. Com dados cada vez mais ricos em informação, a tendência é que seja possível aprofundar o conhecimento sobre o jogo e desenvolver novos meios de avaliar ações de jogadores e das equipes em geral.
Algumas métricas para dados de eventos já são bastante consolidadas, como é o caso do xG, ou gols esperados (“expected goals”, em inglês). O xG é um valor entre 0 e 1 que tenta prever a probabilidade de se fazer um gol daquela localização. Um xG de valor perto de zero indica que é quase impossível que um gol seja feito daquela localização, enquanto um xG de valor perto de 1 significa que as chances são grandes. Como todo modelo de previsão, ele tem sua limitações.
Para a análise do jogo através de dados de rastreamento, William Spearman desenvolveu uma métrica chamada Controle de Espaço (“Pitch Control”, em inglês) que tenta quantificar o controle de espaço no campo. O Controle de Espaço de um jogador em um pequeno espaço do campo é a probabilidade de que esse jogador venha a controlar a bola, caso a mesma vá para esse espaço. Isso nos permite responder uma pergunta relevante ao analisar o jogo: qual time ou jogador controlaria a bola, caso ela fosse para uma localização de interesse? O Controle de Espaço é um preditor do próximo time em posse, caso a bola vá para a localização em análise. Uma solução simples seria assumir que o jogador mais próximo da bola é quem obteria a posse. No entanto, isso não necessariamente é correto, pois um jogador pode estar mais próximo, porém se movendo em direção oposta à da bola, e outro mais longe, mas se movendo em direção à bola.
Os cálculos feitos por Spearman para descobrir quanto tempo cada jogador demora a chegar à bola levam em conta posição, direção, velocidade, aceleração e velocidade máxima dos jogadores. Em termos gerais, o time mais próximo da possível nova localização da bola e com mais jogadores próximos a ela terá uma probabilidade maior de adquirir a posse, caso a bola seja passada para lá.
O valor do Controle de Espaço é uma variável contínua que vai de 0 a 1, que representa a probabilidade de o time em posse continuar em posse. Um Controle de Espaço de valor zero quer dizer que o time com a posse possui probabilidade zero de controlar a bola, caso ela fosse a esse espaço, ou seja, o time sem a posse obteria a bola. O contrário também é válido — um Controle de Espaço de valor um quer dizer que o time com a posse possui probabilidade um de controlar a bola caso ela fosse a esse espaço, ou seja, ele continuaria com ela.
Caso o Controle de Espaço fosse 0,7, por exemplo, a probabilidade do time com a posse mantê-la é de 0,7 e seu complemento, 0,3, de perdê-la. Para calcular o Controle de Espaço para todo o campo, é preciso dividir o campo em pequenos espaços iguais e calculamos o Controle de Espaço para cada um deles. O tamanho dos espaços é arbitrário e espaços menores implicam que serão necessários mais cálculos para gerar o Controle de Espaço no campo todo.
Nessa análise, separei o campo em quadrados de 2,12m de lado, gerando uma matriz de 50×32. O valor do Controle de Espaço em cada posição da matriz é o valor que corresponde à cor que será sobreposta no campo gerado. Ao calcular o Controle de Espaço para todo o campo, é possível ver áreas onde um time ou outro controlariam a bola com maior chance, e outras áreas onde ambos os times possuem probabilidade similar de obter a bola. Chamarei esse gráfico abaixo de Mapa de Controle de Espaço (de forma curta, MCE).
FIGURA 1
O exemplo acima vai ajudar na compreensão da ideia. Cada jogador possui uma posição, dada pelas coordenadas x e y, em metros, a partir do centro do campo, que é a coordenada (0, 0). Todos os jogadores possuem uma velocidade (que pode ser zero), representada pela seta que sai do próprio (jogadores com velocidade zero não possuem seta). Cada espaço no campo possui um valor de Controle de Campo de zero a um, que indica quem controlaria a bola caso ela fosse para lá. A escala ajuda na interpretação desses espaços. O exemplo abaixo é o momento em que Alexander Arnold cruza rasteiro para Firmino fazer o terceiro gol do Liverpool contra o Leicester, no jogo realizado em 26/12/2019. Os números dos jogadores correspondem aos seus números de camisa.
Ao assistir os 19 gols, é notável como o Liverpool gosta de explorar o espaço deixado atrás da última linha de defensores, com Salah e Mané, seja quando o oponente está em um bloco defensivo alto ou em uma situação de contra-ataque. No entanto, parece que, caso o goleiro adversário tivesse se posicionado melhor na jogada, o passe ou lançamento poderia ter sido cortado.
O primeiro gol a ser analisado é o primeiro do Liverpool no jogo de volta das quartas-de-final da Champions League de 2019, feito por Mané. O vídeo abaixo mostra a evolução da jogada, desde o lançamento de Van Dijk até a finalização de Mané, lembrando que os dados disponibilizados não dispõem da localização de todos jogadores ao mesmo tempo, então o goleiro Alisson não aparece. Nesse lance, identifiquei todos jogadores presentes nos dados e, portanto, todos têm seu número de camisa.
Analisemos a jogada no momento em que Van Dijk lança a bola. À esquerda (Figura 2), encontra-se a disposição dos jogadores no momento do passe e, à direita (Figura 2), o Mapa de Controle de Espaço do momento. O ‘X’, nos campos, representa o local onde Mané recebeu o passe. O valor do Controle de Campo no lugar da recepção é de 0.098, ou seja, o Bayern possuía uma probabilidade de 0.902 de conquistar a bola, enquanto o Liverpool tinha a probabilidade de 0.098 de mantê-la. Isso significa que o evento do Liverpool manter a posse após o lançamento era improvável, mas aconteceu.
FIGURA 2
Na minha visão, o jogador mais apto a cortar o lançamento de Van Dijk era Neuer, que estava de frente para o campo, conseguia ter uma boa noção de quais espaços os atacantes poderiam usar para atacar em profundidade e poderia se adiantar a isso. Para descobrir o espaço do campo que o goleiro alemão controlava, calculei o MCE, levando em conta que Neuer era o único jogador do Bayern com possibilidade de obter controle da bola, contra todo o time do Liverpool. Dessa forma, o MCE mostra a área em que o Neuer teria vantagem de Controle de Espaço sobre o time do Liverpool, ou seja, uma região em que ele conseguiria chegar antes de qualquer jogador do Liverpool.
FIGURA 3
O MCE da esquerda (Figura 3) descreve a situação do parágrafo anterior. No local da recepção, no ‘X’, o valor do Controle de Espaço é de 0,733, indicando que o Liverpool tinha uma probabilidade de 0,733 de manter a bola, ao passo que Neuer tinha uma probabilidade de 0,267 de fazer uma intervenção. No entanto, ao calcular o MCE com Neuer 10 metros adiantado (alteração de -10 metros na coordenada do eixo x), a situação é completamente diferente.
Por estar perto de locais para onde passes poderiam ser lançados, Neuer conseguiria chegar mais rápido e interferir na jogada. O valor do Controle de Espaço no local da recepção, na situação à direita, é de 0,060. Sendo assim, a probabilidade do Liverpool reter a bola, com Neuer 10 metros adiantado em relação à posição original, seria de 0,060, enquanto a probabilidade de Neuer fazer uma intervenção seria de 0,940. Além de aumentar o valor do Controle de Espaço no lugar que Mané recebeu a bola, a área que Neuer controlaria é nitidamente maior, indicando que ele também estaria melhor preparado para intervir, caso o passe fosse para outros lugares.
Ao pensar no posicionamento do goleiro, quando o time adversário possui a posse e sua defesa está em um bloco mais alto, me parece intuitivo que ele sempre tente controlar o máximo de espaço possível atrás de sua linha de defesa, sem deixar de proteger o gol. Essa nova posição sugerida (-10 metros na coordenada x e sem alteração na coordenada y) não necessariamente é a melhor, mas já indica uma melhora significativa em relação à posição original.
O passo seguinte, em trabalho futuro, é tentar otimizar a posição do goleiro, de forma a saber de qual lugar ele conseguiria controlar uma área maior, sem deixar de controlar a área do gol, que é sua função principal. Assim, seria possível chegar à localização ideal de posicionamento do goleiro. Claro que, para um modelo mais preciso, seria necessário levar em conta diferentes velocidades e acelerações máximas dos jogadores (por exemplo, Mané é mais rápido que Neuer), além da orientação corporal (nesse sentido, Neuer levaria vantagem, por estar de frente para o lance), já que ambas afetam o tempo em que cada jogador chegaria a um espaço do campo.
Ter um bom posicionamento apenas no momento do lançamento não é suficiente para conseguir intervir na jogada. A interpretação de quais espaços controlar é contínua. Isso se torna evidente no primeiro gol do Liverpool sobre o Watford, jogo realizado em 14/12/2019. O vídeo abaixo mostra o desenrolar da jogada, que acabou sendo concluída em gol.
Primeiramente, calculei o MCE geral no momento em que Mané dá o passe (Figura 4), para tentar entender melhor o que estava ocorrendo em campo. Como nas figuras anteriores, o ‘X’ indica o local onde a recepção do passe foi feita. Novamente o lugar onde o passe é dominado pelo jogador do Liverpool é de controle da defesa, o que me leva a tentar explicar o porquê de Salah ter conseguido chegar primeiro à bola. No ‘X’, o Controle de Espaço é de 0,002. Com isso, a probabilidade do Liverpool continuar com a bola é de 0,002 e de 0,998 do Watford recuperá-la.
FIGURA 4
Como no jogo contra o Bayern, me parece que o goleiro é o jogador mais apto a intervir na jogada, pois está de frente para o lance e significativamente mais próximo do ‘X’. Portanto, calculei o MCE do goleiro Foster contra todo o time do Liverpool, como no caso Neuer x Liverpool, para verificar sobre quais espaços ele possuía maior domínio, se comparado ao time do Liverpool. Assim, obtive o MCE à esquerda (Figura 5). O Controle de Espaço no ‘X’ é o mesmo de quando calculado considerando todos jogadores em campo, 0,002. Isso nos permite concluir que o modelo de Controle de Espaço, de fato, espera que Foster seja o jogador a intervir na jogada, enquanto os outros jogadores de defesa pouco interferem no controle daquele espaço.
FIGURA 5
Por ter uma probabilidade de 0,998 de controlar o ‘X’ no momento do passe, fica a dúvida de porque o gol aconteceu. Para tentar explicar melhor, à direita (Figura 5), calculei o MCE exatamente um segundo após o lançamento ter sido feito. Fica claro que faltou a Foster interpretar o passe como uma grande chance de recuperar a bola. Ao ficar praticamente estático em relação ao segundo anterior, Foster permitiu que o Controle de Espaço do ‘X’ mudasse completamente. Nessa segunda situação, o Controle de Espaço foi de 0,604, indicando que o Liverpool possuía uma probabilidade de 0,604 de continuar com a bola, enquanto Foster tinha uma probabilidade complementar de 0,396 de fazer uma intervenção.
Seria possível analisar o posicionamento de goleiros em alguns outros gols do Liverpool, mas me limitei a esses dois para esse texto. A introdução do conceito de Controle de Espaço nos permite analisar o jogo de forma quantitativa, tendo em vista os espaços supostamente disponíveis para ambos os times explorarem, fato que se restringia à intuição do analista quando não havia ferramentas suficientes para tal. Há uma infinitude de possíveis formas de explorar o Controle de Espaço e explorei no texto apenas uma delas.
O objetivo principal foi apresentar um pouco do mundo de analytics no futebol, trazer o conceito de Controle de Espaço (em grande evidência no momento) e, por fim, analisar como isso se aplica ao jogo e quais conclusões podemos tirar. Os dados de rastreamento óptico trazem possibilidades reais de impacto na parte tática do jogo, se traduzindo em vantagem competitiva. Isso já é realidade na NBA, onde alguns times, além de possuírem um departamento dedicado à analytics, possuem membros da comissão técnica que vieram desse departamento. Falta ao futebol seguir o mesmo caminho.
Comente!