Mais que chutes e gols: dando crédito a quem se posiciona em condições de fazer o gol

Chance de Gol Sem Bola, o modelo que busca, a partir do Controle de Espaço, avaliar a qualidade do posicionamento que possa levar a gols.

São frequentes, no futebol, situações onde um jogador se coloca em posição de receber um passe ou cruzamento para finalizar, mas, por algum motivo, a bola não chega, seja por um passe forte demais ou um cruzamento muito alto. Como, até então, grande parte das análises quantitativas têm focado somente na qualidade dos chutes, perde-se o valor das alternativas de passe oferecidas pelos jogadores que estão atacando e podem resultar em gol.

William Spearman, cientista de dados chefe do Liverpool e doutor em Física pela Harvard University, desenvolveu um modelo (ou métrica) chamado Chance de Gol Sem Bola (Off-ball Scoring Opportunity, em inglês) que avalia a qualidade do espaço controlado pelos jogadores para receber em condição de fazer o gol. O modelo identifica, em cada momento do jogo, quais jogadores, se algum, possuem chances de fazer gol e onde essas chances seriam. O artigo científico de 2018, onde esse conceito é apresentado, se chama “Beyond Expected Goals” (Além de Gols Esperados, tradução minha para o português) e pode ser facilmente encontrado na internet.

Ao longo do texto, mostrarei quatro formas de se utilizar o modelo de Chance de Gol Sem Bola (CGSB). São elas: a identificação de situações de perigo durante o jogo (mostrarei a evolução do CGSB no gol de empate do Flamengo contra o River Plate na final da Libertadores de 2019), a análise da partida, a análise do adversário, e o scouting.

O modelo CGSB é uma extensão do modelo de Controle de Espaço que apresentei em meu texto anterior, também desenvolvido por William Spearman. De forma simplificada, podemos definir o problema da seguinte forma: como calcular a probabilidade de o time com a bola fazer um gol após o próximo evento (passe, condução, lançamento, cruzamento, rebatida, etc.).

Para calcular a probabilidade de que o time que está atacando irá marcar um gol após o próximo evento, torna-se necessário que três fatos ocorram: que, a bola vá, de onde ela se encontra, para algum lugar específico (transição); que, ao chegar nessa localização, algum jogador do time que está atacando irá controlá-la (controle); e que, o jogador que a controle, chute e faça o gol (finalização). Cada uma dessas etapas pode ser expressada como uma probabilidade. Para obtermos a probabilidade das três condições ocorrerem, basta multiplicar a probabilidade obtida em cada etapa.

PCGSB = PT PC PF

Com isso, calculamos essas três probabilidades para cada ponto no campo e, em seguida, as somamos a fim de se obter a probabilidade total, que é o valor total do CGSB em um instante do jogo. Vários dos valores de CGSB serão praticamente zero, uma vez que a maioria das opções de passe ou condução em um instante do jogo não oferece risco de gol. Um exemplo seria um passe de volta para o goleiro, que é provável de acontecer em diversas situações, mas dificilmente o goleiro fará um gol ao receber a bola.

Gostaria de reforçar que o modelo possui limitações e tentarei mostrá-las. No entanto, apesar de ser importante compreender as limitações de um modelo, não devemos gastar todo nosso tempo pensando em suas limitações, mas sim em como ele pode ser útil. Nessa situação, creio que o modelo pode ser útil para jogadores, treinadores, analistas de desempenho e scouts.

Todos os dados, utilizados para a análise que gerou o texto, são de rastreamento (tracking, em inglês), ou seja, capturam a localização dos jogadores e da bola a todo instante. A primeira parte do texto apresenta a fundamentação teórica e está dividida em transição, controle, finalização e chance de gol sem bola.

Para exemplificar o conceito de CGSB utilizei os dados do momento em que Alexander-Arnold cruzou para Andrew Robertson para o segundo gol do Liverpool contra o RB Salzburg, pela segunda rodada da fase de grupos da Champions League de 2019/2020.

Abaixo está o vídeo da evolução da jogada.

1. Fundamentação teórica

1.1 Transição

Através de uma análise sobre a distribuição do deslocamento (yx) de eventos, William Spearman desenvolveu um modelo que calcula a probabilidade de que a bola seja passada ou conduzida para cada ponto no campo. Passes tendem a ocorrer para jogadores que estejam mais próximos e com espaço para recebê-los. Intuitivamente, a soma das probabilidades de transição para cada ponto no campo é igual a 1.

No Mapa de Transição abaixo, podemos ver que, de fato, o modelo de transição reconhece  Salah como a opção mais provável de passe, pois está próximo do portador da bola e não se encontra pressionado.

Uma limitação do modelo de transição é que ele não considera que jogadores tendem a mover a bola em direção ao gol adversário. Isso pode ser percebido na imagem abaixo, já que o modelo indica que um dos lugares com maior chance da bola transicionar é para a região de escanteio, onde Alexander Arnold não possui pressão adversária. Contudo, sabemos que não faz sentido algum o jogador do Liverpool conduzir a bola para escanteio e, como essa região é considerada uma das mais prováveis dele levar a bola, as opções de passe acabam sendo subavaliadas.

Todavia, é possível contornar esse problema de algumas formas. De maneira simples, podemos assumir que Alexander-Arnold não pode deslocar a bola para si próprio, ou seja, não passar de primeira. Assim, são feitos os mesmos cálculos, mas considerando que necessariamente Alexander Arnold irá passar de primeira. Podemos notar o aumento de valor na região onde está Salah, após forçar o modelo a considerar que Alexander Arnold passará de primeira.

Portanto, ao definir a etapa de transição, conseguimos visualizar as regiões do campo para onde há maior probabilidade da bola se mover.

1.2 Controle

A etapa de controle é simplesmente o modelo de Controle de Espaço (CE) descrito no texto anterior (recomendo fortemente a leitura do meu texto anterior para melhor compreensão desta etapa). O CE é a probabilidade de que, caso vá a um ponto de coordenadas (x, y), a bola será controlada pelo time que está atacando. É uma variável contínua que vai de zero a um.

Um CE de valor zero quer dizer que o time com a posse possui probabilidade zero de controlar a bola, caso ela fosse a esse espaço, ou seja, o time sem a posse obteria a bola. O contrário também é válido — um CE de valor um quer dizer que o time com a posse possui probabilidade um de controlar a bola caso ela fosse a esse espaço, ou seja, ele continuaria com ela.

Como principal limitação, o modelo de CE que utilizei é um pouco mais simples do que o desenvolvido por William Spearman e não leva em consideração a chance do passe ser interceptado.

Em síntese, o CE pode ser considerado como um preditor do próximo time em posse, caso a bola vá para a localização em análise.

Como podemos ver abaixo, o lugar para onde Alexander-Arnold cruzou é uma área considerada neutra, onde o modelo não consegue definir qual time tem maior chance de obter controle da bola.

1.3 Finalização

Na etapa de finalização, calculamos a probabilidade de se fazer um gol de cada ponto do campo. Para isso, utilizei um modelo simples de gols esperados, xG (expected goals, em inglês), baseado em um tutorial de um canal do YouTube dedicado ao analytics no futebol, chamado Friends of Tracking (explico mais sobre esse projeto em meu texto anterior).

O Mapa de xG mostra a probabilidade de se fazer um gol ao chutar de cada ponto do campo.

1.4 Chance de Gol Sem Bola

Por fim, no intuito de chegarmos à probabilidade final, para cada ponto no campo multiplicamos as probabilidades obtidas em cada etapa descrita acima. Com isso, a probabilidade final indica a chance de que um passe seja feito a um dado lugar no campo, o jogador controle a bola e marque o gol ao finalizar.

Obtém-se o CGSB total no momento em que o passe é dado ao integrar os valores em todo o campo, ou seja, somar todas as pequenas probabilidades de cada espaço do campo. No caso aqui analisado, a probabilidade total (ou CGSB total de um instante) é de 1,54% (ou 0,0154). Apesar dessa probabilidade total parecer extremamente baixa, os valores de CGSB total não costumam ser altos, visto que não são muitos os momentos no jogo onde há chance de alguém marcar um gol após o evento seguinte. Na maioria do tempo, esse valor beira zero.

A seguir, apresento algumas aplicações, divididas em quatro partes: identificação de momentos de perigo em um jogo, análise da partida, preparação para adversário e scouting.

Na primeira aplicação, foram utilizados dados do primeiro gol de Gabigol na final da Copa Libertadores de 2019. Nas aplicações subsequentes, foi realizada uma tradução dos resultados obtidos por William Spearman em seu artigo. Com isso, meu objetivo foi apresentar aplicações valiosas do modelo de Chance de Gol Sem Bola, mesmo sem ter dados ou poder computacional suficientes. Reforço que todas as imagens das aplicações 2.2, 2.3 e 2.4 vieram dos resultados obtidos por Spearman. Apenas tentei mostrar, assim como o próprio autor, as diferentes áreas de aplicação.

2. Aplicações

2.1 Identificação de momentos de perigo em um jogo

Chances de perigo não necessariamente terminam em finalização. Com isso, não é possível obter todos lances perigosos de uma partida selecionando apenas os momentos em que as jogadas foram concluídas com finalizações. No entanto, com o modelo de Chance de Gol Sem Bola, podemos identificar esses lances ao calcular o CGSB para cada instante do jogo. Logo, um aumento no CGSB em um intervalo de tempo indica que ali houve um aumento na chance de se fazer gol, ou seja, pode ser considerado um lance de perigo independentemente de ser concluído com finalização.

Foi o que aconteceu no gol de empate do Flamengo contra o River Plate, pela final da Libertadores de 2019 (segundo vídeo). Como o desenrolar da jogada ocorre de maneira rápida, também fiz uma versão do vídeo com metade da velocidade, para facilitar a visualização (terceiro vídeo).

Como podemos observar, o valor de CGSB aumenta com o desenvolvimento da jogada, chegando ao seu máximo quando, de fato, a chance de gol é a maior. Nesse caso, mesmo se Arrascaeta errasse o passe, teríamos detectado um aumento considerável no CGSB e notaríamos que foi uma chance de perigo de gol. Ademais, Gabigol receberia crédito pelo valioso espaço que ocupa (área de maior valor no vídeo), mesmo que não recebesse a bola.

2.2 Análise da partida

Em seu artigo, William Spearman calculou a soma dos valores totais de CGSB por minuto para uma partida inteira, obtendo os gráficos abaixo. O gráfico 1 possui como eixo das ordenadas a soma cumulativa do CGSB por minuto, enquanto o gráfico 2 a soma do CGSB apenas naquele minuto. Com isso, conseguimos ter uma ideia de como o jogo desenrolou.

Fonte: “Beyond Expected Goals”, Spearman, 2018

No gráfico 1, o Time I (em vermelho) é o time da casa, o Time D (em azul) é o time visitante e os gols da partida são representados pelos círculos no gráfico. Como podemos observar, durante os primeiros vinte minutos, o time da casa produziu bem mais chances e terminou por fazer um gol. Entretanto, a partir dos 30 minutos, o time visitante foi mais dominante e conseguiu empatar. Os dois times acabaram a partida com a soma de Chance de Gol Sem Bola parecida.

Além disso, também é possível fazer uma análise espacial sobre onde as chances são criadas em uma partida. Para isso, basta somar todos os valores de CGSB para cada ponto no campo durante toda a partida. Dessa forma, obtemos um mapa de calor que pode nos informar mais sobre o jogo.

Fonte: “Beyond Expected Goals”, Spearman, 2018

Os valores entre parênteses são os valores totais de CGSB dos times durante a partida. Podemos notar que o Time I chutou bem mais que o Time D e, apesar disso, os valores totais de CGSB são extremamente próximos. Esse é um exemplo de um jogo onde o modelo de gols esperados indicaria uma dominância do time da casa – uma vez que ele considera apenas finalizações – , mesmo o jogo tendo sido equilibrado. Uma hipótese sobre o por quê de um time ter chutado muito menos que o outro pode ser o fato de terem errado várias vezes o “último passe”, por exemplo.

2.3 Preparação para adversário

Como no gráfico 3, também podemos ver, espacialmente, a contribuição de jogadores específicos de um time para ter maior entendimento do adversário. Em seu artigo, Spearman analisou as contribuições de um lateral-direito de destaque em quatro partidas diferentes. Abaixo podemos ver que ele criou espaços de valor similares nos quatro jogos, apesar de só ter feito gol em um deles. Caso tivesse analisado isso antes, poderia o adversário ter se antecipado à tendência deste jogador conseguir criar perigo nesta região?

Fonte: “Beyond Expected Goals”, Spearman, 2018

2.4 Scouting:

Por fim, o modelo de Chance de Gol Sem Bola pode auxiliar bastante na avaliação de possíveis reforços a um time. Isso se deve, principalmente, ao fato de que o contexto no qual o jogador está inserido muitas vezes influencia sua produção de finalizações e de gols. Ao calcular a média de CGSB por jogo e CGSB por gol, obtemos métricas importantes para compreender o volume e a conversão de chances de um jogador específico. Spearman fez um ranking com os jogadores com maior média de CGSB por jogo em seu conjunto de dados. Nesse caso, o nome dos jogadores e dos times não foi revelado. Os times estão nomeados baseados em sua colocação no campeonato, ou seja, o primeiro colocado é o Time A, segundo colocado Time B e assim por diante.

Fonte: “Beyond Expected Goals”, Spearman, 2018

Como seria de se esperar, a maioria dos jogadores com as maiores médias de CGSB (OBSO, em inglês) são centroavantes, seguidos de pontas e meias ofensivos. Surpreendentemente, um lateral (no caso, o do exemplo da parte III) fecha o top 20. Além disso, também intuitivamente, os jogadores com maior média de CGSB tendem a atuar em times de melhor colocação.

Por fim, essas quatro diferentes maneiras de aplicar o conceito de Chance de Gol Sem Bola mostram um pouco da forma como o analytics pode agregar imensamente na capacidade dos times de tomar decisões em diversas esferas, desde o nível técnico-tático, ao planejamento de construção de equipe.

Por fim, gostaria de agradecer ao Ricardo Tavares pelo fornecimento dos dados, tanto os do desafio do Liverpool, como também os do gol do Flamengo. Sem isso, definitivamente não seria possível realizar esses trabalhos. Além dele, gostaria também de agradecer ao Gabin Rolland, por ter me ajudado com dúvidas que tive ao implementar o modelo de Chance de Gol Sem Bola, e ao Thiago Costa Porto (colega do grupo de Sports Analytics da UFMG) , com quem conversei algumas vezes durante o processo de implementação e escrita e pude esclarecer algumas ideias.

Compartilhe

Comente!

Tem algo a dizer?

Últimas Postagens

Fique de olho: Jogadores que podem se destacar no Brasileiro Sub-20 – Parte 1

Fique de olho: Jogadores que podem se destacar no Brasileiro Sub-20 - Parte 1

André Andrade
Guia do Brasileirão: Vitória

Guia do Brasileirão: Vitória

Douglas Batista
Guia do Brasileirão: Vasco

Guia do Brasileirão: Vasco

Gabriel Mota
Guia do Brasileirão: São Paulo

Guia do Brasileirão: São Paulo

Vinícius Dutra
Guia do Brasileirão: Red Bull Bragantino

Guia do Brasileirão: Red Bull Bragantino

Vinícius Dutra
Guia do Brasileirão: Palmeiras

Guia do Brasileirão: Palmeiras

Vinícius Dutra
Guia do Brasileirão: Juventude

Guia do Brasileirão: Juventude

Vinícius Dutra
Guia do Brasileirão: Internacional

Guia do Brasileirão: Internacional

Vinícius Dutra
Guia do Brasileirão: Grêmio

Guia do Brasileirão: Grêmio

Vinícius Dutra
Guia do Brasileirão: Fortaleza

Guia do Brasileirão: Fortaleza

Douglas Batista
Guia do Brasileirão: Fluminense

Guia do Brasileirão: Fluminense

Gabriel Mota
Guia do Brasileirão: Flamengo

Guia do Brasileirão: Flamengo

Gabriel Mota
Guia do Brasileirão: Cuiabá

Guia do Brasileirão: Cuiabá

André Andrade
Guia do Brasileirão: Cruzeiro

Guia do Brasileirão: Cruzeiro

André Andrade
Guia do Brasileirão: Criciúma

Guia do Brasileirão: Criciúma

André Andrade