Quantificando jogadas de ataque
Apresento uma forma de avaliar jogadas usando a métrica Chance de Gol Sem Bola e como isso pode ser utilizado por profissionais para maior efetividade no estudo jogo-a-jogo.
Em tese, um departamento de analytics em um clube de futebol deve auxiliar vários outros departamentos a tomarem decisões mais assertivas, baseadas em estudos sobre dados históricos. A análise de desempenho e comissão técnica não ficam de fora. O analytics tem muito a oferecer à esses profissionais, que são os que têm maior influência sobre o que ocorre em campo.
Olhando para a parte coletiva do jogo, a análise de desempenho tem dois objetos de estudo principais: o próprio time e o adversário. Em termos gerais, a análise do próprio time visa identificar pontos positivos e negativos que devem ser reforçados ou aprimorados para um melhor desempenho da equipe, enquanto a análise do adversário faz o mesmo para que o time esteja pronto para se proteger das qualidades do adversário e saber explorar suas fraquezas. E como o analytics pode auxiliar nisso?
Conseguir quantificar a qualidade de um ataque, com relação à chance de se marcar um gol, pode ser de extremo valor. Saber quais jogadas de ataque criadas por um foram as mais perigosas, ou quais foram as jogadas concedidas onde o time estava mais exposto, pode contribuir para uma melhor preparação para enfrentar esse adversário. Da mesma forma, fazer a mesma avaliação para seu próprio time permite uma melhor avaliação das próprias qualidades e fraquezas.
No entanto, isso é uma tarefa muito custosa quando realizada manualmente. Analistas de desempenho estão constantemente fazendo esse tipo de avaliação para a preparação jogo-a-jogo. Por falta de tempo, muitas vezes conseguem assistir apenas os últimos 5 jogos do adversário. E se pudessem buscar essas jogadas de perigo automaticamente para poder estudar algum time de forma mais eficiente?
Isso é possível usando o xG (gols esperados), mas acaba sendo limitado a jogadas que terminaram em chutes. Isso acaba deixando de fora boas jogadas onde a posse foi perdida antes da finalização e um gol poderia ter ocorrido. Ademais, o xG por si só não captura como foi o resto da jogada, apenas o chute.
Com dados de tracking, temos a posição de cada jogador e da bola a cada 0,05s. Com isso, sabemos exatamente o que ocorreu durante toda a jogada e não precisamos limitar nossa avaliação apenas ao momento do chute. Quanto mais informação podermos ter, melhor.
Em meu último texto, expliquei a métrica chamada Chance de Gol Sem Bola (CGSB), que representa a probabilidade de se fazer um gol após o próximo movimento da bola (condução, passe ou cruzamento), em um instante de tempo. Ao calcularmos esse valor para todos instantes de tempo onde um jogador do time com a bola possui ela no pé, obtemos uma série temporal do CGSB. Não faz sentido calcular esse valor para quando a bola está sendo passada entre dois jogadores ou no ar após um cruzamento, pois não há como ela ter seu percurso alterado sem que algum jogador interfira nela. Por isso, para esses momentos, o valor do CGSB é zero. A figura abaixo ilustra isso.
É intuitivo pensar que quanto mais tempo um jogador tem para tomar uma decisão, maior a chance da ação ser correta. Para incorporar essa ideia na métrica de Chance de Gol Sem Bola, podemos somar todos os valores da série temporal. Isso vai fazer com que jogadas onde os jogadores tiverem mais tempo com a bola no pé, numa situação de gol, possuam uma avaliação maior do que aquelas onde a oportunidade se mostrou disponível por um curto período de tempo. Ao somar esses valores ao longo do tempo, o que obtemos deixa de representar uma probabilidade. No entanto, continua sendo uma ótima forma de avaliar a qualidade da jogada.
Agora mostraremos isso na prática. Pegando 19 gols do Liverpool durante o ano de 2019, vamos calcular essa soma ao longo do tempo para cada um deles e mostrar que os mais bem-avaliados foram, de fato, jogadas mais perigosas do que os mal-avaliados. Lembrando que esses dados são apenas de gols, mas seria possível aplicar esse método com qualquer jogada, basta ter os dados (no caso, só tenho desses).
A tabela abaixo mostra qual foi o gol (os colchetes indicam qual gol foi), a data do jogo onde ele ocorreu, a duração da parte da jogada capturada pelos dados e a soma da série temporal de cada jogada.
A tabela acima está ordenada baseada no valor obtido ao somar os valores da série temporal do CGSB de cada uma das jogadas. Como podemos ver, o primeiro gol do Liverpool contra o Fulham teve o maior valor. Vejamos esse gol:
De fato, o Liverpool chega com 5 jogadores na área no Fulham, com espaço para receber o passe e em boa posição para finalizar. Além disso, podemos ver que as oportunidades de passe se apresentam disponíveis por muito tempo.
Agora mostrarei o primeiro gol do Liverpool contra o Wolverhampton, que teve a pior avaliação.
Esse gol não parece ser uma chance ruim. No entanto, se pararmos para analisar, muito se deve à qualidade individual dos jogadores envolvidos de executar ações com maior grau de dificuldade e a uma falha individual do defensor dos Wolves que, no último segundo, afasta de Mané, permitindo-o finalizar sozinho. No geral, os Wolves possuíam domínio de grande parte da grande área, impossibilitando que passes fossem feitos a outros jogadores. Outro fator que fez com que essa jogada específica ter sido mal avaliada foram os passes terem sido feitos de primeira, o que significa que haviam menos valores a serem somados, já que a bola fica pouquíssimo tempo no pé do jogador.
Continuando com as segundas melhores e piores chances, olharemos agora o segundo gol do Liverpool contra o Porto, que teve a segunda melhor avaliação.
Nessa jogada, Alexander Arnold chega na linha de fundo, dentro da área, podendo cruzar rasteiro para Salah, Mané ou Firmino (que fez o gol). Três jogadores em condição de receber o passe e em ótimas condições de finalizar.
Agora vejamos o segundo gol do Liverpool contra o Newcastle.
Nessa jogada, mesmo numa situação de transição defensiva, o Newcastle tinha três defensores contra apenas Mané, que ainda conta com uma falha enorme do goleiro, deixando-o com o gol aberto.
Apesar de possuir limitações, como qualquer outro modelo, creio que essa forma de avaliar jogadas pode ser bastante útil para ajudar a entender como um time cria e cede oportunidades. No caso do Liverpool, é notável que grande parte dos gols bem avaliados vieram de cruzamentos rasteiros onde haviam atacantes em boas condições de finalizar. Imagino que isso seria diferente para outros times, com outras características. Além disso, gols mal avaliados tendem a ser resultado de ações onde sobressai qualidades individuais não capturadas pelo modelo, como cruzamentos excepcionais de Alexander-Arnold e Robertson (gol contra o City), ou pela aleatoriedade inerente ao jogo de futebol, como na falha do goleiro do Newcastle.
Por fim, essa análise foi feita em cima apenas de gols, que de qualquer forma seriam de interesse de analistas e membros da comissão técnica. O ideal seria fazer o mesmo com um conjunto muito maior de dados, com jogadas que tiveram todo tipo de resultado, perda de posse, passe errado, chute e gol. Espero ter conseguido mostrar como essa forma de avaliar jogadas possibilita analistas e comissões técnicas a economizar tempo na busca por informações relevantes sobre seu objeto de estudo, seja seu próprio time ou o adversário, atacando ou defendendo.
Comente!