O uso de Clusters para criar contexto no Analytics

Recurso para criar contexto na análise de dados

Uma palavra que você leu bastante aqui nos posts do Data Footure foi: “contexto”. Isso porque quando falamos de análise de dados aplicada ao futebol, não há como ser eficiente sem colocar nossos números dentro de um contexto. E é nessa hora que os CLUSTERS aparecem para salvar a lavoura.

A análise de cluster é uma técnica estatística usada para classificar elementos em grupos, de forma que esses elementos dentro de um mesmo cluster sejam muito parecidos, e os elementos em diferentes clusters sejam distintos entre si.

Para definir a semelhança – ou diferença – entre os elementos é usada uma função de distância, que precisa ser definida considerando o CONTEXTO do problema em questão.

A idéia básica é que elementos que componham um mesmo cluster devem apresentar alta similaridade, mas devem ser muito dissimilares de objetos de outros clusters. Ou seja, toda clusterização é feita com objetivo de maximizar a homogeneidade dentro de cada cluster e maximizar a heterogeneidade entre clusters. 

A grande vantagem do uso das técnicas de Clusterização é que, ao agrupar dados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Isso fornece um maior entendimento do conjunto de dados original, além de possibilitar o desenvolvimento de esquemas de classificação para novos dados e descobrir correlações interessantes entre os atributos dos dados que não seriam facilmente visualizadas. 

Método de Clusterização por Grafos | Fonte: Internet

Por exemplo, se você for analisar a probabilidade de gol das finalizações (xG/F) de uma equipe em certo campeonato, vale separar os jogos em clusters. Você pode criar o contexto que lhe interesse. Um bem simples seria “jogos em casa” e “jogos de visitante”.

Mas você também pode cavar mais nesses clusters e criar um contexto mais preciso. Dentro desses 2 clusters iniciais, criar sub clusters como “adversário marca por encaixe”, “adversário marca por setor”, “PPDA do adversário”, etc.

E assim entender melhor em que condições o time analisado cria chances MELHORES e MAIORES. E a partir daí, definir desde metodologia de treino à estratégias de jogos futuros. Vai depender do que você quer saber dos números.

Recurso de Clusterização do Tableau | Fonte: Tableau

Há várias classificações de algoritmos de Clusterização, e você pode criar clusters em programas como Excel, Tableau, R e Phyton. Ai vai pelo gosto do cliente. A questão é: se você quer contextualizar os dados, os clusters irão salvar sua vida. Use sem moderação!

*OBS: o DataFooture vai dar um break de férias e voltamos em janeiro de 2021. Obrigado pela parceria e boas festas a todos!

Compartilhe
1XBet - Receber Bônus

Comente!

Tem algo a dizer?

Últimas Postagens

Por que a Juventus de Allegri falhou no caminho das conquistas?
Caio Bitencourt

Por que a Juventus de Allegri falhou no caminho das conquistas?

0 Comentários
Início de Luís Castro no Botafogo merece a euforia da torcida
Gabriel de Assis

Início de Luís Castro no Botafogo merece a euforia da torcida

0 Comentários
Conheça Allan Aal, técnico do Grêmio Novorizontino, surpresa da Série B 2022

Conheça Allan Aal, técnico do Grêmio Novorizontino, surpresa da Série B 2022

Douglas Batista
Uma nova, mas já conhecida, função: o renascer de Léo Baptistão no Santos
Aurelio Solano

Uma nova, mas já conhecida, função: o renascer de Léo Baptistão no Santos

0 Comentários
Zalewski: a descoberta de Mourinho que mudou a Roma
Caio Bitencourt

Zalewski: a descoberta de Mourinho que mudou a Roma

0 Comentários
1XBet - Receber Bônus
Líder, Vítor Pereira vai ganhando tempo no Corinthians
Gabriel de Assis

Líder, Vítor Pereira vai ganhando tempo no Corinthians

0 Comentários
Qual o impacto de Maignan no gol do Milan?
Caio Bitencourt

Qual o impacto de Maignan no gol do Milan?

0 Comentários
Retratos de um Real Madrid campeão espanhol e finalista europeu
Bruna Mendes

Retratos de um Real Madrid campeão espanhol e finalista europeu

0 Comentários
Planejado, Coritiba tem seu melhor time dos últimos anos
Gabriel de Assis

Planejado, Coritiba tem seu melhor time dos últimos anos

0 Comentários
O que falta ao Napoli para levantar o Scudetto?
Caio Bitencourt

O que falta ao Napoli para levantar o Scudetto?

0 Comentários
Liderança do Santos chega a partir de melhora defensiva
Gabriel de Assis

Liderança do Santos chega a partir de melhora defensiva

0 Comentários
1XBet - Receber Bônus
Real Betis x Valencia: a final entre Manuel Pellegrini e Pepe Bordalás
Bruna Mendes

Real Betis x Valencia: a final entre Manuel Pellegrini e Pepe Bordalás

0 Comentários
Ten Hag e a missão de reconstruir o Manchester United
Lucas Filus

Ten Hag e a missão de reconstruir o Manchester United

1 Comentários
Coppa Italia: meu bem ou meu mal?
Caio Bitencourt

Coppa Italia: meu bem ou meu mal?

0 Comentários
O Galo que tem tudo para ganhar mais uma vez
Gabriel de Assis

O Galo que tem tudo para ganhar mais uma vez

0 Comentários