O uso de Clusters para criar contexto no Analytics

Recurso para criar contexto na análise de dados

Uma palavra que você leu bastante aqui nos posts do Data Footure foi: “contexto”. Isso porque quando falamos de análise de dados aplicada ao futebol, não há como ser eficiente sem colocar nossos números dentro de um contexto. E é nessa hora que os CLUSTERS aparecem para salvar a lavoura.

A análise de cluster é uma técnica estatística usada para classificar elementos em grupos, de forma que esses elementos dentro de um mesmo cluster sejam muito parecidos, e os elementos em diferentes clusters sejam distintos entre si.

Para definir a semelhança – ou diferença – entre os elementos é usada uma função de distância, que precisa ser definida considerando o CONTEXTO do problema em questão.

A idéia básica é que elementos que componham um mesmo cluster devem apresentar alta similaridade, mas devem ser muito dissimilares de objetos de outros clusters. Ou seja, toda clusterização é feita com objetivo de maximizar a homogeneidade dentro de cada cluster e maximizar a heterogeneidade entre clusters. 

A grande vantagem do uso das técnicas de Clusterização é que, ao agrupar dados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Isso fornece um maior entendimento do conjunto de dados original, além de possibilitar o desenvolvimento de esquemas de classificação para novos dados e descobrir correlações interessantes entre os atributos dos dados que não seriam facilmente visualizadas. 

Método de Clusterização por Grafos | Fonte: Internet

Por exemplo, se você for analisar a probabilidade de gol das finalizações (xG/F) de uma equipe em certo campeonato, vale separar os jogos em clusters. Você pode criar o contexto que lhe interesse. Um bem simples seria “jogos em casa” e “jogos de visitante”.

Mas você também pode cavar mais nesses clusters e criar um contexto mais preciso. Dentro desses 2 clusters iniciais, criar sub clusters como “adversário marca por encaixe”, “adversário marca por setor”, “PPDA do adversário”, etc.

E assim entender melhor em que condições o time analisado cria chances MELHORES e MAIORES. E a partir daí, definir desde metodologia de treino à estratégias de jogos futuros. Vai depender do que você quer saber dos números.

Recurso de Clusterização do Tableau | Fonte: Tableau

Há várias classificações de algoritmos de Clusterização, e você pode criar clusters em programas como Excel, Tableau, R e Phyton. Ai vai pelo gosto do cliente. A questão é: se você quer contextualizar os dados, os clusters irão salvar sua vida. Use sem moderação!

*OBS: o DataFooture vai dar um break de férias e voltamos em janeiro de 2021. Obrigado pela parceria e boas festas a todos!

Compartilhe

Comente!

Tem algo a dizer?

Gustavo Fogaça

Últimas Postagens

Como Vlahovic virou um artilheiro de muitos gols na Fiorentina
Caio Bitencourt

Como Vlahovic virou um artilheiro de muitos gols na Fiorentina

0 Comentários
Depressão: a inimiga invisível do futebol
Fernanda Lima

Depressão: a inimiga invisível do futebol

0 Comentários
Power in Motion: o projeto de restabelecimento do Dínamo de Moscou
Caio Nascimento

Power in Motion: o projeto de restabelecimento do Dínamo de Moscou

0 Comentários
Em sua primeira final europeia da história, o Villarreal desbanca o Arsenal nas semis da Europa League
Bruna Mendes

Em sua primeira final europeia da história, o Villarreal desbanca o Arsenal nas semis da Europa League

0 Comentários
A coerência no Chelsea de Thomas Tuchel e no City de Pep Guardiola
Lucas Filus

A coerência no Chelsea de Thomas Tuchel e no City de Pep Guardiola

0 Comentários
O que fez Darío Sarmiento chamar a atenção do Manchester City?
Dimitri Barcellos

O que fez Darío Sarmiento chamar a atenção do Manchester City?

0 Comentários
Paul Pogba pode ser o primeiro ‘reforço’ do United para a próxima temporada
Lucas Filus

Paul Pogba pode ser o primeiro 'reforço’ do United para a próxima temporada

0 Comentários
A vez da geração 2004: conheça Matheus Nascimento, Cowell, Sesko e Demir
Caio Nascimento

A vez da geração 2004: conheça Matheus Nascimento, Cowell, Sesko e Demir

0 Comentários
Por que João Pedro é a tábua de salvação para o Cagliari
Caio Bitencourt

Por que João Pedro é a tábua de salvação para o Cagliari

0 Comentários
Biotipo, velocidade de raciocínio e tomada de decisão: o que é a intensidade no futebol
Caio Alves

Biotipo, velocidade de raciocínio e tomada de decisão: o que é a intensidade no futebol

0 Comentários
Knappenschmiede: a histórica forja do Schalke 04 em meio a turbulência existencial do clube
Caio Nascimento

Knappenschmiede: a histórica forja do Schalke 04 em meio a turbulência existencial do clube

0 Comentários
Campeão da Copa do Rei, Barcelona domina o Athletic e busca o doblete
Bruna Mendes

Campeão da Copa do Rei, Barcelona domina o Athletic e busca o doblete

0 Comentários
O que a contratação de Alexandre Gallo pode aportar ao Santa Cruz?
Jonatan Cavalcante

O que a contratação de Alexandre Gallo pode aportar ao Santa Cruz?

0 Comentários
4 histórias para se observar na fase de grupos da Libertadores 2021
Dimitri Barcellos

4 histórias para se observar na fase de grupos da Libertadores 2021

0 Comentários
Raúl Bobadilla e Abel Hernández: conheça os novos centroavantes do Fluminense
Gabriel Corrêa

Raúl Bobadilla e Abel Hernández: conheça os novos centroavantes do Fluminense

0 Comentários