O uso de Clusters para criar contexto no Analytics

Recurso para criar contexto na análise de dados

Uma palavra que você leu bastante aqui nos posts do Data Footure foi: “contexto”. Isso porque quando falamos de análise de dados aplicada ao futebol, não há como ser eficiente sem colocar nossos números dentro de um contexto. E é nessa hora que os CLUSTERS aparecem para salvar a lavoura.

A análise de cluster é uma técnica estatística usada para classificar elementos em grupos, de forma que esses elementos dentro de um mesmo cluster sejam muito parecidos, e os elementos em diferentes clusters sejam distintos entre si.

Para definir a semelhança – ou diferença – entre os elementos é usada uma função de distância, que precisa ser definida considerando o CONTEXTO do problema em questão.

A idéia básica é que elementos que componham um mesmo cluster devem apresentar alta similaridade, mas devem ser muito dissimilares de objetos de outros clusters. Ou seja, toda clusterização é feita com objetivo de maximizar a homogeneidade dentro de cada cluster e maximizar a heterogeneidade entre clusters. 

A grande vantagem do uso das técnicas de Clusterização é que, ao agrupar dados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Isso fornece um maior entendimento do conjunto de dados original, além de possibilitar o desenvolvimento de esquemas de classificação para novos dados e descobrir correlações interessantes entre os atributos dos dados que não seriam facilmente visualizadas. 

Método de Clusterização por Grafos | Fonte: Internet

Por exemplo, se você for analisar a probabilidade de gol das finalizações (xG/F) de uma equipe em certo campeonato, vale separar os jogos em clusters. Você pode criar o contexto que lhe interesse. Um bem simples seria “jogos em casa” e “jogos de visitante”.

Mas você também pode cavar mais nesses clusters e criar um contexto mais preciso. Dentro desses 2 clusters iniciais, criar sub clusters como “adversário marca por encaixe”, “adversário marca por setor”, “PPDA do adversário”, etc.

E assim entender melhor em que condições o time analisado cria chances MELHORES e MAIORES. E a partir daí, definir desde metodologia de treino à estratégias de jogos futuros. Vai depender do que você quer saber dos números.

Recurso de Clusterização do Tableau | Fonte: Tableau

Há várias classificações de algoritmos de Clusterização, e você pode criar clusters em programas como Excel, Tableau, R e Phyton. Ai vai pelo gosto do cliente. A questão é: se você quer contextualizar os dados, os clusters irão salvar sua vida. Use sem moderação!

*OBS: o DataFooture vai dar um break de férias e voltamos em janeiro de 2021. Obrigado pela parceria e boas festas a todos!

Compartilhe

Comente!

Tem algo a dizer?

Gustavo Fogaça

Últimas Postagens

A onda tecnicista na função do auxiliar técnico de futebol
Jonatan Cavalcante

A onda tecnicista na função do auxiliar técnico de futebol

0 Comentários
Friendly #1 | Imaginar e construir o futuro, a habilidade fundamental do século XXI
Footure

Friendly #1 | Imaginar e construir o futuro, a habilidade fundamental do século XXI

0 Comentários
Surpresa e tradição: os classificados para as quartas do futebol masculino na Olimpíada
Caio Nascimento

Surpresa e tradição: os classificados para as quartas do futebol masculino na Olimpíada

0 Comentários
Osimhen, Simy, e a problemática das narrativas sobre jogadores africanos
Caio Bitencourt

Osimhen, Simy, e a problemática das narrativas sobre jogadores africanos

0 Comentários
O que esperar do Real Madrid para os próximos anos com Carlo Ancelotti?
Bruna Mendes

O que esperar do Real Madrid para os próximos anos com Carlo Ancelotti?

0 Comentários
O que explica as goleadas do Flamengo com Renato Gaúcho?
Gabriel de Assis

O que explica as goleadas do Flamengo com Renato Gaúcho?

0 Comentários
Como o Vojvodismo transformou o Fortaleza em protagonista no futebol brasileiro?
Jonatan Cavalcante

Como o Vojvodismo transformou o Fortaleza em protagonista no futebol brasileiro?

0 Comentários
God Save the Game #34 | A janela de transferências da Premier League 21/22
Gabriel Corrêa

God Save the Game #34 | A janela de transferências da Premier League 21/22

0 Comentários
Felipão chega entregando o de sempre: segurança e resultado
Gabriel de Assis

Felipão chega entregando o de sempre: segurança e resultado

0 Comentários
Guia do futebol masculino na Olimpíada de Tokyo 2020: parte 2
Caio Nascimento

Guia do futebol masculino na Olimpíada de Tokyo 2020: parte 2

0 Comentários
A Itália ainda pode crescer após o título da Euro?
Caio Bitencourt

A Itália ainda pode crescer após o título da Euro?

0 Comentários
Guia do futebol masculino na Olimpíada de Tokyo 2020: parte 1
Caio Nascimento

Guia do futebol masculino na Olimpíada de Tokyo 2020: parte 1

0 Comentários
O complicado início de Diego Aguirre no Internacional
Gabriel de Assis

O complicado início de Diego Aguirre no Internacional

0 Comentários
Rodrigo De Paul: o meia com DNA de Simeone e Atlético de Madrid
Bruna Mendes

Rodrigo De Paul: o meia com DNA de Simeone e Atlético de Madrid

0 Comentários
A Inglaterra superou seus traumas e, agora, se permite sonhar
Lucas Filus

A Inglaterra superou seus traumas e, agora, se permite sonhar

0 Comentários