O uso de Clusters para criar contexto no Analytics

Recurso para criar contexto na análise de dados

Uma palavra que você leu bastante aqui nos posts do Data Footure foi: “contexto”. Isso porque quando falamos de análise de dados aplicada ao futebol, não há como ser eficiente sem colocar nossos números dentro de um contexto. E é nessa hora que os CLUSTERS aparecem para salvar a lavoura.

A análise de cluster é uma técnica estatística usada para classificar elementos em grupos, de forma que esses elementos dentro de um mesmo cluster sejam muito parecidos, e os elementos em diferentes clusters sejam distintos entre si.

Para definir a semelhança – ou diferença – entre os elementos é usada uma função de distância, que precisa ser definida considerando o CONTEXTO do problema em questão.

A idéia básica é que elementos que componham um mesmo cluster devem apresentar alta similaridade, mas devem ser muito dissimilares de objetos de outros clusters. Ou seja, toda clusterização é feita com objetivo de maximizar a homogeneidade dentro de cada cluster e maximizar a heterogeneidade entre clusters. 

A grande vantagem do uso das técnicas de Clusterização é que, ao agrupar dados similares, pode-se descrever de forma mais eficiente e eficaz as características peculiares de cada um dos grupos identificados. Isso fornece um maior entendimento do conjunto de dados original, além de possibilitar o desenvolvimento de esquemas de classificação para novos dados e descobrir correlações interessantes entre os atributos dos dados que não seriam facilmente visualizadas. 

Método de Clusterização por Grafos | Fonte: Internet

Por exemplo, se você for analisar a probabilidade de gol das finalizações (xG/F) de uma equipe em certo campeonato, vale separar os jogos em clusters. Você pode criar o contexto que lhe interesse. Um bem simples seria “jogos em casa” e “jogos de visitante”.

Mas você também pode cavar mais nesses clusters e criar um contexto mais preciso. Dentro desses 2 clusters iniciais, criar sub clusters como “adversário marca por encaixe”, “adversário marca por setor”, “PPDA do adversário”, etc.

E assim entender melhor em que condições o time analisado cria chances MELHORES e MAIORES. E a partir daí, definir desde metodologia de treino à estratégias de jogos futuros. Vai depender do que você quer saber dos números.

Recurso de Clusterização do Tableau | Fonte: Tableau

Há várias classificações de algoritmos de Clusterização, e você pode criar clusters em programas como Excel, Tableau, R e Phyton. Ai vai pelo gosto do cliente. A questão é: se você quer contextualizar os dados, os clusters irão salvar sua vida. Use sem moderação!

*OBS: o DataFooture vai dar um break de férias e voltamos em janeiro de 2021. Obrigado pela parceria e boas festas a todos!

Compartilhe

Comente!

Tem algo a dizer?

Últimas Postagens

O caminho da Seleção, as mudanças de Tite e um norte para o Catar
Aurelio Solano

O caminho da Seleção, as mudanças de Tite e um norte para o Catar

0 Comentários
Cinco promessas africanas na base de clubes europeus
Caio Nascimento

Cinco promessas africanas na base de clubes europeus

0 Comentários
Pellegrini: a história dos romanos na Roma continua
Caio Bitencourt

Pellegrini: a história dos romanos na Roma continua

0 Comentários
A afirmação da Espanha e sua nova geração
Bruna Mendes

A afirmação da Espanha e sua nova geração

0 Comentários
Guto Ferreira coloca o Bahia para acelerar
Gabriel de Assis

Guto Ferreira coloca o Bahia para acelerar

0 Comentários
RAIO-X: De onde saem as assistências dos líderes do quesito na Série B
Douglas Batista

RAIO-X: De onde saem as assistências dos líderes do quesito na Série B

0 Comentários
Os destaques dos 8 classificados no Brasileirão Sub-20
Caio Nascimento

Os destaques dos 8 classificados no Brasileirão Sub-20

0 Comentários
A reinvenção de Brahim Diaz no meio-campo do Milan
Caio Bitencourt

A reinvenção de Brahim Diaz no meio-campo do Milan

0 Comentários
Maduro, o Red Bull Bragantino se aproxima de fazer história
Gabriel de Assis

Maduro, o Red Bull Bragantino se aproxima de fazer história

0 Comentários
Friendly #7 | O novo rico Newcastle, Sports Washing e a ‘era’ de clube-estado
Eduardo Dias

Friendly #7 | O novo rico Newcastle, Sports Washing e a 'era' de clube-estado

0 Comentários
Napoli: O impacto inicial de Anguissa com a camisa partenopei
Caio Bitencourt

Napoli: O impacto inicial de Anguissa com a camisa partenopei

0 Comentários
O Grande Norte e os grandes desafios: o que o futuro reserva para o futebol masculino do Canadá?
Caio Nascimento

O Grande Norte e os grandes desafios: o que o futuro reserva para o futebol masculino do Canadá?

0 Comentários
O agressivo América/MG de Vagner Mancini
Gabriel de Assis

O agressivo América/MG de Vagner Mancini

0 Comentários
O Botafogo/PB em busca de um acesso histórico na Paraíba
Douglas Batista

O Botafogo/PB em busca de um acesso histórico na Paraíba

0 Comentários
A disparidade entre Atlético de Madrid e Barcelona
Bruna Mendes

A disparidade entre Atlético de Madrid e Barcelona

0 Comentários