Balanço estatístico da Copa de 2018

Por em 16 de julho de 2018 , atualizado em 17 de julho de 2018

Com o fim da Copa do Mundo foi divulgada a classificação das 32 seleções participantes. Podemos então verificar como algumas características das equipes se correlacionam com seu desempenho no torneio (medido pela posição na classificação). Trata-se de uma oportunidade de aplicarmos conceitos de estatística a um evento bem atual. Veja mais aqui  e na playlist abaixo sobre noções de estatística (e, em particular, sobre as técnicas que utilizaremos no texto).

Antes de tudo, um aviso: os resultados que mostraremos a seguir são meramente correlações. Eles nos dizem como duas variáveis se movem conjuntamente nos dados. Mas não dá para afirmar nada quanto a relações de causa-efeito. Se duas variáveis X e Y tendem a andar juntas, elas apresentam correlação positiva. Se quando uma sobe, a outra tende a descer, a correlação é negativa. Não é possível afirmar, com base nisso, que um aumento em X levará a um aumento/diminuição em Y (ou vice-versa).

Uma forma de visualizar a correlação entre duas variáveis é o diagrama de dispersão. Abaixo apresentamos um diagrama de dispersão em que relacionamos a posição da seleção na Copa (eixo vertical) ao valor de mercado dos atletas convocados (eixo horizontal). Cada ponto corresponde a um país. A classificação da seleção está em ordem inversa: quanto mais alto o valor no eixo (e mais baixo o ranking), melhor o desempenho na Copa.

grafico-folha-16.07.0

A linha verde é a reta que melhor se ajusta aos dados. Note que ela é ascendente, o que significa que há uma correlação positiva entre as variáveis. Seleções mais caras apresentaram, em média, melhor desempenho. Claro que a relação não é perfeita. Note a Croácia, por exemplo, bem acima da reta – seu desempenho é muito melhor do que o previsto pelos dados de valor de mercado. E a Alemanha, bem abaixo. Mas a correlação é relativamente forte (ou seja, o ajuste da reta à nuvem de pontos não é ruim).

O coeficiente de correlação é um índice que mede o grau de associação linear entre duas variáveis. Ele é um número entre -1 e 1. Quanto mais próximo de 1, mais juntamente tendem a andar as duas variáveis. Se ele está próximo de -1, elas também andam juntas, mas em sentido contrário (quando uma sobe, a outra tende a descer).

No gráfico acima, o coeficiente de correlação é aproximadamente 0,6.

Uma curiosidade com relação a esses dados: a seleção mais cara é a França (justamente a campeã), e a mais barata a do Panamá (última colocada).

Calculamos correlações do desempenho com outras duas variáveis: a altura média e a idade média dos jogadores de cada seleção. A seguir exibimos o gráfico do desempenho contra a altura média (em centímetros). A linha de tendência é ascendente, mas há muito ruído. Ela explica muito pouco da variação nos dados.
grafico-folha-16.07.2
De fato, o coeficiente de correlação é bem próximo de zero. Aliás, estatisticamente, nem mesmo é possível distinguir esse valor de zero. Não dá para afirmar, portanto, que seleções mais altas se deram melhor no Mundial.

Finalmente, apresentamos a correlação entre classificação e idade média. Nesse caso a reta de tendência é descendente, ou seja, há correlação negativa entre as duas variáveis. Seleções mais jovens, em média, tiveram desempenho melhor. Essa correlação é mais forte do que a anterior, porém não explica muito da variação nos dados. O coeficiente de correlação estimado é igual a -0,2.

grafico-folha-16.07.1

Nos exercícios acima estimamos relações entre duas variáveis. Mas há técnicas que nos permitem levar em conta o efeito conjunto de diversas variáveis sobre o desempenho das seleções. Se relacionarmos a classificação das seleções às três variáveis simultaneamente (valor do elenco, altura média e idade média), a única que se correlaciona com o desempenho das seleções é o valor de mercado dos jogadores. O efeito das outras duas não é diferente de zero, em termos estatísticos.

Fontes dos dados:

Classificação final da Copa do Mundo de 2018

Valor de mercado dos jogadores convocados para as seleções (Os dados foram coletados em 30/6. Hoje os valores já mudaram, provavelmente em função do resultado da Copa)

Altura média

 

Idade média

 

Para ficar por dentro do que rola no Por Quê?, clique aqui e assine a nossa Newsletter.

Siga a gente no Facebook e Twitter!
Inscreva-se no nosso canal no YouTube!
E curta as nossas fotos no Instagram 🙂

 

Mais Postagens

VER TUDO

Receba nossas atualizações em primeira mão

Se você gosta do nosso conteúdo, inscreva-se e não perca nenhuma novidade.