48
Um modelo estatístico para campeonatos de Futebol Zwinglio Guimarães IFUSP Tratamento Estatístico de dados em Física Experimental - 2016

Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Um modelo estatístico para

campeonatos de Futebol

Zwinglio Guimarães

IFUSP

Tratamento Estatístico de dados em Física Experimental - 2016

Page 2: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Sumário

• Apresentar um modelo para jogos de Futebol

– Incerteza dos jogos

– Vantagem de ser o mandante

• Caracterizar campeonatos

• Extrapolação (Basquete)

• Simulações Monte-Carlo

– Avaliar a resolução dos campeonatos

– Comparar diferentes sistemas de disputa

• Conclusões

Page 3: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

A arte do Futebol

• Alguns conceitos empíricos:

– Os resultados dos jogos são imprevisíveis

• “Futebol é uma caixinha de surpresas”

• “O jogo se define é no campo”

– O mandante tem maior chance de ganhar

• “Empatar fora de casa é um bom resultado”

– No campeonato Brasileiro os times são mais

equilibrados do que nos regionais

• “No Brasileirão não tem jogo fácil”

Page 4: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

O jogo como uma medição

Time A GA x GB Time B

Resultado da partida: R = GA - GB

RInterpretação estatística:

Onde ε é um erro aleatório e Δ é o valor médio esperado para

o resultado da partida (relacionado aos times A e B).

Page 5: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Resultados de jogos

RInterpretação estatística:

pdf(ε) ?

Δ ?

Page 6: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Modelo I – p/ copas do mundo

Δ é a diferença entre as qualidades efetivas de A e B Δ = QA - QB

Ajuste pelo Método dos Mínimos Quadrados permite estimar:

• A qualidade efetiva de cada time, Q

• A incerteza, σ, no resultado R de cada jogo

• As características dos erros, ε, pela análise de resíduos

BA QQR

Page 7: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Ajuste pelo MMQ

Modelo para o resultado

dos jogos:

Na forma matricial:

Onde:

𝑅1 = 𝑄𝐴 − 𝑄𝐵

𝑅2 = 𝑄𝐶 − 𝑄𝐷

⋮𝑅𝑁 = 𝑄𝐴 − 𝑄𝐷

𝑌 = X∙ 𝐴𝐗 =

1 −1 0 00 0 1 −1⋮ ⋮ ⋮ ⋮1 0 0 −1

𝑌 =

𝑅1

𝑅2

⋮𝑅𝑁

𝐴 =

𝑄𝐴

𝑄𝐵

𝑄𝐶

𝑄𝐷

Page 8: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Ajuste de funções lineares nos

parâmetros pelo MMQ (revisão)

• Escrevendo a função modelo como:

𝐆(𝑥) = 𝑎1𝑔1 𝑥 + 𝑎2𝑔2 𝑥 + ⋯ + 𝑎𝑀𝑔𝑀(𝑥)

• O sistema linear de equações do MMQ pode ser escrito

de forma matricial: 𝐷 = 𝐌 𝐴

𝐷𝑙 =

𝑖=1

𝑁𝑦𝑖𝑔𝑙(𝑥𝑖)

𝜎𝑖2 𝑀𝑙,𝑐 =

𝑖=1

𝑁𝑔𝑙(𝑥𝑖)𝑔𝑐(𝑥𝑖)

𝜎𝑖2

cuja solução é: 𝐴 =

𝑎1

𝑎2

⋮ 𝑎𝑀

= (𝐌−1)𝐷 com V 𝐴 = 𝐌−1

Page 9: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Ajuste pelo MMQ - II

O modelo para o resultado dos

jogos na forma matricial:

Implica que a matriz X é:

𝐗 =

𝟏 −𝟏 𝟎 𝟎𝟎 𝟎 𝟏 −𝟏⋮ ⋮ ⋮ ⋮𝟏 𝟎 𝟎 −𝟏

Com:

𝑌 =

𝑅1

𝑅2

⋮𝑅𝑁

𝐴 =

𝑄𝐴

𝑄𝐵

𝑄𝐶

𝑄𝐷

𝑌 = 𝐗 ∙ 𝐴

𝐗 = 𝑔1 𝑔2 𝑔3 𝑔4

Possibilitando escrever M e 𝐷

e determinar 𝐴 pelo MMQ.

Page 10: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Exemplo de resultados (Q) 02

Page 11: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Exemplo de resultados (ε) 02

• Desvio-padrão, σε = 1,3(2)

• Curtose, Kε = 4,0 (14)

Page 12: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Quantificando o ε – COPAS

Page 13: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Mais sobre o ε – COPAS (58 a 06)

• Desvio-padrão, σε = 1,53(6)

• Curtose, Kε = 3,5 (4)

Page 14: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Campeonatos Nacionais: BR

MQQ BA Novo modelo

para Δ:

Distribuição

assimétrica:

Mandante tem

vantagem.

Page 15: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Efeito do mando de jogo – BR

Considerando o

efeito do mando:

MQQ BA

Sem considerar o

mando:

BA QQ

σε = 1,58 (2) Kε = 3,5 (2)

Page 16: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Quantificadores de ε - BRσε = 1.58 (2) Kε = 3.5 (2)

Page 17: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Qualidades dos times no BR

σQ = 0,47 (8)

M = 0,58 (8)

σQ = 0,42 (8)

M = 0,47 (8)

σQ = 0,32 (7)

M = 0,47 (7)

Page 18: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Caracterização do Brasileirão

Page 19: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Caracterização de campeonatos

Page 20: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

ε em diversos campeonatosσε ~ 1,55 Kε ~ 3,4

Page 21: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Kε ~ 3.4 e as probabilidades

A x B com

QA – QB = 0,45

M = 0,5

B x A

Page 22: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

ALGUMAS APLICAÇÕES

Page 23: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Dúvidas Históricas

Final da copa 98

França 3 x 0 Brasil

Δ = 0,2 (1,5)

copa 1978

Argentina 6 x 0 Peru

Δ = 0,7 (1,1)

Page 24: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Mudança de Q devida ao técnico

Page 25: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

EXTRAPOLAÇÃO PARA

CAMPEONATOS DE

BASQUETE

Page 26: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Extrapolação: ε no Basquete

σε ~ 11 Kε ~ 3,4

Page 27: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Extrapolação - Campeonatos

Page 28: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Futebol x Basquete

Page 29: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Assimetrias e Curtoses

Page 30: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

SIMULAÇÕES MONTE

CARLO PARA AVALIAR

SISTEMAS DE DISPUTA

Page 31: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

R

Simulações Monte Carlo

Interpretação estatística:

Características do ε:

Page 32: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

R

Simulações Monte Carlo

Interpretação estatística:

Simular os resultados (Saldo de gols) das partidas de um

campeonato e determinar a classificação obtida segundo os

critérios do campeonato.

As qualidades efetivas e os fatores de mando são definidos com

base nos valores típicos dos campeonatos do tipo escolhido.

MQQ BA Modelo para Δ:

σε ~ 1,55 Kε ~ 3,4Características do ε:

Page 33: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

R

Simulações Monte Carlo

Interpretação estatística:

Simular os resultados (Saldo de gols) das partidas de um

campeonato e determinar a classificação obtida segundo os

critérios do campeonato.

As qualidades efetivas e os fatores de mando são definidos com

base nos valores típicos dos campeonatos do tipo escolhido.

MQQ BA Modelo para Δ:

σε ~ 1,55 Kε ~ 3,4Características do ε:

Page 34: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Exemplo Monte Carlo – BRCaracterísticas do Campeonato Brasileiro:

σQ = 0,45 M = 0,50

20 times, pontos corridos 2 turnos

Page 35: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

BR (pts corridos 2 turnos, 20 times)

Page 36: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Paulistão (com semifinais, 20 times)

Page 37: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

copa do BR (mata-mata, 64 times)

Page 38: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Características comuns:

σε = 1,55 Kε = 3,4

σQ = 0,45 M = 0,50

32 times

Comparação Sistemas

Page 39: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Comparação de sistemas c/ 16 times

Page 40: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Discussão

A modelagem proposta permitiu:

– Quantificar alguns conceitos intuitivos:

• Imprevisibilidade (σε ~ 1,55 é maior que o |Δ| típico)

• Vantagem de ser o mandante (M ~ 0,4 em camp. por pontuação)

• Equilíbrio dos campeonatos (σQ ~ 0,5 em camp. nacionais)

– Identificar semelhanças entre o Futebol e Basquete

• Características dos campeonatos (Imprevisibilidade, vantagem do

mandante e equilíbrio dos times)

– Caracterizar campeonatos e avaliar sistemas de disputa

• O melhor time é o campeão em apenas ~50% das vezes

• Grande dificuldade para definir os 4 melhores (e os 4 piores)

• Segunda fase eliminatória não ajuda a identificar o melhor time

Page 41: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Conclusões

• Propriedades gerais do Futebol e do Basquete

foram obtidos com uma modelagem simples

• Quantificação possibilita outras investigações:

– Origem da vantagem de ser o mandante

– Evolução temporal da Qualidade efetiva

– Causas das incertezas dos jogos

– Relação entre qualidade efetiva e índices técnicos

– Avaliar resultados polêmicos / dúvidas históricas

Futebol e Basquete são caixinhas de incertezas

Page 42: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Previsões (modelo intuitivo)

Desvio-padrão

médio: 0,82 (7)

Page 43: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Comparação Bolão x Copas

BOLÃO:

σε = 0,82 (7)

Kε = 3,7 (6)

COPAS (58 a 06):

σε = 1,53 (6)

Kε = 3,5 (4)

Page 44: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar
Page 45: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar
Page 46: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar
Page 47: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

Ajuste pelo MMQ

NDAN

DC

BA

QQR

QQR

QQR

22

11

Da tabela de jogos:

AY X

Na forma matricial:

1001

1100

0011

X

NR

R

R

Y

2

1

D

C

B

A

Q

Q

Q

Q

A

Onde:

Page 48: Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos de Futebol – Incerteza dos jogos – Vantagem de ser o mandante • Caracterizar

O ajuste pelo MMQ - II

AY X

YA T

A

1~

~VXV

11~

XVXV

T

A

Solução só depende de Y, X e Vε:

1001

1100

0011

X

NR

R

R

Y

2

1

D

C

B

A

Q

Q

Q

Q

A

~

~

~

~

~

NIV2