26
BC-0005 Bases Computacionais da Ciência 2009 Aula 08 Noções de Estatística Média, desvio padrão, erro padrão Exercicíos – utilização da base de dados da turma

Nocões de Estatística

Embed Size (px)

DESCRIPTION

Material do Curso de Bacharel em Ciência e Tecnologia da UFABC.

Citation preview

  • BC-0005Bases Computacionais da

    Cincia

    2009

    Aula 08Noes de Estatstica

    Mdia, desvio padro, erro padroExercicos utilizao da base de dados da turma

  • Roteiro da Aula PARTE I Noes de Estatstica

    O que Estatstica Descritiva e Estatstica Inferencial Medidas de Tendncia Central Medidas de Disperso

    PARTE II Exerccios Determinao da altura mdia, peso mdio Grficos

    idade X altura; idade x peso Histograma de times

  • Idade Altura Peso Taxa Pulsao

    Presso Sistlica

    Presso diastlica

    Colesterol IMC

    (anos) (m) (Kg) bat/min mmHg mmHg mg

    58 1,8 76,1 68 125 78 522 23,522 1,68 64,9 64 107 54 127 2332 1,82 80,7 88 126 81 740 24,331 1,74 79,1 72 110 68 49 2628 1,72 68,7 64 110 66 230 23,346 1,76 75,1 72 107 83 316 24,341 1,69 60,8 60 113 71 590 21,356 1,71 90,7 88 126 72 466 31,120 1,73 78,8 76 137 85 121 26,254 1,67 62,6 60 110 71 578 22,517 1,6 70,3 96 109 65 78 27,573 1,73 84 72 153 87 265 27,952 1,86 86 56 112 77 250 24,925 1,72 68,1 64 119 81 265 23,129 1,73 94,2 60 113 82 273 31,617 1,8 106,7 64 125 76 272 32,841 1,56 79,5 84 131 80 972 32,852 1,94 99,3 76 121 75 75 26,532 1,68 74,7 84 132 81 138 26,420 1,77 61,8 88 112 44 139 19,720 1,66 73,9 72 121 65 638 26,829 1,78 73,1 56 116 64 613 23,1

    Estatstica Quais so a altura, peso

    e IMC mdios desta amostra?

    Qual a altura mdia da turma?

    Qual a taxa de aprovao no vestibular de uma determinada escola?

    Qual a maior torcida presente nesta sala?

  • A Estaststica capaz de responder com maior exatido essas questes

    Estatstica Descritiva apresentao, organizao e resumo dos dados Pode incluir a construo de grficos, tabelas e computao de vrias medidas, tais como, medidas de

    tendncia central (mdia, mediana, moda), medidas de disperso (amplitude, desvio mdio, varincia, desvio padro), percentagem e outras

    O propsito desta estatstica fazer com que os dados coletados sejam compreendidos mais facilmente

    Estatstica Inferencial generalizao de uma amostra de dados para um grande nmero de sujeitos

    mtodos estatsticos so usados para tirar concluses, fazer estimativas, predies e generalizaes sobre todo um conjunto de dados, estudando apenas parte dele, ou seja, a estatstica inferencial nos permite usar informaes de pequenos grupos para fazer inferncias sobre grandes grupos dos quais os dados foram retirados

  • Medidas de Tendncia Central Valor mdio ou tpico de um conjunto

    de dados Mdia Aritmtica ou Mdia: utilizada

    para dados quantitativos Mediana: utilizada para dados ordinais Moda: utilizada tambm para dados

    nominais (variveis qualitativas)

  • Mdia Aritmtica o centro de gravidade dos dados

    Soma de um conjunto de valores dividida pelo nmero de dados do conjunto :

    N

    XX

    N

    ii

    =

    =1

    N

    iX o nmero total de valores do conjunto

    um valor do conjunto

    Alunos Notas

    1 3,0

    2 5,0

    3 6,0

    4 4,0

    5 5,0

    6 8,0

    7 9,0

    8 6,0

    9 2,0

    10 5,0

    Total 53

    Mdia 5,3

    Funo no Excel ou BrOffice: MDIA

    2 3 4

    5

    6

    8 90 1

  • Mediana: valor central do conjunto que divide a

    distribuio em duas partes iguais (mesmo nmero de dados abaixo e acima do valor)

    Os dados devem estar ordenados Notao: Mediana = Posio da mediana =>

    No caso de um nmero par de sujeitos a mediana ser a mdia entre os dois valores centrais.

    Dadas as alturas: 62 54 82 49 75 64 Ordene: 49 54 62 64 75 82 Med = 62+64 = 63

    2

    Notas Freqncia Simples

    Freqncia Acumulada

    2 1 1

    3 1 2

    4 1 3

    5 3 6

    6 2 8

    7 1 9

    8 1 10

    9 1 11

    iX

    21+

    =

    Ni

    Funo no Excel ou BrOffice: MED

    i= 11 + 1 = 6 Posio 6 Nota 5

    2

  • Moda a categoria que ocorre com

    maior frequncia A moda pode no existir OU pode

    no ser nica Exemplos:

    1,1,3,3,5,7,7,7,11,13 moda 7 3,5,8,11,13,18 no tem moda 3,5,5,5,6,6,7,7,7,11,12 tem duas modas: 5,7 (bimodal)

    Notas Freq.

    2 1

    3 1

    4 1

    5 3

    6 2

    7 1

    8 1

    9 1

    Notas Freq.

    2 1

    3 3

    4 1

    5 1

    7 3

    8 1

    9 1

    01234

    2 3 4 5 6 7 8 9

    Frequncia

    Nota

    Distribuio Unimodal

    01234

    2 3 4 5 7 8 9

    Frequncia

    Nota

    Distribuio Bimodal

    Funo no Excel ou BrOffice: MODO

  • Caractersticas das medidas de tendncia central

    Abaixo de 100100

    300500

    700900

    10003000

    5000acima de 5000

    0

    20000

    40000

    60000

    80000

    100000

    120000

    140000

    160000

    Renda Mdia Mensal (R$)

    Freq

    unc

    ia

    MdiaMediana

    Moda

    Mdia influncia de cada amostra depende de seu valor (os valores extremos influenciam fortemente)

    Mediana influncia de cada amostra depende de sua posio (valor central)

    Moda influncia de cada amostra depende de sua frequncia (valor com mais ocorrncia)

    Mediana e Moda so menos influenciadas por valores extremos

    Fonte: Censo Demogrfico IBGE 2000

  • Distribuio de Renda na Califrnia e nos EUA

  • Medidas de Disperso ou Variabilidade: quanto os dados numricos dispersam-se em torno de um valor

    mdio Varincia: Soma dos quadrados dos desvios, onde desvio a

    diferena entre cada dado e a mdia do conjunto.

    Dados )(X

    Desvios )( XX

    Quadrados dos Desvios 2)( XX

    0 -5 25 4 -1 1 6 1 1 8 3 9 7 2 4

    5=X = 0)( XX = 40)( 2XX

    Funo no Excel ou BrOffice: VAR2

    2 ( ) 40 / 4 101

    x Xs

    N

    = = =

  • Medidas de Disperso ou Variabilidade: Desvio Padro reflete o quanto os dados se

    dispersam da mdia a raiz quadrada da varincia

    Funo no Excel ou BrOffice: DESVPAD

    2( )10 3,16

    1x X

    sN

    = = =

  • Erro Padro da Mdia - EPMAlunos Notas

    1 3,0

    2 5,0

    3 6,0

    4 4,0

    5 5,0

    6 8,0

    7 9,0

    8 6,0

    9 2,0

    10 5,0

    Total 53

    Mdia 5,3

    DVP 2,11

    EPM 0,7

    Quando se obtm uma amostra aleatria de tamanho n, estima-se a mdia populacional. bastante intuitivo supor que se uma nova amostra aleatria for realizada a estimativa obtida ser diferente daquela primeira. Desta forma, reconhece-se que as mdias amostrais esto sujeitas variao e formam populaes de mdias amostrais, quando todas as possveis amostras so retiradas de uma populao.

    O erro padro analisa a variabilidade de uma mdia

    Quanto maior o nmero de dados, menor o erro padro da mdia

    1=

    Ns

    X

  • Erro Padro da Mdia - EPM

    1=

    Ns

    X

    No existe uma Funo direta no Excel ou BrOffice para clculo do EPM

    Portanto, calcula-se a partir do desvio padro

    EPM = s/ RAIZ (CONT.NM-1)Alunos Turma A Turma B

    1 5 8

    2 5 9

    3 5 7

    4 5 7

    5 5 2

    6 6 5

    7 4 2

    8 6 0

    9 5 2

    10 5 10

    Total 53 53

    Mdia 5,1 5,2DVP 0,57 3,49EPM 0,18 1,1Turma A Turma B

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

  • Distribuio Normal A distribuio normal (tambm chamada distribuio gaussiana, em homenagem

    a Carl Friedrich Gauss) um importante modelo de distribuio estatstica, observado frequentemente em experimentos relacionados ao estudo de fenmenos de cincias to distintas quanto biologia, fsica e economia.

    ExemploUm instituto de pesquisas realiza uma amostragem com 5000 pessoas para obter uma estimativa da altura mdia do brasileiro adulto. Estas pessoas so sorteadas para a pesquisa atravs de uma estratificao adequada, que reflita os dados de toda a populao do pas. Observe os resultados, categorizados por faixas de altura:

    www.financasnet.com.br

    Clculo da frequncia relativa (porcentagem) =

    freq. Absoluta/ freq. total * 100

  • Distribuio Normal

    Mdia: 1,653

    Desvio Padro: 0,173

    www.financasnet.com.br

    Ela hipottica e essencial na tomada de decises em estatstica. Muitos dos testes estatsticos s tm validade se seus dados constiturem uma distribuio normal.

  • Caractersticas da Distribuio Normal Quanto mais valores so

    plotados em uma distribuio, mais ela se assemelha a uma normal

    determinada por dois parmetros: - Mdia da populao - Desvio padro da populao

    Distribuio simtrica e unimodal em relao mdia

    Valores de mdia, moda e mediana so iguais

    rea total sob a curva igual a 100%, com exatos 50% distribudos esquerda da mdia e 50% sua direita

  • reas sob a Curva Normal A rea sob a curva de uma

    distribuio normal fundamental na soluo de problemas. Ela corresponde a 100% dos dados

    Uma rea de 34,13 % da totalidade dos dados delimitada entre a mdia e 1 desvio padro da mdia

    Quando o desvio padro da mdia 2 a rea aumenta para 47,87%

    Quando 3 a rea aumenta para 49,87%.

    Estas propores so constantes em uma distribuio normal

  • Tipos de distribuio Distribuio Unimodal e Simtrica: Mdia, Mediana e Moda

    so iguais!!!! o ponto de Freqncia Mxima (moda) tambm o mais

    central (mediana) e o centro de gravidade (mdia) Em geral, em uma distribuio assimtrica:

    A moda est sempre prxima ao pico A mdia est mais prxima da cauda (sofre influncia dos

    valores extremos) mediana est entre a moda e mediana

    Medida de Tendncia Central mais adequada: Distribuio Simtrica Mdia Distribuio Assimtrica Mediana ou Moda Distribuio Bimodal Modas

  • Tipos de Distribuio e medidas de tendncia central

    Distribuio Unimodal e Simtrica:

    Mdia, Mediana e Moda so iguais!!!!

    Ponto de Freqncia Mxima (moda) tambm o mais central (mediana) e o centro de gravidade (mdia).

    Distribuio assimtrica: A moda est sempre prxima ao

    pico A mdia est mais prxima da

    cauda (sofre influncia dos valores extremos)

    A mediana est entre a moda e mediana

    Distribuio Assimtrica

    0

    1

    2

    3

    4

    5

    2 3 4 7 8 9 10N o ta

    Fre

    q

    n

    cia

    M oda

    M ediana

    M dia

    Distribuies assimtricas => mediana !!!Distribuio bimodal => Moda!!!

  • Exerccio 1 em sala: Idade Altura Peso Taxa

    PulsaoPresso Sistlica

    Presso diastlica

    Colesterol IMC

    (anos) (m) (Kg) bat/min mmHg mmHg mg

    58 1,8 76,1 68 125 78 522 23,5

    22 1,68 64,9 64 107 54 127 23

    32 1,82 80,7 88 126 81 740 24,3

    31 1,74 79,1 72 110 68 49 26

    28 1,72 68,7 64 110 66 230 23,3

    46 1,76 75,1 72 107 83 316 24,3

    41 1,69 60,8 60 113 71 590 21,3

    56 1,71 90,7 88 126 72 466 31,1

    20 1,73 78,8 76 137 85 121 26,2

    54 1,67 62,6 60 110 71 578 22,5

    17 1,6 70,3 96 109 65 78 27,5

    73 1,73 84 72 153 87 265 27,9

    52 1,86 86 56 112 77 250 24,9

    25 1,72 68,1 64 119 81 265 23,1

    29 1,73 94,2 60 113 82 273 31,6

    17 1,8 106,7 64 125 76 272 32,8

    41 1,56 79,5 84 131 80 972 32,8

    52 1,94 99,3 76 121 75 75 26,5

    32 1,68 74,7 84 132 81 138 26,4

    20 1,77 61,8 88 112 44 139 19,7

    20 1,66 73,9 72 121 65 638 26,8

    29 1,78 73,1 56 116 64 613 23,1

    18 1,6 68,3 68 95 58 762 26,8

    26 1,74 64,8 64 110 70 303 21,4

    33 1,73 92,1 60 110 66 690 30,6

    55 1,76 87,2 68 125 82 31 28,1

    53 1,76 77,8 60 124 79 189 25,2

    28 1,73 72,9 60 131 69 957 24,4

    28 1,83 78,7 56 109 64 339 23,6

    37 1,68 76,4 84 112 79 416 27,1

    40 1,84 96 72 127 72 120 28,4

    33 1,85 89,1 84 132 74 702 25,9

    26 1,73 78 88 116 81 1252 26

    53 1,74 96,5 56 125 84 288 31,7

    36 1,79 61,7 64 112 77 176 19,3

    34 1,62 53,8 56 125 77 277 20,5

    42 1,81 85,1 56 120 83 649 26,1

    18 1,67 74,1 60 118 68 113 26,7

    44 1,73 76,5 64 115 75 656 25,4

    20 1,68 68 72 115 65 172 24

    Calcule Mdia, Mediana,Moda, desvio padro e erro padro dos dados abaixo

  • Exerccio 2 em sala: Um teste de memria foi aplicado a 10 idosos e 10 jovens com o objetivo de verificar o

    declnio de memria decorrente do processo de envelhecimento. Alm do resultado do teste, foram registrados outros dados dos indivduos, tais como: idade, sexo e anos de escolaridade (ver apostila). Estas caractersticas foram registradas pois podem influenciar o desempenho dos indivduos nos testes. Construa uma planilha no BROffice utilizando os dados destas amostras.

    a) Desempenho de cada sujeito: (varia de 0 a 20)Idosos: 16/17/19/19/15/17/18/20/20/16Jovens: 20/20/19/19/20/20/17/19/20/18

    b) Calcule a mdia, desvio padro e erro padro da mdia do desempenho para idosos e jovens

    c) Faa um grfico de colunas da mdia do desempenho de idosos e jovens, com o ttulo Teste de Memria

    d) Inclua as barras de erros com o erro padro da mdia

    e) Discuta a diferena do desempenho entre os grupos com base nos valores de mdia e erro.

  • Para inserir o erro padro no BROffice

    Selecionar os valores de erro calculados na planilha

  • Exerccio 3 em Sala Considere a seguinte tabela de dados de

    presso sangunea obtida para um grupo de 40 pessoas:

    Indivduo Pres s o S is tlic a

    Pres s o dia s tlic a

    mmHg mmHg

    1 1 2 5 7 8

    2 1 0 7 5 4

    3 1 2 6 8 1

    4 1 1 0 6 8

    5 1 1 0 6 6

    6 1 0 7 8 3

    7 1 1 3 7 1

    8 1 2 6 7 2

    9 1 3 7 8 5

    1 0 1 1 0 7 1

    1 1 1 0 9 6 5

    1 2 1 5 3 8 7

    1 3 1 1 2 7 7

    1 4 1 1 9 8 1

    1 5 1 1 3 8 2

    1 6 1 2 5 7 6

    1 7 1 3 1 8 0

    1 8 1 2 1 7 5

    1 9 1 3 2 8 1

    2 0 1 1 2 4 4

    2 1 1 2 1 6 5

    2 2 1 1 6 6 4

    2 3 9 5 5 8

    2 4 1 1 0 7 0

    2 5 1 1 0 6 6

    2 6 1 2 5 8 2

    2 7 1 2 4 7 9

    2 8 1 3 1 6 9

    2 9 1 0 9 6 4

    3 0 1 1 2 7 9

    3 1 1 2 7 7 2

    3 2 1 3 2 7 4

    3 3 1 1 6 8 1

    3 4 1 2 5 8 4

    3 5 1 1 2 7 7

    3 6 1 2 5 7 7

    3 7 1 2 0 8 3

    3 8 1 1 8 6 8

    3 9 1 1 5 7 5

    4 0 1 1 5 6 5

    Utilizando os dados de presso diastlica, calcule a mdia, desvio padro e construa duas tabelas de frequncia:

    1) com intervalos de 5 batimentos (

  • Exerccio 1 para Casa Escolha um cruzamento que tenha o trfego controlado por um semforo.

    Pode ser o que voc observa diretamente da janela de seu apartamento ou da padaria.

    Enquanto voc toma um caf (isso opcional) conte o nmero de carros que passa (escolha uma direo e sentido) a cada intervalo de tempo em que o sinal verde. Tome no mnimo 30 medidas. Faa uma tabela que registre cada medida. Anote o cruzamento, direo, sentido e hora da experincia. Calcule a mdia e o desvio padro.

    Elabore tabelas de frequncia considerando diferentes intervalos (observe que o intervalo aqui dado em nmero de carros). Faa os respectivos grficos de distribuio.

    Faa uma nova srie de medidas para comparao. Pode ser outro cruzamento, outro horrio (hora do rush/trnsito livre, dia til/domingo) etc. Que concluses voc pode tirar comparando as duas sries? Baseie sua resposta nos valores mdios, desvio padro e forma da distribuio.

  • Exerccio 2 para Casa Finalizar exerccio da planilha de memria como est na apostila

    Slide 1Slide 2Slide 3Slide 4Slide 5Slide 6Slide 7Slide 8Slide 9Slide 10Slide 11Slide 12Slide 13Slide 14Slide 15Slide 16Slide 17Slide 18Slide 19Slide 20Slide 21Slide 22Slide 23Slide 24Slide 25Slide 26