23
Homepage agina de Abertura ´ Indice Geral agina 1 de 23 Voltar Tela Cheia Fechar Sair Aula 2: Estat´ ıstica Descritiva (Probabilidades: conceitos e leis) Disc. Inform´ atica M´ edica, FMUSP 6 de agosto de 2003 Resumo A partir de um conjunto de dados, propomos extrair os parˆ ametros da chamada Estat´ ıstica Descritiva: edia, mediana, etc. Al´ em disto, pretendemos construir histogramas com freq¨ encias absolutas e relativas.

Aula 2: Estat´ıstica Descritiva (Probabilidades: conceitos ... · Homepage P´agina de Abertura ´Indice Geral JJ II J I P´agina 1 de 23 Voltar Tela Cheia Fechar Sair Aula 2: Estat´ıstica

  • Upload
    vancong

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 1 de 23

Voltar

Tela Cheia

Fechar

Sair

Aula 2: Estatıstica Descritiva (Probabilidades:

conceitos e leis)

Disc. Informatica Medica, FMUSP

6 de agosto de 2003

Resumo

A partir de um conjunto de dados, propomos extrair os parametrosda chamada Estatıstica Descritiva: media, mediana, etc. Alem disto,pretendemos construir histogramas com frequencias absolutas e relativas.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 2 de 23

Voltar

Tela Cheia

Fechar

Sair

Sumario

1 Objetivos 3

2 Tabela ordenada 4

3 Estatıstica descritiva 6

4 Histogramas 11

5 Macros 21

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 3 de 23

Voltar

Tela Cheia

Fechar

Sair

1. Objetivos

Objetivos desta aula� �Ao final desta aula, o aluno devera ser capaz de:

• aplicar tecnicas de reducao de dados;

• montar uma “tabela ordenada”;

• calcular media aritmetica, mediana, variancia, desvio padrao e erropadrao da media;

• calcular intervalos de classes;

• construir histogramas;

• construir distribuicoes de frequencias: absolutas e relativas.� �

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 4 de 23

Voltar

Tela Cheia

Fechar

Sair

2. Tabela ordenada

1. Inicialmente, baixe do site (clique aqui e veja na outra janela) o arquivo“idades.xls” em um diretorio adequado de sua estacao de trabalho. Odiretorio pode ser, e.g.,“C:\MPT164\seunome”, o qual ja existe ou devera ser criado.

2. Inicie o MINITAB e abra a planilha “idades.xls”:

File I Open WorkSheet . . .

Procure o diretorio mencionado no item 1 acima e nao se esqueca de sele-cionar a extensao “.xls” (arquivo MS-Excel) no menu Files of Type. Emcaso de duvida, consulte a apostila Introducao ao MINITAB.

3. Ha uma coluna nesta tabela denominada idade onde ha as idades sem or-dem definida dos pacientes atendidos em uma certa clınica em um dadodia.Para ordena-las, em ordem crescente, utilize o comando do menu ja utili-zado em aula anterior:

Manip I Sort . . .

Preencha os campos de acordo com a Figura 1. Clique OK e observe queha 169 pacientes, com idades no intervalo:

18 ≤ idade ≤ 63

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 5 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 1: Janela do comando Sort no MINITAB para ordenacao da coluna C1.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 6 de 23

Voltar

Tela Cheia

Fechar

Sair

3. Estatıstica descritiva

1. Vamos calcular a media das idades e colocar o resultado na coluna C2.

(a) Nesta coluna C2, na primeira linha, escreva a palavra media (semacento mesmo), apenas para fazermos referencia.

(b) Em seguida, no menu, clique

Calc I Calculator . . .

(c) Surge a tela apresentada na Figura 2.i. Digite C2 no campo referente a Store result in variable:.ii. No menu Functions:, procure a funcao Mean (Media), marque-

a e clique o botao Select. Surgira no campo referente a Expres-sion: o termo

MEAN(number)

No lugar do termo number, coloque C1.iii. Clique OK.

(d) Na coluna C2, logo abaixo da palavra media, surge o resultado damedia (µ = 34.2604), como mostra a Figura 3.

(e) A janela do Calculator (Figura 2) apresenta diversas outras funcoesque poderao ser uteis em ocasioes posteriores.

2. Outras grandezas como a mediana, desvio-padrao e demais podem serobtidas de modo semelhante ao que foi apresentado no item 1c acima,utilizando o menu Calculator. . . . Contudo, mostramos a seguir que hauma forma mais rapida de obter todos os valores mencionados.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 7 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 2: Tela do menu do MINITAB referente ao Calculator.

(a) No menu, clique

Stat I Basic Statistics I Display Descriptive Statistics . . .

Surge a janela Display Descriptive Statistics, como mostra a Fi-gura 4. Coloque no campo Variables: a variavel idade (ou C1).

(b) Clique OK.

(c) Na janela Session, o qual normalmente se apresenta acima da plani-lha, surgem os resultados solicitados, como mostra o quadro abaixo.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 8 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 3: Planilha do MINITAB que apresenta a media calculada das idadestranscritas na coluna C1.

Descriptive Statistics: idade

Variable N Mean Median TrMean StDev SE Meanidade 169 34.26 31 33.784 10.356 0.797

Variable Min Max Q1 Q3idade 18 63 26 42

Em seguida, uma breve descricao de cada um dos valores obtidos:

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 9 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 4: A janela do Display Descriptive Statistics.

N = 169 e a quantidade de dados; Mean = 34, 260, a media µ dosvalores Xi (como ja foi calculada anteriormente); Median = 31, a me-diana; TrMean = 33.784, e a media removendo 5% dos valores maisbaixos e 5% dos valores mais altos;StDev = 10.356, desvio padrao Sdada pela expressao

S =

√√√√√ N∑i=1

(Xi − µ)

N − 1;

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 10 de 23

Voltar

Tela Cheia

Fechar

Sair

SE Mean = 0.797, erro padrao da media (EPM) dado pela ex-pressao

EPM =S√N

;

Minimum = 18.000 e Maximum = 63.000 sao obvios; Q1 = 26.000 eQ3 = 42.000 sao, respectivamente, primeiro quartil e terceiro quartil.O primeiro quartil e o maior valor entre os 25% menores valores doconjunto de dados. Por sua vez, o terceiro quartil e o menor valorentre os 25% maiores valores do conjunto de dados.

Atencao: Cuidado no uso do ponto decimal� �Todos sabemos que se utiliza ”vırgula”como ponto decimal no Brasil e oponto na maioria de outros paıses do mundo. O uso as vezes indiscri-minado de ponto como decimal quando se redige texto em portugues estaerrado. Portanto, nao e o fato de os programas de estatıstica ou de planilhaseletronicas mostrarem os resultados usando ponto, que devemos utiliza-lopara mostrar os resultados em um relatorio.� �

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 11 de 23

Voltar

Tela Cheia

Fechar

Sair

4. Histogramas

O histograma de um conjunto finito de valores permite-nos visualizar, a partirde uma classificacao previamente definida, a distribuicao destes valores em cadaclasse. As praticas sugeridas abaixo esclarecerao melhor os seus propositos.

O MINITAB cria histogramas com diversos enfoques. Mostraremos em se-guida alguns procedimentos basicos, a saber:

• procedimento automatico, ou seja, o MINITAB utiliza o seu formato padrao(default);

• definicao dos limites dos intervalos de cada classe por parte do usuario.

1. O procedimento automatico e bastante simples, como mostraremos a se-guir.

(a) Clique no menuGraph I Histogram . . .

(b) Surge a janela Histogram. No campo Graph variables:, coloquecomo a primeira variavel X a idade (ou C1), como esta indicado naFigura 5.

(c) Logo abaixo, ha o item Annotation H. Clique-o e surge um menupush-down, como esta apresentado na Figura 6. Clique em DataLabels. . . , o que ativa a janela Data Labels (vide Figura 7).

(d) Clique a opcao Show data labels, como mostra a Figura 8 e cliqueOK. Voltamos para a janela 5. Clique OK.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 12 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 5: Janela para configuracao de histogramas no MINITAB.

(e) Surge o histograma, em janela a parte, mostrado na Figura 9. Osnumeros apresentados sobre cada barra sao os data labels e se referema frequencia que cada valor apresenta no conjunto de dados.

(f) Como se ve no grafico 9, o formato padrao do MINITAB nem sempree o modo mais conveniente de construir um histograma, pois o resul-tado, neste caso, e pouco esclarecedor a respeito da distribuicao dosvalores.

2. Podemos obter um histograma cujas barras representam a frequencia dedados entre 10 e 20, 20 e 30, 40 e 50, etc.

(a) Na janela da planilha, na coluna C3, escreva na primeira linha apalavra intervalo e, nas linhas seguintes, coloque os numeros de 10

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 13 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 6: Janela do item Histogram com o menu push-down do botao Anno-tation.

a 70, como mostra a Figura 10.

(b) Execute GraphI Histogram. . .

(c) A janela 5 e ativada. Clique o botao Options. . . e surge a janelaHistogram Options (Figura 11).

(d) Marque as opcoes:

Type of Histogram : • Frequency

Type of Intervals : • CutPoint

Definitium of Intervals : • Midpoint/cutpoint positions :

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 14 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 7: Janela Data Labels do MINITAB antes da ativacao da opcao Showdata labels.

No campo em frente a opcao Midpoint/cutpoint positions:, digiteC3 ou de um duplo clique na palavra intervalo na janela mais aesquerda. Clique OK.

(e) Ao voltar para a janela de Histogram (Figura 5), clique em FrameH. Um menu push-down surge, como mostra a Figura 12. EscolhaMin and Max. . ..

(f) Na janela Min and Max, digite os valores apresentados na Figura13, ou seja, coloque os valores para Y entre 0 e 100.

(g) clique OK ate sairmos da janela de Histogram (Figura 5). O graficoapresentado na Figura 14 e gerado.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 15 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 8: Janela Data Labels do MINITAB apos a ativacao da opcao Showdata labels.

(h) Comparando os graficos das Figuras 9 e 14, observe que este ultimoapresenta uma distribuicao mais esclarecedora dos dados apresenta-dos. Note que os valores das idades estao concentrados nos valoresentre 20 e 30 anos.

3. Em vez das frequencias absolutas, podemos obter a distribuicao com frequenciasrelativas (expressas em percentuais).

(a) ExecuteGraph I Histogram . . . IOptions. . .

A janela de Options e ativada (vide Figura 11).

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 16 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 9: Histograma segundo o procedimento default do MINITAB.

(b) Clique em Type of Histogram a opcao Percent e mantenha osoutros valores (vide Figura 15).

(c) Feche as janelas clicando OK e obtera o histograma mostrado naFigura 16.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 17 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 10: Planilha apos o preenchimento da coluna C3 com os valores dosintervalos.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 18 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 11: Janela com as opcoes de histograma, levando em conta a utilizacaode limites para os intervalos.

Figura 12: Histogram do MINITAB com o menu push-down de Frame.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 19 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 13: Janela de Min and Max com os valores definidos para Y de acordocom a expressao 0 ≤ Y ≤ 100.

Figura 14: Histograma com intervalos definidos entre 10 ≤ X ≤ 70 com passoigual a 10.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 20 de 23

Voltar

Tela Cheia

Fechar

Sair

Figura 15: Janela de Histogram Options com a opcao de •Percent escolhida.

Figura 16: Histograma com frequencias relativas.

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 21 de 23

Voltar

Tela Cheia

Fechar

Sair

5. Macros

Os resultados dos histogramas podem ser obtidos de forma analıtica, sem o usodos graficos, utilizando os chamados macros do MINITAB.

1. Va ao site (clique aqui) e baixe o arquivo HBINS.MAC. Guarde-o no di-retorio

C:\Arquivos de programas\MTBWIN\macros

2. No MINITAB, clique na janela Session, i.e., ative-a e, em seguida, escolhano menu

Editor I Enable Commands

3. Na janela Session, surge um prompt denominado MTB, como e mostradoabaixo:

MTB >

Este e um modo utilizado para digitar comandos, sem recorrer a janelas emenus.

4. Nos resultados apresentados nas Figuras 14 e 16, procuramos obter, apartir dos dados da coluna C1, histogramas cujos intervalos variam dedez em dez (passo 10), entre os valores 10 e 70. Vamos agora utilizar umrecurso do MINITAB para obter os valores das frequencias de outra forma.

5. Em frente ao prompt MTB¿, digite o seguinte comando:

MTB > %HBINS 10 70 10 C1;

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 22 de 23

Voltar

Tela Cheia

Fechar

Sair

e aperte a tecla ENTER.Alerta: nao se esqueca do sinal de porcentagem (%), no inıcio, e do ponto-e-vırgula, no final (;).A sintaxe do comando e simples:

• HBINS e o nome da macro;

• 10 70 sao justamente o intervalo que estamos levando em conta;

• 10 e o passo;

• C1 e a coluna que contem os dados a serem analisados.

6. Em seguida, surge o prompt SUBC >. Digite os comandos como mostradosabaixo:

MTB > %HBINS 10 70 10 C1;SUBC > CUTPOINTS.

e aperte a tecla ENTER.Alerta: nao se esqueca do ponto final (.).

7. Se tudo funcionar, a seguinte tabela e mostrada na janela Session:

Homepage

Pagina de Abertura

Indice Geral

JJ II

J I

Pagina 23 de 23

Voltar

Tela Cheia

Fechar

Sair

Row Intervals Frequencies Percents1 10 to 20 4 2.3672 20 to 30 66 39.0533 30 to 40 47 27.8114 40 to 50 36 21.3025 50 to 60 12 7.1016 60 to 70 4 2.3677 Totals 169 100.000

Compare os valores de Frequencies com os data labels da Figura 14 e osvalores de Percents com os data labels da Figura 16.

Lista Semanal 2� �Agora que voce finalizou o roteiro de aula pratica, entre no sistema deProva Interativa e pode fazer a lista semanal. Esta semana a lista constade 9 exercıcios versando sobre Probabilidade e, para alguns exercıcio, vocefara uso de um banco de dados novo, exames2.xls, que pode ser obtido nosite de Aula Pratica Probabilidade. (clique aqui)� �