69
Tópicos de Estatística André Luiz M. de Assumpção [email protected] Teoria e Exercícios

Apostila de Estatistica Atualizada 2011

Embed Size (px)

Citation preview

Tópicos de Estatística

André Luiz M. de Assumpçã[email protected]

Teoria e Exercícios

Fevereiro de 2011

Estatística André Assumpção

INTRODUÇÃO

O termo Estatística é derivado da palavra Estado e, originalmente, foi empregado para denominar levantamentos de dados, com a finalidade de fornecer orientações para que o Estado pudesse tomar suas decisões.

Atualmente, a Estatística pode ser definida como um conjunto de métodos e processos quantitativos ou qualitativos que servem para estudar e medir os fenômenos.

O Estudo estatístico tem como principal objetivo a organização e análise de informações que possibilitarão a realização de uma inferência com uma boa margem de segurança.

Dessa forma, podemos entender que a Estatística nos fornece informações pontuais, baseadas em dados históricos ou “momentâneos”, coletados por meios de testes ou pesquisas de opinião.

2

Estatística André Assumpção

CAPÍTULO IALGUMAS DEFINIÇÕES

1. População: é o conjunto escolhido para se realizar uma pesquisa.Ex.: Os alunos da Universidade Chico Mendes.

2. Amostra: é o subconjunto da população, formado pelos elementos que foram “entrevistados”.Ex.: João, Cristina, Maria, Antônio, Fábio, José Carlos, Ana Cristina, Rosa, Janete, César, Estela e Natália.

3. Dados Brutos: são aqueles que ainda não foram numericamente organizados.Ex.: As idades dos alunos do 3o período de Administração da Universidade Chico Mendes.

Idades18

20

21

20

19

25

31

31

35

33

28

27

24

21

28

21

18

19

28

21

19

29

27

4. Rol: é um arranjo ordenado de dados numéricos brutos, podendo ser crescente ou decrescente.Ex.: Idades: 18 18 19 19 19 20 20 21 21 21 21 24 25 27 27 28 28 28 29 31 31 33 35

Idades18

18

19

19

19

20

20

21

21

21

21

24

25

27

27

28

28

28

29

31

31

33

35

5. Variável: é um termo simbolizado por X, Y, H, Z, que pode assumir qualquer um dos valores contidos num conjunto de valores, que lhe são atribuídos. A este conjunto denominamos domínio da variável. As variáveis se dividem em:

Quantitativas QualitativasDiscretas NominaisContínuas Ordinais

6. Variável Qualitativa: é aquela que representa uma categoria. Ela é nominal quando não existe nenhum tipo de hierarquia ou ordenamento dos valores.Ex.: Os municípios de onde saíram os estudantes da Universidade Chico Mendes.

A variável é ordinal quando esse ordenamento existe.

Ex.: As posições dos 10 melhores alunos do curso de Administração da Universidade Chico Mendes.Relação dos Dez Melhores Alunos do Curso de Administração

3

Estatística André Assumpção

Colocação

Nome

1º João2º Cristiane3º Janaína4º Marco Antônio5º Juliana6º Jacqueline7º Luiz Carlos8º Heitor9º Júlio Cezar

10º Maria da Glória

7. Variável Quantitativa: é aquela que representa uma medida. Ela é contínua quando pode assumir qualquer valor entre dois.Ex.: Altura dos alunos do 3o período de Administração da Universidade Chico Mendes.

E será discreta quando somente poderá assumir valores inteiros.Ex.: Idade dos alunos do 3o período de Administração da Universidade Chico Mendes.

8. Freqüência: é o número de vezes em que uma observação se repete.Ex.: no exemplo das idades, as freqüências são:

Idades (X)Freqüências

(F)18 219 320 221 424 125 127 228 329 131 233 135 1

Total 23

9. Estatística Descritiva: dizemos que uma estatística é descritiva quando seu objetivo é ordenar, expor e sumarizar registros relativos aos atributos do fenômeno estudado.

4

Estatística André Assumpção

10. Estatística Inferencial ou Indução Estatística: uma estatística é inferecial quando o seu objetivo é generalizar para uma população o que foi estudado em amostras.

11. Aproximação de Valores Numéricos: são “cortes” realizados nas casas decimais de valores não inteiros. Esses cortes são realizados segundo regras e em função das características da variável e/ou do nível de precisão adotado ao estudo da variável.

Regra de Aproximação: para realizar as aproximações de valores numéricos, utilizaremos a seguinte regra.

Observe, no exemplo da reta numérica, a posição do valor 3,57

Ele se encontra mais próximo do 3,6 que do 3,5. Assim, para representarmos este valor com apenas uma casa decimal, cometeremos um erro menor se o representarmos como 3,6, ao invés de 3,5.

Podemos generalizar a regra da seguinte forma:

1º) Observe em qual casa decimal você irá fazer a aproximação;Ex.: Aproximar o valor 12,56789 na segunda casa decimal.

1 2 5 6 7 8 9Parte Inteira Parte Decimal

1ª CD 2ª CD 3ª CD 4ª CD 5ª CD

O algarismo da 2ª Casa Decimal é o 6.2º) Observe o algarismo que está na primeira casa a direita da casa que sofrerá a aproximação;

1 2 5 6 7 8 91ª CD 2ª CD 3ª CD 4ª CD 5ª CD

Se esse algarismo for maior ou igual que 5, acrescente uma unidade no algarismo da casa que sofrerá a aproximação e abandone todas os algarismos das casas decimais que estiverem a sua direita. Caso ele seja menor que 5, mantenha inalterado o algarismo da casa que está sofrendo a aproximação e abandone as demais que estiverem a sua direita.

Exemplos:

5

| | | | 3,5 3,55 3,57 3,6

Algarismo que sofrerá a aproximação

Algarismo da primeira casa a direita da casa que sofrerá a

aproximação

Estatística André Assumpção

a) 3,25679 aproximado na 2ª casa decimal fica 3,26.b) 4,56753 aproximado na 3ª casa decimal fica 4,568.c) 2,43567 aproximado na 1ª casa decimal fica 2,4.d) 1,18697 aproximado na 4ª casa decimal fica 1,1870.e) 3,99950 aproximado na 3ª casa decimal fica 4,000.

6

Estatística André Assumpção

Exercícios 1:

1) Coloque um D para as variáveis discretas e um C para as contínuas:

( ) Nº de livros da biblioteca da Universidade Chico Mendes( ) Altura dos alunos do 3o período de Matemática( ) Velocidade de um carro( ) Inflação anual no Brasil( ) Peso dos estudantes( ) Salário dos professores da Universidade Chico Mendes( ) Nº de filhos de uma família( ) Nº de faltas na disciplina de Estatística( ) Média dos alunos na disciplina de Estatística

2) Arredonde os seguintes números:

a. 24,6 para a unidade mais próxima.b. 242,5 para a unidade mais próxima.c. 5,438 para o centésimo mais próximo.d. 1,426 para o décimo mais próximo.e. 1,0482 para o milésimo mais próximo.f. 2,57502 para o centésimo mais próximo.g. 3,5464 para o centésimo mais próximo.h. 3,897 para o centésimo mais próximo.i. 12,9986 para o centésimo mais próximo.

3) Use os critérios de arredondamento para aproximar os seguintes números na 3a casa decimal:

a- 4,3167 -b- 13.4579 -c- 21,8954 -d- 12,8771 -e- 13,1235 -f- 56,2365 -g- 2,01027 -h- 10,12045 -i- 19,9996 -j- 31,13554 -k- 15,2395 -

4) Calcular:a) 3% de 420;b) 6% de 18;c) 125% de 36;d) 0,4% de 200;

7

Estatística André Assumpção

e) 12,5 % de 1250;f) 19% de 4000;g) 100% de 200;h) 150 % de 200;i) 200% de 200.

5) Qual é o principal cujos 3% são 20?

6) Qual é o principal cujos 10% são 55?

7) Se 50% de uma mensalidade é R$ 75,00, qual é o valor da mensalidade?

8) Se 75% de uma prestação é R$ 250,00, qual é o valor da prestação?

9) Numa cidade, 45% da população são homens. Qual é a população dessa cidade, se nela residem 60500 mulheres?

10) Sabendo que um artigo de R$ 50,00 foi vendido com abatimento de R$ 1,60, encontrar a taxa utilizada na operação.

11) Se minha mensalidade custa R$ 175,00 e, por estar em atraso, vou pagá-la com juros de 5 %, quanto pagarei pela mensalidade?

12) Numa escola, a mensalidade das turmas de 4ª série é de R$ 60,00. Caso o aluno pague a mensalidade com atraso, a escola cobrará uma taxa de juros de 2%, acrescido de uma multa de R$ 2,00 por dia de atraso. Se um aluno vai pagar a mensalidade com 10 dias de atraso, quando ele terá que desembolsar para efetuar esse pagamento?

13) Todos os produtos de uma loja de roupas sofreram um aumento de 30% no seu valor de venda. Uma semana após o aumento, notando que as vendas tiveram uma queda significativa, o dono da loja resolveu anunciar um desconto para todas as mercadorias, de modo que os preços voltassem a ser os mesmos de antes do aumento. De quanto deverá ser esse desconto?

Exercícios Complementares

1) Calcular:

8

Estatística André Assumpção

a- 9% de 3000;b- 16% de 1500;c- 146% de 2500;d- 12,5% de 400;e- 8,5% de 800;f- 7,75% de 650;g- 15,42% de 175,30.

2) Represente como porcentagem:

a- 85 de 1700;b- 68 de 400;c- 54 de 900;d- 1300 de 6900;e- 340 de 200;f- 1500 de 500.

3) O salário mensal de uma pessoa era R$ 8.000,00. Ela recebeu um aumento de 35%. Quanto passou a receber

4) Uma taxa de 13% é aplicada num capital, aumentando-o para R$ 52.000,00. Qual é o capital?

5) Em certo país, a população atual é de 80 milhões de habitantes. Sabendo-se que a taxa de crescimento populacional é de 40% ao ano, qual será a população daqui a 2 anos?

6) O índice de aumento salarial de um funcionário será 80% do índice do ano passado, que foi de 70%. Qual é o índice de aumento salarial atual?

7) A média de reprovação em matemática de um certo colégio é de 45%. Sabendo-se que o colégio possui 3200 alunos, quantos alunos ficam reprovados em matemática?

8) A média de reprovação em concursos públicos é de 82%. Quantas pessoas serão aprovadas num concurso público com 6500 inscritos?

9) Comprei um terreno cujo preço estava estipulado em R$ 200.000,00. Gastei ainda 5% desse valor em impostos e dei 3% ao corretor. Quanto efetivamente tive que gastar?

10) Um vendedor ganha 3% de comissão sobre as vendas que realiza. Tendo recebido R$300,00 de comissões, quanto vendeu?

9

Estatística André Assumpção

11) Do que recebo, 30% vão para a poupança, 20% para o aluguel e 35% para a alimentação. Com os 450,00 que sobram, eu me visto. Qual é o meu salário?

12) Sabendo que um artigo de R$ 50.000,00 foi vendido com abatimento de R$1.600,00, encontrar a taxa utilizada na operação.

13) Um caminhão de areia perde 1,5% de seu conteúdo em toda a viagem que realiza. Carregando 8 m3 de areia, quanto será perdido?

14) Poderei obter abatimento de 13% para pagamento à vista de uma geladeira que custa R$450,00. Quanto pagarei pela geladeira nestas condições?

15) Se eu comprar um objeto por R$ 20,00 e vende-lo por R$ 35,00, qual será a minha porcentagem de lucro?

16) Sabendo-se que numa turma tenho 25 alunas e 15 alunos, qual o percentual de alunas da turma?

10

Estatística André Assumpção

CAPÍTULO IIDISTRIBUIÇÃO DE FREQÜÊNCIA

Quando estamos trabalhando com um conjunto contendo uma quantidade relativamente grande de elementos, é comum se criar uma tabela para relacionar o valor da variável e a quantidade de vezes em que ela aparece no conjunto. Essa tabela é denominada “distribuição de freqüência absoluta simples”.

Ex.: Supondo que em uma turma existam 25 alunos, a tabela a baixo representará a distribuição de freqüência das idades desses alunos.

Tabela 1: Altura dos alunos da Universidade

Idades(X)

Freqüência

(F)14 115 216 417 518 719 420 2

Total 25

Para resumirmos grandes quantidades de dados, costumamos separá-los em classes e, em seguida, determinamos a quantidade de elementos que consta em cada classe, denominada de freqüência absoluta da classe. Uma tabela contendo as classes e as freqüências correspondentes, é denominada de distribuição de freqüência absoluta em classes ou tabela de freqüência absoluta em classes. Ex.: Vamos exemplificar mostrando a distribuição de freqüência das alturas de 100 alunos da XKZW.

Tabela 2: Altura dos alunos da Universidade

Altura(cm)

Nº de Estudantes

151 – 158159 – 166167 – 174175 – 182183 - 190

51842278

Total 100Para a construção de uma tabela de distribuição de freqüência

em classes é necessário que se defina os seguintes elementos:

a) Intervalos de Classe: são as divisões feitas na primeira coluna da tabela.

11

Estatística André Assumpção

Ex.: 151 – 158 é um intervalo de classe.

b) Limites de Classe: são os extremos do intervalo de classe.Ex.: o 151 é o menor valor do intervalo (limite inferior) e o 158 é o maior valor do intervalo (limite superior).OBS.: Um intervalo de classe que não possui limite superior ou inferior indicado, é denominado intervalo de classe aberto.Ex.: Alunos maiores de 20 anos.

c) Limites reais de Classe: no exemplo de distribuição de freqüência da Tabela 1, com as medidas colocadas em centímetros, o intervalo 151 – 158 inclui, teoricamente, todas as medidas compreendidas entre 150,50.... até 158,50 cm. Estes valores são denominados de limites reais de classe.

OBS.: Na prática, os limites reais de classe são obtidos adicionando-se o limite superior de um intervalo de classe ao inferior da classe e dividindo-se a soma por 2.Ex.: As classes 151 – 158 e 159 – 166, fazendo 158 + 159 = 317, dividindo por 2 resulta em 158,5.

d) Amplitude do Intervalo de Classe: é a variação dos limites reais do intervalo, ou seja, c = 158,5 – 150,5 = 8.

Amplitude = limite superior – limite inferior

e) Ponto Médio de uma Classe: é a média aritmética dos limites de classe.

Ex.: O ponto médio do intervalo 151 – 158 é (151 +158)/2 = 154,5.

Regras Gerais para a Elaboração de uma Distribuição de Freqüência:

a. Determina-se a Amplitude Total do Rol (At)b. Divide-se a amplitude total em um número conveniente de

intervalos de classe que tenham a mesma amplitude, ou aplique a seguinte fórmula:

onde:n – nº de classesAt – Amplitude Total

Em verdade, existem outros modelos para o cálculo do número de classes, como por exemplo:

* O Critério da Raiz - , onde k é a quantidade de elementos da amostra.

12

Estatística André Assumpção

* A Fórmula de Sturges – n= 1 + 3,3.log k.

c. Determina-se o número de observações que caem dentro de cada intervalo de classe, isto é, calculam-se as freqüências de classe.

Distribuição de Freqüência Relativa:

A freqüência relativa de uma classe é a freqüência dela dividida pelo total de todas. Geralmente expressamos esta freqüência por meio de porcentagem.Ex.: Para o intervalo 151 – 158 da Tab. 1, a freqüência é 5, logo, a freqüência relativa desse intervalo será 5/100 = 5 %.

Vejamos o seguinte exemplo:Tabela 3: Salário

SaláriosR$

Ponto Médio

(X)

Freqüência

Absoluta (f)

Freqüência Relativa (%)

230,00 – 350,00360,00 – 480,00490,00 – 610,00620,00 – 740,00750,00 – 870,00

880,00 – 1000,00

290,00420,00550,00680,00810,00940,00

5111471810

7,6916,9221,5410,7727,6915,38

TOTAIS 65 100,00

Exercícios 1:

1) Façamos a tabela de distribuição de freqüências para o seguinte problema:“Uma pesquisa sobre a idade, em anos de uma classe de calouros de uma faculdade, revelou os seguintes valores:”

18 17 18 20 21 19 20 18 17 19 20 18 19 18 19 21 18 19 18 18 19 19 21 20 17 19 19 18 18 19 18 21 18 19 19 20 19 18 19 20 18 19 19 18 20 20

Montar o histograma para a amostra acima.

13

Estatística André Assumpção

2) Faça o gráfico de barras para a tabela abaixo, até o ano de 1981:

Ano Filmes Nacionais (%) Filmes Estrangeiros (%)19771978197919801981

2530293133

7570716967

3) Faça um gráfico de área para a seguinte tabela:

Hábito Freqüência Relativa SIM 82%NÃO 18%

4) Construa um gráfico de setores para a seguinte tabela:

Região Freqüência Freqüência RelativaNorte 2240Sul 2000Leste 1360Oeste 2400Total 8000

14

Estatística André Assumpção

CAPÍTULO IIIMEDIDAS DE TENDÊNCIA CENTRAL

Uma medida de tendência central é um valor intermediário da série estatística com a qual estamos trabalhando. As principais medidas de tendência central são: a moda, a mediana e a média.

Primeiramente analisaremos o modelo matemático para o cálculo dessas medidas, tomando os valores de um rol. Depois, serão mostrados os modelos para o cálculo utilizando uma tabela de distribuição de freqüências.

Cálculo das medidas de tendência central com o rol:

a) A Moda: para os valores de um rol, definimos a moda por meio da observação do elemento de se apresenta com a maior freqüência.

Ex.: Dado o seguinte rol: {1,1,2,2,2,3,4,5,5,5,5,6,7,7,8,8,9}, o elemento 5 se repete 4 vezes, e é o elemento que mais se repete dentro do rol. Logo, essa amostra é unimodal, com Mo = 5. b) A Mediana: a mediana é o valor que se encontra no ponto

intermediário do rol. Caso o rol possua uma quantidade ímpar de elementos, a mediana pertencerá ao rol bastando, para determina-la, observar o elemento eqüidistante aos extremos do rol. Se o rol possuir uma quantidade par de elementos, a mediana será determinada por meio do ponto médio dos dois elementos centrais.

Ex1.: Observe que o seguinte rol {1,1,2,2,2,3,4,5,5,5,5,6,7,7,8,8,9} possui 17 elementos. Assim, como 17:2 = 8.5, a mediana será o nonagésimo valor do rol. Logo, Md = 5.

Ex2.: Agora, observe que o rol {10, 12, 12, 13, 13, 13, 14, 15, 16, 16, 16, 16, 17, 18, 19, 20} possui 16 elementos. Assim, os dois elementos centrais estarão na oitava e nona posições. Logo, Md = ( 15 + 16):2 = 15,5.

c) A Média: Existem diversas maneiras para se calcular uma média de um conjunto de valores. Estaremos interessados em estudar apenas três tipos de média, a média aritmética, a média geométrica e a média harmônica, podendo elas ser simples ou ponderadas. Para o momento, nos prenderemos apenas no estudo na média aritmética.

15

Estatística André Assumpção

c.1) A Média Aritmética Simples: Para um conjunto de valores X: x1, x2, x3, ..., xn, a

média aritmética simples, representada por X, será definida por:

Exemplos:1) Se X: 2, 0, 5, 3, 1, então:

2) Se X: 1,1,2,2,2,3,4,5,5,5,5,6,7,7,8,8,9, então: ________________________________

c.2) A Média Aritmética Ponderada: Se uma seqüência numérica é afetada por pesos, a média será calculada da seguinte forma:

Ex.: Se X: 1, 3, 5, com pesos 1, 2 e 3 respectivamente, então:

Cálculo das medidas de tendência central para valores agrupados:

Variáveis Discretas:

Para a seguinte distribuição de valores obtidos de uma amostra, teremos:

Xi Fi18 319 520 721 622 4

Total 25

a) A Moda: Será definida pelo valor que se apresentar com a maior freqüência. Neste caso a moda será o valor 20, que possui freqüência 7.

16

Estatística André Assumpção

b) A Mediana: Assim como no rol, a mediana será o elemento central ou a média dos elementos centrais, dependendo se a quantidade de valores é par ou ímpar. No exemplo, a mediana será 13o elemento, ou seja, o valor 20.

c) A Média: para determinarmos a média desta amostra, calcularemos a média ponderada dos valores, onde os pesos serão as respectivas freqüências. Assim teremos:

Variáveis Contínuas

Para a seguinte tabela de distribuição de freqüências, obtidos de uma amostra, teremos:

Classes fi Xi fi.Xi fa 18 – 20 3 19 57 320 – 22 5 21 105 822 – 24 7 23 161 1524 – 26 6 25 150 2126 - 28 4 27 108 25Total 25 581

a) A Média: será calculada por:

b) A Mediana: poderá ser definida por:

Onde:Linf – Limite inferior da classe;Fant – Freqüência acumulada da classe anterior;Fc – Freqüência da classe;Amp – Amplitude das classes.

Para a determinação da mediana, a primeira coisa que teremos que fazer é determinar em qual classe ela se encontra. Para isto,

bastará calcular , que no exemplo dará 25/2 = 12,5. Assim,

observando a coluna da freqüência acumulada, na tabela de distribuição de freqüências, determinaremos que a mediana estará na 3a classe. Agora, uma vez determinada a classe da mediana, aplicaremos o modelo matemático onde:

17

Onde:fi – freqüência da classe;Xi – ponto médio da classe;fa – freqüência acumulada.

Estatística André Assumpção

Linf = 22; Fant = 8; Fc = 7; Amp = 2.

Observação Importante

I- Moda de Pearson:

II- Moda de King:

Onde:Im – Limite inferior da classe modal;fant – Freqüência da classe anterior;fpost – Freqüência da classe posterior;Amp – Amplitude das classes.

III- Moda de Czuber

Exercícios:

1- Determine a média , a moda e a mediana das séries abaixo:

a) X: 2,3,5,5,6,6,6,7,8,9,10b) Y: 10,10,12,12,12,13,14,14,14,15,16,16,17c) Z: 2,5,6,7,8,9d)

Notas Alunos0 – 2 52 - 4 204 - 6 226 - 8 19

8 - 10 7Total 73

18

Podemos optar por vários processos, para determinarmos a moda de uma variável contínua. Além do modelo que vimos, podemos ainda calcular a moda de Pearson, a moda de King e a moda de Czuber.

Classe Modal é a classe de maior

freqüência.

Estatística André Assumpção

e)

Salários Funcionários

150,0 – 200,0 300200,0 – 250,0 250250,0 – 300,0 470300,0 – 350,0 360350,0 – 400,0 140

Total 1520

2- Montar um gráfico de freqüência acumulada relativa para a seguinte tabela de valores:

Notas Alunos0,0 – 1,5 141,5 – 3,0 183,0 – 4,5 254,5 – 6,0 206,0 – 7,5 177,5 – 9,0 10

Total 104

3- A tabela abaixo revela a variação do dólar durante alguns meses. Dia Venda29/0

62,304

9 31/0

72,431

331/0

82,551

718/0

92,679

3

a) Construir os gráficos de setores para as variações dos preços de venda;

b) Construir um gráfico de colunas para os valores apresentados;c) Determinar a variação relativa dos valores.

19

Estatística André Assumpção

Capítulo IVMedidas Separatrizes

As separatrizes são valores reais que dividem a seqüência ordenada de dados em partes com a mesma quantidade de elementos da série. A própria mediana, que é uma medida de tendência central, é uma separatriz que divide uma seqüência de valores em duas partes com a mesma quantidade de elementos.

Além da mediana, utilizaremos normalmente duas outras separatrizes, os quartis e os percentis.

Quartis: são os valores reais que fazem com que a seqüência seja dividida em quatro partes, cada uma co 25% dos valores da série. Assim teremos 3 (três) quartis: Q1 (1o quartil), Q2 (2o quartil) e Q3 (3o quartil).

Para calcularmos os quartis, deveremos proceder de maneira idêntica ao cálculo da mediana. Porém, como os quartis dividem a seqüência de valores em quatro partes, a primeira coisa a fazer é dividir o total de elementos por quatro, ou seja:

O próximo passo é multiplicar esse quociente pelo número que representa a posição do quartil, ou seja, 1, 2 ou 3, para que se possa determinar a classe do quartil que se pretende calcular. Por fim, aplicar o modelo matemático semelhante ao utilizado para o cálculo da mediana.

Exemplo:Notas Alunos Fa

0,0 – 1,5 141,5 – 3,0 183,0 – 4,5 254,5 – 6,0 206,0 – 7,5 177,5 – 9,0 10

Total 104

Calcular Q1, Q2 e Q3.Percentis: São os valores reais que fazem com que uma seqüência numérica seja dividida em cem partes iguais, cada uma com 1% dos valores da série. Assim teremos 99 percentis: P1, P2, P3,......, P99.

20

Estatística André Assumpção

Como ocorreu no cálculo dos quartis, a primeira coisa a se fazer é calcular

O próximo passo será multiplicar esse valor pelo número que representa a posição do percentil que se deseja calcula, para que, enfim, se possa determinar a classe do percentil. Por último, aplicar a fórmula:

Exemplo:Notas Alunos Fa

0,0 – 1,5 141,5 – 3,0 183,0 – 4,5 254,5 – 6,0 206,0 – 7,5 177,5 – 9,0 10

Total 104

Calcular P10, P50 e P90.

Capítulo VMedidas de Dispersão

Dadas as seguintes seqüências de valores:

A={1, 3, 6, 7, 10}B={4, 5, 5, 6, 7}

Podemos observar, com um rápido cálculo, que ambas possuem a mesma média, . Porém, é fácil observar que os valores

21

Estatística André Assumpção

apresentados no conjunto B estão bem mais próximos da média, enquanto que, no conjunto A, os valores estão mais distanciados.

Dessa forma, dizemos que o conjunto B possui os valores mais concentrados, enquanto que os valores no conjunto A estão mais dispersos. O grau ao qual os dados numéricos tendem a dispersar-se em relação a um valor médio chama-se variação ou dispersão dos dados. Essa dispersão pode ser calculada por meio das seguintes medidas:

Amplitude total; Desvio Médio; Desvio Padrão; Variância.

Amplitude Total: como já foi falado anteriormente, é a diferença entre o maior e o menor valor da seqüência numérica.

Desvio Médio: é a média aritmética do módulo das diferenças entre cada valor e a média, ou seja:

Desvio Padrão: para uma seqüência de valores X1, X2, ..., Xn, o desvio padrão σ é definido por:

Variância: para um conjunto de valores, a variância é definida como o quadrado do desvio padrão, σ 2.

Exemplo1:

Para a seguinte seqüência de valores, determinar a média, o desvio médio, o desvio padrão e a variância.

X: 2, 3, 3, 4, 5, 5, 5, 6, 7, 7, 8, 9

a) A Média:

b) O Desvio Médio:

22

Assim,

Estatística André Assumpção

X f A f.A2 1 3,33 3,333 2 2,33 4,66 4 1 1,33 1,335 3 0,33 0,996 1 0,67 0,677 2 1,67 3,348 1 2,67 2,679 1 3,67 3,67

Totais

12 20,66

Onde:

c) O Desvio Padrão:

X f A A2 f.A2

2 1 3,33 11,089 11,0893 2 2,33 5,429 10,858 4 1 1,33 1,769 1,7695 3 0,33 0,109 0,3276 1 0,67 0,449 0,4497 2 1,67 2,789 5,5788 1 2,67 7,129 7,1299 1 3,67 13,469 13,469

Totais

12 50,668

Onde:d) A Variância:

σ 2= 4,22

Exemplo 2:

Determinar o desvio padrão e a variância para os dados agrupados na seguinte tabela:

Notas Alunos

X X2 f.X2

0,0 – 1,5 141,5 – 3,0 183,0 – 4,5 254,5 – 6,0 206,0 – 7,5 177,5 – 9,0 10

Total 104

23

Assim,

Estatística André Assumpção

Para calcularmos o desvio padrão de valores agrupados, podemos utilizar o método abreviado:

Coeficiente de Variação: é uma medida muito útil para a comparação de distribuições de valores. É definida pelo quociente entre o desvio padrão e a média:

Para o exemplo 1 deste capítulo, o coeficiente de variação será:

24

Determine:a) A média, a moda, a mediana;b) O desvio Padrão e a Variância;c) O Coeficiente de Variação;d) O Histograma.

Estatística André Assumpção

Outras Medidas de Dispersão: além das medidas vistas anteriormente, também é comum utilizarmos as amplitudes das separatrizes.

Amplitude Interquartílica = Q3 – Q1;

Amplitude Semi-Interquartílica =

Amplitude entre os Percentis 10 e 90 = P90 – P10

Observação Importante sobre o Desvio Padrão

É comum se fazer uma distinção entre o cálculo do desvio padrão para os dados de uma população e para os dados de uma amostra dessa população. No primeiro caso, utilizamos os modelos já mencionados anteriormente e o simbolizamos por σ. No segundo caso, vamos simbolizá-lo por S e calculá-lo através do seguinte modelo:

Exercícios:

1) Dados os seguintes conjuntos de valores, determinar a média, a amplitude, o desvio médio, o desvio padrão, a variância e o coeficiente de variação:

a) X: 1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 6;b) Y: 10, 10, 10, 11, 11, 13, 14, 15, 15, 16, 16, 16, 17;c) Z: 2, 4, 5, 7, 7, 7, 9, 9, 10, 10, 13, 15, 17;

2) Numa determinada turma, o resultado obtido em uma prova de estatística foi representado pela seguinte tabela:

Notas Número de Alunos

0 |– 2 62 |– 4 94 |– 6 156 |– 8 12

8 |– 10 8Total 50

3) Numa prova de matemática, duas turmas obtiveram as seguintes médias e desvios:

Turma A: Média: 6,0 e Desvio Padrão: 2,3Turma B: Média : 6,0 e Desvio Padrão: 3,2

25

Determine:a) a média;b) o desvio padrão;c) a variância;d) o coeficiente de variação;e) a mediana, Q1 e P90.

Estatística André Assumpção

Se um aluno de cada turma for escolhido, em qual delas existe maior probabilidade da nota do aluno estar entre 8,0 e 4,0 ?

4) Numa escola, duas turmas conseguiram os seguintes resultados:

Turma A : Média = 4,5 e Desvio Padrão = 1,0Turma B: Média = 4,5 e Desvio Padrão = 3,5

Responda:a) Qual a turma mais homogênea ? Por quê ?b) Um aluno com média 4,0 é considerado normal na turma

A? E na turma B? Por quê ?5) Numa determinada escola, mediu-se a altura de cada um de seus alunos e

representou-se os resultados pela seguinte tabela:Altura (cm) f151 – 158 5159 – 166 18167 – 174 42175 – 182 27183 - 190 8

6) A tabela abaixo apresenta os Coeficientes de Inteligência de 480 alunos de certa Universidade. Determinar a média, o desvio padrão e a variância desses valores:

CI 70 74 78 82 86 90 94 98 102

106

110

114

118

122

126

f 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

7) Para o exercício anterior, determine a porcentagem dos alunos com CI entre 85,5 e 106,4.

26

Estatística André Assumpção

Capítulo VIProblemas de Contagem e Probabilidades

Pense nos seguintes problemas:

P1.: Uma equipe de trabalho será montada, contendo cinco funções: presidente, vice-presidente, relator, assessor de pesquisa e assessor de comunicação. Paulo, Maria, Cláudia, João e Luiz foram escolhidos para formar essa equipe sendo que, agora, terão que escolher quem irá ocupar cada função. Se cada um irá ocupar apenas uma das funções, de quantas maneiras a equipe poderá ser montada? Resolução:

Observe que temos 5 funções que serão ocupadas por 5 pessoas. Cada função terá uma única pessoa e cada pessoa poderá ocupar uma única função.

Assim, teremos 5 opções de pessoas para a 1ª função (presidente). Após escolher a pessoa que ocupará essa função, teremos apenas 4 pessoas para ocupar a função de vice-presidente. Para a função de relator teremos apenas 3 opções de pessoas e, finalmente, 2 opções para a função de assessor de pesquisa e 1 opção para a função de assessor de comunicação. Ou seja,

Presidente

Vice-President

eRelator

Assessor de

Pesquisa

Assessor de

Comunicação

5 4 3 2 15 x 4 x 3 x 2 x 1 = 120

Utilizando o princípio básico da multiplicação, percebemos que essa equipe poderá ser formada de 120 maneiras diferentes. P2.: Oito nadadores vão disputar a final dos 100 metros costa. Supondo não haver empates, de quantas formas poderemos ter a classificação final da disputa? Resolução

Da mesma forma que no problema anterior, teremos 8 colocações para 8 atletas. Assim, teremos 8 possibilidades para a 1ª colocação, 7 possibilidades para a 2ª colocação e assim sucessivamente.

1ª 2ª 3ª 4ª 5ª 6ª 7ª 8ª

8 7 6 5 4 3 2 1

8 x 7 x 6 x 5 x 4 x 3 x 2 x 1 = 40320

27

Estatística André Assumpção

Logo, essa classificação poderá ser formada de 40320 maneiras diferentes.

P3.: Quantos números de 3 algarismos podemos formar com todos os algarismos do nosso sistema decimal?

Resolução:Lembramos que temos 10 algarismos em nosso sistema

decimal {0,1,2,3,4,5,6,7,8,9}. Além disso, não podemos formar números de 3 algarismos iniciando pelo zero. Assim, teremos 9 possibilidades para o primeiro algarismo. É importante lembrar que podemos ter números com algarismos repetidos. Assim, para os 2º e 3º algarismos, teremos 10 opções para cada.

1º algarismo 2º algarismo 3º algarismo9 10 10

9 x 10 x 10 = 900 números

Logo, poderemos formar 900 números de 3 algarismos.

P4.: Quantos números de 3 algarismos distintos podemos formar com todos os algarismos do sistema decimal?

ResoluçãoEsse problema pode ser resolvido da mesma maneira que o

anterior. Porém, observamos que não poderá haver repetição de algarismos. Assim, teremos:

1º algarismo 2º algarismo 3º algarismo

9 9 8

9 x 9 x 8 = 648 números

Logo, podemos formar 648 números com 3 algarismos diferentes.

P5.: Uma placa de carro possui 3 letras e 4 algarismos. Sabendo-se que as letras e os algarismos podem ser repetidos, quantas são as placas de carro que podemos montar?

ResoluçãoLembramos que, para a montagem de placas, podemos utilizar qualquer uma das 26 letras. Da mesma forma, podemos utilizar qualquer um dos 10 algarismos, em qualquer das posições, pois não estamos montando números.

Letra 1

Letra 2

Letra 3

Algarismo1

Algarismo 2

Algarismo 3

Algarismo 4

28

Estatística André Assumpção

26 26 26 10 10 10 10

26 x 26 x 26 x 10 x 10 x 10 x 10 = 175.760.000

Logo, poderemos montar 175.760.000 placas de carro.

P6.: De uma turma com 12 alunos serão sorteados 3 para formar um grupo que irá apresentar um trabalho. Assim, de quantas maneiras poderemos montar esse grupo?

ResoluçãoObserve que, neste caso, não existe qualquer tipo de hierarquia

para a formação do grupo. Vamos analisar a diferença que existe na formação de uma equipe com presidente, diretor e gerente, quando temos apenas 3 pessoas para a formação dessa equipe.

Assim como fizemos em problemas anteriores, para a formação dessa equipe teríamos:

Presidente Diretor Gerente3 2 1

3 x 2 x 1 = 6 formas diferentes

Neste caso, como existe hierarquia, poderemos montar a equipe de 6 maneiras diferentes. Na formação do grupo de alunos, como não existe hierarquia, poderemos formar apenas um grupo, tendo apenas 3 alunos.

Como são 12 alunos, utilizando o princípio da multiplicação teremos:

12 x 11 x 10 = 1320 formas. Porém, quando estamos utilizando o princípio da multiplicação, contabilizamos todas as possíveis combinações. Desta forma, teremos grupos iguais, diferenciados apenas pela ordem dos nomes. Por exemplo:

• G1.: {Paulo, André e João}• G2.: {André, João e Paulo}

Como não existe hierarquia, esses grupos são iguais. Assim, para cada conjunto de 3 nomes, teremos 6 grupos iguais, diferenciados pela ordem dos nomes.

Esses grupos precisam ser retirados desta conta. Para que isso seja possível, teremos que dividir o resultado encontrado anteriormente por 6, encontrando o seguinte resultado:

1320/ 6 = 220.

Logo, poderemos montar o grupo de 220 maneiras diferentes.

Permutação, Arranjo e Combinação

29

Estatística André Assumpção

Todos os problemas anteriores foram resolvidos sem que tivéssemos que utilizar os conceitos de Permutação, Arranjo e Combinação, pois o princípio da multiplicação resolve todos os problemas desse tipo. Porém, para facilitar, ou apenas dar mais uma ferramenta para a resolução desses problemas, podemos utilizar esses conceitos.

Cabe apenas lembrar que esses conceitos servem apenas para problemas em que não são possíveis repetições de elementos.

Permutação:

Temos uma permutação quando, para um conjunto de n elementos, estamos contabilizando de quantas maneiras poderemos montar uma seqüência de n elementos. Neste caso, a ordem é importante e estamos utilizando todos os elementos do conjunto.

Assim, bastará fazer a seguinte seqüência de multiplicações:

P(n) = n x (n-1) x (n-2) x ...... x 1.

Essa seqüência é denominada de fatorial do número n, simbolizada por n!.

Assim, uma permutação de n elementos será calculada por:

P(n) = n!Arranjo:

Num arranjo, temos um conjunto com n elementos, mas queremos formar seqüências com apenas k elementos, onde k < n. Neste caso, a ordem continua sendo importante, mas não utilizaremos todos os elementos disponíveis.

Assim, o arranjo de n elementos tomados em seqüência de k elementos será calculado por:

Combinação:

Numa combinação, temos um conjunto com n elementos, com os quais formaremos subconjuntos com k elementos, sendo k < n. Neste caso, a ordem não será importante e também não utilizaremos todos os elementos.

Assim, a combinação de n elementos tomadas em conjuntos de k elementos será calculada por:

30

Estatística André Assumpção

Para introduzirmos determinados conceitos de probabilidade será preciso, inicialmente, discutir algumas definições necessárias para a compreensão desses conceitos.

São elas:

Experimento Aleatório

Denominamos de experimento aleatório a todo experimento que, repetindo em condições idênticas, pode apresentar resultados diferentes.

Ex.: E1 – Lançamento de um dado

Espaço Amostral

É o conjunto de todos os resultados possíveis de um experimento aleatório. É simbolizado por W.

EX.: Para o experimento E:“Lançamento de um dado”, o espaço amostral é W={1;2;3;4;5;6}.

Evento

É qualquer subconjunto de um espaço amostral.

Ex.: A: Sair um número par no lançamento de um dado.A={2;4;6}

Probabilidade

A probabilidade de ocorrer um evento A qualquer será dada por:

Ex.: A probabilidade de sair um número par no lançamento de um dado será:

Propriedades da Probabilidade

a) A probabilidade de ocorrer um evento impossível é sempre zero – P(f) = 0;

b) A soma das probabilidades de cada elemento de um espaço amostral será 1 – P(W) = 100%;

Sendo W ={a1; a2; a3; a4; ....; an}

31

Estatística André Assumpção

P(a1)+ P(a2)+ P(a3)+....+ P(an)= 1

c) Para qualquer evento A, 0 £ P(A) £ 1;

Espaço Amostral EquiprovávelUm espaço amostral é equiprovável quando todos os elementos possuem a mesma probabilidade de ocorrer.

Sendo W ={a1; a2; a3; a4; ....; an}, um espaço equiprovável, entãoP(a1)= P(a2)= P(a3)=....= P(an)

EX.: Para um dado honesto, a probabilidade de sair qualquer um dos números será igual a 1/6. Ou seja, P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6

Probabilidade de Não Ocorrer um Evento

Dado um evento A, simbolizaremos por o evento complementar de A.Por exemplo:Sendo A: Sair 2 ou 3 no lançamento de um dado.Observe que:

Assim:

Probabilidade da União de dois EventosDados os eventos A e B, a probabilidade de AÈB, ou seja, P(A ÈB), será calculada por:

P(A ÈB) = P(A) + P(B) – P(AÇB)

EX.: Dados os seguintes eventos do experimento lançamento de um dado:A: Sair em número par = {2;4;6} – P(A) = 3/6 = 1/2;B: Sair um número maior que 3 = {4;5;6} – P(B) = 3/6 = 1/2;

Observe que AÇB = {4;6}. Assim, P(AÇB) = 2/6 = 1/3.Logo, P(AÈB) = 1/2 + 1/2 - 1/3 = 2/3.

Probabilidade Condicional

32

Estatística André Assumpção

Vamos supor que no lançamento de um dado, alguém tenha observado que o resultado obtido é par. Assim, qual será a probabilidade de sair o número 2?

Em condições normais, a probabilidade de sair o 2, no lançamento de um dados, será de 1/6. Porém, como sabemos que o resultado é par, o espaço amostral se reduz ao conjunto dos pares entre 1 e 6. Ou seja:

W = {2;4;6}

Assim, a probabilidade de sair o 2 será de 1/3.

A probabilidade de ocorrer o evento A: sair o número 2, condicionada ao evento B: o número é par será simbolizada por P(A/B).

Podemos deduzir desta fórmula que:

P(AÇB) = P(B).P(A/B)

OBS.: Dois eventos são independentes quando vale a igualdade:

P(AÇB) = P(A).P(B)

Exercícios:

1) Seis pessoas desejam sentar-se num banco de 6 lugares. De quantos modos elas podem se colocar no banco?

2) Quantos são os anagramas da palavra CINEMA?

3) Quantos são os anagramas da palavra MANADA?4) Quantos são os números de dois algarismos distintos possíveis

de serem formados com os algarismos 1, 2, 3, 4 e 5?

5) Oito alunos fizeram um trabalho em grupo, mas apenas três deles deverão apresentá-lo. De quantos modos podem ser escolhidos os três alunos que farão a apresentação?

6) Vinte equipes disputam um campeonato de futebol. De quantas maneiras distintas poderemos ter a classificação de campeão e vice-campeão?

7) Com as letras da palavra FLAMENGO, quantos anagramas distintos, com 5 letras, poderão ser formados?

33

Estatística André Assumpção

8) Qual a probabilidade do resultado ser cara ao jogar uma moeda?

9) No sorteio de um número natural de 1 a 20, qual a probabilidade de sair um múltiplo de 5?

10) Numa urna encontramos 3 bolas amarelas, 5 bolas azuis e 7 bolas brancas. Qual a probabilidade de sair uma bola amarela num sorteio aleatório?

11) Em uma questão típica de múltipla escolha com cinco respostas possíveis, respondendo à questão aleatoriamente, qual é a probabilidade de sua resposta estar errada?

12) De um baralho (convencional) de 52 cartas retirou-se uma carta, verificando-se que é vermelha. Qual a probabilidade de essa carta ser uma figura?

13) Seja o experimento lançar um dado e os eventos:A: sair o número 3B: sair um número parC: sair um número ímpara) Qual a probabilidade de sair o número 3?b) Qual a probabilidade de sair um número par?c) Qual a probabilidade de sair um número ímpar?d) Qual a probabilidade de sair o número 3 ou sair um número

par?e) Qual a probabilidade de sair o número 3 ou sair um número

ímpar?f) Qual a probabilidade de não sair o número 3?

14) O seguinte grupo de pessoas está numa sala: 5 rapazes com mais de 21 anos, 4 rapazes com menos de 21 anos, 6 moças com mais de 21 anos, 3 moças com menos de 21 anos. Uma pessoa é escolhida ao acaso dentre as 18. Qual a probabilidade dos seguintes eventos?a) A: a pessoa tem mais de 21 anos;b) B: a pessoa tem menos de 21 anos;c) C: a pessoa é um rapaz;d) D: a pessoa é uma moça.

15) Numa urna encontramos 3 bolas numeradas de 1 a 3. Duas bolas serão extraídas, sucessivamente, sem reposição. Calcule a probabilidade de a primeira bola extraída apresentar número maior que a segunda.

16) Um casal decidiu que vai ter 3 filhos. Qual é a probabilidade de que:a) tenham pelo menos um menino?b) tenham filhos de ambos os sexos?

34

Estatística André Assumpção

c) tenham dois filhos de cada sexo?

17) Em um armário há 6 pares de sapatos. Escolhem-se 2 pés de sapatos. Qual é a probabilidade de se formar um par de sapatos?

18) A Mastercard International efetuou um estudo de fraudes em cartões de crédito; os resultados estão consubstanciados na tabela a seguir:

TIPO DE FRAUDE NÚMERO1. Cartão roubado 2432. Cartão falsificado 853. Pedido

correio/telefone52

4. Outros 46

Selecionado aleatoriamente um caso de fraude nos casos resumidos na tabela, qual a probabilidade de a fraude resultar de um cartão falsificado?

17) A Nike Corporation deseja testar um novo material a ser usado na fabricação de tênis. Um grupo de teste consiste em 20 homens e 30 mulheres. Escolhida aleatoriamente uma pessoa desse grupo de teste, determine a probabilidade de não ser homem.

18) Um gerente de controle de qualidade utiliza equipamento de teste para detectar modems de computador defeituosos. Retiram-se aleatoriamente 3 modems diferentes de um grupo onde há 12 defeituosos e 18 sem defeito. Qual a probabilidade:a) de todos os 3 serem defeituosos?b) de ao menos um dos modems escolhidos ser defeituosos?

21) A probabilidade de que um homem esteja vivo daqui a 30 anos é 2/5; a de sua mulher é de 2/3. Determinar a probabilidade de que daqui a 30 anos:a) ambos estejam vivos;b) somente o homem esteja vivo;c) somente a mulher esteja viva;d) nenhum esteja vivo;e) pelo menos um esteja vivo.

22) Retiram-se sem reposição duas peças de um lote de 10 peças, onde 4 são boas. Qual a probabilidade de que ambas sejam defeituosas?

35

Estatística André Assumpção

36

Estatística André Assumpção

Capítulo VIIDistribuição de Probabilidades

Variável AleatóriaDados um experimento E e o espaço amostral S associado a ele, denominamos

de variável aleatória à função X(s) que associa a cada elemento s do espaço amostral S um número real X(s) S X R

Ex.: No lançamento de duas moedas, vamos analisar o comportamento da variável aleatória X: nº de caras obtidas nas duas moedas.

Neste caso, podemos verificar que o espaço amostral deste experimento é o conjunto S:{ (c;c); (c;k); (k;c); (k;k)}.

OBS.: Sendo c – cara e k – coroa.Assim, teremos:X = 0 ® Associado ao evento {(k;k)}, cuja probabilidade é ¼;X = 1 ® Associado ao evento {(k;c), (c;k)}, cuja probabilidade é ½ ;X = 2 ® Associado ao evento {(c;c)}, cuja probabilidade é ¼;

Importante: 1. Uma variável aleatória X será discreta se o número de valores possíveis de X

for numerável (seja finito ou infinito). Quanto este conjunto de possibilidades de X for um intervalo, ou uma coleção de intervalos reais, ela será uma variável aleatória contínua.

2. No exemplo anterior é possível observar a probabilidade de cada elemento do espaço amostral, que será apresentada na tabela abaixo:

Ponto Amostr

al

X P(X)

(c;c) 2 ¼

(c;k) 1 ¼

(k;c) 1 ¼

(k;k) 0 ¼

37

Estatística André Assumpção

Função ProbabilidadeDada a variável aleatória X. A probabilidade de que esta variável assuma um valor particular x será representada pela função probabilidade P(X = x), ou simplesmente P(x).Cabe destacar que esta função P(x) irá associar a cada valor de x um determinado valor, que será a sua probabilidade pi.Assim, teremos:Σ pi = 1Ainda para o exemplo anterior, podemos verificar que a distribuição de probabilidade da variável aleatória X será:

x 0 1 2

P(X) ¼ ½ ¼

Outros Exemplos:1) Vamos analisar o experimento E1: Lançamento de um dado; e a variável aleatória associada X: resultado da face superior (número de pontos);

A distribuição de probabilidade de X será representada pela tabela abaixo:

x 1 2 3 4 5 6

P(x) 1/6 1/6 1/6 1/6 1/6 1/6

2) Vamos, agora, analisar o experimento E2: Lançamento de dois dados; e a variável aleatória associada Y: soma dos resultados da face superior (soma dos pontos);A distribuição de probabilidade de Y será representada pela tabela abaixo. Porém, é importante lembrar que a soma mínima será 2, obtida pelo par (1;1), enquanto que a soma máxima será 12, obtida pelo par (6;6):

y 2 3 4 5 6 7 8 9 10 11 12

P(y)

1/36

2/36

3/36

4/36

5/36

6/36

5/36

4/36

3/36

2/36

1/36

3) Ainda com base no experimento E2: Lançamento de dois dados; vamos analisar agora a variável aleatória Z: o maior resultado obtido (ponto máximo);Neste caso, a distribuição de probabilidade será:

x 1 2 3 4 5 6

P(x) 1/36 3/36 5/36 7/36 9/36 11/36

38

Estatística André Assumpção

Modelos de Distribuição de ProbabilidadeI. Distribuição Binomial

Este modelo de distribuição é adequado a experimentos que possuam as seguintes características:

a. O experimento deve ser repetido, nas mesmas condições, em uma quantidade finita de vezes (n);

b. As repetições do experimento devem ser independentes. Ou seja, o resultado de uma aplicação não deverá afetar os resultados das repetições posteriores;

c. Em cada repetição do experimento deve aparecer um dos dois resultados: sucesso ou insucesso;

d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q (onde q = 1 – p) do insucesso se manterão constantes;

Ex.: Uma moeda não viciada é lançada 8 vezes. Encontre a probabilidade de sair:a) 5 caras;b) pelos menos uma cara;c) no máximo 2 caras;

Observe que n = 8; p = ½ e q = ½;A probabilidade de que um evento, que siga as características da distribuição

binomial observadas anteriormente, se realize k vezes, em n repetições, será dada pela função:

Assim, para o exemplo anteriormente, teremos:a) A probabilidade de sair 5 caras:

b) A probabilidade de sair pelo menos uma cara:Observe que equivale a não sair nenhuma cara. Ou seja, se nesta distribuição

podemos observar que a variável aleatória admitirá os valores do conjunto {0; 1; 2; 3; 4; 5; 6; 7; 8}, estamos querendo conhecer a probabilidade P (X ³ 1). Assim, se calcularmos a probabilidade P(X = 0), podemos fazer P(X ³ 1) = 1 – P(X = 0).

39

Estatística André Assumpção

c) A probabilidade de sair no máximo 2 caras;Observe que, neste caso, nos interessa saber a probabilidade de sair as seguintes quantidades de caras {0; 1; 2}. Assim, queremos calcular P(X£ 2). Ou seja, P(X = 0) + P(X = 1) + P(X = 2).

Distribuição NormalO modelo de distribuição normal é um dos mais utilizados quando tratamos de variáveis aleatórias contínuas. Seu comportamento é representada graficamente por uma curva na forma de Sino (Curva de Gauss), simétrica em torno da média.

A distribuição normal obedecerá às seguintes características:a) A variável aleatória X pode assumir todo e qualquer valor real;b) A área total limitada pela curva e pelo eixo das abscissas (eixo x) é igual a 1,

pois corresponde à probabilidade de a variável aleatória X assumir qualquer valor real;

c) A curva normal é assintótica em relação ao eixo das abscissas, pois aproxima-se indefinidamente do eixo x sem que consiga alcançá-lo;

d) A probabilidade de ocorrer valor maior que a média é igual à probabilidade de ocorrer valor menor que a média, visto que a curva é simétrica em relação à média;

Ex.: Seja X uma variável aleatória que possui média X = 1,5 e desvio padrão S = 0,04. Neste exemplo, iremos identificar graficamente a probabilidade de ocorrência de valores desta variável localizadas entre 1,5 e 1,55. Ou seja, queremos identificar P(1,5 < X < 1,55).Esta probabilidade corresponde à faixa hachurada mostrada na figura abaixo.

40

Estatística André Assumpção

Para calcularmos P(1,5<X<1,55), sem a necessidade do aprofundamento das ferramentas do cálculo, utilizaremos a Distribuição Normal Padrão.Seja Z uma variável aleatória tal que:

em que X é uma variável normal de média X e desvio padrão S.Admitindo que a média de Z é 0 e o desvio padrão 1, as probabilidades (as áreas abaixo da curva) poderão ser calculadas e tabeladas.

No exemplo anterior, necessitamos calcular a área abaixo da curva compreendida pelos limites de X. Ou seja, para 1,5 < X < 1,55.Assim, calcularemos os valores de Z1 e Z2, considerando X = 1,5 e S = 0,04:

Então, para calcularmos P(1,5 < X < 1,55), calcularemos a área abaixo da curva de Gauss, considerando o intervalo de 0 < Z < 1,25. Essa área será determinada com o auxílio da tabela que veremos a seguir.

Vamos destacar um pedaço da tabela, para ilustrar o seu funcionamento. Queremos calcular a área entre 0 e 1,25. Assim, bastará associar a linha 1,2, da tabela, com a coluna 0,05.

0,00 0,01 0,02 0,03 0,04 0,05

Assim, podemos dizer que a probabilidade de ocorrência de um valor entre 1,5 e 1,55 é igual a probabilidade P(0 < Z< 1,25) = 0,3944.

Outros Exemplos:1) Um teste padronizado de escolaridade tem distribuição normal com média 100 e

desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota:

a. maior que 120;b. entre 85 e 115;

Maior que 80;

41

Estatística André Assumpção

Capítulo VIIIMedidas de Assimetria e Curtose

Assimetria: É o grau de deformação de uma curva de freqüências. A medida de assimetria procura caracterizar como e quanto a distribuição de freqüências se afasta da condição de simetria.

Tipos de Curvas :

Simétrica ou Distribuição Simétrica

Apresenta como característica principal o fato de as três medidas de tendência central, média, mediana e moda serem iguais.

Assimétrica Positiva ou Distribuição Assimétrica Positiva

Uma distribuição com deformação positiva se apresenta com uma cauda mais alongada à direita da moda pois há uma predominância

de valores superiores à moda.

Assimétrica Negativa ou Distribuição Assimétrica Negativa

Predominam valores inferiores à moda. Neste caso, a curva de freqüências apresenta uma cauda mais longa à esquerda da moda.

42

Estatística André Assumpção

Cálculo da Medida de Assimetria

Coeficiente de Assimetria de Pearson:

Coeficiente de Bowley:

Coeficiente de Assimetria entre os Percentis 10 e 90:

43

Se As = 0, então a distribuição é simétrica.Se As < 0, então a distribuição é assimétrica negativa.Se As > 0, então a distribuição é assimétrica positiva.Por este critério, as distribuições são classificadas da seguinte maneira:Se As £ -1 :assimetria negativa forte.Se –1 < As < 0 : assimetria negativa fraca.Se As = 0 : simétrica.Se 0 < As < 1 : assimetria positiva fraca.Se As ³ 1 : assimetria positiva forte.

Se As = 0, então a distribuição é simétrica.Se As < 0, então a distribuição é assimétrica negativa.Se As > 0, então a distribuição é assimétrica positiva.O coeficiente de Bowley é um valor que varia de –1 a 1. Neste critério, as distribuições são classificadas da seguinte maneira:Se –1 £ As £ -0,3 :assimetria negativa forte.Se –0,3 < As < -0,1 : assimetria negativa moderada.Se –0,1£ As < 0: assimetria negativa fraca.Se As = 0 : simétrica.Se 0 < As £ 0,1 : assimetria positiva fraca.Se 0,1 < As < 0,3 : assimetria positiva moderada.Se 0,3 £ As £ 1 : assimetria positiva forte.

Neste critério, as distribuições são classificadas da seguinte maneira:

Se,Sk = 0 ® curva simétrica ou distribuição simétrica.Sk > 0 ® curva assimétrica positiva ou distribuição assimétrica positiva.Sk < 0 ® curva assimétrica negativa ou distribuição assimétrica negativa.

Estatística André Assumpção

Exercícios:

1) Classifique, quanto à assimetria, a distribuição abaixo, segundo o Coeficiente de Pearson.

X F1 22 103 64 45 26 1

2) Classifique, quanto à assimetria, a distribuição abaixo, segundo o Coeficiente de Bowley.

Classes F0 – 2 22 – 4 54 – 6 126 – 8 158 - 10 1Totais

3) Uma amostra de oitenta peças retiradas de um grande lote forneceu a seguinte distribuição de comprimentos:

Classes F50 – 60 160 – 70 370 – 80 680 – 90 1590 – 100 25

100 – 110 20110 – 120 7120 - 130 3

44

Estatística André Assumpção

A especificação para esse tipo de material exige que o comprimento médio das peças esteja entre 92 e 96 mm, que o coeficiente de variação seja inferior a 20%, e que a distribuição dos comprimentos seja simétrica. Quais dessas exigências parecem não estar satisfeitas no presente caso?

45

Estatística André Assumpção

I.2 – Curtose: Indica até que ponto a curva de freqüências de uma distribuição se apresenta mais afilada ou mais achatada do que uma curva padrão, denominada curva normal.

Tipos de Curtose

Curva ou Distribuição Mesocúrtica

Apresenta um grau de achatamento equivalente ao da normal.

Curva ou Distribuição Platicúrtica

Apresenta um alto grau de achatamento, superior ao da normal.

Curva ou Distribuição Leptocúrtica

Apresenta um alto grau de afilamento, superior ao da normal.

46

Estatística André Assumpção

I.2.2 - Coeficiente de Curtose

Se,

K = 0,263 ® curva ou distribuição mesocúrtica

K > 0,263 ® curva ou distribuição platicúrtica

K < 0,263 ® curva ou distribuição leptocúrtica

Também podemos calcular o coeficiente de curtose por:

Exercícios:

1) Classifique, quanto a curtose, a distribuição abaixo:

Classes F3 – 5 15 – 7 27 – 9 139 – 11 311 - 13 1Totais

2) Uma empresa produz caixas de papelão para embalagens e afirma que o número de defeitos por caixa se distribui conforme a tabela:

Nº de Defeitos

Nº de Caixas

0 321 282 113 44 35 1

Assim, determine:

47

Estatística André Assumpção

a) O número médio de defeitos por caixa;b) A porcentagem de caixas com dois defeitos;c) A porcentagem de caixas com mais de três defeitos;d) O histpgrama;e) A moda;f) O desvio Padrão;g) O Coeficiente de Variação;h) Classifique, quanto à assimetria, a distribuição segundo o

Coeficiente de Pearson;i) Classifique, quanto à curtose, a distribuição.

48

Estatística André Assumpção

Capítulo IXCORRELAÇÃO E REGRESSÃO

Correlação

É o estudo da existência e do grau de relacionamento entre

variáveis.

Correlação Linear Simples

Mede a relação entre as variáveis X e Y através da disposição dos

pontos em torno de uma reta.

a) Coeficiente de Correlação Linear de Pearson

onde,

n = número de observações

X = valores observados da variável X

Y = valores observados da variável Y

O campo de variação do coeficiente rx,y é: -1 £ rx,y £ 1

b) Interpretação do Coeficiente de Correlação Linear

Correlação Linear Positiva Correlação Linear

Positiva Perfeita

0 < rx,y < 1 rx,y = 1

49

Estatística André Assumpção

Correlação Linear Negativa Correlação Linear

Negativa Perfeita

-1 < rx,y < 0 rx,y

= -1

Correlação Nula

rx,y = 0

A correlação será tanto mais forte quanto mais próximo estiver o

resultado de 1, e será tanto mais fraca quanto mais próximo o

resultado estiver de zero.

Correlação Espúria

Apesar da independência entre X e Y, o coeficiente resulta em um

valor muito próximo de 1.

Correlação Ordinal - Coeficiente de Spearman

Mede a relação entre as variáveis X e Y levando em conta as posições

que os valores das variáveis ocupam quando ordenados na forma

crescente ou decrescente.

50

Onde:n = número de observações

di = diferença entre um i-ésimo par

Estatística André Assumpção

Regressão

Descreve através de um modelo matemático, a relação existente

entre duas variáveis

Supondo X a variável explicativa e Y a variável explicada,

Y = f(X) + e , Y é função da variável X e e são as influências

sobre Y não devidas a X

Um modelo de regressão linear de Y sobre X consiste em obter uma

reta que melhor represente a relação verdadeira entre as variáveis.

A determinação dos parâmetros desta reta é denominada

ajustamento.

Através de um diagrama de dispersão determina-se a função através

da qual os valores de X explicarão os de Y.

A reta ajustada é representada por:

onde a e b são os parâmetro do modelo,

a = ponto onde a reta ajustada corta o eixo da variável Y

b = é a tangente do ângulo que a reta forma com uma paralela do

eixo da variável X

Os valores de a e b são obtidos através de um sistema de equações

que torna mínima a soma dos quadrados das diferenças entre os

valores observados de Y e da reta ajustada para os mesmos valores

de X (método dos mínimos quadrados).

51

Estatística André Assumpção

Então,

e

A reta ajustada,

2.1 - Coeficiente de Determinação - Poder explicativo do

Modelo

É a avaliação da qualidade do ajuste. Seu valor fornece a proporção

da variação total da variável Y explicada pela variável X através da

função ajustada.

onde,

Sxx = nX2 - (X)2

Syy = nY2 - (Y)2

A variação de R2 é:

0 £ R2 £ 1 ou 0 £ R2 £ 100 %

Quando R2 = 0, a variação explicada de Y é zero, isto é, a reta

ajustada é paralela ao eixo da variável X.

Quando R2 = 1, a reta ajustada explicará toda a variação de Y.

Quanto mais próximo da unidade R2 estiver, melhor a qualidade do

ajuste da função. A parte não explicada do ajustamento ( 1 - R2 ) é

atribuída a causas aleatórias.

52

Estatística André Assumpção

CAPÍTULO XAJUSTAMENTO DE CURVAS E O

MÉTODO DOS MÍNIMOS QUADRADOS

Freqüentemente verificamos relações entre duas ou mais variáveis. Assim, buscamos expressar essa relação matematicamente através de uma equação que ligue as variáveis.

Ajustamento de Curvas

Um primeiro passo para a determinação dessa equação é colecionar dados que indiquem os valores correspondentes das variáveis consideradas.

Supondo que X e Y representem, respectivamente, a altura e o peso de adultos do sexo masculino. Então, uma amostra de N indivíduos apresentaria as alturas Xi e os pesos correspondentes Yi.

O diagrama de dispersão facilita à visualização da curva regular que se aproxima dos dados. No caso de os dados, no diagrama de dispersão, estarem próximos de uma reta, diz-se que há uma relação linear. No caso contrário, a relação é denominada de não-linear.

A determinação das equações de curvas que se acomodem a certos conjuntos de dados é denominado de ajustamento de curvas.

A Reta

O tipo mais simples de curva de ajustamento é a linha reta, cuja equação pode ser descrita por:

Y = aX + b

O Método dos Mínimos Quadrados

Objetivando evitar critérios individuais na construção de curvas de ajustamento, é necessário instituir uma definição para a melhor curva ajustada.

Dados um conjunto de pontos (Xi; Yi), de todas as curvas C que se ajustam a este conjunto de pontos, a que tem a propriedade de apresentar o mínimo valor de

53

Estatística André Assumpção

onde D é a distância entre o valor de Y de em ponto do conjunto e o valor de Y de um ponto da curva C que possuam o mesmo valor de X, será denomina a melhor curva de ajustamento.

C (X1; Y1) D1 (X2;Y2)

D2

X1 X2

A Reta dos Mínimos Quadrados

A reta dos mínimos quadrados que se ajusta ao conjunto de pontos (X1;Y1), (X2;Y2); ...... (Xn;Yn) tem equação:

Y = aX + b

onde os valores de a e b são obtidos através do sistema de equações:

Desta forma:

Ex1.: A tabela abaixo mostra as alturas e os pesos, arredondados para centímetros e quilogramas, de uma amostra de 12 estudantes do sexo masculino, extraída ao acaso. Construir um diagrama de dispersão dos dados. Traçar a reta dos mínimos quadrados.

Peso (X)

70 63 72 60 66 70 74 65 62 67 65 68

Altura (Y)

155 150 180 135 156 168 178 160 132 145 139 152

Resolução:

54

Estatística André Assumpção

190

180

170

160

150

140

130

120

60 62 64 66 68 70 72 74 76

Peso (X)

Altura (Y)

X2 X.Y

70 155 4900 1085063 150 3969 945072 180 5184 1296060 135 3600 810066 156 4356 1029670 168 4900 1176074 178 5476 1317265 160 4225 1040062 132 3844 818467 145 4489 971565 139 4225 903568 152 4624 10336802 1850 53792 12425

864320

4

Y = 3,22X – 60,75

Anexo 1

55

Estatística André Assumpção

56