18
Serviço Público Federal Universidade Federal do Pará Instituto de ciências exatas e naturais Disciplina: Probabilidade e estatística Docente: Marcelo Protázio Discentes: Mozaniel Santana de Oliveira Matricula: 10089000901 Kalebe de Lima Lino Matricula: 10089001901

Probabilidade e Estatistica

Embed Size (px)

Citation preview

Page 1: Probabilidade e Estatistica

Serviço Público Federal Universidade Federal do Pará

Instituto de ciências exatas e naturais Disciplina: Probabilidade e estatística

Docente: Marcelo Protázio Discentes: Mozaniel Santana de Oliveira Matricula: 10089000901 Kalebe de Lima Lino Matricula: 10089001901

Page 2: Probabilidade e Estatistica

Introdução

Ao longo do tempo a humanidade vem aprimorando as técnicas e os recursos que utiliza no seu cotidiano. Com o advento de tecnologias inovadoras, tem-se conseguido aperfeiçoar essas técnicas, que ajudam na realização das diversas atividades de uma forma mais eficaz, desde as mais simples até a resolução de problemas bastante complexos. Após o surgimento dos computadores, o que trouxe grande economia de tempo

e de recursos humanos, a estatística chegou ao nível que está hoje. No

entanto, o progresso das técnicas estatísticas continua em constante

desenvolvimento. Na última década, também houve uma mudança, por

exemplo, como determinados tipos de dados. Aqueles de medições que

teoricamente poderiam ser feitas continuamente, em vez de ser tratada como

escalares ou vetores de dimensão finita, tem a possibilidade de ser tratada

como uma função analítica (ou seja, curvas) e, portanto, são chamados de

dados funcionais [Frozza].

Em qualquer decisão que tomamos em nossas vidas, sempre levamos em

conta um grande número de fatores. Obviamente nem todos estes pesam da

mesma maneira na hora de uma escolha. Às vezes, por tomarmos uma

decisão usando a intuição, não identificamos de maneira sistemática estes

fatores. Ou seja, não identificamos quais as variáveis que afetaram a nossa

decisão.

Quando analisamos o mundo que nos cerca, identificamos que todos os

acontecimentos,sejam eles culturais ou naturais, envolvem um grande número

de variáveis. As diversas ciências têm a pretensão, de conhecer a realidade e

de interpretar os acontecimentos (ciências humanas) e os fenômenos (ciências

naturais), baseados no conhecimento das variáveis intervenientes

consideradas importantes nestes eventos. Estabelecer relações, encontrar ou

propor leis explicativas é o papel próprio da ciência. Para isso é necessário

controlar, manipular, medir as variáveis que são consideradas relevantes ao

entendimento do fenômeno analisado. Muitas são as dificuldades em traduzir

as informações obtidas em conhecimento. A maior delas é de natureza

epistemológica: a ciência não conhece a realidade, apenas a representa

através de modelos e teorias dos diversos ramos do conhecimento. Outra

dificuldade é a aspiração de universalidade das explicações científicas. Ora,

isto implica e condiciona a pesquisa a uma “padronização” metodológica. Um

aspecto essencial desta padronização é a avaliação estatística das

informações. A maneira própria de fazer ciência, procurando reduzir a poucas

variáveis, desenvolveu muito um ramo da estatística que olha as variáveis de

maneira isolada – a estatística univariada. Somos cientificamente treinados a

analisar as variáveis isoladamente e a partir desta análise fazer inferências

sobre a realidade. Esta simplificação tem vantagens e desvantagens. Quando

um fenômeno depende de muitas variáveis, geralmente este tipo de análise

Page 3: Probabilidade e Estatistica

falha, pois não basta conhecer informações estatísticas isoladas, mas é

necessário também conhecer a totalidade destas informações fornecida pelo

conjunto das variáveis (fapepi.pi.gov.br).

A estatística descritiva tem por objetivo descrever a realidade observada

(população ou amostra), usando métodos numéricos e métodos gráficos e

realizando comentários simples de maneira mais informativa possível. Pode-se

dizer que a estatística descritiva ocupa-se do tratamento de dados quantitativos

(ordenação, expos tratamento de dados quantitativos (ordenação, exposição e

ição e sumarização de registros de dados) do fenômeno em estudo.A

estatística inferencial (ou indutiva) ocupa-se em formular inferências sobre uma

população, com base em informações contidas na amostra. Ou seja, através de

técnicas inferenciais conclui-se para o todo, a partir da observação de uma

parte. Assim, os métodos de estatística inferencial só podem ser utilizados,

com algum sentido, sobre dados amostrais (sorocaba.unesp.br).

Análise descritiva univariada. Usando o teste t como teste de significância para

obter as principais diferenças entre dois grupos de um conjunto de amostras,

temos que esta diferença é dada basicamente pela diferenças entre as médias

de cada grupo ponderadas por um desvio padrão do espalhamento das

amostras Graner (1966). Matematicamente este valor t que descreve a

diferença entre os grupos é dado pela equação abaixo:

Onde kt é o t-valor da variável k , x1k e xk2 são respectivamente as médias da

variável k do grupo 1 e do grupo 2, σ k é o desvio padrão ponderado da

variável k , e N1 e N2 são respectivamente o total de amostras do grupo 1 e

do grupo 2. O desvio padrão ponderado do conjunto de amostras é dado pela

equação 2,

onde σ1k e σ2k são respectivamente o desvio padrão da variável k para os

grupos 1 e 2. Usando o mapa de t-valores calculado para cada uma das

variáveis, o conceito de hipótese nula pode ser utilizado para definir as

variáveis com um nível de

Page 4: Probabilidade e Estatistica

significância desejado [Siegel (1975)]. Por exemplo, no problema em questão

considerando a característica hipertensão, a hipótese nula define que as

médias de cada um dos voxels das imagens que compõem o grupo hipertenso

são iguais às médias correspondentes das amostras do grupo não-hipertenso.

Assim, realiza-se o teste estatístico univariado para verificar se as imagens

contém evidências de que esta hipótese é falsa. Em outras palavras, um valor

de significância p é determinado e com base no grau de liberdade do conjunto

de amostras um valor t é obtido através da tabela t de student [Graner (1966)].

Este grau de liberdade é dado pela diferença entre a quantidade de amostras e

a quantidade de grupos analisados. Com base nestes conceitos, pode-se

determinar as variáveis que apresentam uma diferença maior ou igual a um

determinado nível estatístico de significância esperado.

A estatística é, hoje em dia, um instrumento útil e, nalguns casos,

indispensável para tomadas de decisão em diversos campos: científico,

econômico, social, político…

Todavia, antes de chegarmos à parte de interpretação para tomadas de

decisão, há que proceder a um indispensável trabalho de recolha e

organização de dados, sendo a recolha feita através de recenseamentos (ou

censos ou levantamentos estatísticos) ou sondagens.

Existem indícios que há 300 mil anos a.C. já se faziam censos na China,

Babilónia e no Egipto. Censos estes que se destinavam á taxação de

impostos.

Definição

Estatística pode ser pensada como a ciência de aprendizagem a partir de

dados. No nosso quotidiano, precisamos tomar decisões, muitas vezes

decisões rápidas.

Em linhas gerais a Estatística fornece métodos que auxiliam o processo de

tomada de decisão através da análise dos dados que possuímos.

Pesquisas de opinião

Problema: como selecionar uma amostra de tal modo que as informações

possam ser expandidas para toda a população?

Page 5: Probabilidade e Estatistica

Por exemplo, desejamos fazer uma sondagem acerca da escolha dos

portugueses sobre o seu partido preferido. Acha que esta amostra é

representativa?

Não. Ao selecionar a nossa amostra devemos considerar alguns critérios de

acordo com o tipo de pesquisa. Exemplo: região, sexo, nível socio-económico,

idade…

Generalidades

Na estatística consideram-se dois ramos:

Estatística Descritiva, que visa descrever o real de forma de forma a

permitir entendê-lo melhor;

Page 6: Probabilidade e Estatistica

A Estatística Descritiva trata da recolha, organização e tratamento de dados

com vista a descrever e interpretar a realidade atual ou fatos passados

relativos ao conjunto observado. O seu objetivo é informar, prevenir,

esclarecer.

Universo ou população Estatística: conjunto de seres (humanos ou não) sobre

o qual se incide o estudo feito ou a fazer.

Unidade Estatística ou indivíduo: cada elemento do conjunto anterior.

Caráter estatístico ou atributo: propriedade dos indivíduos que foi ou vai ser

estudada.

Levantamento estatístico: estudo de um ou vários caracteres relativamente s

certo universo.

Média: é o quociente da soma de todos os dados pelo efetivo total.

Moda: é o valor que ocorre mais vezes numa distribuição, ou seja, é o de maior

efetivo e, portanto, de maior frequência.

Mediana: A mediana é o valor que têm tantos dados antes dele, como depois

dele. Para se medir a mediana, os valores devem estar por ordem crescente ou

decrescente. No caso do número de dados ser ímpar, existe um e só um valor

central que é a mediana. Se o número de dados é par, toma-se a médias

aritmética dos dois valores centrais para a mediana.

Amostra: precisa ser:

Representativa: deve conter indivíduos de todos os extratos da população;

- Não viciada: o número de elementos de todos os extratos deve ser

proporcional à população desses extratos;

- Aleatória: em todos os extratos os indivíduos devem ser escolhidos

aleatoriamente;

- Ampla: deve ser bastante alargada, para poder apresentar características

semelhantes às da população total que pretende representar.

Page 7: Probabilidade e Estatistica

Tipos de gráficos que serão usados neste trabalho.

Os dados podem então ser representados de várias formas:

Diagramas de barras:

Diagramas circulares:

Histogramas:

Pictogramas:

(10)

2ª (8)

3ª (4)

4ª (5)

5ª (4)

= 1 unidade

Estudo Estatístico

O presente trabalho visa mostrar à aplicação da estatística em diferentes ares

de conhecimento mostrado de forma clara a concisa sua grande importância na

sociedade atual, mostrar como é importante fazer os cálculos dos eventos foi

selecionado um conjunto de dados para que este trabalho pudesse ser

realizado.

Questão 1. Descreva o que é medida de assimetria e dê um exemplo em que a

assimetria pode ocorrer.

Page 8: Probabilidade e Estatistica

É a análise gráfica das formas geométricas obtidas à partir de uma distribuição

de freqüências com relação à moda.

Uma distribuição é chamada simétrica quando apresenta o mesmo valor para a

moda, média e mediana. Quando não existe essa igualdade, ocorre uma

distribuição assimétrica, traçado sobre o valor da média da distribuição.

Portanto, sempre que a curva de distribuição se afastar do eixo, ocorrerá a

assimetria.

Questão 2. Num experimento foram obtidos os seguintes dados:

45,62,38,55,54,65,60,55,48,56,59,55.

1 2 3 4 5 6 7 8 9 10 11 12 Σfi=12

38 45 48 54 55 55 55 56 59 60 62 65 Σxi=65

2

1444 2025 2304 2916 3025 3025 3025 3136 3481 3600 3844 4225 Σxi2=3

6050

Média, mediana e desvio padrão.

Média:

= 652 12= 54,33 = 54,3

Mediana:

Md= (55+55) 2= 55

Desvio Padrão:

= (Σxi2 n) – (Σ xi n)2 = (36050 12) – (652 12)2 = 52,055 = 7,2

Page 9: Probabilidade e Estatistica

b )Calcule o coeficiente de assimetria de Pearson e classifique a

distribuição com relação a sua simetria (simétrica, assimétrica positiva ou

negativa, fraca ou forte

As= 3 - Md = 3 . 54,3 – 55 = - 0,038 = - 0,04

52,1

Distribuição assimétrica negativa fraca

Questão 3 (Nota 1/1): Os dados abaixo corresponde às variáveis renda familiar

e gastos com alimentação numa amostra de 10 famílias, representados em

salários mínimos.

Renda Familiar (x) 3 5 10 20 30 50 70 100 150 200

Gastos com

alimentação (y) 1,5 2,0 6,0 10,0 15,0 20,0 25,0 40,0 60,0 80,0

Com base nestes dados e no exemplo do texto responda os seguintes itens

Renda

Familiar

x

Gastos

Alimentação

Y

Xi2

Yi2

XiYi

Xi2Yi

3 1,5 9 2,25 4,5 13,5

5 2,0 25 4 10 50

10 6,0 100 36 60 600

20 10,0 400 100 200 4.000

30 15,0 900 225 450 13.500

50 20,0 2.500 400 1.000 50.000

70 25,0 4.900 625 1.750 122.500

100 40,0 10.000 1.600 4.000 400.000

150 60,0 22.500 3.600 9.000 1.350.000

200 80,0 40.000 6.400 16.000 3.200.000

Σxi=638 Σyi=259,5 Σxi2=81.334 Σyi

2=12.992,25 Σxiyi=32.474,50 Σxi2yi=5.140.663,5

Page 10: Probabilidade e Estatistica

a) Determine o coeficiente de correlação de Pearson e comente o resultado

r= 10 x 32.474,50 – (638 x 259,5)

(10x 81.334 – (638)2) x (10x12.992,5-(259,5)2 )

r= 324.745 – 165.561 = 159.184

(813.340-407.044)x(129.925 - 67.340,25) 406.296 x 62.584,75

r= 159,184 = 0,9982=1,0

159.461,4

r = 1, portanto há uma correlação perfeita entre as variáveis x e y.

b) Gráfico ou diagrama de dispersão deste fenômeno de correlação de x

com y.

80 Y

X

10 25 50 70 100 150 200

40

60

20

Page 11: Probabilidade e Estatistica

Correlação positiva perfeita r = 1

c )Obtenha os parâmetros a e b da função y=ax+b

a= 10 x 32.474,5 – 638 x 259,5 = 159,184 =

10x 81.334 – (638)2 406,296

a= 0,39 = 0,4

b= 81.334 x 259,5 - 638 x 32.474,5 = 21.106,176 - 20.718,731

10x 81.334 – (638)2 406,296

b= 0,954 = 1,0 y = 0,4x + 1,0

Questão 4. Um fabricante de aparelho de dvd verificou numa pesquisa que de

cada 100 aparelhos fabricados 13 apresentam problemas nos seis primeiros

meses de uso. Qual a probabilidade de um cliente comprar um aparelho que

apresente problema antes de 6 meses?

R: P(A)= 13 x 100 = 13%

100

A probabilidade de um cliente comprar um aparelho que apresente problemas

antes de 6 meses é de 13%.

Questão 5. De um grupo de três mulheres e dois homens , uma pessoa será

sorteada para presidir uma reunião. Qual a probabilidade da presidência ser

assumida por uma mulher ou por um homem?

R: P(A) = 1 x 100 = 20%

Page 12: Probabilidade e Estatistica

5

A probabilidade de uma mulher ou um homem presidirem a reunião é de 20%.

Questão 6. O jogo da Mega Sena consiste em acertar 6 números dentre 1 a

60. Ao todo temos possibilidades de combinação de

resultados. O jogador pode marcar num cartão de 6 a 15 dezenas. Se o

jogador escolher 10 dezenas, qual será a probabilidade de acertar as 6

dezenas?

10! = 10! = 10x9x8x7x6x5x4x3x2x1 = 5040 = 210

6! 6! 4! (6x5x4x3x2x1)(4x3x2x1) 24

P(A)= y = 210 = 4,2 x 10 -4 %

N 50.063.860

Questionário de numero 7.

Foram selecionadas pessoas de diferentes estatutos sociais e idades.

Esta amostra consiste num número de 30 pessoas.

1-É a favor da Reciclagem?

a)Sim

b)Não

c)É-me indiferente.

2-Faz a separação dos diferentes tipos de lixo?

a)Sim

b)Não

c)Só com certos tipo de lixo (vidro, ou papel…)

Page 13: Probabilidade e Estatistica

3-Quais as cores dos eco pontos?

a)Verde, laranja e azul

b)Verde, azul e vermelho

c)Verde, azul e amarelo

4-O que se encontra no eco ponto “Lixeira” azul?

a)Papel

b)Vidro

c)Plástico

5- O que se encontra no eco ponto “Lixeira” amarelo?

a)Papel

b)Vidro

c)Plástico

6-O que se encontra no eco ponto “Lixeira” verde?

a)Papel

b)Vidro

c)Plástico

Tabela de respostas:

1 2 3 4 5 6 7 8

1 a b a a c b c a

2 a b c a c a a a

3 c b c a c b c a

4 a b a a c a b c

5 a b c a c a c b

6 c b a a c a b c

7 a a a a c a c b

8 a b a a c c a b

9 c b c a c a b c

Page 14: Probabilidade e Estatistica

10 a b a a c a b c

11 a a a c c a b c

12 c b c a c a b c

13 a a a c c a b c

14 a b c a c a c b

15 a b a a c c b a

16 a b a a c a b c

17 a b a c c a b c

18 a a a c c b c a

19 a b c c c b a c

20 a b a a c a b c

21 a b a a c a b c

22 a a a a c c b a

23 a b c a c a c b

24 a a a a c c b a

25 a b a c c a b c

26 a b a a c a b c

27 a a a c c a b c

28 a b c a c a b c

29 a b c a c a c b

30 a b c a c a b c

1ª Pergunta:

Tabela: Conclusão

N %

A 25 83,3

B 0 0,0

C 5 16,7

Total

30 100,

0

A partir destes gráficos podemos constatar que

maior parte da amostra é a favor da Reciclagem.

Uma pequena parte diz que não é a favor da

Reciclagem.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (25)

b) (0)

c) (5)

= uma resposta

Page 15: Probabilidade e Estatistica

2ª Pergunta:

Tabela: Conclusão

N %

A 6 20,0

B 24 0,0

C 0 80,0

Total

30 100,

0

A partir destas representações gráficas podemos

visualizar que maior parte da amostra não faz a

separação dos lixos.

Apenas uma pequena parte faz.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (6)

b)

(24)

c) (0)

= uma resposta

3ª Pergunta:

Tabela: Conclusão

N %

A 0 0,0

B 0 0,0

C 30 100,

0

Total 30 100,

0

Esta representação gráfica mostra-nos que não há

dúvida entre os portugueses, ou certa parte deles

quanto ás cores dos respectivos reservatórios de

Reciclagem.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (0)

b) (0)

c) (30)

= uma resposta

Page 16: Probabilidade e Estatistica

4º Pergunta

Tabela: Conclusão

N %

A 23 77,0

B 4 13,0

C 3 10,0

Total

30 100,

0

Nesta representação gráfica, podemos visualizar que

65% da amostra, 65% diz que no eco ponto azul se

encontra papel, 20% diz que é vidro, e os 15

restantes dizem que é plástico.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (23)

b) (4)

c) (3)

= uma resposta

5º Pergunta

Tabela: Conclusão

N %

A 3 10,0

B 19 63,0

C 8 27,0

Total

30 100,

0

Neste gráfico, podemos concluir que 10% da

amostra diz que é papel o que e encontra no eco

ponto amarela, 63% diz que é vidro, e 10% diz que

é plástico o que se encontra no eco ponto

amarelo.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (3)

b) (19)

c) (8)

= uma resposta

Page 17: Probabilidade e Estatistica

6º Pergunta

Tabela: Conclusão

N %

A 6 20,0

B 6 20,0

C 18 60,0

Total 30 100,

0

Ao visualizarmos estes gráficos, podemos constatar

que, 20% da amostra diz que o que se encontra no

eco ponto verde é papel, outros 20% diz que é

vidro, e os 60% acha que o que se encontra no eco

ponto verde é plástico.

Gráfico de Barras: Gráfico Circular: Pictograma:

a) (6)

b) (6)

c)

(18)

= uma resposta

Conclusão:

Este trabalho mostra como a estatística pode ser empregada em diferentes

áreas para analise de dados foram utilizados sete questionários para que se

possa ter uma noção de quão grande é a diversidade de estudos realizados

utilizando estatística, podemos pode-se observar que estatística descritiva e de

suma importância para a sociedade, pois com ela podemos ter noção de

estimativas futuras sendo desta forma podendo estimar valores de renda media

entre outras.

Na segunda conclusão que pude observar foi que o estudo, não se trata de um

estudo representativo o que me leva a lidar apenas com uma pequena

amostra, e não com a população devida á quantidade reduzida de indivíduos

interrogados. Quanto à Reciclagem pude concluir que os indivíduos sabem as

cores dos eco pontos, mas que maior parte não sabe a que materiais se

destinam.

Page 18: Probabilidade e Estatistica

Referências Bibliográficas:

Maicom Frozza, Introdução à analise descritiva de dados funcionais

Fonte: http://www.fapepi.pi.gov.br/novafapepi/ciencia/documentos/univariada.PDF.

Acesso em 15/02/2012

Fonte:.http://www2.sorocaba.unesp.br/professor/robertow/Arquivos%202011/Geoproc_2011/Int

r ducao%20a%20%20Analise%20Exploratoria_Aula_3.pdf Acesso em 15/02/2012

Graner, E. A. (1966) Estatística. Ed. Companhia Melhoramentos de São Paulo.

Siegel, S. (1975), Estatística não-paramétrica para as Ciências do Comportamento. McGraw-

Hill Ltda. SPM Home Page, Wellcome Trust Centre for Neuroimaging

http://www.fil.ion.ucl.ac.uk/spm/

. Matemática B - 10ºano, Ana Arede Soveral, Cármen Viegas Silva, Texto Editora

XEQMAT – volume 2 - 10ºano, Fancelino Gomes, Cristina Viegas, Yolanda Lima, Editorial O

Livro