Upload
mozaniel-roots-de-oliveira
View
78
Download
3
Embed Size (px)
Citation preview
Serviço Público Federal Universidade Federal do Pará
Instituto de ciências exatas e naturais Disciplina: Probabilidade e estatística
Docente: Marcelo Protázio Discentes: Mozaniel Santana de Oliveira Matricula: 10089000901 Kalebe de Lima Lino Matricula: 10089001901
Introdução
Ao longo do tempo a humanidade vem aprimorando as técnicas e os recursos que utiliza no seu cotidiano. Com o advento de tecnologias inovadoras, tem-se conseguido aperfeiçoar essas técnicas, que ajudam na realização das diversas atividades de uma forma mais eficaz, desde as mais simples até a resolução de problemas bastante complexos. Após o surgimento dos computadores, o que trouxe grande economia de tempo
e de recursos humanos, a estatística chegou ao nível que está hoje. No
entanto, o progresso das técnicas estatísticas continua em constante
desenvolvimento. Na última década, também houve uma mudança, por
exemplo, como determinados tipos de dados. Aqueles de medições que
teoricamente poderiam ser feitas continuamente, em vez de ser tratada como
escalares ou vetores de dimensão finita, tem a possibilidade de ser tratada
como uma função analítica (ou seja, curvas) e, portanto, são chamados de
dados funcionais [Frozza].
Em qualquer decisão que tomamos em nossas vidas, sempre levamos em
conta um grande número de fatores. Obviamente nem todos estes pesam da
mesma maneira na hora de uma escolha. Às vezes, por tomarmos uma
decisão usando a intuição, não identificamos de maneira sistemática estes
fatores. Ou seja, não identificamos quais as variáveis que afetaram a nossa
decisão.
Quando analisamos o mundo que nos cerca, identificamos que todos os
acontecimentos,sejam eles culturais ou naturais, envolvem um grande número
de variáveis. As diversas ciências têm a pretensão, de conhecer a realidade e
de interpretar os acontecimentos (ciências humanas) e os fenômenos (ciências
naturais), baseados no conhecimento das variáveis intervenientes
consideradas importantes nestes eventos. Estabelecer relações, encontrar ou
propor leis explicativas é o papel próprio da ciência. Para isso é necessário
controlar, manipular, medir as variáveis que são consideradas relevantes ao
entendimento do fenômeno analisado. Muitas são as dificuldades em traduzir
as informações obtidas em conhecimento. A maior delas é de natureza
epistemológica: a ciência não conhece a realidade, apenas a representa
através de modelos e teorias dos diversos ramos do conhecimento. Outra
dificuldade é a aspiração de universalidade das explicações científicas. Ora,
isto implica e condiciona a pesquisa a uma “padronização” metodológica. Um
aspecto essencial desta padronização é a avaliação estatística das
informações. A maneira própria de fazer ciência, procurando reduzir a poucas
variáveis, desenvolveu muito um ramo da estatística que olha as variáveis de
maneira isolada – a estatística univariada. Somos cientificamente treinados a
analisar as variáveis isoladamente e a partir desta análise fazer inferências
sobre a realidade. Esta simplificação tem vantagens e desvantagens. Quando
um fenômeno depende de muitas variáveis, geralmente este tipo de análise
falha, pois não basta conhecer informações estatísticas isoladas, mas é
necessário também conhecer a totalidade destas informações fornecida pelo
conjunto das variáveis (fapepi.pi.gov.br).
A estatística descritiva tem por objetivo descrever a realidade observada
(população ou amostra), usando métodos numéricos e métodos gráficos e
realizando comentários simples de maneira mais informativa possível. Pode-se
dizer que a estatística descritiva ocupa-se do tratamento de dados quantitativos
(ordenação, expos tratamento de dados quantitativos (ordenação, exposição e
ição e sumarização de registros de dados) do fenômeno em estudo.A
estatística inferencial (ou indutiva) ocupa-se em formular inferências sobre uma
população, com base em informações contidas na amostra. Ou seja, através de
técnicas inferenciais conclui-se para o todo, a partir da observação de uma
parte. Assim, os métodos de estatística inferencial só podem ser utilizados,
com algum sentido, sobre dados amostrais (sorocaba.unesp.br).
Análise descritiva univariada. Usando o teste t como teste de significância para
obter as principais diferenças entre dois grupos de um conjunto de amostras,
temos que esta diferença é dada basicamente pela diferenças entre as médias
de cada grupo ponderadas por um desvio padrão do espalhamento das
amostras Graner (1966). Matematicamente este valor t que descreve a
diferença entre os grupos é dado pela equação abaixo:
Onde kt é o t-valor da variável k , x1k e xk2 são respectivamente as médias da
variável k do grupo 1 e do grupo 2, σ k é o desvio padrão ponderado da
variável k , e N1 e N2 são respectivamente o total de amostras do grupo 1 e
do grupo 2. O desvio padrão ponderado do conjunto de amostras é dado pela
equação 2,
onde σ1k e σ2k são respectivamente o desvio padrão da variável k para os
grupos 1 e 2. Usando o mapa de t-valores calculado para cada uma das
variáveis, o conceito de hipótese nula pode ser utilizado para definir as
variáveis com um nível de
significância desejado [Siegel (1975)]. Por exemplo, no problema em questão
considerando a característica hipertensão, a hipótese nula define que as
médias de cada um dos voxels das imagens que compõem o grupo hipertenso
são iguais às médias correspondentes das amostras do grupo não-hipertenso.
Assim, realiza-se o teste estatístico univariado para verificar se as imagens
contém evidências de que esta hipótese é falsa. Em outras palavras, um valor
de significância p é determinado e com base no grau de liberdade do conjunto
de amostras um valor t é obtido através da tabela t de student [Graner (1966)].
Este grau de liberdade é dado pela diferença entre a quantidade de amostras e
a quantidade de grupos analisados. Com base nestes conceitos, pode-se
determinar as variáveis que apresentam uma diferença maior ou igual a um
determinado nível estatístico de significância esperado.
A estatística é, hoje em dia, um instrumento útil e, nalguns casos,
indispensável para tomadas de decisão em diversos campos: científico,
econômico, social, político…
Todavia, antes de chegarmos à parte de interpretação para tomadas de
decisão, há que proceder a um indispensável trabalho de recolha e
organização de dados, sendo a recolha feita através de recenseamentos (ou
censos ou levantamentos estatísticos) ou sondagens.
Existem indícios que há 300 mil anos a.C. já se faziam censos na China,
Babilónia e no Egipto. Censos estes que se destinavam á taxação de
impostos.
Definição
Estatística pode ser pensada como a ciência de aprendizagem a partir de
dados. No nosso quotidiano, precisamos tomar decisões, muitas vezes
decisões rápidas.
Em linhas gerais a Estatística fornece métodos que auxiliam o processo de
tomada de decisão através da análise dos dados que possuímos.
Pesquisas de opinião
Problema: como selecionar uma amostra de tal modo que as informações
possam ser expandidas para toda a população?
Por exemplo, desejamos fazer uma sondagem acerca da escolha dos
portugueses sobre o seu partido preferido. Acha que esta amostra é
representativa?
Não. Ao selecionar a nossa amostra devemos considerar alguns critérios de
acordo com o tipo de pesquisa. Exemplo: região, sexo, nível socio-económico,
idade…
Generalidades
Na estatística consideram-se dois ramos:
Estatística Descritiva, que visa descrever o real de forma de forma a
permitir entendê-lo melhor;
A Estatística Descritiva trata da recolha, organização e tratamento de dados
com vista a descrever e interpretar a realidade atual ou fatos passados
relativos ao conjunto observado. O seu objetivo é informar, prevenir,
esclarecer.
Universo ou população Estatística: conjunto de seres (humanos ou não) sobre
o qual se incide o estudo feito ou a fazer.
Unidade Estatística ou indivíduo: cada elemento do conjunto anterior.
Caráter estatístico ou atributo: propriedade dos indivíduos que foi ou vai ser
estudada.
Levantamento estatístico: estudo de um ou vários caracteres relativamente s
certo universo.
Média: é o quociente da soma de todos os dados pelo efetivo total.
Moda: é o valor que ocorre mais vezes numa distribuição, ou seja, é o de maior
efetivo e, portanto, de maior frequência.
Mediana: A mediana é o valor que têm tantos dados antes dele, como depois
dele. Para se medir a mediana, os valores devem estar por ordem crescente ou
decrescente. No caso do número de dados ser ímpar, existe um e só um valor
central que é a mediana. Se o número de dados é par, toma-se a médias
aritmética dos dois valores centrais para a mediana.
Amostra: precisa ser:
Representativa: deve conter indivíduos de todos os extratos da população;
- Não viciada: o número de elementos de todos os extratos deve ser
proporcional à população desses extratos;
- Aleatória: em todos os extratos os indivíduos devem ser escolhidos
aleatoriamente;
- Ampla: deve ser bastante alargada, para poder apresentar características
semelhantes às da população total que pretende representar.
Tipos de gráficos que serão usados neste trabalho.
Os dados podem então ser representados de várias formas:
Diagramas de barras:
Diagramas circulares:
Histogramas:
Pictogramas:
1ª
(10)
2ª (8)
3ª (4)
4ª (5)
5ª (4)
= 1 unidade
Estudo Estatístico
O presente trabalho visa mostrar à aplicação da estatística em diferentes ares
de conhecimento mostrado de forma clara a concisa sua grande importância na
sociedade atual, mostrar como é importante fazer os cálculos dos eventos foi
selecionado um conjunto de dados para que este trabalho pudesse ser
realizado.
Questão 1. Descreva o que é medida de assimetria e dê um exemplo em que a
assimetria pode ocorrer.
É a análise gráfica das formas geométricas obtidas à partir de uma distribuição
de freqüências com relação à moda.
Uma distribuição é chamada simétrica quando apresenta o mesmo valor para a
moda, média e mediana. Quando não existe essa igualdade, ocorre uma
distribuição assimétrica, traçado sobre o valor da média da distribuição.
Portanto, sempre que a curva de distribuição se afastar do eixo, ocorrerá a
assimetria.
Questão 2. Num experimento foram obtidos os seguintes dados:
45,62,38,55,54,65,60,55,48,56,59,55.
1 2 3 4 5 6 7 8 9 10 11 12 Σfi=12
38 45 48 54 55 55 55 56 59 60 62 65 Σxi=65
2
1444 2025 2304 2916 3025 3025 3025 3136 3481 3600 3844 4225 Σxi2=3
6050
Média, mediana e desvio padrão.
Média:
= 652 12= 54,33 = 54,3
Mediana:
Md= (55+55) 2= 55
Desvio Padrão:
= (Σxi2 n) – (Σ xi n)2 = (36050 12) – (652 12)2 = 52,055 = 7,2
b )Calcule o coeficiente de assimetria de Pearson e classifique a
distribuição com relação a sua simetria (simétrica, assimétrica positiva ou
negativa, fraca ou forte
As= 3 - Md = 3 . 54,3 – 55 = - 0,038 = - 0,04
52,1
Distribuição assimétrica negativa fraca
Questão 3 (Nota 1/1): Os dados abaixo corresponde às variáveis renda familiar
e gastos com alimentação numa amostra de 10 famílias, representados em
salários mínimos.
Renda Familiar (x) 3 5 10 20 30 50 70 100 150 200
Gastos com
alimentação (y) 1,5 2,0 6,0 10,0 15,0 20,0 25,0 40,0 60,0 80,0
Com base nestes dados e no exemplo do texto responda os seguintes itens
Renda
Familiar
x
Gastos
Alimentação
Y
Xi2
Yi2
XiYi
Xi2Yi
3 1,5 9 2,25 4,5 13,5
5 2,0 25 4 10 50
10 6,0 100 36 60 600
20 10,0 400 100 200 4.000
30 15,0 900 225 450 13.500
50 20,0 2.500 400 1.000 50.000
70 25,0 4.900 625 1.750 122.500
100 40,0 10.000 1.600 4.000 400.000
150 60,0 22.500 3.600 9.000 1.350.000
200 80,0 40.000 6.400 16.000 3.200.000
Σxi=638 Σyi=259,5 Σxi2=81.334 Σyi
2=12.992,25 Σxiyi=32.474,50 Σxi2yi=5.140.663,5
a) Determine o coeficiente de correlação de Pearson e comente o resultado
r= 10 x 32.474,50 – (638 x 259,5)
(10x 81.334 – (638)2) x (10x12.992,5-(259,5)2 )
r= 324.745 – 165.561 = 159.184
(813.340-407.044)x(129.925 - 67.340,25) 406.296 x 62.584,75
r= 159,184 = 0,9982=1,0
159.461,4
r = 1, portanto há uma correlação perfeita entre as variáveis x e y.
b) Gráfico ou diagrama de dispersão deste fenômeno de correlação de x
com y.
80 Y
X
10 25 50 70 100 150 200
40
60
20
Correlação positiva perfeita r = 1
c )Obtenha os parâmetros a e b da função y=ax+b
a= 10 x 32.474,5 – 638 x 259,5 = 159,184 =
10x 81.334 – (638)2 406,296
a= 0,39 = 0,4
b= 81.334 x 259,5 - 638 x 32.474,5 = 21.106,176 - 20.718,731
10x 81.334 – (638)2 406,296
b= 0,954 = 1,0 y = 0,4x + 1,0
Questão 4. Um fabricante de aparelho de dvd verificou numa pesquisa que de
cada 100 aparelhos fabricados 13 apresentam problemas nos seis primeiros
meses de uso. Qual a probabilidade de um cliente comprar um aparelho que
apresente problema antes de 6 meses?
R: P(A)= 13 x 100 = 13%
100
A probabilidade de um cliente comprar um aparelho que apresente problemas
antes de 6 meses é de 13%.
Questão 5. De um grupo de três mulheres e dois homens , uma pessoa será
sorteada para presidir uma reunião. Qual a probabilidade da presidência ser
assumida por uma mulher ou por um homem?
R: P(A) = 1 x 100 = 20%
5
A probabilidade de uma mulher ou um homem presidirem a reunião é de 20%.
Questão 6. O jogo da Mega Sena consiste em acertar 6 números dentre 1 a
60. Ao todo temos possibilidades de combinação de
resultados. O jogador pode marcar num cartão de 6 a 15 dezenas. Se o
jogador escolher 10 dezenas, qual será a probabilidade de acertar as 6
dezenas?
10! = 10! = 10x9x8x7x6x5x4x3x2x1 = 5040 = 210
6! 6! 4! (6x5x4x3x2x1)(4x3x2x1) 24
P(A)= y = 210 = 4,2 x 10 -4 %
N 50.063.860
Questionário de numero 7.
Foram selecionadas pessoas de diferentes estatutos sociais e idades.
Esta amostra consiste num número de 30 pessoas.
1-É a favor da Reciclagem?
a)Sim
b)Não
c)É-me indiferente.
2-Faz a separação dos diferentes tipos de lixo?
a)Sim
b)Não
c)Só com certos tipo de lixo (vidro, ou papel…)
3-Quais as cores dos eco pontos?
a)Verde, laranja e azul
b)Verde, azul e vermelho
c)Verde, azul e amarelo
4-O que se encontra no eco ponto “Lixeira” azul?
a)Papel
b)Vidro
c)Plástico
5- O que se encontra no eco ponto “Lixeira” amarelo?
a)Papel
b)Vidro
c)Plástico
6-O que se encontra no eco ponto “Lixeira” verde?
a)Papel
b)Vidro
c)Plástico
Tabela de respostas:
1 2 3 4 5 6 7 8
1 a b a a c b c a
2 a b c a c a a a
3 c b c a c b c a
4 a b a a c a b c
5 a b c a c a c b
6 c b a a c a b c
7 a a a a c a c b
8 a b a a c c a b
9 c b c a c a b c
10 a b a a c a b c
11 a a a c c a b c
12 c b c a c a b c
13 a a a c c a b c
14 a b c a c a c b
15 a b a a c c b a
16 a b a a c a b c
17 a b a c c a b c
18 a a a c c b c a
19 a b c c c b a c
20 a b a a c a b c
21 a b a a c a b c
22 a a a a c c b a
23 a b c a c a c b
24 a a a a c c b a
25 a b a c c a b c
26 a b a a c a b c
27 a a a c c a b c
28 a b c a c a b c
29 a b c a c a c b
30 a b c a c a b c
1ª Pergunta:
Tabela: Conclusão
N %
A 25 83,3
B 0 0,0
C 5 16,7
Total
30 100,
0
A partir destes gráficos podemos constatar que
maior parte da amostra é a favor da Reciclagem.
Uma pequena parte diz que não é a favor da
Reciclagem.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (25)
b) (0)
c) (5)
= uma resposta
2ª Pergunta:
Tabela: Conclusão
N %
A 6 20,0
B 24 0,0
C 0 80,0
Total
30 100,
0
A partir destas representações gráficas podemos
visualizar que maior parte da amostra não faz a
separação dos lixos.
Apenas uma pequena parte faz.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (6)
b)
(24)
c) (0)
= uma resposta
3ª Pergunta:
Tabela: Conclusão
N %
A 0 0,0
B 0 0,0
C 30 100,
0
Total 30 100,
0
Esta representação gráfica mostra-nos que não há
dúvida entre os portugueses, ou certa parte deles
quanto ás cores dos respectivos reservatórios de
Reciclagem.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (0)
b) (0)
c) (30)
= uma resposta
4º Pergunta
Tabela: Conclusão
N %
A 23 77,0
B 4 13,0
C 3 10,0
Total
30 100,
0
Nesta representação gráfica, podemos visualizar que
65% da amostra, 65% diz que no eco ponto azul se
encontra papel, 20% diz que é vidro, e os 15
restantes dizem que é plástico.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (23)
b) (4)
c) (3)
= uma resposta
5º Pergunta
Tabela: Conclusão
N %
A 3 10,0
B 19 63,0
C 8 27,0
Total
30 100,
0
Neste gráfico, podemos concluir que 10% da
amostra diz que é papel o que e encontra no eco
ponto amarela, 63% diz que é vidro, e 10% diz que
é plástico o que se encontra no eco ponto
amarelo.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (3)
b) (19)
c) (8)
= uma resposta
6º Pergunta
Tabela: Conclusão
N %
A 6 20,0
B 6 20,0
C 18 60,0
Total 30 100,
0
Ao visualizarmos estes gráficos, podemos constatar
que, 20% da amostra diz que o que se encontra no
eco ponto verde é papel, outros 20% diz que é
vidro, e os 60% acha que o que se encontra no eco
ponto verde é plástico.
Gráfico de Barras: Gráfico Circular: Pictograma:
a) (6)
b) (6)
c)
(18)
= uma resposta
Conclusão:
Este trabalho mostra como a estatística pode ser empregada em diferentes
áreas para analise de dados foram utilizados sete questionários para que se
possa ter uma noção de quão grande é a diversidade de estudos realizados
utilizando estatística, podemos pode-se observar que estatística descritiva e de
suma importância para a sociedade, pois com ela podemos ter noção de
estimativas futuras sendo desta forma podendo estimar valores de renda media
entre outras.
Na segunda conclusão que pude observar foi que o estudo, não se trata de um
estudo representativo o que me leva a lidar apenas com uma pequena
amostra, e não com a população devida á quantidade reduzida de indivíduos
interrogados. Quanto à Reciclagem pude concluir que os indivíduos sabem as
cores dos eco pontos, mas que maior parte não sabe a que materiais se
destinam.
Referências Bibliográficas:
Maicom Frozza, Introdução à analise descritiva de dados funcionais
Fonte: http://www.fapepi.pi.gov.br/novafapepi/ciencia/documentos/univariada.PDF.
Acesso em 15/02/2012
Fonte:.http://www2.sorocaba.unesp.br/professor/robertow/Arquivos%202011/Geoproc_2011/Int
r ducao%20a%20%20Analise%20Exploratoria_Aula_3.pdf Acesso em 15/02/2012
Graner, E. A. (1966) Estatística. Ed. Companhia Melhoramentos de São Paulo.
Siegel, S. (1975), Estatística não-paramétrica para as Ciências do Comportamento. McGraw-
Hill Ltda. SPM Home Page, Wellcome Trust Centre for Neuroimaging
http://www.fil.ion.ucl.ac.uk/spm/
. Matemática B - 10ºano, Ana Arede Soveral, Cármen Viegas Silva, Texto Editora
XEQMAT – volume 2 - 10ºano, Fancelino Gomes, Cristina Viegas, Yolanda Lima, Editorial O
Livro