Upload
aleniv
View
3.993
Download
2
Embed Size (px)
Citation preview
UNIVERSIDADE ESTADUAL DO CEARÁ – UECE
CENTRO DE CIÊNCIAS E TECNOLOGIA – CECITEC
CURSO DE LICENCIATURA PLENA EM CIÊNCIAS BIOLÓGICAS
DISCIPLINA: BIOESTATÍSTICA III SEMESTRE
PROFº. ALEXANDRE LOPES ANDRADE
NOÇÕES BÁSICAS DE BIOESTATÍSTICA
Tauá/Ceará2012
1.CAP-DEFINIÇÃO
A Estatística pode ser definida como oconjunto de ferramentas para a coleta,organização, análise e interpretação dedados experimentais.
A Bioestatística consiste na aplicação daEstatística à Biologia.
HISTÓRICO DA ESTATÍSTICA
• ANTIGUIDADE: os povos já registravam o número dehabitantes, nascimentos, óbitos. Faziam "estatísticas".
• IDADE MÉDIA: as informações eram tabuladas comfinalidades tributárias e bélicas.
• SÉC. XVI: surgem as primeiras análises sistemáticas, asprimeiras tabelas e os números relativos.
• SÉC. XVIII: a estatística com feição científica é batizadapor Gottfried Achemmel (1719-1772). As tabelas ficammais completas, surgem as primeiras representaçõesgráficas e os cálculos de probabilidades
A estatística está presente em nosso dia-a-dia
• Nos jornais, revistas, nosnoticiários de televisão, napolítica, nos estudos epesquisas científicas, quandose calcula a porcentagem depessoas que concluíram oensino Fundamental, Médioe Superior... Crescimento Educacional – 2001 a 2010
ESTATÍSTICA DESCRITIVA E INFERÊNCIAL
• Descritiva: é utilizada para descrever aobservação de fenômenos, uma realidadesocial, econômica ou outra qualquer, atravésde tabelas e/ou gráficos;
Descritiva
Ano: Sede: Número de medalhas:
1972 Munique 2
1976 Montreal 2
1980 Moscou 4
1984 Los Angeles 8
1988 Seul 6
1992 Barcelona 3
1996 Atlanta 15
2000 Sydney 12
• A tabela abaixo mostra o número de medalhas de Ouro que o Brasil ganhou em olimpíadas, entre 1972 e 2000.
Nº de medalhas
0
5
10
15
Nº de medalhas
Nº de medalhas
Descritiva
ESTATÍSTICA DESCRITIVA E INFERÊNCIAL
• Indutiva: refere-se a um processo degeneralização, a partir de resultadosparticulares.
POPULAÇÃO E AMOSTRA
• População- É o conjunto da totalidade deindivíduos que apresentam uma característicacomum, cujo comportamento se quer analisar(finita ou infinita).
• Amostra- É um subconjunto finito dapopulação, ou seja, é uma parte da populaçãoda qual se observa algumas características.
VARIÁVEIS
Em Estatística trabalhamos com variáveis querepresentam as características dos elementosque formam o conjunto de dados.
As variáveis podem ser:
• Qualitativas
• Quantitativas
VARIÁVEIS
VARIÁVEIS
APRESENTAÇÃO DE DADOS
1. Tabelas- são representações que resumemum conjunto de informações observadasnum fenômeno.
São partes de uma tabela:
• Titulo
• Cabeçalho
• Corpo
TABELAS
Anos Produção por Toneladas
1995 20.000
1996 27.000
1997 27.500
1998 29.000
1999 29.800
2000 30.000
Produção de Café no Brasil 1995-2000TABELA 1.1
Fonte: Imaginária
2. Series Estatísticas- são tabelas queapresentam uma distribuição de um conjuntode dados em função da época, do local ou daespécie.
APRESENTAÇÃO DE DADOS
Série Cronológica
Anos Vendas
2000 30.000
2001 45.000
2002 75.000
2003 85.000
Vendas da Campanha 2000 a 2003TABELA 1.2
Fonte: Imaginária
Região Quantidade de Crianças
Norte 200.000
Nordeste 600.000
Sudeste 1.100.000
Sul 400.000
Centro Oeste 180.000
Série Geográfica
Vacinação contra PoliomieliteBrasil- 1993
TABELA 1.3
Fonte: Imaginária
Setor Industrial Quantidade (Toneladas)
Aço 400
Papel 180
Açúcar 90.000
Chocolate 40.000
Produção média de cada operário por setorBrasil- 2002
TABELA 1.4
Série Especifica
Fonte: Imaginária
Gráficos Estatísticos
1. Por Setor
Fonte: Google Analytcs
2. Linha:
Gráficos Estatísticos
Fonte: Associação brasileira de prevenção dos acidentes de Trânsito
3. Colunas:
Gráficos Estatísticos
Fonte: Projeto Nacional de Telessaúde – Núcleo São Paulo
2. CAP-DISTRIBUIÇÃO DE FREQUÊNCIA
• Distribuição de freqüência com intervalos declasse: quando o tamanho da amostra éelevado, é mais racional efetuar oagrupamento dos valores em vários intervalosde classe.
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• CLASSE- São os intervalos de variação davariável. São sempre iguais, em todas asclasses
Ex: 3ª classe é representada pela freqüência dedados encontrados entre 49 e 53 cm (49 |---- 53)
• LIMITES DE CLASSE- Sãoos extremos de cadaclasse. O menornúmero é o limiteinferior de classe e omaior número, o limitesuperior de classe. Ex:em 49 |------- 53 (classe3), o limite inferior é 49e o superior é 53.
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• AMPLITUDE DO INTERVALO DE CLASSE-
É a medida obtida pela diferença entre olimite superior e inferior da classe. Ex: natabela anterior, a amplitude da classe 3ª éigual a 53 - 49 = 4
Também pela Fórmula: h= AA/K
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• AMPLITUDE AMOSTRAL (AA)- É a diferençaentre o valor máximo e o valor mínimo daamostra (ROL). Em nosso exemplo, aamplitude da amostra é igual a 60 - 41 = 19.
Fórmula = −
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• AMPLITUDE TOTAL (At)- É a diferença entre olimite superior da última classe e o limiteinferior da primeira classe.
At= Xmax- Xmin
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• PONTO MÉDIO DA CLASSE- É o ponto quedivide o intervalo de classe em duas partesiguais. Também dado pela fórmula:
Xi= Linf+ Lsup /2
Ex: a classe 3ª
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
• NÚMERO DE CLASSES- A primeirapreocupação para a construção de umadistribuição de freqüência.
Para a determinação do número de classes deuma distribuição, usamos a Regra de Sturges:
ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA
PASSOS PARA UMA DISTRIBUIÇÃO DE FREQUÊNCIAS COM CLASSE:
1. Organize os dados brutos em Rol;
2. Calcular a Amplitude Amostral (AA);
3. Calcular o Nº de Classes (K);
4. Calcular o Ponto Médio Xi= Liminf+Limsup ;
2
5. Confeccionar a Tabela.
EXERCÍCIO
• Considere a distribuição de freqüência a seguir e responda (F) ou (V):
Diâmetro fi
4|.... 6
6|.... 8
8|.... 10
10|.... 12
12|.... 14
5
9
13
10
3
∑ 40
• a) Menos de 85% tem diâmetro não inferior a 6cm ( ).
• b) 75% das observações estão no intervalo de 6|.... 12 ( )
• c) A soma dos pontos médios é inferior a soma da Fi ( )
• d) 32,5% das observações estão na 4ª classe ( )
• e) 27% das observações tem diâmetro baixo de 10cm
( )
3.CAP- MEDIDAS DE POSIÇÃO E DISPERSÃO
As medidas de posição mais importantes sãoas medidas de tendência central, que SÃOassim chamadas pelo fato de os dados seagruparem em torno dos valores centrais.
• Média Aritmética;
• Moda;
• Mediana.
MEDIDAS DE POSIÇÃO
• Média Aritmética Simples ( X ):
Média Aritmética é o quociente da divisão da soma dos valores da variável pelo número deles:
X = ∑ Xi
• Média Aritmética Ponderada ( X ): A média é considerada Ponderada quando somam-se valores (Pesos) diferentes ao conjunto das observações:
X = ∑ xi fi
n
∑ fi
• Dados não agrupados:Ex: Sabendo-se que a produção de solvente do reatorA, durante uma semana, foi de 10, 14, 13, 15, 18, 16 e 12litros, temos, para produção média da semana:
x = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14
Ex2: Um professor aplicou quarto provas e atribuiu os seguintes pesos respectivamente: 1, 2, 3, 4. se um aluno tiver recebido as notas 8, 7, 9 e 9 nessa ordem, sua nota final será:
X= (8x1)+ (7x2)+ (9x3)+(9x4)= 85 = 8,5
Média Aritmética ( X )
7 7
1+2+3+4 10
• Dados agrupados: Sem intervalo de classe:
Consideremos a distribuição relativa a 34 famílias de quatrofilhos, tomando para variável o numero de filhos do sexomasculino:
Nº de
meninos
fi
0
1
2
3
4
2
6
10
12
4
∑ = 31
Tabela 01:
Média Aritmética ( X )
Média Aritmética ( X )
• Neste caso, como as freqüências são números indicadores daintensidade de cada valor da variável, elas funcionam comofatores de ponderação, o que nos leva a calcular a médiaaritmética ponderada, dada pela formula:
X = ∑ xi fi
∑ fi
Xi fi Xifi0
1
2
3
4
2
6
10
12
4
0
6
20
36
16
∑ = 34 ∑ = 78
Tabela 02:
X= 78/34= 2,29 ou 2,3 Meninos
• Dados agrupados: Com intervalo de classe:
Neste caso, convencionamos que todos os valores incluídosem um determinado intervalo de classe coincidem com o seuponto médio, e determinamos a média aritmética ponderada.
i Estaturas
(cm)
fi xi xifi
1
2
3
4
5
6
150 – 154
154 – 158
158 – 162
162 – 166
166 – 170
170 – 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1404
1760
1312
840
516
∑ = 40 ∑ = 6440
Tabela 03:
• Temos: ∑ xifi = 6440, ∑ fi = 40
x = 6440 = 161 cm40
• Moda (Mo): Denominamos moda o valor que ocorre com maior freqüência em uma série de valores.
Dados não agrupados:A serie de dados:
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
Tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal:
3, 5, 8, 10, 12, 13 (amodal)
Na serie: 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
Temos duas modas: 4 e 7 (bimodal).
MEDIDAS DE POSIÇÃO
Moda (Mo):
• Dados agrupados: Sem intervalo de classe:
Uma vez agrupados os dados, épossível determinar imediatamentea moda, basta fixar da variável demaior freqüência.
Na distribuição da tabela 02, áfreqüência máxima (12)corresponde o valor 3 da variável.Logo: Mo = 3
Xi fi Xifi0
1
2
3
4
2
6
10
12
4
0
6
20
36
16
∑ = 34 ∑ =
78
Moda (Mo):
• Dados agrupados: Com intervalo de classe:
A classe que apresenta a maior freqüência é denominada classe modal.
Temos então: Mo = l* + L*/2
L* = limite superior da classe modal
l* = limite inferior da classe modal
Moda (Mo):
Na distribuição da tabela 03, á freqüência máxima (11) corresponde:
Mo = 158 + 162/2 = 160 Logo: Mo = 160 cm.
i Estaturas
(cm)
fi xi xifi
1
2
3
4
5
6
150 – 154
154 – 158
158 – 162
162 – 166
166 – 170
170 – 174
4
9
11
8
5
3
152
156
160
164
168
172
608
1404
1760
1312
840
516
∑ = 40 ∑ = 6440
Tabela 03:
• Mediana (Md): É definida como o numero que seencontra no centro de uma serie de números, estando estesdispostos segundo uma ordem.
• Dados não agrupados:
Dada uma serie de valores, como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9
Ordenação (crescente ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta omesmo numero de elementos á direita e á esquerda númerosímpar de termos.
Temos então Md = 10
MEDIDAS DE POSIÇÃO
Mediana (Md):
Se, porém, a serie dada tiver um numero par de termos, a mediana será o ponto médio.
Assim, a serie de valores:
2, 6, 7, 10 12, 13, 18, 21
Tem para mediana a média aritmética entre 10 e 12.
Logo: Md = 10 + 12/2 = 11; sendo assim a Md = 11
Mediana (Md):
• Dados agrupados: Se os dados se agrupam em uma
distribuição de freqüência, o cálculo da mediana se processade modo muito semelhante àquele dos dados não agrupados.
Apenas compara-se o valor com a Fa.Emd = ∑ fi
2
TABELA
Nº DE
MENINOSfi Fi
0
1
2
3
4
2
6
10
12
4
2
8
18
30
34
∑= 34
A mediana será aquele valor davariável que corresponde a talfreqüência acumulada:
Sendo: (∑ f1) ÷ 2 = 34 ÷ 2 = 17
Mediana (Md):
Mediana (Md):
• Dados agrupados:
Se os valores da variável estiverem agrupados em classe o
cálculo da mediana será realizado pelo seguintes passos:
• 1) Determinamos as freqüências acumuladas.
• 2) Calculamos (∑ f1) ÷ 2.
• 3) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à (∑ f1) ÷ 2 − classe mediana − e, em seguida, empregamos a fórmula:
Md= l + c EMd- Fant
Onde :
l= Lim inferior da classe
c= Amplitude do intervalo de classe
Emd= Elemento da Mediana
fMd= Freqüência simples da mediana
Fant= Freqüência acumulada anterior à da classe mediana
FMd
Mediana (Md):
TABELA 6
iESTATURAS
(cm)fi Fa
123456
150 ι— 154154 ι— 158158 ι— 162162 ι— 166166 ι— 170170 ι— 174
4911853
41324323740
∑ = 40
Mediana (Md):
Quartis
Na estatística descritiva, um quartil é qualquer um dos trêsvalores que divide o conjunto ordenado de dados em quatropartes iguais, e assim cada parte representa 1/4 da amostraou população.
Assim, no caso duma amostra ordenada:
• primeiro quartil (designado por Q1/4) = quartil inferior = é ovalor aos 25% da amostra ordenada = 25º percentil
• segundo quartil (designado por Q2/4) = mediana = é o valoraté ao qual se encontra 50% da amostra ordenada = 50ºpercentil, ou 5º decil.
• terceiro quartil (designado por Q3/4) = quartil superior = valora partir do qual se encontram 25% dos valores mais elevados= valor aos 75% da amostra ordenada = 75º percentil
MEDIDAS DE DISPERSÃO
As medidas de tendência central fornecem informações valiosasmas, em geral, não são suficientes para descrever ediscriminar diferentes conjuntos de dados.
As medidas de dispersão ou variabilidade permitem visualizar amaneira como os dados espalham-se (ou concentram-se) emtorno do valor central, são elas:
• Amplitude Total; Distância Interquartílica; Desvio Médio;Desvio Padrão ; Variância;e Coeficiente de Variação.
MEDIDAS DE DISPERSÃO
• Amplitude Total (At); é a diferença entre o maior e o
menor valor do conjunto de dados.
At= Xmax- Xmin
Ex.: dados: 3, 4, 7, 8 e 8.
At= 8 – 3 = 5
• Distância Interquartílica; é a diferença entre o
terceiro e o primeiro quartil de um conjunto de dados.
Dq= Q3- Q1
Fórmula das posições dos quartis:
Q1= Eq1= n Q3= Eq3= 3n
MEDIDAS DE DISPERSÃO
2
4 4
Distância Interquartílica;
• Os Quartis são calculados a partir da fórmula:
hfi
facn
lQ
ANT4
inf1 hfi
facn
lQ
ANT4
2
inf2
hfi
facn
lQ
ANT4
3
inf3
• Desvio Médio (Dm); é a diferença entre o valor
observado e a medida de tendência central (MédiaAritmética) do conjunto de dados.
Desvio Médio (Dm);
• Calcular o desvio médio dos conjuntos de números apresentados do ex:
A= { 10,12,13,20,25,34,45}
B= {17,18,19,20,21,22,23 }
C= {-4, -3, -2, 3, 5 }
• Calcular a média X
• Calcular o somatório de todos os Xi – X em modulo | |
• Aplicar a fórmula
• Variância (S2); é uma medida que expressa um desvio
quadrático médio do conjunto de dados, e sua unidade é oquadrado da unidade dos dados.
• Desvio Padrão (S); é raiz quadrada da variância e sua
unidade de medida é a mesma que a do conjunto de dados.
• Coeficiente de Variação; é uma medida de
variabilidade relativa, definida como a razão percentual entreo desvio padrão e a média, e assim sendo uma medidaadimensional expressa em percentual.
= ∙100 X
4-CAP PROBABILIDADE
• Probabilidades- O estudo das probabilidades se faz
necessário em situações em que se conhece os desfechospossíveis de alguma situação, porém não se conhece qualdeles irá acontecer.
A probabilidade de um evento (E) é a divisão do número deresultados favoráveis pelo número de resultados possíveis (S).
P (E)= n(E)
S
PROBABILIDADE
Alguns conceitos precisam ser apresentados para facilitar a
definição e entendimento das probabilidades.
São eles:
• Experimento Aleatório- é qualquer experimento em que épossível definir todos os resultados deste sem conhecer qualdeles será observado.
• Espaço Amostral- é o conjunto de todos os valores possíveisde um experimento aleatório. (S)
• Evento -é qualquer subconjunto de um espaço amostral. (E)
• Ex: Lançamento de um dado:
S= {1,2,3,4,5,6,}
P (E1)= de ocorrer um número ímpar
P (E1)= 3/6 = ½
P (E2)= de ocorrer o nº 3
P (E2)= 1/6
• Ex2: Em um lançamento de uma moeda, qual a probabilidade de obter “cara”?
S = {Cara, Coroa}, n (S) = 2
P(E) = 1 / 2 = 0,5
PROBABILIDADE
• Lançamento de dois dados:
P (E1)= (1, 3)
P (E2)= (1, 3) ou (3, 1)
Lançamento de duas moedas:
P (E1)= duas Caras
P (E2)= uma Cara e uma Coroa
P (E3)= duas Coroas
PROBABILIDADE
• Propriedades:
1ª_ P(0)= 0
2ª_ P(S)= 1 ou 100%
3ª_ { P (par)= 1/2
{ P (ímpar)= 1/2
Logo: P(E) + P (E)= 1
4ª_ 0 < P (E) < 1
PROBABILIDADE
1/2 + 1/2= 2/2= 1
Observação:
Probabilidade de 2 partos:
M=1/2
F= ½
(a + b)2 ou (M + F)2
Probabilidade de 3 partos:
(M+ F)3
PROBABILIDADE
S= { (M, F) (M, M) (F, M) (F, F)
• A União de eventos (ou) probabilísticos é calculado pela fórmula:
P(E1 E2)= P(E1) + P(E2) - P(E1 E2)
Ex: Numa urna contém bolas...
UNIÃO DE EVENTOS
• Condição:
E1 e E2 (E1 E2) = 0
P(E1 E2)= P(E1) + P(E2)
Ex; No lançamento de um dado....
EVENTOS MUTUAMENTE EXCLUSIVOS
PROBABILIDADE CONDICIONAL
• Quando dois eventos E1 e E2 de um espaço amostral (S)qualquer ocorrem, chamamos de probabilidade E1
condicionada a E2 e representamos por P (E1/E2).
• Para o calculo utilizamos a fórmula:
P(E1/E2)= n (E1 E2)
Ex: No lançamento de um dado...
REFERÊNCIAS BIBLIOGRÁFICAS
• Crespo, Antonio Arnot. Estatística Fácil. 17ª Edição. Saraiva,2002.
• Pereira, Paulo Henrique. Noções de Estatística. Papirus, 2004.