9
1 Universidade Federal do Piauí Campus Universitário “Prof a . Cinobelina Elvas” – Bom Jesus, PI Profa. Gisele ESTATÍSTICA I - IMPORTÂNCIA DA ESTATÍSTICA E CONCEITOS BÁSICOS 1. INTRODUÇÃO: Origem e importância Há tempos o homem tem, muitas vezes, tomado notas de coisas e pessoas, não somente com o fim de acumular números, mas também visando utilizar os dados do passado para a resolução de problemas do presente. Todavia, somente no fim do século XIX e início do século XX, com a aplicação das probabilidades aos problemas sobre a interpretação dos dados, os números passaram a ser utilizados tanto para resolver os problemas do presente quanto prever os acontecimentos futuros. A palavra Estatística deriva do latim “status”, que significa ESTADO. Os primeiros usos da estatística envolviam a compilação de dados e gráficos que descreviam vários aspectos de um estado ou país, daí a origem da palavra estar relacionada a estado. O primeiro levantamento estatístico remonta a 3500 a.C no Egito, tendo como objetivo informar ao estado sobre os recursos humanos e econômicos. No século XVII d.C a disciplina estatística já era lecionada nas universidades alemãs, continuando com a finalidade de descrever as populações e as riquezas do estado. Ainda neste século, ocorreu a expansão da ciência em áreas como saúde pública, indústria, comércio e densidade demográfica. Alguns estudiosos contribuíram ao longo dos anos para o desenvolvimento da estatística como ciência, como Francis Galton (1822-1911) que apresentou as noções de regressão e correlação; Karl Pearson (1857-1936) que apresentou seus famosos coeficientes, hoje chamados de coeficientes de Pearson; e Fisher que apresentou estudos sobre inferência estatística, dentre outros. Porém, o grande avanço mesmo da ciência foi por volta de 1940, quando o tratamento dos dados deixou de ser manual para ser computadorizado e, com isso, a realização de procedimentos estatísticos que, geralmente eram de alto custo do ponto de vista humano, passaram a ser dinamizados pela aplicação da informática no tratamento dos dados.

Apostila 1 - Importância da estatística e conceitos básicos

Embed Size (px)

DESCRIPTION

apostila de estatística básica

Citation preview

Page 1: Apostila 1 - Importância da estatística e conceitos básicos

1

Universidade Federal do Piauí

Campus Universitário “Profa. Cinobelina Elvas” – Bom Jesus, PI

Profa. Gisele

ESTATÍSTICA

I - IMPORTÂNCIA DA ESTATÍSTICA E CONCEITOS BÁSICOS

1. INTRODUÇÃO: Origem e importância

Há tempos o homem tem, muitas vezes, tomado notas de coisas e pessoas, não somente com

o fim de acumular números, mas também visando utilizar os dados do passado para a resolução de

problemas do presente. Todavia, somente no fim do século XIX e início do século XX, com a

aplicação das probabilidades aos problemas sobre a interpretação dos dados, os números passaram a

ser utilizados tanto para resolver os problemas do presente quanto prever os acontecimentos futuros.

A palavra Estatística deriva do latim “status”, que significa ESTADO. Os primeiros usos da

estatística envolviam a compilação de dados e gráficos que descreviam vários aspectos de um

estado ou país, daí a origem da palavra estar relacionada a estado. O primeiro levantamento

estatístico remonta a 3500 a.C no Egito, tendo como objetivo informar ao estado sobre os recursos

humanos e econômicos.

No século XVII d.C a disciplina estatística já era lecionada nas universidades alemãs,

continuando com a finalidade de descrever as populações e as riquezas do estado. Ainda neste

século, ocorreu a expansão da ciência em áreas como saúde pública, indústria, comércio e

densidade demográfica.

Alguns estudiosos contribuíram ao longo dos anos para o desenvolvimento da estatística

como ciência, como Francis Galton (1822-1911) que apresentou as noções de regressão e

correlação; Karl Pearson (1857-1936) que apresentou seus famosos coeficientes, hoje chamados de

coeficientes de Pearson; e Fisher que apresentou estudos sobre inferência estatística, dentre outros.

Porém, o grande avanço mesmo da ciência foi por volta de 1940, quando o tratamento dos dados

deixou de ser manual para ser computadorizado e, com isso, a realização de procedimentos

estatísticos que, geralmente eram de alto custo do ponto de vista humano, passaram a ser

dinamizados pela aplicação da informática no tratamento dos dados.

Page 2: Apostila 1 - Importância da estatística e conceitos básicos

2

A importância da estatística reside no esforço do homem para melhor compreender o

mundo, tanto do ponto de vista físico como social. Na sociedade científica, da qual fazemos parte

atualmente, a investigação é parte essencial do trabalho diário. O interesse por descobrir novos

procedimentos por meio da experiência acumulada tem sido determinante para a necessidade de os

profissionais se perceberem imersos na formação e aprendizado de técnicas básicas de metodologia

da investigação e de algumas mais concretas como a análise de dados. Os profissionais que se

apóiam na quantificação e no estudo do que se observa diariamente, e entendem e conhecem os

conceitos básicos de estatística se aprofundam e compreendem melhor o fundamento de sua área de

trabalho.

2. O QUE É ESTATÍSTICA?

Segundo o Dicionário de Língua Portuguesa Aurélio:

“1Parte da matemática em que se investigam processos de obtenção, organização e análise de

dados sobre uma coleção de seres quaisquer, e métodos de tirar conclusões e fazer predições com

base nesses dados. 2Conjunto de elementos numéricos relativos a um fato social.”

Para muitas pessoas, a palavra “estatística” faz lembrar longas colunas de números, gráficos

e diagramas que mostram de que forma o governo está gastando o dinheiro dos impostos. No

passado, esta palavra referia-se exclusivamente à informações numéricas de que os governos

necessitavam para planejar sua conduta. Os estatísticos eram pessoas que coletavam grandes

quantidades de informações numéricas. Alguns estatísticos ainda realizam este tipo de trabalho, mas

existem outros que auxiliam a conduzir e interpretar experimentos científicos e pesquisas

profissionais. As mudanças no significado da palavra estatística acompanharam as mudanças

ocorridas no tipo de trabalho realizado pelos estatísticos.

A palavra estatística pode ser utilizada para designar dados numéricos, como, por exemplo,

estatísticas esportivas ou estatísticas financeiras. Entretanto, a palavra pode também se referir à

estatística como uma disciplina própria da mesma forma que a matemática ou a economia.

Assim, conceituando temos que:

A estatística é o ramo da matemática interessado nos métodos científicos para coleta,

organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões

válidas e na tomada de decisões razoáveis baseadas em tais análises.

Portanto, a estatística é uma ciência que se preocupa com o planejamento de uma pesquisa,

envolvendo desde a forma de coleta das observações obtidas em experimentos ou levantamentos,

até a maneira como será feita a organização, a descrição, o resumo dos dados e a avaliação e

Page 3: Apostila 1 - Importância da estatística e conceitos básicos

3

afirmação sobre características de interesse do pesquisador. Tudo isso corresponde às fases do

método estatístico.

As fases do método estatístico são então:

a) Definição do Problema

Consiste na:

- formulação correta do problema;

- examinar outros levantamentos realizados no mesmo campo (revisão da literatura);

- saber exatamente o que se pretende pesquisar definindo o problema corretamente (variáveis,

população, hipóteses, etc.)

b) Planejamento

Determinar o procedimento necessário para resolver o problema:

- Como levantar informações;

- Tipos de levantamentos: por censo (completo) ou por amostragem (parcial).

- Cronograma, custos, etc.

c) Coleta ou levantamento dos dados

Consiste na obtenção dos dados referentes ao trabalho que desejamos fazer.

A coleta pode ser: Direta - diretamente da fonte; Indireta - feita através de outras fontes.

Os dados podem ser obtidos pela própria pessoa (primários) ou se baseia no registro de terceiros

(secundários).

d) Apuração dos Dados ou sumarização

Consiste em resumir os dados, através de uma contagem e agrupamento. É um trabalho de

coordenação e de tabulação.

e) Apresentação dos dados

É a fase em que são mostrados os resultados obtidos na coleta e na organização.

f) Análise e interpretação dos dados

É a fase mais importante e também a mais delicada. Obtêm-se conclusões que auxiliam o

pesquisador nas tomadas de decisões.

Page 4: Apostila 1 - Importância da estatística e conceitos básicos

4

OBS: As análises estatísticas dependem da forma de como os dados são coletados, e o

planejamento estatístico da pesquisa indica o esquema sob o qual os dados serão obtidos. Portanto,

o planejamento da pesquisa e a análise estatística dos dados estão intimamente ligados.

PLANEJAMENTO DA PESQUISA ⇒⇒⇒⇒ ANÁLISE ESTATÍSTICA

Assim, o pesquisador deve possuir razoável conhecimento de estatística para desenvolver

suas pesquisas, ou então consultar um estatístico para auxiliá-lo. Vale ressaltar que esta consulta

deve ser feita antes do início da pesquisa, ainda durante a fase de elaboração do projeto.

3. SUBDIVISÕES DA ESTATÍSTICA

A estatística pode ser dividida em duas áreas:

�Estatística Descritiva ou Análise Exploratória dos Dados

� Estatística Indutiva ou Inferência Estatística

A Estatística Descritiva ou Análise Exploratória de Dados é a parte da estatística que

cuida da apresentação dos dados observados em certo grupo por meio de uso de tabelas, de gráficos

e de medidas dentre as quais se destacam as medidas de posição e de dispersão, sem fazer

inferências sobre um grupo maior.

A Inferência Estatística ou Analise Confirmatória é a parte da estatística que trata das

condições sob as quais faz-se inferências (ou pressuposições ou generalizações) sobre uma

população. Se uma amostra é representativa de uma população, possui as mesmas características

básicas da mesma, e conclusões importantes sobre a população podem ser inferidas de sua análise,

assim, com a inferência estatística fazemos inferências além dos dados conhecidos. A inferência

estatística envolve questões de dois tipos: a estimação de parâmetros populacionais e os testes de

hipóteses.

Nota: Mesmo sendo um importante instrumento auxiliar na pesquisa e na interpretação dos

fenômenos, a estatística tem as suas limitações quanto ao uso:

• Não serve para corrigir erros grosseiros nem técnicas defeituosas. Como toda informação

está contida nos dados, se esses são viciados, será falsa qualquer conclusão que deles se

obtenha;

• Não substitui o julgamento crítico. Ela fornece critérios que auxiliam na tomada de decisões,

mas não dispensa a análise crítica do pesquisador.

Page 5: Apostila 1 - Importância da estatística e conceitos básicos

5

4. CONCEITOS BÁSICOS

a) POPULAÇÃO X AMOSTRA

� População (N): Conjunto de todos os elementos relativos a um determinado fenômeno que

possuem pelo menos uma característica em comum, a população é o conjunto Universo. Pode varia

quanto à sua origem (conjunto de pessoas, de objetos, de acontecimentos, etc.), à sua natureza

(existente ou real, hipotética ou não totalmente inexistente) e ainda pode ser finita ou infinita.

Finita - apresenta um número limitado de observações, que é passível de contagem.

Infinita - apresenta um número ilimitado de observações que é impossível de contar e

geralmente esta associada a processos.

� Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma

irá depender do tamanho da amostra. Se a freqüência relativa entre amostra e população for menor

do que 5% ela é considerada infinita, se a freqüência relativa for maior do que 5% ela é considerada

finita.

�Amostra (n): É um subconjunto da população e deverá ser considerada finita, a amostra deve ser

selecionada seguindo certas regras e deve ser representativa da população, de modo que ela

represente todas as características da população.

b) CENSO X AMOSTRAGEM

� Censo: É a coleta exaustiva de informações das "N" unidades populacionais.

� Amostragem: É o processo de retirada de informações dos "n" elementos amostrais.

OBS: Censo por amostragem

c) DADO X VARIÁVEL

� Dado: qualquer característica que possa ser observada ou medida de alguma maneira. As

matérias-primas da estatística são os dados observáveis.

As características importantes dos dados são:

• Centro: um valor representativo ou médio, que indica onde está localizado o meio do

conjunto de dados;

Page 6: Apostila 1 - Importância da estatística e conceitos básicos

6

• Variação: medida de quanto os valores dos dados variam entre eles;

• Distribuição: a natureza ou forma de distribuição dos dados;

• Tempo: características dos dados que mudam com o tempo.

� Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão. Os símbolos

utilizados para representar estatisticamente as variáveis são as letras maiúsculas do alfabeto, tais

como X, Y, Z, ..., que podem assumir qualquer valor de um conjunto de dados. As variáveis podem

ser classificadas dos seguintes modos:

• Qualitativas (ou atributos ou categóricos): São características que não podem ser

medidas, ou seja, são não-numéricas.

Nominal : são utilizados nomes, rótulos ou símbolos para representar determinados tipos de

dados, mostrando, assim, a qual grupo ou categoria eles pertencem.

Ex.: cor da flor, que pode ser rosa, branca ou vermelha.

Ordinal ou por postos: quando uma classificação for dividida em categorias ordenadas em

graus convencionados, havendo uma relação entre as categorias do tipo “maior do que”,

“menor do que”, “igual a”, os dados por postos consistem de valores relativos atribuídos para

denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente.

Ex.: resistência a inseto, que pode ser suscetível, parcialmente resistente e resistente.

• Quantitativas: São características que podem ser contadas ou medidas, sendo classificadas

em discretas e contínuas.

Discretas: são aquelas variáveis que podem assumir somente valores inteiros num conjunto

de valores. É gerada pelo processo de contagem.

Ex.: número de folhas por planta; número de carrapatos por animal; etc.

Contínuas: são aquelas variáveis que podem assumir um valor dentro de um intervalo de

valores. É gerada pelo processo de medição ou mensuração.

Ex.: volume de água em um reservatório; peso de raiz; diâmetro do caule; produção;

produtividade; etc.

d) PARÂMETRO X ESTIMADOR X ESTIMATIVA

� Parâmetro: é uma medida numérica que descreve alguma característica da população. É o

resumo da variável observada na população. Por exemplo, média, variância e desvio padrão.

Page 7: Apostila 1 - Importância da estatística e conceitos básicos

7

Cada parâmetro é representado por um símbolo ou letra. No exemplo tem-se que para a

média, a variância e o desvio padrão as letras gregas µ (mi), σ2 (sigma ao quadrado) e σ (sigma).

Não é possível fazer inferências baseada em parâmetro, uma vez que toda a população foi

investigada.

� Estimador (também chamado de Estatística): é uma medida numérica que descreve alguma

característica de uma amostra, ou seja, o estimador é obtido a partir do resumo da variável

observada na amostra. Neste caso, é possível utilizarmos as teorias inferências para que, com base

na amostra, possamos obter conclusões sobre a população.

Cada estimador também é representado por um símbolo ou letra. Para a média, a variância e

o desvio padrão as letras gregas µ̂ ou X , 2σ̂ ou S2 e σ̂ ou S.

NOTE QUE O ESTIMADOR DO PARÂMETRO PODE SER REPRESENTADO PELO

SÍMBOLO OU LETRA ACRESCIDO DO ACENTO CIRCUNFLEXO OU POR OUTRA LETRA

OU SÍMBOLO.

Parâmetro

(valores reais)

Estimador

(valores estimados)

Média (µ) µ̂ X

Variância (σ2) 2σ̂

S2

Desvio padrão (σ) σ̂ S

Proporção (π) - p̂

� Estimativa: Valor numérico assumido pelo estimador, isto é, valor aproximado do parâmetro,

calculado com base na amostra.

Page 8: Apostila 1 - Importância da estatística e conceitos básicos

8

Exemplo:

Consideremos uma população hipotética formada por 10 plantas de determinada espécie (N

= 10). A variável em estudo foi altura das plantas em centímetros (variável X). Assim, tem-se que:

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10

1,4 1,5 1,7 1,7 1,8 1,8 1,9 1,9 1,9 2,0

Podemos obter o parâmetro média desta população (µ), qual seja:

76,110

0,29,19,19,18,18,17,17,15,14,11=

+++++++++==

∑=

N

XN

i

i

µ

Suponhamos que retiramos aleatoriamente uma amostra representativa da população de

tamanho n = 3:

X1 X9 X10

1,4 1,9 2,0

Podemos agora obter o estimador da média da população ( X ), dado por:

77,13

0,29,14,11=

++==

∑=

n

X

X

n

i

i

A estimativa é o resultado numérico dado pelo estimador, ou seja, 1,77.

6. ARREDONDAMENTO DE DADOS

Regras: Portaria 36 de 06/07/1965 - INPM (Instituto Nacional de Pesos e Medidas).

1a) Se o primeiro algarismo após aquele que formos arredondar for de 0 a 4, conservamos o

algarismo a ser arredondado e desprezamos os seguintes.

Ex.: 7,34856 (para décimos) → 7,3

2a) Se o primeiro algarismo após aquele que formos arredondar for de 6 a 9, acrescenta-se uma

unidade no algarismo a ser arredondado e desprezamos os seguintes.

Page 9: Apostila 1 - Importância da estatística e conceitos básicos

9

Ex.: 1,2734 (para décimos) → 1,3

3a) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido apenas de zeros,

conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for ímpar, desprezando

os seguintes.

Ex.: 6,2500 (para décimos) → 6,2

12,350 (para décimos) → 12,4

Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero,

aumentamos uma unidade no algarismo e desprezamos os seguintes.

Ex.: 8,2502 (para décimos) → 8,3

8,4503 (para décimos) → 8,5

4a) Quando, arredondarmos uma série de parcelas, e a soma ficar alterada, devemos fazer um novo

arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique

inalterada.

Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%

Arredondando para inteiro:

17% + 18% + 12% + 30% + 22% = 99%

17% + 18% + 12% + 31% + 22% = 100%

7. LITERATURA CONSULTADA

ARA, A. B.; MUSETTI, A. V.; SHNEIDERMAN, B. Introdução à estatística. São Paulo: Egard

Blucher: Instituto Mauá de Tecnologia, 2003.152p.

CARVALHO, S. Estatística básica. Rio de Janeiro: Campus-Elsevier, 2006. 464p.

FERREIRA, D. F. Estatística básica. Lavras: UFLA, 2005. 664p.

REGAZZI, A. Curso de iniciação à estatística (Apostila). Universidade Federal de Viçosa,

Viçosa – MG, 1997. 136p.

TRIOLA, M. F. Introdução à estatística. Rio de Janeiro: LTC, 2005. 656p.

Este conteúdo é resultado de pesquisas em vários livros e apostilas de estatística básica e aplicada,, portanto, ainda

deve ser revisado. Qualquer erro de digitação (ou outro qualquer), sugestões, críticas, etc., por favor, me comuniquem.

Obrigada, Profa. Gisele