21
ADMINISTRAÇÃO APOSTILA – Iª UNIDADE Professor: Érico José Rodrigues dos Santos Disciplina: METODOS QUANTITAVOS Data: __/__/__ Aluno: Turma: INTRODUÇÃO À ESTATÍSTICA A Utilização da Estatística é cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos seus mais diversificados ramos de atuação, as pessoas estão frequentemente expostas à estatística, utilizando-a com maior ou menor intensidade. Isto se deve às múltiplas aplicações que o método estatístico proporciona aqueles que dele necessitam. A estatística é uma coleção de métodos para planejar experimentos, obter dados, organiza-los, resumi-los, analisa-los, interpreta-los e deles extrair conclusões. DIVISÃO DA ESTATÍSTICA Estatística Descritiva: É um ramo da estatística que se encarrega da coleta, organização, classificação, apresentação através de tabelas e gráficos dos dados e cálculo de coeficientes (estatísticos), que permitem descrever resumidamente os fenômenos. Estatística Inferencial: É o ramo da estatística que se encarrega da analise e a interpretação dos dados apresentados permitindo tirarem conclusões sobre um universo a partir de uma amostra. POPULAÇÃO E AMOSTRA Na terminologia estatística, o grande conjunto de dados que contém a característica que temos interesse recebe o nome de população. Esse termo refere-se não somente a uma coleção de indivíduos, mas também ao alvo sobre o qual reside nosso interesse. Assim, nossa população pode ser tanto todos os habitantes de Salvador, ou todo o sangue no corpo de uma pessoa. Tendo em vista as dificuldades de várias naturezas para se observar todos os elementos da população, tomaremos alguns

INTRODUÇÃO À ESTATÍSTICA - … …  · Web viewNenhuma casa da tabela deve ficar em branco. Na ausência de um dado numérico, empregam-se alguns dos sinais convencionais como:

  • Upload
    lelien

  • View
    217

  • Download
    3

Embed Size (px)

Citation preview

INTRODUO ESTATSTICA

ADMINISTRAO

APOSTILA I UNIDADE

Professor: rico Jos Rodrigues dos Santos

Disciplina: METODOS QUANTITAVOS Data: __/__/__

Aluno: Turma:

INTRODUO ESTATSTICA

A Utilizao da Estatstica cada vez mais acentuada em qualquer atividade profissional da vida moderna. Nos seus mais diversificados ramos de atuao, as pessoas esto frequentemente expostas estatstica, utilizando-a com maior ou menor intensidade. Isto se deve s mltiplas aplicaes que o mtodo estatstico proporciona aqueles que dele necessitam.

A estatstica uma coleo de mtodos para planejar experimentos, obter dados, organiza-los, resumi-los, analisa-los, interpreta-los e deles extrair concluses.

DIVISO DA ESTATSTICA

Estatstica Descritiva: um ramo da estatstica que se encarrega da coleta, organizao, classificao, apresentao atravs de tabelas e grficos dos dados e clculo de coeficientes (estatsticos), que permitem descrever resumidamente os fenmenos.

Estatstica Inferencial: o ramo da estatstica que se encarrega da analise e a interpretao dos dados apresentados permitindo tirarem concluses sobre um universo a partir de uma amostra.

POPULAO E AMOSTRA

Na terminologia estatstica, o grande conjunto de dados que contm a caracterstica que temos interesse recebe o nome de populao. Esse termo refere-se no somente a uma coleo de indivduos, mas tambm ao alvo sobre o qual reside nosso interesse. Assim, nossa populao pode ser tanto todos os habitantes de Salvador, ou todo o sangue no corpo de uma pessoa.

Tendo em vista as dificuldades de vrias naturezas para se observar todos os elementos da populao, tomaremos alguns deles para formar um grupo a ser estudado. Este subconjunto da populao, em geral com dimenso sensivelmente menor, denominado amostra.

1

CLASSIFICAO DAS VARIVEIS

Qualitativa Nominal

Ordinal

Varivel

Quantitativa Discreta

Contnua

A varivel qualitativa quando os possveis valores que assume representam atributos e/ou qualidades. Se tais variveis tm uma ordenao natural, indicando intensidades crescentes de realizao, ento elas sero classificadas como qualitativas ordinais. Caso contrrio, quando no possvel estabelecer uma ordem natural entre seus valores, elas so classificadas como qualitativas nominais. Variveis tais como Turma (A ou B), Sexo (masculino ou feminino) e Fuma (sim ou no) so variveis qualitativas nominais. Por outro lado, variveis como Tamanho (pequeno, mdio ou grande), Classe Social (baixa, mdia ou alta) so variveis qualitativas ordinais.

Variveis quantitativas, isto , variveis de natureza numrica, podem ser subdivididas em discretas e contnuas. As variveis quantitativas discretas podem ser vistas como resultantes de contagens, assumindo assim, em geral, valores inteiros. De uma maneira mais formal, o conjunto de valores assumidos finito ou enumervel. J as variveis quantitativas continuas assumem valores em intervalos dos nmeros reais e, geralmente, so provenientes de uma mensurao. Por exemplo, Nmero de Irmos (0, 1, 2, ...) e Nmero de Defeitos (0, 1, 2, ...) so discretas, enquanto que Peso e Altura so quantitativas contnuas.

FASES DO MTODO ESTATSTICO (ESTATSTICA DESCRITIVA)

A estatstica est envolvida em todas as etapas de um projeto de pesquisa. Para que uma pesquisa cientifica tenha xito devemos seguir as seguintes etapas.

Definio do Problema

Planejamento

ETAPAS Coleta de Dados

Apurao dos Dados

Apresentao dos Dados

Anlise e Interpretao

2

Por mais diversa que seja a finalidade que se tenha em vista os dados devem ser apresentados sob forma adequada (tabela e grfico) tornando mais fcil o exame daquilo que est sendo objeto de tratamento estatstico.

APRESENTAO TABULAR DOS DADOS

Depois da coleta dos dados necessrio que eles sejam dispostos de uma forma ordenada e resumida, a fim de auxiliar o pesquisador na anlise e facilitar a compreenso das concluses apresentadas ao leitor.

Uma tabela deve ser auto-explicativa. Os elementos essenciais de uma tabela so: ttulo, cabealho, corpo e fonte.

Algumas observaes fazem-se importantes na elaborao de uma tabela:

1. As tabelas devem ser fechadas em cima e embaixo por linhas horizontais, no sendo fechadas direita ou esquerda por linhas verticais.

2. Os totais devem ser destacados na tabela.

3. Dever ser mantida a uniformidade, quanto ao nmero de casas decimais.

4. Nenhuma casa da tabela deve ficar em branco. Na ausncia de um dado numrico, empregam-se alguns dos sinais convencionais como: um trao horizontal (valor zero), reticncias (sem dados), ponto de interrogao (dvida quanto exatido de determinado valor), zero (valor muito pequeno).

Ttulo

Cabealho da Coluna Indicadora

Cabealho das Colunas Numricas

Colunas

Linha

Clula

Fonte ou Nota (geral ou especifica)

3

DISTRIBUIES DE FREQUNCIAS

um tipo de srie estatstica onde o fenmeno considerado uma varivel quantitativa discreta ou contnua e seus valores observados so descritos considerando o nmero de vezes que ocorrem na srie (freqncia).

TIPOS DE FREQUNCIAS Uma tabela de freqncias pode representar e caracterizar um dos seguintes tipos de freqncias:

Absoluta

Freqncia Simples

Relativa

Absoluta

Freqncia Acumulada

Relativa

Freqncia Simples Absoluta ( f i ) o nmero de repeties de um valor individual ou de uma classe de valores da varivel. A soma das freqncias simples absolutas em uma tabela chamada freqncia total e corresponde ao nmero total de observaes.

k

f i = n

i = 1

Freqncia Absoluta Acumulada ( f ac ) a soma da freqncia simples absoluta dessa classe ou desse valor com as freqncias simples absolutas das classes ou dos valores anteriores.

Freqncia Simples Relativa ( f ri ) Representa a proporo de observaes de um individuo ou de uma classe, em relao ao nmero total de observaes. Trata-se, portanto, de um nmero relativo. Para calcular a freqncia relativa basta dividir a freqncia absoluta da classe ou do valor individual pelo nmero total de observaes.

f i

f ri =

n

Freqncia Relativa Acumulada ( f rac ) igual soma da freqncia simples relativa dessa classe ou desse valor com freqncias simples relativas das classes ou dos valores anteriores.

4

DISTRIBUIO DE FREQUNCIAS PARA DADOS AGRUPADOS SEM CLASSES

N de dias

Freqncia

( fi )

1

3

2

11

3

16

4

9

5

6

6

1

7

2

8

1

15

1

Total

50

DISTRIBUIO DE FREQUNCIAS PARA DADOS AGRUPADOS EM CLASSES

Os dados agrupados em classes so indicados para variveis contnuas ou variveis discretas cujo nmero de valores representativos seja muito grande.

Amplitude Total ou Intervalo Total a diferena entre o maior e o menor valor observado da varivel em estudo.

At = X max - X mm

Nmero de Classes em uma distribuio de freqncias representado por K.

importante que a distribuio conte com um nmero adequado de classes.

Se esse nmero for escasso, os dados originais ficaro to comprimidos que pouca informao se poder extrair da tabela. Se, por outro lado, forem utilizadas muitas classes, haver algumas com freqncia nula ou muito pequena, e o resultado ser uma distribuio irregular e prejudicial interpretao do fenmeno como um todo.

No h uma frmula exata para o clculo do nmero de classes. Para determinar o nmero de classes h diversos mtodos:

a) STURGES ~

K = 1+ 3,3log n k= nmero de classes

n= nmero total de observaes

b) K=5 para n 5 e K = n, para n>5

c) KELLEY

N

5

10

25

50

100

200

500

1000

K

2

4

6

8

10

12

15

15

5

Amplitude das Classes(h) igual ao quociente entre a amplitude total da

At

srie e o nmero de classes escolhido. h =

K

Muitas vezes, ao efetuar a diviso acima, pode-se chegar a um resultado no muito conveniente, sob o aspecto de montagem das classes. Neste caso, convm arredondar o nmero correspondente amplitude do intervalo de classe a que se chegou para um nmero mais adequado, que facilite os clculos.

Pontos Mdios das Classes(xi) o ponto intermedirio do intervalo da classe e obtido somando-se o limite inferior ao superior e dividindo-se a soma por 2.

Exemplo:

IDADE DOS ALUNOS DA TURMA DE ENFERMAGEM / NUTRIO

x

Fi

Xi

18 I-- 23

23 I-- 28

28 I-- 33

33 I-- 38

38 I-- 43

6

6

1

1

2

20,5

25,5

30,5

35,5

40,5

TOTAL

16

Fonte: alunos de enfermagem/nutrio, turno matutino. UNIRB, 2008.2

O smbolo Iindica a incluso do limite inferior do intervalo naquela classe.

Outras possibilidades so: --I , II, --

APRESENTAO GRFICA DOS DADOS

O grfico um complemento da tabela. A principal vantagem de um grfico sobre a tabela o fato de que ele permite conseguir uma visualizao imediata da distribuio dos valores observados. O grfico deve ser auto-explicativo e de fcil compreenso. Contudo, os elementos simplicidade, clareza e veracidade devem ser considerados na elaborao de um grfico. Deve atrair a ateno do leitor e inspirar confiana. Todo grfico deve apresentar um ttulo e uma escala, dispensando esclarecimentos adicionais no texto.

Os grficos podem ser cartogramas ou diagramas:

6

1. CARTOGRAMAS So mapas geogrficos em que as freqncias das categorias de uma varivel so projetadas nas reas especificas do mapa. Em epidemiologia, os mapas alfinetados so de grande emprego para apreciar o aparecimento e expanso de certas molstias. Esse tipo de representao grfica de grande utilidade em Sade Pblica em que se deseja conhecer a distribuio geogrfica de casos e bitos de uma determinada doena epidmica.

2. DIAGRAMAS So grficos mais usados na representao de sries estatsticas e se apresentam atravs de uma grande variedade de tipos.

Diagrama circular ou grficos em setores utilizado principalmente quando se pretende comparar cada valor da srie com o total. Adapta-se muito bem s variveis qualitativas nominais, ou quantitativas discretas que possuam poucas categorias cujas porcentagens sejam complementares.

Grfico em Colunas Esse tipo de grfico se adapta melhor s variveis discretas ou qualitativas. Tem por finalidade comparar grandezas, por meio de retngulos de igual altura e largura proporcionais s respectivas grandezas. Cada coluna representa a intensidade de uma modalidade ou atributo.

7

ESCOLARIDADE DOS ENTREVISTADOS

PESQUISA CLULAS TRONCO

SALVADOR BA 2008.1

40

35

30

25

20

15

10

5

0

Nenhuma 1 Grau 1 Grau 2 Grau 2 Grau 3 Grau 3 Grau

Incompleto Completo Incompleto Completo Incompleto Completo

FONTE: Questionrio aplicado pela equipe de Bioestatstica da UNIRB, matutino, 2008.1

Grfico de barras semelhante ao grfico em colunas, porm os retngulos so dispostos horizontalmente.

FAIXA ETRIA DOS ENTREVISTADOS

PESQUISA CLULAS TRONCO

SALVADOR BA 2008.1

Acima de 60 2

anos

Entre 21 e 60

anos 59

Inferior a 21 anos 20

0 10 20 30 40 50 60 70

FONTE: Questionrio aplicado pela equipe de Bioestatstica da UNIRB, matutino, 2008.1

Histograma a representao grfica de uma distribuio de freqncia por meio de retngulos justapostos, de forma que a rea de cada retngulo seja proporcional freqncia da classe que ele representa. Indicado para variveis quantitativas continuas ou quantitativas discretas com muitas categorias.

8

FAIXA ETRIA DOS ENTREVISTADOS

PESQUISA CLULAS TRONCO

SALVADOR BA 2008.1

9

8

7

6

5

4

3

2

1

0

18 I-- 23 23 I-- 28 28 I-- 33 33 I--38 38 I-- 43

FONTE: Questionrio aplicado pela equipe de Bioestatstica da UNIRB, matutino, 2008.1

MEDIDAS DE POSIO

So medidas da estatstica descritiva, que tendem a localizar um determinado ponto do conjunto de dados. As medidas de posio podem ser:

TENDNCIA CENTRAL So medidas que tendem a localizar pontos que ficam no centro de um conjunto de dados ordenados.

SEPARATRIZES So medidas que dividem um conjunto de dados ordenados em partes iguais.

MEDIDAS DE TENDNCIA CENTRAL

1) Mdia Aritmtica

Simples a medida de tendncia central mais usada para descrever resumidamente uma distribuio de freqncia. obtida pela diviso da soma dos valores observados da varivel pelo nmero total de observaes.

Dados no agrupados:

n

x i

- i = 1 - 7142

X = X = = R$ 1.428,40

n 5

Onde n o nmero de elementos da amostra

9

Salrio dos funcionrios

da empresa X

Funcionrios

Salrio

(R$)

Alex

1.200,00

Eraldo

2.000,00

Fausto

820,00

Gleice

1.002,00

Mrcia

2.120,00

7.142,00

FONTE: Dados fictcios

Ponderada Em algumas situaes, os nmeros que queremos sintetizar tm graus de importncia diferentes. Utiliza-se ento uma mdia ponderada. Quando os dados esto agrupados por freqncias os ponderados sero as freqncias.

Dados agrupados sem classes

K

x i f i

- i = 1 - 37

X = x = = 1,5 defeitos

fi 25

Nmero de defeitos apresentados por

Aparelho de Raio X

N de

defeitos

N de

aparelhos

xi.fi

0

7

0

1

7

7

2

5

10

3

4

12

4

2

8

10

25

37

xi

fi

xi.fi

Fonte: Dados fictcios

Dados agrupados em classes

K

xifi

- i=1 - 423

X = x = = 26,4 anos

fi 16

10

IDADE DOS ALUNOS DA TURMA DE

ADMINISTRAO

FCS, Matutino, 2 semestre 2008.2

Idade

FI

XI

Xi.fi

18 I-- 23

23 I-- 28

28 I-- 33

33 I-- 38

38 I-- 43

6

6

1

1

2

20,5

25,5

30,5

35,5

40,5

123,0

153,0

30,5

35,5

81,0

TOTAL

16

423

FI

XI.FI

Fonte: alunos de enfermagem/nutrio, turno

matutino. UNIRB, 2008.2

Utilizada quando desejamos obter a medida de posio que possui a maior estabilidade.

2) MODA

Moda: O valor que ocorre com maior freqncia em uma srie de valores;

Dados no agrupados Valores no agrupados facilmente

Reconhecida basta procurar o valor

Que mais se repete.

Dados agrupados sem A identificao da Moda facilitada

Classes pela simples observao do

Elemento que apresenta maior

Freqncia.

Exemplo:

Determinar moda na srie de dados?

7,8,9,10,10,10,11,12,13,15 M0 = 10

Identifique a moda na srie valores?

3,5,8,10,12,13 amodal

11

Para dados agrupados em classes, h diversas frmulas para clculo da Moda.

MDIA DA PRIMEIRA UNIDADE

DOS ALUNOS DA TURMA A

Escola Y, Matutino, 8 srie 2007

Mdia

Qtde.

alunos

0 I-- 2

2 I-- 4

4 I-- 6

6 I-- 8

8 I10

2

6

13

10

4

TOTAL

35

fi

Fonte: Dados Fictcios

Frmula de Czuber

Frmula de King

Frmula de Pearson

SEPARATRIZES

As separatrizes so medidas de posio que permitem calcularmos valores que dividem ou separam a distribuio em partes iguais. Temos quatro tipos de separatrizes: os quartis, os decis e os percentis.

Quartis divide um conjunto de dados em quatro partes iguais.

Q1 1 quartil deixa 25% dos elementos;

Q2 2 quartil, deixa coincidi com mediana, deixa 50% dos elementos;

Q3 3 quartil deixa 75% dos elementos.

12

Utiliza os quartis apenas para dados agrupados em classe. As frmulas para determinao dos Q1 e Q3 so semelhantes usada para clculo da mediana.

3) Mediana (A mediana tambm uma medida de tendncia central)

A mediana uma separatriz que divide um conjunto ordenado de dados em duas partes iguais. Cinqenta por cento das observaes estaro esquerda do valor mediano e 50% delas estaro direita do valor mediano.

Para valores no agrupados devemos considerar dois casos:

n + 1

1. Posio da mediana se a srie impar

2

Sendo n (nmero de elementos da amostra) impar a mediana ser a observao que se localiza no centro, tendo os valores observados ordenados.

n n

2. Posio da mediana se a srie par e + 1

2 2

Sendo n par a mediana ser a mdia aritmtica dos valores que esto no centro da srie.

Para dados agrupados em classes ser calculada atravs de:

NMERO DE ASSALTOS POR

ESTABELECIMENTOS COMERCIAIS

Salvador/BA, janeiro/2005

Xi

Fi

Fac

0 I-- 3

3 I-- 6

6 I-- 9

9 I-- 12

12 I-- 15

5

22

14

3

1

5

27

41

44

45

TOTAL

45

fi

Fonte: dados fictcios

13

Onde:

Ii = Limite inferior da classe da mediana

f ac ant = Freqncia acumulada anterior a classe da mediana

h = Intervalo de classe

fiMd = Freqncia absoluta da classe da mediana

P Md = Posio da mediana.

MEDIDAS DE DISPERSO

Medidas de disperso ou variabilidade Serve para verificar a maior ou menor diversificao ou variabilidade entre os valores da varivel em torno da mdia.

Amplitude Total Referente a certa varivel, definida como a diferena entre o maior e o menor valor do conjunto de dados. A amplitude s leva em conta dois valores de todo o conjunto e, assim, seria mais conveniente considerarmos uma medida que utilizasse as observaes.

At = Xmax - X mm

Varincia

Varincia trata-se da mdia aritmtica dos quadrados dos desvios.

Varincia Amostral

IDADE DOS ALUNOS DA TURMA DE ADMINISTRAO

FCS,Matutino, 2 semestre 2008.2

Idade

Fi

Xi

Xi.fi

Xi.fi

(xi-x).fi

18 I-- 23

23 I-- 28

28 I-- 33

33 I-- 38

38 I-- 43

6

6

1

1

2

20,5

25,5

30,5

35,5

40,5

123

153

30,5

35,5

81

2521,50

3901,50

930,25

1260,25

3280,50

211,523

5,273

16,504

82,129

395,508

TOTAL

16

423

11894,00

710,938

Fonte: alunos de enfermagem/nutrio, turno matutino. UNIRB, 2008.2

X = 26,4

14

Desvio Padro a raiz quadrada da varincia

Coeficiente de Variao

Trata-se de uma medida relativa de disperso. til para a comparao em termos relativos do grau de concentrao em torno da mdia de srie distinta. dado por:

Para efeitos prticos o C.V superior 50% indica alto grau de disperso e pequena representatividade da mdia e valores inferiores a 50% a mdia e mais representativa.

15

Frmulas

Freqncia Relativa:

Amplitude Total:

Nmero de Classes:

Amplitude das Classes:

Pontos Mdios das Classes:

Mdia Aritmtica:

Mediana:

Moda

Varincia

Desvio-padro

Coeficiente de Variao

16

Uma populao um conjunto de todos os elementos (valores, pessoas, medidas), a serem estudados que possuam pelo menos uma caracterstica em comum.

Um censo uma coleo de dados relativos a todos os elementos de uma populao.

Uma amostra um subconjunto de elementos extrados de uma populao.