Upload
liliana
View
268
Download
0
Embed Size (px)
Citation preview
AMEI Escolar
Matemática
8º Ano
Estatística: Organização e
Tratamento de Dados
Organização, representação e interpretação de dados
Quando falamos em estatística e em estudo estatístico, há uma série
de expressões que vêm associados. São estas:
população – conjunto de pessoas, objectos ou acontecimentos
sobre os quais incide um estudo estatístico;
amostra – parte representativa da população, sobre a qual
incide o estudo;
censo ou recenseamento – estudo estatístico realizado sobre a
totalidade da população;
sondagem – estudo estatístico realizado a partir de uma
amostra;
variável estatística – características que os elementos da
população podem ou não ter e que é alvo de investigação num
estudo estatístico.
As variáveis estatísticas podem ser classificadas em variáveis
quantitativas e variáveis qualitativas. As variáveis quantitativas
Conteúdos desta unidade:
Organização,
representação e
interpretação de
dados;
Medidas de tendência
central;
Medidas de
localização.
Exemplos:
“A Joana realizou um estudo estatístico na sua escola sobre a cor favorita dos
alunos do 8º ano. Primeiro, interrogou para o estudo 2 alunos de cada uma das
turmas de 8º ano da sua escola e anotou os dados obtidos. Seguidamente,
interrogou, na totalidade, todos os alunos do 8º ano da sua escola e voltou a
anotar os dados obtidos.”
Neste caso:
- a população são os alunos do 8º ano da escola da Joana;
- a amostra é o conjunto de todos os 2 alunos escolhidos de cada turma;
- quando a Joana interrogou apenas os 2 alunos de cada turma realizou uma
sondagem;
- quando a Joana interrogou todos os alunos do 8º ano realizou um censo;
- a variável estatística é a cor favorita dos alunos do 8º ano.
representam informação que é susceptível de medida e as variáveis
qualitativas representam informação que identifica alguma
qualidade ou categoria, logo, não são susceptíveis de medida. Dentro
das variáveis quantitativas podemos encontrar:
variáveis quantitativas discretas – representam informação
que apenas pode tomar um número finito (ou infinito
numerável) de valores distintos;
variáveis quantitativa contínua – representam informação
que pode tomar todos os valores no seu intervalo de variação.
Existem mais dois conceitos relacionados com os estudos
estatísticos: frequência absoluta e frequência relativa. A frequência
absoluta representa-se por e é o número de vezes que um
acontecimento se repete. A frequência relativa representa-se por
e é o quociente entre a frequência absoluta de um acontecimento e o
número total de observações (N). A soma das frequências relativas é
sempre 1. Podemos multiplicar a frequência relativa de um
acontecimento por 100 e obtemos a frequência relativa em
percentagem.
variáveis estatísticas
variáveis quantitativas
variáveis quantitativas
discretas
variáveis quantitativas
contínuasvariáveis
qualitativas
Exercício resolvido:
Classifica as seguintes variáveis estatísticas:
- cor favorita dos alunos do 8º ano: variável qualitativa
- idade dos alunos do 7º ano: variável quantitativa discreta
- altura dos alunos do 9º ano: variável quantitativa contínua
Tabelas e gráficos
Uma tabela de frequências é uma tabela onde se indica uma ou
duas frequências.
Os gráficos constituem uma forma prática e eficiente de transmitir
informação. Dos gráficos mais utilizados destacam-se os gráficos de
barras, histogramas, gráficos circulares e pictogramas. Observa a
tabela para ficares a conhecer melhor estes e outros gráficos.
GRÁFICO EXEMPLO REGRAS DE CONSTRUÇÃO
Gráfico de
barras
- só uma das dimensões das barras
varia (geralmente a altura);
- a dimensão que varia corresponde à
frequência da variável estatística;
- as barras devem estar separadas por
espaços iguais;
- o gráfico deve ter um título
adequado.
Exercício resolvido:
A turma do 8ºA tem 25 alunos. 10 alunos preferem gelado de chocolate, 10 alunos
preferem o de morango e 5 alunos preferem o de nata. Calcula:
- a frequência absoluta do acontecimento “gostar de gelado de chocolate”: 10
- a frequência relativa do acontecimento “gostar de gelado de nata”:
ou
.
Exemplo – Tabela de Frequências:
Clube de futebol favorito do 8º B
Clube Frequência absoluta Frequência relativa Frequência relativa
(percentagens)
Sporting 5
Benfica 6
Porto 9
TOTAL 20 1 100%
Gráfico
circular
- a amplitude de cada sector é
proporcional à frequência que
representa;
- os sectores circulares devem ser
identificados, podendo recorrer-se a
uma legenda;
- podem usar-se cores diferentes para
os diferentes sectores;
- o gráfico deve ter um título
adequado.
Pictograma
- indicar no gráfico o significado de
cada símbolo utilizado;
- utilizar símbolos ou figuras
sugestivas de acordo com a variável
estatística a representar;
- utilizar sempre o mesmo símbolo ou
símbolos;
- os símbolos devem ser apresentados
em linhas ou colunas e com
espaçamento uniforme entre eles;
- as diferentes frequências são
representadas por um maior ou menor
número de símbolos e nunca por
símbolos de tamanhos diferentes. Se
for necessário poderão ser utilizadas
fracções dos símbolos;
- o gráfico deve ter título adequado.
Diagrama de
caule-e-
folhas
- deve começar-se por traçar um
segmento de recta que servirá de
separador entre o caule e as folhas;
- os dados devem ser ordenados;
- números que diferem apenas no
algarismo da menor ordem (algarismo
mais à direita) devem ser
representados na mesma linha; no
início de cada linha (caule) deverão
ser colocados os algarismos comuns a
todos esses números;
- em cada linha os algarismos de
menor ordem (folhas) devem ser
colocados por ordem do menor para o
maior;
- o gráfico deve ter título adequado.
Histograma
- os dados devem ser agrupados em
classes;
- os intervalos das classes
representam-se no eixo horizontal;
- as frequências das classes
representam-se no eixo vertical;
- as barras são desenhadas
verticalmente para cada uma das
classes não existindo qualquer espaço
entre elas;
- a área de cada uma das barras é
proporcional à frequência da
respectiva classe;
- o gráfico deve ter título adequado.
Polígono de
frequências
- em cada uma das barras marcam-se
os pontos médios do lados superiores;
- unem-se ponto médios consecutivos
através de segmentos de recta;
- para finalizar o polígono de
frequências consideram-se duas
classes de frequência zero, uma
imediatamente à esquerda de todas as
classes existentes e outra
imediatamente à direita e unem-se,
através de um segmento de recta, os
pontos médios dessas classes aos
pontos médios subjacentes.
Medidas de tendência central
Habitualmente, quando estamos perante um conjunto de dados
estatísticos, interessa-nos saber se estes têm tendência a concentrar-
se em torno de algum valor médio ou central. As medidas estatísticas
que nos dão essa indicação são a média, a moda e a mediana e
designam-se por medidas de tendência central.
A moda é a única das três que pode ser determinada para variáveis
qualitativas. A moda de uma distribuição é a observação que mais
vezes se repete. Se não houver nenhuma observação que se repita
mais vezes que as restantes então diz-se que a distribuição é amodal.
No caso de haver duas modas diz-se que a distribuição é bimodal. Se
houver três ou mais modas, diz-se que a distribuição é plurimodal.
A média ( ) apenas pode ser calculada para variáveis quantitativas.
Dado um conjunto de dados numéricos, calcula-se a média somando
todos os dados e dividindo o resultado pelo número total de
observações.
A mediana ( ) também pode ser calculada apenas para variáveis
quantitativas. Dada uma sequência ordenada (por ordem crescente ou
decrescente) dos dados observados, a mediana é o valor que ocupa a
posição intermédia. Se o número de dados for par, a mediana é a
média aritmética dos dois valores centrais.
Medidas de localização
A média, moda e mediana não são por vezes suficientes para retirar
conclusões sobre uma dada amostra. Para além destas medidas
existem outras medidas importantes que nos permitem descrever
melhor a distribuição de um conjunto de dados. São elas as medidas
de localização.
Numa distribuição existem três quartis, o primeiro quartil ( ), o
segundo quartil ( ), que coincide com a mediana, e o terceiro
quartil ( ). Dada uma sequência ordenada (por ordem crescente ou
decrescente) dos dados em estudo, o segundo quartil (mediana) é o
Exercício resolvido:
Na turma do 8ªC existem 20 alunos cuja idade se distribuem da seguinte
maneira.
11 anos 5
12 anos 10
13 anos 5
Calcule a média, a moda e a mediana destes dados.
moda = 12 anos
valor que ocupa a posição intermédia. Se o número de dados for par,
o segundo quartil (mediana) é a média aritmética dos dois valores
centrais. Uma vez determinada a mediana ( ) a distribuição fica
dividida a meio. Para calcularmos o primeiro quartil ( )
determinamos a mediana da primeira metade da distribuição. Para
calcularmos o terceiro quartil ( ) determinamos a mediana da
segunda metade da distribuição.
Todas as distribuições têm dois extremos, o extremo máximo, que é
a maior das observações feitas, e o extremo mínimo, que é a menor
das observações feitas. A amplitude (A) é a diferença entre o
máximo e o mínimo de uma distribuição. A amplitude interquartis
(AIQ) é a diferença entre o valor do terceiro e do primeiro quartis.
O diagrama de extremos e quartis (ou caixa de bigodes) é uma
forma esquemática de representar os extremos, mediana e quartis de
uma distribuição. Para construir um diagrama de extremos e quartis é
necessário conhecer os seguintes valores:
extremos (máximo e mínimo);
mediana;
1.º quartil ( );
3.º quartil ( ).
O conjunto dos valores da amostra compreendidos entre o 1.º e o 3.º
quartis são representados por um rectângulo (a largura do rectângulo
não dá qualquer informção). No rectângulo marca-se o valor da
mediana com uma barra. De seguida, marcam-se duas linhas que
unem os meios dos lados do rectângulo com os extremos da amostra.
Exercício resolvido:
2 4 1 5 7 10 8 9 3 6
Observa os dados obtidos num estudo e coloca-os num diagrama de extremos e
quartis.