160
MARA LÚCIA DE MIRANDA CORRELAÇÃO E REGRESSÃO EM CURSO DE ENGENHARIA: UMA ABORDAGEM COM FOCO NA LEITURA E INTERPRETAÇÃO DE DADOS Dissertação apresentada ao Programa de Pós- Graduação, Mestrado Profissional em Ensino de Ciências e Matemática da Pontifícia Universidade Católica de Minas Gerais, como requisito parcial para obtenção do título de Mestre em Ensino de Matemática. Orientadora: Dra. Maria Clara Rezende Frota Belo Horizonte 2008

CAPA DISSERTAÇÃO FINAL Mara Lucia

  • Upload
    buiphuc

  • View
    214

  • Download
    1

Embed Size (px)

Citation preview

Page 1: CAPA DISSERTAÇÃO FINAL Mara Lucia

MARA LÚCIA DE MIRANDA

CORRELAÇÃO E REGRESSÃO EM CURSO DE ENGENHARIA: UMA ABORDAGEM COM FOCO NA LEITURA E INTERPRETAÇÃO DE DA DOS

Dissertação apresentada ao Programa de Pós-

Graduação, Mestrado Profissional em Ensino de

Ciências e Matemática da Pontifícia Universidade

Católica de Minas Gerais, como requisito parcial

para obtenção do título de Mestre em Ensino de

Matemática.

Orientadora : Dra. Maria Clara Rezende Frota

Belo Horizonte

2008

Page 2: CAPA DISSERTAÇÃO FINAL Mara Lucia

FICHA CATALOGRÁFICA Elaborada pela Biblioteca da Pontifícia Universidade Católica de Minas Gerais

Miranda, Mara Lúcia de M672c Correlação e regressão em curso de engenharia: uma abordagem com foco na

leitura e interpretação de dados / Mara Lúcia de Miranda. Belo Horizonte, 2008. 159f. : il. Orientadora: Maria Clara Rezende Frota Dissertação (Mestrado) – Pontifícia Universidade Católica de Minas Gerais, Programa de Pós-Graduação em Ensino de Ciências e Matemática 1. Estatística – Ensino-aprendizagem. 2. Correlação (Estatística). 3. Modelos

lineares (Estatística). I. Frota, Maria Clara Rezende. II. Pontifícia Universidade Católica de Minas Gerais. Programa de Pós-Graduação em Ensino de Ciências e Matemática. III. Título.

CDU: 311.2:378

Page 3: CAPA DISSERTAÇÃO FINAL Mara Lucia

Mara Lúcia de Miranda Correlação e Regressão em Curso de Engenharia: Uma abordagem com foco na leitura e interpretação de dados. Dissertação apresentada ao Programa de Pós - graduação, Mestrado Profissional em Ensino de Ciências e Matemática da Pontifícia Universidade Católica de Minas Gerais. Belo Horizonte, 2008 _____________________________________________________________ Professora Doutora Maria Clara Rezende Frota (Orientadora) – Programa de Pós - graduação em Ensino de Ciências e Matemática - PUC Minas ______________________________________________________________ Professor Doutor Leônidas Conceição Barroso - Programa de Pós - graduação em Geografia - Tratamento da Informação Espacial – PUC Minas ______________________________________________________________ Professora Doutora Eliane Scheid Gazire – Programa de Pós - graduação em Ensino de Ciências e Matemática - PUC Minas

Page 4: CAPA DISSERTAÇÃO FINAL Mara Lucia

AGRADECIMENTOS Aos meus pais, pelo carinho e companheirismo.

Aos meus irmãos, pelo apoio no momento de tantas atribulações.

À Professora Doutora Maria Clara Rezende Frota, pelo carinho, compreensão,

compromisso e disponibilidade em todos os momentos durante este trabalho.

À Engenheira Daniela Pereira Dias - Grupo de Pesquisa Green Solar, pela

colaboração e atenção.

Ao Professor Luiz Geraldo de Azevedo, pelo carinho e disponibilidade durante

a realização deste trabalho.

Ao Professor Doutor Dimas Felipe de Miranda, por tudo que tem feito por mim

desde a minha infância até o presente momento. A nossa convivência

representa muito a essência do meu ser.

Ao Gilvan, pelo apoio durante este trabalho.

Enfim, a todos que colaboraram diretamente ou não para a realização deste

trabalho.

Page 5: CAPA DISSERTAÇÃO FINAL Mara Lucia

RESUMO

Esse trabalho investigou possibilidades de uma abordagem

metodológica para o ensino-aprendizagem de correlação e regressão, com

base nos trabalhos de Batanero e colaboradores (1994, 1995, 1996, 2001). O

tópico estatístico foi discutido a partir de um enfoque intuitivo, com ênfase no

desenvolvimento dos níveis de compreensão de leitura de dados apresentados

na forma de gráficos e tabelas, propostos por Curcio (1987). Foram sujeitos da

pesquisa, alunos do quarto período de um curso de Engenharia, de uma

instituição particular de ensino de Belo Horizonte, Minas Gerais. Na pesquisa,

de caráter qualitativo, foram elaboradas e aplicadas duas seqüências de

atividades, envolvendo o conteúdo correlação e regressão, além da análise

desse assunto em quatro livros didáticos. Os resultados apontam que

atividades desenhadas numa linha investigativa a partir de uma abordagem

inicial intuitiva do tema correlação e regressão, utilizando gráficos e tabelas,

podem contribuir de forma significativa para o entendimento e a formalização

das idéias estatísticas. A proposta de abordagem do tema, em cursos de

engenharia, que integra esse trabalho, amplia as seqüências de atividades

testadas em sala, oferecendo novas possibilidades para uma abordagem

introdutória do tema correlação e regressão.

Palavras-chave: Ensino–aprendizagem de Estatística; Correlação e regressão

linear; leitura e interpretação de dados.

Page 6: CAPA DISSERTAÇÃO FINAL Mara Lucia

ABSTRACT

This work has investigated the possibilities of a methodologic approach

for the learning-teaching correlation and regression based on Batanero`s works

as well as his collaborators (1994, 1995, 1996, 2001). The statistical topic was

discussed from an intuitive focus emphasizing the development of the

comprehension levels of data readings presented in graph and table form

proposed by Curcio (1987). The subjects of this research were sophomore

engineering students at a students at a private education institution in Belo

Horizonte, Minas Gerais. That survey considering qualitative features has been

elaborated and applies in two sequences of activities involving content,

correlation and regression, besides an analysis contained in four books. The

resuts show that activities drawn in an investigation from an initial intintive

approach of the correlation and regression by using graphs and tables may

contribute significantly for the understanding and formalization of statistical

ideas. The proposal of the theme approach in engineering courses that

integrates this work enlarges the sequences of the activities tested in class by

offering new possibilities for an introductory approach of the theme correlation

and regression.

Key Works: Learning teaching of Statistics; Correlation and linear regression;

Data reading and comprehension.

Page 7: CAPA DISSERTAÇÃO FINAL Mara Lucia

LISTA DE GRÁFICOS E FIGURA

Gráfico 01: Diagrama de dispersão - Tendência ascendente 25

Gráfico 02: Diagrama de dispersão - Tendência descendente 26

Gráfico 03: Número de filhos e renda familiar (em salários mínimos) 32

Gráfico 04: Resíduos 35

Gráfico 05: Índice de octanagem e quantidade de aditivo 36

Gráfico 06: Produção mensal de arruelas no período de março a junho 50

Gráfico 07: Notas de Estatística e Matemática da Turma 1 – 2004 51

Gráfico 08: Níveis de leitura e interpretação de dados nos exercícios do Livro 1.

61

Gráfico 09: Níveis de leitura e interpretação de dados nos exercícios do Livro 2

62

Gráfico 10: Níveis de leitura e interpretação de dados nos exercícios do Livro 3

64

Gráfico 11: Níveis de leitura e interpretação de dados nos exercícios do Livro 4

68

Gráfico 12: Diagrama 1- Primeira Seqüência de Atividades

78

Gráfico 13: Diagrama 2 - Primeira Seqüência de Atividades

79

Gráfico 14: Diagrama 3- Primeira Seqüência de Atividades 79

Gráfico 15: Diagrama 1 – Segunda Sequência de Atividades 92

Gráfico 16: Diagrama 2 – Segunda Sequência de Atividades 93

Gráfico 17: Diagrama 3 – Segunda Sequência de Atividades 94

Figura 01: Coletor solar e reservatório térmico 90

Page 8: CAPA DISSERTAÇÃO FINAL Mara Lucia

LISTA DE TABELAS Tabela 1: Produção de peças (X) e custos (Y) em milhares de reais 29

Tabela 2: Elementos para o cálculo do coeficiente de correlação, da produção de peças (X) e custos (Y)

30

Tabela 3: Renda familiar e número de filhos 32

Tabela 4: Dados experimentais do efeito de um aditivo(X) na octanagem da gasolina (Y)

36

Tabela 5: Produção mensal de arruelas no período de março a junho – 2006

52

Tabela 6: Notas de Matemática e Estatística – Turma 1 - Escola A –2004 53

Tabela 7: Relação entre alteração da pressão sanguínea e o nível de pressão sonora

58

Tabela 8: Freqüência das categorias de Curcio nos exercícios dos quatro livros

69

Tabela 9: Percentual das categorias de Curcio nos exercícios dos quatro livros em relação ao total geral

69

Tabela 10: Percentual dos exercícios segundo as categorias de Curcio por livro

70

Tabela 11: Resultados de 18 ensaios, em corpos de prova, durante o processo de queima de massa de cerâmica para pavimentação

78

Tabela 12: Coletor solar 1 91

Tabela 13: Coletor solar 2 92

Tabela 14: Coletor solar 3 93

Page 9: CAPA DISSERTAÇÃO FINAL Mara Lucia

LISTA DE ABREVIATURAS ASA – American Statistical Association. DGE – Diretoria Geral de Estatística. ENEM – Exame Nacional do Ensino Médio. IBGE – Instituto Brasileiro de Geografia e Estatística. MAA – Mathematical Association of America. NTCM – National Council of Teachers of Mathematics. PCN`s - Parâmetros Curriculares Nacionais.

Page 10: CAPA DISSERTAÇÃO FINAL Mara Lucia

SUMÁRIO 1 INTRODUÇÃO 11

2 O ENSINO E APRENIZAGEM DE ESTATÍSTICA: CORRELAÇÃO E REGRESSÃO

15

2.1 A Estatística e o seu desenvolvimento 15

2.2 Ensino e aprendizagem de Estatística 19

2.3 Correlação e Regressão 24

2.4 Ensino e aprendizagem de Correlação e Regressão 38

3 LEITURA E INTERPRETAÇÃO DE DADOS NO ENSINO E APRENDIZAGEM DE ESTATÍSTICA

42

3.1 A Análise e interpretação de dados: da Escola B ásica ao Ensino Superior

44

3.2 Níveis de compreensão e interpretação de dados 49

3.3 Correlação e regressão em textos didáticos: uma análise a partir dos níveis de leitura e interpretação de dados

57

3.3.1 Análise comparativa dos quatro livros e concl usões 68

4 O DESENHO METODOLÓGICO DA PESQUISA 71

4.1 O Contexto da pesquisa 71

4.2 Os instrumentos e fases de coleta de dados 72

4.3 Critérios de análise de dados 75

5 PRIMEIRA SEQUÊNCIA DE ATIVIDADES: TESTANDO IDÉIAS 77

5.1 A seqüência de atividades 77

5.2 Desenvolvimento das atividades e análises dos res ultados 81

6 SEGUNDA SEQUÊNCIA DE ATIVIDADES: MODELANDO DADOS REAIS

89

6.1 A seqüência de atividades 89

Page 11: CAPA DISSERTAÇÃO FINAL Mara Lucia

6.2 Desenvolvimento da seqüência de atividades e an álise dos resultados

95

7 CONCLUSÃO 101

REFERÊNCIAS 104

APÊNDICES 109

APÊNDICE A: Tabelas de classificação dos exercícios 110

APÊNDICE B: UMA PROPOSTA DIDÁTICO-METODOLÓGICA PARA O ENSINO-APRENDIZAGEM DE CORRELAÇÃO E REGRESSÃO EM CURSOS DE ENGENHARIA COM FOCO NA LEITURA E INTERPRETAÇÕ DE DADOS

115

ANEXOS 152

ANEXO A: Plano de Ensino 153

ANEXO B: Exercícios Propostos 158

Page 12: CAPA DISSERTAÇÃO FINAL Mara Lucia

11

1 INTRODUÇÃO

Essa pesquisa aborda o tema correlação e regressão no ensino de

Estatística, no contexto de um curso de engenharia.

Inquietações decorrentes da prática docente da pesquisadora, ministrando

aulas de Estatística em vários cursos, levaram-na a escolher o tema correlação e

regressão, considerando uma série de questionamentos levantados pelos alunos. O

que é associação entre variáveis? Por que estudar correlação? Existe apenas

correlação linear? Por que o coeficiente de correlação linear de Pearson apresenta-

se ora positivo e ora negativo? Será a correlação uma relação de “causa e efeito”?

Qual a utilidade da regressão? Existe apenas um tipo de regressão?

Se por um lado os alunos questionam o porquê de estudar correlação e

regressão, por outro lado, enquanto professora, a pesquisadora levanta algumas

questões acerca das formas com que tais conteúdos são apropriados pelos alunos e

empregados no seu cotidiano de estudantes de engenharia, ou mesmo

posteriormente, no seu cotidiano profissional. Por que os alunos têm dificuldades em

visualizar, através do diagrama de dispersão, a linha imaginária ascendente ou

descendente, a partir da marcação dos pares ordenados? Por que insistem em

interpretar a correlação como uma relação de “causa e efeito”? A abordagem

didática, dada ao desenvolvimento dos dois conceitos, favorece a interlocução com

outras disciplinas do curso de engenharia, no que se refere à formalização dos

conceitos e à modelagem?

Os conceitos de correlação e regressão são amplamente empregados em

situações do cotidiano, que demandam indagar a respeito de como duas variáveis

se correlacionam. Dessa forma, correlação e regressão têm instruído a pesquisa

científica desenvolvida nas mais variadas áreas, como a Psicologia, a Biologia, a

Educação, a Engenharia, entre muitas outras.

As diversas leituras feitas, as interlocuções teóricas e reflexões conduziram à

definição da seguinte questão de pesquisa: Que tipos de estratégias didáticas

podem favorecer um melhor entendimento dos conceito s de correlação e

regressão junto a estudantes de engenharia?

O objetivo geral da pesquisa foi analisar possibilidades de uma abordagem

metodológica para o ensino-aprendizagem de correlação e regressão em turmas de

Page 13: CAPA DISSERTAÇÃO FINAL Mara Lucia

12

graduação de um curso de engenharia. Tomou-se como foco a leitura e

interpretação de dados, considerada como uma competência primordial não apenas

para a Estatística, mas para instruir, de modo geral, a leitura e interpretação do

mundo, dos fenômenos da natureza, sociais e políticos, bem como para a tomada de

decisões.

Conforme apontam as diretrizes e orientações curriculares para o ensino de

diversos países, entre eles, Parâmetros Curriculares Nacionais no Brasil, Standards

do National Council of Teachers of Mathematics nos Estados Unidos,

recomendações da Associação dos Professores de Matemática de Portugal – é

através de experiências de coleta e análise de dados que os estudantes aprendem

sobre como interpretar informações, desenvolvendo habilidades para ler com

entendimento as informações apresentadas em diferentes linguagens e

representações, de modo particular, na forma de tabelas e gráficos.

A questão de pesquisa foi investigada através de uma abordagem qualitativa,

junto a alunos do quarto período, de um curso noturno de engenharia, de uma

instituição particular de ensino de Minas Gerais.

Os procedimentos metodológicos para o desenvolvimento da pesquisa

consistiram em:

• Ampliação dos estudos teóricos relativos ao desenvolvimento da pesquisa

em Educação em Estatística, de modo especial sobre o tema correlação e

regressão, usando como referências principais os trabalhos de Batanero e

Batanero e colaboradores (1994, 1995, 1996, 2001);

• Análise da abordagem do tema em livros didáticos usados na engenharia,

tendo como base as categorias de análise e interpretação de dados,

propostas por Curcio (1987);

• Elaboração de instrumentos didáticos (seqüências de atividades), a serem

utilizados para diagnóstico de competências apresentadas pelos alunos e,

ao mesmo tempo, desenvolvimento de habilidades de leitura e

interpretação de dados, numa abordagem intuitiva ao tema correlação e

regressão;

• Elaboração de uma proposta de abordagem metodológica para o ensino

de correlação e regressão, em um curso introdutório de Estatística na

Engenharia, a partir das seqüências desenvolvidas em sala.

Page 14: CAPA DISSERTAÇÃO FINAL Mara Lucia

13

O relato da pesquisa é estruturado em sete capítulos, sendo a Introdução o

primeiro deles. No capítulo 2, a primeira seção aborda alguns pontos importantes da

História da Estatística e a segunda seção discute acerca do ensino e aprendizagem

de Estatística. A terceira seção discorre a respeito de correlação e regressão,

especificamente correlação linear e regressão linear, do ponto de vista teórico. Na

quarta seção, destacam-se algumas dificuldades dos alunos com relação à

correlação e regressão.

No capítulo 3, a primeira seção discorre a respeito da análise e interpretação

de dados da Escola Básica ao Ensino Superior, tomando como base os Standarts do

National Council of Teachers of Mathematics (NCTM) e os Parâmetros Curriculares

Nacionais, Brasil (1998). A segunda seção apresenta o foco teórico da pesquisa, isto

é, os níveis de compreensão e interpretação de dados à luz de Curcio (1987). Nessa

seção, são discutidas algumas dificuldades, apresentadas pelos alunos durante o

processo de leitura e interpretação de dados e apontadas pela literatura. A terceira

seção apresenta uma análise a partir dos níveis de leitura de Curcio (1987) de

quatro livros didáticos de Estatística. A análise feita dos livros envolve os textos e os

exercícios, onde o tema tratado é correlação linear e regressão linear.

No capítulo 4, a primeira seção discorre a respeito do contexto da pesquisa,

nomeando os seus sujeitos, a disciplina e o curso. A segunda e terceira seções

apresentam os instrumentos e fases de coleta de dados e os critérios de análise

adotados.

No capítulo 5, a primeira seção apresenta a Primeira Sequência De

Atividades, consistindo em uma atividade investigativa composta por seis questões.

Cada questão proposta teve o seu objetivo construído a partir das categorias de

Curcio (1987). A segunda seção relata o desenvolvimento da atividade e apresenta

as idéias intuitivas dos alunos a respeito do tema abordado, bem como o processo

de socialização dessas idéias e formalização estatística das mesmas.

No capítulo 6, a primeira seção apresenta a Segunda Sequência de

Atividades, consistindo em uma atividade investigativa, desenvolvida a partir de

dados reais, composta de oito questões, elaboradas a partir das categorias de

Curcio (1987). A segunda seção discute o desenvolvimento da atividade

investigativa, analisa as idéias intuitivas dos alunos a respeito do tema, até a

formalização dos resultados de um ponto de vista estatístico.

Page 15: CAPA DISSERTAÇÃO FINAL Mara Lucia

14

No capítulo 7, são feitas as considerações finais, isto é, um pequeno relato

de como foi realizada a pesquisa, os pontos relevantes observados pela professora

pesquisadora com relação ao entendimento dos alunos em relação ao processo da

aplicação das duas atividades investigativas. Nesse capítulo, são feitas algumas

considerações em relação a limitações da pesquisa e aos cuidados que deverão ser

considerados ao trabalhar outras atividades com outras turmas. Alguns pontos são

sugeridos para que se explorem outros itens dentro do tema abordado correlação e

regressão e que podem motivar pesquisas futuras.

No Apêndice B, é apresentado o produto desta dissertação, constituído

por duas seqüências de atividades que ampliam as seqüências elaboradas e

aplicadas a duas turmas de cursos de engenharia. Integra a proposta as análises

dos textos e exercícios dos quatros livros a respeito do tema correlação e regressão

à luz das categorias de Curcio (1987). O produto desta dissertação é uma proposta

didático-metodológica para o ensino e aprendizagem de correlação e regressão em

cursos de engenharia com foco na leitura e interpretação de dados e espera-se que

ela possa contribuir de forma significativa para o ensino-aprendizagem numa

perspectiva de um olhar diferenciado para o ensino do tema abordado nessa

dissertação.

É limitado o número de trabalhos de Educação Estatística no Ensino

Superior. Espera-se que esse trabalho venha a somar-se aos já existentes e que

muitos outros trabalhos venham a contribuir de forma sugestiva a todos os

professores e pesquisadores que buscam novas formas de contribuir para o ensino-

aprendizagem.

Page 16: CAPA DISSERTAÇÃO FINAL Mara Lucia

15

2 ENSINO E APRENDIZAGEM DE ESTATÍSTICA: CORRELAÇÃO E

REGRESSÃO

A pesquisa aqui relatada teve como objetivo investigar possibilidades de uma

abordagem metodológica para o ensino-aprendizagem de correlação e regressão

em turmas de graduação de um curso de engenharia, construída a partir de um

enfoque intuitivo.

Nesse capítulo, pretendeu-se inicialmente situar o tema no contexto da

Estatística e seu ensino. Assim, a primeira seção recupera alguns pontos relevantes

da própria História da Estatística e a segunda seção busca, da mesma forma,

recuperar alguns aspectos sobre a História do Ensino de Estatística no Brasil. O

tema, objeto dessa dissertação, é tratado na seção terceira, pontuando-se também

alguns fatos históricos. A última seção destaca questões relativas ao ensino de

correlação e regressão, trazendo resultados importantes que a literatura aponta,

tendo em vista a dificuldade de abordagem do conteúdo, segundo vários

pesquisadores.

2.1 A Estatística e seu desenvolvimento

A palavra estatística, popularmente falando, está associada à idéia de dados

numéricos, apresentados principalmente na forma de gráficos ou tabelas, publicados

por órgãos governamentais (MEMÓRIA, 2004).

Tais dados dizem respeito, de modo geral, a fatos demográficos, econômicos,

sociais e políticos e são hoje amplamente veiculados na mídia, passando a

demandar das pessoas competências específicas para a leitura e interpretação dos

mesmos.

Essa concepção de Estatística está de certa forma ligada à própria origem da

Estatística. A palavra Estatística originou-se do termo em latim “Status”, que significa

Estado e surgiu da necessidade do homem de fazer levantamentos de dados,

tornando-se um instrumento para auxiliar os governantes na tomada de decisões.

Esse fato pode de certa forma justificar o forte apoio hoje aos números, quando da

Page 17: CAPA DISSERTAÇÃO FINAL Mara Lucia

16

condução de campanhas governamentais e durante gestões, justificando propostas

e medidas políticas de governos, como por exemplo, de contenção da inflação

monetária ou dos juros, ou ainda o redirecionamento de planos de investimentos na

saúde, educação e moradia para a população de baixa renda, entre várias outras.

Desde a antiguidade, a Estatística já era utilizada pelo homem, para

contabilizar populações, armamentos, riquezas, e as informações utilizadas com

objetivos militares e tributários, orientando estratégias de guerra e estratégias

fiscais. Memória (2004) lembra o relato de Confúcio1, dos levantamentos a respeito

da população chinesa, feitos há mais de 2000 anos antes de Cristo. O autor também

aponta que os egípcios, assim como as civilizações pré-colombianas, os maias, os

astecas e os incas, utilizaram recursos estatísticos, fato constatado a partir das

pesquisas arqueológicas. Da mesma forma, os balancetes do império romano, o

inventário das posses de Carlos Magno, entre outros, evidenciam ao longo da

História uma abordagem descritiva de dados, embora a Estatística enquanto

descrição de dados tenha emergido, posteriormente, no século 16, na Itália.

Os levantamentos censitários têm hoje um papel preponderante, sendo

realizados nos vários países por agências especializadas. No Brasil, o primeiro

censo, no caso apenas demográfico, foi realizado em 1872, sob a responsabilidade

da então Diretoria Geral de Estatística (DGE), um órgão governamental. Desde

1940, o levantamento censitário brasileiro é de responsabilidade do “Instituto

Brasileiro de Geografia e Estatística” (IBGE), tendo sido realizado em alguns anos

de modo a abordar não apenas as questões demográficas, mas econômicas,

agrícolas, industriais, comerciais, de transportes, de índices sociais, entre muitas.

(PEREIRA; MORETTIN, 1991).

A ampla disseminação das técnicas estatísticas e sua aplicação nos diversos

setores confirmam o fato, destacado por Memória (2004), que a Estatística, como

hoje se conhece está bem longe de uma mera descrição de dados. Segundo esse

autor:

A primeira tentativa para se tirar conclusões, a partir de dados numéricos, foi feita somente no século 17, na Inglaterra, com o que foi denominada Aritmética Política, que evoluiu para o que hoje se chama demografia. Contudo, só começou a existir como disciplina autônoma no raiar do século 20, o verdadeiro início da estatística moderna. (MEMÓRIA, 2004, p.12).

1 Confúcio (551 a.C. - 479a.C.), o pensador chinês que teve sua trajetória de vida marcada como mestre, filósofo e teórico político.

Page 18: CAPA DISSERTAÇÃO FINAL Mara Lucia

17

Com o passar dos anos, a Estatística evoluiu de forma significativa, através

dos trabalhos realizados por Bernoulli, Fermat, Pascal, Laplace,Gauss, Quetélet,

Galton, Pearson, Student, Fisher, Poisson, entre vários outros estudiosos.

A Estatística desenvolveu-se fundamentada nos estudos de probabilidades e

recebendo contribuições valiosas da Astronomia e do que veio a se constituir a

Biometria. Atualmente, pode ser considerada como uma ciência que permite

analisar, interpretar, conjeturar e tomar decisões, deixando de lado a sua antiga

qualificação de apenas quantificar dados.

A estatística é uma coleção de métodos para planejar experimentos, obter dados e organizá-los, resumi-los, analisá-los, interpretá-los e deles extrair conclusões. (TRIOLA, 1999, p.2).

Segundo Batanero (2001), adota-se, há cerca de trinta anos, uma divisão

clássica da Estatística em dois grandes ramos: Estatística Descritiva ou Dedutiva e

Estatística Indutiva ou Inferencial.

A Estatística Descritiva tem como essência descrever os dados,

apresentando-os de forma gráfica ou através de tabelas, restringindo-se a um

estudo de noções básicas. Este ramo, por muito tempo foi o cerne das aplicações

em pesquisas experimentais.

A Estatística Descritiva tem como fim apresentar um conjunto de dados de forma resumida, explicitando suas características, mediante representações gráficas. Os dados são usados para fins de comparação, sem utilização de princípios de probabilidade. O interesse se concentra em descrever o conjunto de dados e não planeja estender as conclusões a outros dados diferentes ou a uma população. (BATANERO, 2001, p. 10, tradução nossa)2

O segundo ramo é conhecido como Estatística Indutiva ou Inferencial.

[...] estuda os conjuntos de dados com referência a um modelo de distribuição de probabilidade ou uma família de modelos, com determinada margem de incerteza, na estimativa dos parâmetros desconhecidos dos mesmos. Supõe–se que o conjunto de dados analisados seja uma amostra de uma população e o interesse principal é predizer o comportamento da

2 La estadística descriptiva tiene como fin presentar resúmenes de un conjunto de datos y poner de manifiesto sus características, mediante representaciones gráficas. Los datos se usan para fines comparativos, y no se usan principios de probabilidad. El interés se centra en describir el conjunto de datos y no se plantea el extender las conclusiones a otros datos diferentes o a una población.

Page 19: CAPA DISSERTAÇÃO FINAL Mara Lucia

18

população, a partir dos resultados da amostra. (BATANERO, 2001, p. 10, tradução nossa)3

A todo o momento, recebe-se uma grande quantidade de informações

estatísticas da mídia escrita ou televisiva, demandando um conhecimento mais

apurado de análise e interpretação de tais informações. O conhecimento estatístico

vem de encontro às necessidades atuais do mundo globalizado, o mundo dos

negócios, sejam eles relacionados às áreas políticas, sociais, científicas ou

tecnológicas, onde a tomada de decisões se faz sempre necessária.

A Estatística caracteriza-se, hoje, por uma forte matematização e um forte

apelo aos recursos computacionais. Memória (2004) comenta o fato que até a

década de 40 (referindo-se ao período de 1940 a 1950) os conhecimentos

matemáticos demandados para entendimento da teoria estatística eram mais

reduzidos e que a situação alterou-se a ponto da leitura de artigos especializados,

mesmo aqueles das revistas aplicadas, serem inacessíveis para muitos estatísticos,

considerando-se o elevado nível de sofisticação matemática.

O avanço na área tecnológica, a produção de computadores cada vez mais

sofisticados e a criação de softwares educativos e comerciais que possibilitam usar

as funções estatísticas, expandiu o leque de aplicação da Estatística como suporte à

Biologia, Psicologia, Medicina, Economia e Engenharia, entre outras áreas de

conhecimento. Todo o ferramental estatístico computacional que é hoje

disponibilizado, de certa forma viabiliza uma infinidade de cálculos estatísticos

acerca de grandes massas de dados, minimizando a matemática exigida e

permitindo um foco nas idéias estatísticas envolvidas nos problemas.

Entretanto, nas palavras de Yates, “os computadores são bons serventes,

mas maus mestres”, podendo afastar “o estatístico do escrutínio inteligente dos

dados”, conforme aponta Memória (2004, p.86).

É relevante ainda ressaltar que, por mais sofisticados que sejam os pacotes

estatísticos empregados, a leitura e interpretação de dados é uma leitura e

interpretação de mundo.

3 [...] estudia los resúmenes de datos con referencia a un modelo de distribución probabilistico o una familia de modelos, determinando márgenes de incertidumbre en la estimación de los parámetros desconocidos del mismo. Se supone que el conjunto de datos analizados es una muestra de una población y el interés principal es predecir el comportamiento de la población, a partir de los resultados en la muestra.

Page 20: CAPA DISSERTAÇÃO FINAL Mara Lucia

19

A importância da Estatística na formação de profissionais e pesquisadores e, principalmente do cidadão, é cada vez mais valorizada, pois a falta desse conhecimento pode levar o cidadão a consumir informações sem um filtro crítico tornando-o vulnerável aos vieses que as informações estatísticas podem se prestar. (VENDRAMINI, 1998).

A Estatística tem se desenvolvido de modo a explicar dados e inferir

comportamentos, adquirindo hoje um papel relevante na formação do cidadão,

passando a integrar o currículo educacional, desde as primeiras séries da escola

fundamental.

2.2 Ensino e aprendizagem de Estatística

O ensino de Estatística de forma sistematizada é recente em muitos países.

No Brasil, o primeiro curso da matéria foi ministrado no Instituto de Educação, uma

escola de formação de professores do Rio de Janeiro, no começo da década de

1930. Entretanto, noções estatísticas isoladas, como por exemplo, tópicos de cálculo

de probabilidades e teoria de erros, integravam o currículo das escolas militares de

engenharia. (PEREIRA; MORETTIN, 1991).

Em seu texto sobre os “Primórdios do Ensino de Estatística no Brasil e na

UERJ”, Paulo Pardal (1993) destaca que esses estudos eram desenvolvidos na

Academia Real Militar desde 1810, onde os cadetes eram admitidos com apenas 15

anos de idade, e bastava que “dessem conta das quatro operações”. Segundo

Pardal, o currículo do primeiro ano compreendia aritmética, álgebra, geometria,

trigonometria e desenho. No segundo ano, dava-se seqüência aos estudos de

álgebra, geometria, desenho e geometria descritiva, geometria analítica, cálculo

diferencial e integral e suas aplicações “até onde se tem chegado nos nossos dias”,

incluindo aplicações à Física, Astronomia (matérias do 4o ano) e ao cálculo de

probabilidades. Os livros indicados eram os livros utilizados na França, no Instituto

Politécnico de Paris, criado em 1791. Segundo o mesmo autor, era de se questionar,

como os cadetes, dominando apenas as quatro operações, podiam acompanhar

estudos tão avançados e realmente quais os tópicos e qual o nível de

aprofundamento com que eram lecionados, considerando-se o elevado número de

cadeiras, para serem ministradas por poucos professores.

Page 21: CAPA DISSERTAÇÃO FINAL Mara Lucia

20

Segundo Pereira e Morettin (2004), embora tendo início em um curso de

exatas, a Estatística desenvolveu-se a partir de 1935, ligada à área de Ciências

Humanas, apresentando sempre uma conotação aplicada à Saúde, à Economia e à

Administração.

Data de 1946 o primeiro curso de pós-graduação em Estatística, criado na

USP. Posteriormente, com a reforma universitária, a Estatística ganhou um novo

impulso, decorrente da criação dos institutos, no caso da USP, Instituto de

Matemática e Estatística, congregando todas as antigas cátedras de Matemática e

Estatística, alocadas nos vários cursos.

Em outras universidades, foram criados Institutos ou Departamentos de

Estatística ou, ainda um Departamento de Matemática e Estatística, como na

instituição onde a pesquisa foi desenvolvida. Nessa instituição, o Departamento de

Matemática e Estatística foi criado em 1978 e presta serviço a vários outros cursos

que necessitam do conhecimento matemático e estatístico. No ensino superior, a

Estatística se faz presente na grade curricular de vários cursos que necessitam,

cada vez mais, de conhecimentos para análise de dados, interpretações e tomada

de decisões.

A aplicação da Estatística, por exemplo, na Engenharia, é relevante.

Podemos pensar no controle de qualidade, tomando como exemplo, a produção de

peças produzidas por uma máquina. É possível, através do controle de qualidade,

detectar se existe algum problema com as peças e, a partir daí, tomar atitudes que

possam minimizar ou resolver completamente esta situação. Todas essas decisões

são instruídas por ferramentas estatísticas.

Muitas vezes, a relação entre estatística e engenharia é ainda mais estreita. Os próprios métodos de engenharia costumam incorporar intrinsecamente procedimentos probabilísticos ou estatísticos. Assim, para que o aluno possa entender certos métodos de engenharia, é necessário que tenha conhecimento de probabilidade e estatística. (BARBETTA, 2004, p.14).

No entanto, a Estatística, na maior parte das vezes é vista pelos alunos, em

cursos de nível médio ou nível universitário, como sendo uma extensão da

matemática. Essa concepção pode ser explicada, em parte, pelo fato que em geral

as aulas de Estatística no Ensino Fundamental e Médio são ministradas por

profissionais com licenciatura em Matemática, que não necessariamente foram

formados, desenvolvendo habilidades estatísticas básicas ao longo do curso de

Page 22: CAPA DISSERTAÇÃO FINAL Mara Lucia

21

graduação, o que pode ser um fator que compromete a abordagem do conteúdo

estatístico por parte dos mesmos.

Como professora, a pesquisadora tem observado que, durante as aulas de

Estatística, na maioria das vezes, apenas o lado puramente matemático é

enfatizado, fazendo com que a Estatística seja considerada algo sem vida. Um

exemplo dessa distorção pode ser apontado no estudo das medidas descritivas. A

maioria dos alunos encara tais estudos como apenas uma aplicação de fórmulas

matemáticas e produção de gráficos, descartando, na maior parte das vezes, a

análise e a interpretação dessas medidas.

Algumas dificuldades bastante comuns do aluno são com relação ao

entendimento do “valor típico” de um conjunto de dados e a construção de gráficos.

As dificuldades concentram-se exatamente no entendimento conceitual do “valor

típico”, o valor que caracteriza o conjunto de dados.

Batanero (2001), ao se referir à idéia de ”valor típico” reporta-se a Russel y

Mokros (1991)4 para destacar três capacidades que o aluno deve desenvolver

para saber: 1) escolher o valor mais adequado para descrever os dados; 2)

fornecer um exemplo de um conjunto hipotético de dados para um valor central

dado; 3) explicar o efeito sobre um valor central, decorrente das alterações de

alguns dados no conjunto.

O desenvolvimento dessas capacidades pressupõe uma mudança de

concepção da Estatística e seu papel. Na visão do aluno, a Estatística trabalha com

uma massa de dados empíricos, por vezes reais, fornecendo fórmulas para calcular

uma série de medidas descritivas e confeccionar uma série de gráficos. Não parece

existir a preocupação, em nenhum momento, com o pensar reflexivo a respeito de

uma situação, que exige analisar, interpretar e conjeturar acerca daquela massa de

dados e por vezes tomar decisões.

Em qualquer um dos níveis de ensino, os estudantes devem ser preparados para escolher projetos, aprender a formular questões, planejar e coletar efetivamente os dados, escolher os métodos estatísticos adequados, resumir as informações e criticar os resultados obtidos, elaborar relatórios que sejam objetivos e críticos e entender as limitações da Estatística, geradas principalmente pela incerteza e pela variabilidade. (WODEWOTZKI; JACOBINI, 2004, p.235).

4 Citados em Batanero (2001, p.88). Ver referência completa no final.

Page 23: CAPA DISSERTAÇÃO FINAL Mara Lucia

22

A representação e a interpretação gráfica podem ser consideradas como

sendo outro grande problema enfrentado por parte dos alunos. Em geral eles

apresentam dificuldades no entendimento de escalas e sua elaboração, não

adotando um material adequado para confeccionar gráficos. A maior parte dos

alunos não percebe a riqueza dessa forma de representação e conseqüentemente a

interpretação dos dados dentro das varias áreas de estudo, deixa a desejar.

Batanero (2001) destaca os erros comuns dos alunos ao confeccionarem

gráficos, apoiando-se nos trabalhos desenvolvidos por Li y Shen (1992)5 ao

desenvolverem projetos estatísticos com a participação de alunos da escola

secundária. Tais erros consistem na omissão das escalas de alguns dos eixos

coordenados ou da indicação da origem do sistema de coordenadas e por vezes na

utilização de subdivisões de escalas insuficientes.

É necessário um cuidado por parte do professor para que os alunos

desenvolvam um rigor na construção dos gráficos, além do entendimento das várias

formas de representação gráfica e a melhor escolha para cada situação.

A compreensão de qualquer conteúdo estatístico depende muito da

conotação dada pelo professor em sala de aula, da ênfase conceitual e das

aplicações, que devem na medida do possível remeter a situações do contexto

cultural do aluno. Lidar com dados relacionados a sua área de interesse pode levar o

aluno a um maior comprometimento em relação ao conteúdo abordado e talvez

motivá-lo a fazer a interpretação de tais dados.

O desenvolvimento do pensamento estatístico exige uma abordagem

sistêmica e global, não se restringindo ao estudo isolado de alguns métodos e

conceitos. Inicialmente incorporado ao Ensino de Matemática e posteriormente à

Educação Matemática, o Ensino de Estatística ganhou corpo, merecendo cada vez

mais um espaço próprio, congressos e organizações sociais específicas. Segundo

Wodewotsky e Jacobini (2004), essa é uma tendência mundial. Destaca-se, por

exemplo, o número de trabalhos apresentados nos seminários internacionais

relacionados com a Estatística Aplicada, promovidos pelo Instituto Americano de

Estatística. Nos eventos de Educação Matemática essa presença é ainda reduzida.

Só recentemente, em 2001, quando da realização do VI ENEM, foi criado um Grupo

de Trabalho específico para agrupar pesquisadores brasileiros, preocupados com

5 Citados em Batanero( 2001, p.82). Ver referência completa ao final.

Page 24: CAPA DISSERTAÇÃO FINAL Mara Lucia

23

questões relativas ao desenvolvimento do pensamento estatístico e com o ensino e

aprendizagem da Estatística. O número de trabalhos de Estatística nos eventos, em

Educação Matemática, tem aumentado. Nos programas de pós-graduação em

Educação e Ensino, trabalhos relativos à Estatística, começam a se multiplicar,

lentamente. Podemos citar alguns trabalhos desenvolvidos nesta área, por exemplo,

Ara (2006), Bifi (2006) e Cazorla (2002) entre outros pesquisadores.

Uma das tendências em Educação Matemática e Educação Estatística é de

uma abordagem que prioriza a investigação. A investigação estatística acontece

segundo Ponte e colaboradores (2003), quando possibilitamos aos nossos alunos o

desenvolvimento de suas capacidades de analisar, interpretar e fazer conjecturas

em relação aos dados quantitativos. E esse objetivo de promover o desenvolvimento

de um espírito investigativo pode ser atingido de diversas maneiras.

Caminhar em busca do conhecimento exige muito mais do que temos como

referência há anos, na nossa escola tradicional. O deixar fluir na busca do aprender

é o que faz o aluno amadurecer, sendo capaz de refletir e conquistar a sua

autonomia.

A Educação Estatística ou Educação em Estatística avança a cada dia,

discutindo o processo do ensino aprendizagem dos conteúdos estatísticos,

buscando formas de envolver o aluno de maneira que seja questionador e que tenha

em mente que a construção do conhecimento não ocorre em função somente do

professor. Ao aprender a Matemática ou a Estatística, o aluno deve deixar fluir suas

idéias intuitivas, levantando conjecturas, mas buscando a validação das mesmas

através de argumentos teóricos.

O explorar inicialmente de forma intuitiva, no processo de ensino

aprendizagem, pode contribuir de forma construtiva, desde que tal procedimento

seja desenvolvido de maneira que ao findar a abordagem investigativa seja feito o

elo entre o formal e o intuitivo.

As seqüências de atividades presentes nos capítulos 5 e 6, aqui relatadas,

foram aplicadas pela professora-pesquisadora a duas turmas de engenharia.

Trazem uma proposta de abordagem inicial intuitiva, objetivando a investigação,

centrada na análise e interpretação de dados, a partir de referenciais que serão

discutidos no Capítulo 3. Ao final de cada seqüência de atividades aplicada pela

professora-pesquisadora, atentou-se para a necessidade de proceder à formalização

dos conteúdos envolvidos.

Page 25: CAPA DISSERTAÇÃO FINAL Mara Lucia

24

2.3 Correlação e Regressão

No seu cotidiano, as pessoas, freqüentemente, levantam hipóteses, na

tentativa de investigar a existência de alguma relação entre duas, ou mais variáveis.

O aumento de venda de telefones celulares, por exemplo, teria alguma associação

com o aumento de venda de pipocas nas salas de cinemas de uma dada cidade, em

certo momento?

O termo associação é usado para estudar o relacionamento entre variáveis.

As pessoas, em geral, explicam as associações entre as variáveis através do senso

comum e, na maioria das vezes, não têm noção de que essas conjecturas têm uma

sustentação teórica extremamente sofisticada no campo estatístico.

A associação entre as variáveis pode envolver variáveis qualitativas, isto é,

variáveis que não são mensuradas numericamente, como por exemplo, cor e raça

de pessoas; e variáveis quantitativas, que são mensuráveis numericamente, como

no exemplo anterior, vendas de celulares e de pipocas.

No campo estatístico, é comum reservar o termo associação para o estudo de

relações entre variáveis qualitativas, que apresentam informações através de suas

categorias e atributos. No caso das variáveis quantitativas, o termo associação

recebe o nome de correlação e pode ser a princípio, explorada através de um

diagrama de dispersão. Neste trabalho, limita-se à abordagem de correlação entre

duas variáveis.

Considerando-se duas variáveis X e Y, o diagrama de dispersão

consiste em uma forma de representar graficamente, os pares ordenados (X,Y),

observados em determinado período de tempo. A partir da visualização do diagrama

de dispersão, se pudermos perceber certo padrão em relação aos pares ordenados

(X,Y), podemos concluir, intuitivamente, que há uma correlação entre as variáveis,

conforme gráfico 1.

Page 26: CAPA DISSERTAÇÃO FINAL Mara Lucia

25

X

Y

6055504540353025

650

600

550

500

450

400

350

Gráfico 1 - Diagrama de dispersão: Tendência ascend ente

Fonte: Dados fictícios

A Correlação Estatística é uma teoria capaz de medir a intensidade de

certa força que mantém unidas duas ou mais quantidades (variáveis), ainda que isto

não implique em uma relação de causa-efeito. Existe correlação estatística entre

duas variáveis quando uma delas está de alguma forma, relacionada com a outra.

As duas variáveis estarão relacionadas de forma positiva se elas

caminharem no mesmo sentido, isto é, a um aumento de X implicar um aumento de

Y; e a uma redução de X implicar uma redução de Y, de acordo com o gráfico 1. A

relação é tida como negativa, se X e Y caminharem em sentidos opostos, conforme

o gráfico 2.

Page 27: CAPA DISSERTAÇÃO FINAL Mara Lucia

26

X

Y

282624222018161412

18

16

14

12

10

8

6

Gráfico 2 - Diagrama de dispersão: Tendência descen dente

Fonte: Dados fictícios

A correlação permite detectar apenas se há alguma relação, em um

determinado momento, entre as variáveis. É possível que haja correlação, por

exemplo, entre as variáveis X = vendas de parafusos e Y = aumento de alunos nas

universidades. Essas duas variáveis podem estar crescendo, em certo intervalo de

tempo, não porque uma é causa da outra, mas talvez por estar toda a economia do

país em crescimento.

A correlação não indica uma relação determinística (de causa-efeito)

entre as variáveis; a correlação detecta, apenas, que elas estão caminhando num

mesmo sentido, num certo momento. As análises e conjecturas devem ser feitas

pelo pesquisador da área específica, que é o sujeito capaz de extrair informações de

um conjunto de dados. A Estatística é somente um instrumento, que pode se tornar

poderoso e útil, se usado por quem possui forte fundamentação teórica e a devida

prática em sua área de atuação.

A forma como os pontos tendem a se distribuir no diagrama de dispersão

permite identificar, visualmente, a possibilidade de uma correlação linear, se os

pontos se posicionam em uma faixa que acompanha certa reta imaginária. Podem

também apresentar uma tendência não-linear, acompanhando uma curva

imaginária, tipo parabólica, exponencial ou logarítmica. No estudo das correlações,

Page 28: CAPA DISSERTAÇÃO FINAL Mara Lucia

27

as não lineares são os modelos mais complexos. Nosso objetivo é trabalhar com a

correlação linear, visto ser a mais freqüente.

Como as conclusões tiradas de diagramas de dispersão se apóiam nos

aspectos visuais do gráfico, elas tendem a ser subjetivas. Então, o pesquisador

necessita de métodos mais precisos e objetivos. Neste texto, será utilizado um

Coeficiente de Correlação Linear para detectar a intensidade de padrões lineares.

Para afirmarmos que duas variáveis são correlacionadas linearmente de

forma perfeita (todos os pontos alinhados), moderada, forte, fraca ou nula,

(referindo-se à ausência completa de tendência linear), podemos lançar mão de uma

fórmula, aceita no meio científico como apropriada para cálculo do coeficiente de

correlação linear. Ela permite calcular o grau de intensidade do relacionamento entre

as duas variáveis. A fórmula que utilizaremos é denominada correlação de

momento-produto de Pearson, ou simplesmente, coeficiente de correlação de

Pearson. A fórmula é indicada por r, e foi desenvolvida por Karl Pearson6.

Por ser r um coeficiente, ele não deve depender da unidade de medida dos

dados. Deve ser um valor numérico puro, independente das unidades quilogramas e

metros, se as variáveis forem peso e altura de indivíduos, por exemplo.

Assim, a teoria de Pearson, explorada por Barbetta, usa a alternativa de

padronizar os dados para as variáveis X e Y, separadamente, através das

expressões:

xS

Xxx

−=' (1) yS

Yyy

−=' (2)

x : cada valor da variável X

'x : cada valor padronizado

y : cada valor da variável Y

'y : cada valor padronizado

X : média dos dados da variável X Y : média dos dados da variável Y

6 Karl Pearson (1857 –1933) foi um grande contribuidor para o desenvolvimento da Estatística como uma disciplina científica séria e independente. Ele foi o fundador do Departamento de Estatística Aplicada (Department of Applied Statistics) na University College London em 1911; primeiro departamento universitário dedicado à estatística em todo o mundo.

Page 29: CAPA DISSERTAÇÃO FINAL Mara Lucia

28

O coeficiente de correlação linear de Pearson é definido, em termos dos

valores padronizados, pela expressão:

1

)''.(

−= ∑

n

yxr (3)

n: número de pares (x, y) observados.

Os numeradores das expressões (1) e (2) são os desvios em relação à média,

para os valores de X e de Y, respectivamente. Em (3), calculamos, no numerador, os

produtos dos desvios e os somamos. O sinal do resultado r de (3) será determinado

por este numerador, dependendo de os produtos positivos ou de os negativos serem

mais numerosos e maiores (LEVIN, 2004).

Assim, se r for positivo, as variáveis caminham na mesma direção, se for

negativo, elas caminham em direções contrárias. Se os pontos do diagrama

estiverem todos sobre uma reta ascendente, teremos 1+=r , correlação perfeita

positiva. Teremos 1−=r , se os pontos estiverem todos sobre uma reta

descendente. Se não houver correlação linear, r será nulo.

O valor de r varia, então de -1 a 1, qualquer que seja o conjunto de dados.

Quanto mais próximo r estiver do valor 1 ou de -1, mais forte será a correlação; e,

quanto mais perto de zero, mais fraca ela será considerada (LEVIN, 2004).

De acordo com Stevenson (1981, p.369), e em se tratando da área de

ciências sociais e humanas: r entre -1 e -0,70 ou entre 0,70 e 1, indica

relacionamento forte entre as duas variáveis; fora destes intervalos, a correlação vai

de moderada a fraca, ao se aproximar de zero; 0=r indica ausência de correlação

linear entre as duas variáveis.

Page 30: CAPA DISSERTAÇÃO FINAL Mara Lucia

29

Na tabela 1 a seguir, usaremos a expressão (3) para estudar a correlação

entre os valores X e Y.

Tabela 1 – Produção de peças (X) e custos (Y) em m ilhares de reais.

X Y 'x 'y '' yx

91

183

32

294

32

162

45

95

58

209

119

32

4,2

5,6

3,8

7,5

3,0

2,9

3,9

6,3

3,7

4,1

4,1

2,2

-0,24

0,87

-0,95

2,20

-0,95

0,37

-0,79

-0,19

-0,63

1,18

0,10

-0,95

-0,05

088

-0,32

2,15

-0,85

-0,91

-0,25

1,35

-0,38

-0,12

-0,12

-1,38

0,012

0,766

0,304

4,730

0,808

-0,337

0,198

-0,257

0,239

-0,142

-0,012

1,311

Fonte: Dados fictícios

Temos: 037,83=xS ; 503,1=yS ; 0,111=X ; Y =4,275 ;

620,7)''.( =∑ yx

Logo 69,011

620,7 ==r

Vê-se na última coluna da tabela que a soma 7,620 é positiva, o que

determina um r positivo. Isto pode ser confirmado pela observação da relação dos

elementos das duas primeiras colunas, cujo diagrama de X por Y terá uma tendência

linear positiva.

O uso da definição de coeficiente de correlação expressa em (3) é

interessante para se ter uma compreensão maior e mais conceitual da correlação.

Mas, os cálculos se tornam longos e erros de arredondamentos podem ser

acumulados. Então, a expressão (3) pode ser trabalhada algebricamente e adquirir o

formato mais usado nos livros didáticos, como em Levin, 2004.

−=

− −∑ ∑ ∑

∑ ∑ ∑ ∑2 2 2 2

n xy ( x)( y)r

n( x ) ( x) n y ( y)

(4)

Page 31: CAPA DISSERTAÇÃO FINAL Mara Lucia

30

onde:

n quantidade de pares ordenados da amostra

∑ soma dos itens indicados

∑ x soma dos valores de x

∑ x² Indica a soma de cada valor de x elevada ao quadrado

(∑x)² Indica a soma dos valores de x elevada ao quadrado

∑ xy Indica a somatória do produto xy

Tabela 2, retomando os mesmos dados da tabela 1, do exemplo anterior, com

o uso da nova fórmula, teremos:

Tabela 2: Elementos para o cálculo do coeficiente d e correlação, da produção

de peças (X) e custos (Y).

X Y X2 Y2 X.Y

91

183

32

294

32

162

45

95

58

209

119

32

4,2

5,6

3,8

7,5

3,0

2,9

3,9

6,3

3,7

4,1

4,1

2,2

8281

33489

1024

86436

1024

26244

2025

9025

3364

43681

14161

1024

17,64

31,36

14,44

56,25

9

8,41

15,21

39,69

13,69

16,81

16,81

4,84

382,2

1024,8

121,6

2205

96

469,8

175,5

598,5

214,6

856,9

487,9

70,4

∑=1352 ∑=51,3 ∑=229778 ∑=244,15 ∑=6703,2

Fonte: Tabela 1

−=− −2 2

12.(5706,2) 1352.(51,3)

( 12.(251538) (1352) ).( 12.(153,55) (51,3)r

r = 0,67

Page 32: CAPA DISSERTAÇÃO FINAL Mara Lucia

31

Ao se usar a primeira expressão, encontramos r = 0,69. A pequena diferença

entre os dois resultados deve-se ao arredondamento de casas decimais nos cálculos

intermediários, e ao denominador, 1 unidade maior.

No caso da correlação linear, devemos ter cautela ao interpretarmos o

resultado do coeficiente de correlação de Pearson. Alguns enganos podem ser

cometidos durante as interpretações, como:

a) Concluir que a partir do valor do coeficiente de correlação existe uma correlação

de causalidade entre as duas variáveis (X,Y). Isto não deve ser afirmado

gratuitamente, pois, às vezes, existe uma variável oculta7 que pode influenciar o

processo de relacionamento entre as duas variáveis.

b) Fazer aplicações que envolvem variáveis como médias ou taxas, pois neste caso

deixamos de trabalhar com variações individuais. Quando consideramos médias

ou taxas, corremos o risco de inflacionarmos as variáveis em estudo.

c) Afirmar que não existe correlação entre as variáveis, uma vez que r = 0. Pode

ocorrer de não existir correlação linear entre as variáveis, mas pode existir entre

as variáveis uma correlação não linear.

Em geral, os estudantes têm dificuldades em lidar com r negativo e levantam

questões do tipo: como o valor do coeficiente de correlação de Pearson pode ser

negativo, por exemplo, r = -0,90 e, mesmo assim, existir uma forte correlação linear?

O exemplo, a seguir, objetiva mostrar uma tabela de dados, o gráfico do

diagrama de dispersão e o coeficiente de correlação de Pearson, para que se

perceba que as variáveis não estão caminhando no mesmo sentido, portanto ter-se-

á um r negativo e a correlação poderá ser forte.

Considere os dados da tabela 3: Renda familiar (em salários mínimos) e o

número de filhos, coletada de uma amostra de 8 famílias em uma cidade.

7 Define-se formalmente variável oculta como uma variável que afeta as variáveis em estudo, mas não está incluída em estudo.(TRIOLA, 1999, p. 239).

Page 33: CAPA DISSERTAÇÃO FINAL Mara Lucia

32

Tabela 3: Renda familiar e número de filhos Família Renda (X) Filhos (Y)

1 12 3

2 14 2

3 15 2

4 17 1

5 23 1

6 27 0

7 34 0

8 43 0

Fonte: Magalhães; Lima, 2007, p. 341

Renda (X)

Filhos (Y)

4540353025201510

3,0

2,5

2,0

1,5

1,0

0,5

0,0000

11

22

3

Gráfico 3 – Número de filhos e renda familiar (em s alários mínimos)

Fonte: Tabela 3.

a) Observando o diagrama de dispersão, percebe-se que um valor baixo para

renda no eixo (X) tem como correspondente um valor alto para o número de

filhos (Y). E que um valor alto para renda no eixo (X) tem como

correspondente um valor baixo para o número de filhos (Y). Logo isso mostra

que as duas variáveis não estão caminhando no mesmo sentido. Esse fato irá

justificar o porquê do valor do coeficiente de correlação de Pearson ser

negativo.

b) Calculando o coeficiente de correlação de Pearson, encontramos

Page 34: CAPA DISSERTAÇÃO FINAL Mara Lucia

33

r = - 0,859, o que indica uma forte correlação linear negativa entre as duas

variáveis. O sinal negativo não interfere na força de relacionamento entre as

duas variáveis.

Quando se admite uma relação de causalidade entre as variáveis X e Y, as

técnicas de Regressão podem ser usadas para se encontrar um modelo, geralmente

uma função matemática, que expresse a lei de dependência entre as variáveis X e

Y.

Existem várias técnicas de regressão, mas neste trabalho daremos atenção à

Regressão Linear, por ser uma unidade que compõe o plano de ensino da disciplina

cursada pelos alunos que participaram dessa pesquisa.

A regressão linear é uma técnica estatística que descreve a relação entre

duas variáveis, através de uma função matemática.

A regressão linear trabalha com duas variáveis, isto é, variável Y denominada

variável resposta ou dependente e a variável X denominada variável explicativa ou

independente.

Ao observamos um diagrama de dispersão, analisando como os pares

ordenados se distribuem, podemos retomar a idéia de visualização de uma linha

imaginária ascendente ou descendente.

No gráfico1 ( da página 25), por exemplo, percebemos uma tendência

ascendente. Através da teoria da regressão, pode-se encontrar a equação da reta

que melhor se ajusta aos pontos do gráfico.

X

Y

6055504540353025

650

600

550

500

450

400

350

Gráfico 1 - Diagrama de dispersão: Tendência ascend ente

Fonte: Dados fictícios.

Page 35: CAPA DISSERTAÇÃO FINAL Mara Lucia

34

Assim um modelo de regressão linear (populacional) que pode representar tais

pares ordenados, tem a forma:

com

y , variável dependente ou resposta

x, variável dependente ou explicativa

, coeficiente linear ou intercepto da reta

1β , coeficiente angular ou inclinação de reta

ε , erro aleatório, isto é, são fatores que afetam y de modo aleatório.

Algumas suposições devem ser feitas a respeito do erro aleatório, que são

importantes para que se faça inferência a respeito da regressão linear. Tais

inferências estão relacionadas a intervalos de confiança e teste de hipóteses. As

suposições são: 1) os erros aleatórios devem ter distribuição normal com média

igual a zero e variância constante; 2) não existe correlação entre os erros, isto é, um

erro elevado não causa o aumento de outro erro.

A regressão exige que se estimem os interceptos da reta, isto é, 10 e ββ

tendo como referência uma amostra composta pelos pares ordenados (X,Y).

A determinação da equação de uma reta que mais se aproxima dos pares

ordenados pode ser representada por xbby 10ˆ += , onde b0 e b1 são estimativas de

10 e ββ . A equação, é denominada equação de regressão ou reta de regressão. O

valor b0 é o coeficiente linear da reta, isto é, o valor onde a reta intercepta o eixo y,

obtido fazendo-se x = 0. O valor b1 é o coeficiente angular da reta, sendo que

informa a variação no eixo y a cada aumento de uma unidade no eixo x.

Para determinar as estimavas de 10 e ββ , podemos utilizar: o método das

médias, o método dos pontos selecionados ou o método dos mínimos quadrados. O

método dos mínimos quadrados tem como proposta tornar mínima a soma dos

quadrados dos desvios em torno da reta estimada, isto é:

ε= = − = − −∑ ∑ ∑2 2 2

0 1ˆD (y y) (y b b x) (5)

seja mínima.

β β ε= + +0 1y x

Page 36: CAPA DISSERTAÇÃO FINAL Mara Lucia

35

Observe o Gráfico 4, onde é apresentado o erro de predição: − ˆ(y y)

y

= +0 1y b b x

− ˆ(y y)

y

x

Gráfico 4: Resíduos Fonte: Dados fictícios

Para minimizar a função D, dada em (5) calculam-se as derivadas parciais da

função em relação a b0 e b1, igualando-se a zero.

Obtêm-se, após simplificações, os coeficientes:

( )( ) ( )( )( ) ( )22

2

0

∑∑∑∑∑∑

−=

xxn

xyxxyb

( )( )

( ) ( )221

∑∑∑ ∑∑

−=

xxn

yxxynb (7)

O cálculo de b0 pode ser simplificado, lembrando-se que a reta de regressão

contém o ponto ),( yx e usando-se então a fórmula (8) xbyb 10 −= no lugar da

fórmula (6).

A seguir apresenta-se um exemplo de aplicação de correlação linear e regressão

linear.

Considere um experimento em que se analisa a octanagem da gasolina (Y) em

função de um novo aditivo (X). Para isso, foram realizados ensaios com percentuais

de 1, 2, 3, 4, 5, e 6% de ativo.

(6)

Page 37: CAPA DISSERTAÇÃO FINAL Mara Lucia

36

Tabela 4: Dados experimentais do efeito de um aditi vo(X) na octanagem da

gasolina (Y)

X Y

1 80,5

2 81,6

3 82,1

4 83,7

5 83,9

6 85,0

Fonte: Barbetta; Reis; Bórnia; 2004, p.325.

Usando os pares ordenados (X,Y):

a) Construa o diagrama de dispersão;

b) Determine a reta que melhor se ajusta aos pares ordenados;

c) Calcule o coeficiente de correlação de Pearson;

d) Ajuste uma reta a esses dados no diagrama de dispersão.

a)

Quantidade de aditivo (%) (X)

Índice de octanagem (Y)

654321

85

84

83

82

81

80

85,0

83,983,7

82,1

81,6

80,5

Gráfico 5: Índice de octanagem e quantidade de adit ivo Fonte: Barbetta; Reis; Bórnia; 200, p.325

Page 38: CAPA DISSERTAÇÃO FINAL Mara Lucia

37

Observando o diagrama de dispersão, percebe-se que uma baixa

porcentagem de aditivo está relacionada com um baixo índice de octanagem e que

uma alta porcentagem de aditivo está relacionada com um alto índice de octanagem.

As duas variáveis caminham no mesmo sentido. E é possível que o coeficiente de

correlação linear de Pearson seja alto, devido ao fato de visualizarmos no diagrama

pouca dispersão entre os pares ordenados. De acordo com o diagrama de

dispersão, podemos imaginar uma linha imaginária ascendente.

b) Equação da reta de regressão: Y = 79,7 + 0,886 X

Com base na equação de regressão, pode-se dizer que para cada variação

de 1% na quantidade de aditivo (X), tem-se um acréscimo de 0,886 para o índice de

octanagem (Y).

c) Coeficiente de correlação de Pearson: r = 0,987

Com r = 0,987, há evidência de uma forte correlação linear positiva,

facilmente identificada no gráfico 5. ( Página 36)

d)

Quantidade de aditivo (%) (X)

Índice de octanagem (Y)

654321

85

84

83

82

81

80

Gráfico 5: Índice de octanagem e quantidade de adit ivo (Ajuste de reta)

Fonte: Barbetta; Reis; Bórnia; 2004, p.325 .

Logo, o modelo de regressão linear fornece uma equação matemática que

permite descrever o relacionamento entre as variáveis. Com a equação da reta de

regressão matemática, podemos fazer previsões de valores futuros, acerca de

Page 39: CAPA DISSERTAÇÃO FINAL Mara Lucia

38

determinada variável, quando conhecemos os valores de outra variável envolvida no

estudo.

É importante ressaltarmos que: “[...] nem a regressão nem a correlação

podem mostrar que uma variável tenda a “causar” certos valores de outra variável.

(STEVENSON,1981, p. 342)

Cada um desses conceitos pressupõe o desenvolvimento de idéias e

processos estatísticos, podendo apresentar níveis de complexidade variados, que

justificam um investimento para investigar formas mais eficazes para seu ensino.

2.4 Ensino e aprendizagem de Correlação e Regressão

As pesquisas sobre o ensino e aprendizagem de correlação e regressão são

numerosas e, de modo geral, investigam o tema de um ponto de vista psicológico,

ou de um ponto de vista didático.

Um dos primeiros trabalhos desenvolvidos sobre o entendimento do conceito

de associação estatística foi feito por Inhelder e Piaget no ano de 19558. Eles

realizaram uma investigação com crianças de 12 a 13 anos, usando como referência

tabelas de contingência9 2 x 2, com o objetivo de analisar as habilidades dessas

crianças em diferenciar as correlações diretas, inversas e a independência. Os

autores analisaram as estratégias utilizadas pelas crianças ao lidarem com as

tabelas, concluindo que as dificuldades apresentadas, apesar da simplicidade das

tarefas propostas, explicavam-se a partir do estágio de desenvolvimento cognitivo.

Segundo Inhelder e Piaget, a idéia de correlação não é desenvolvida antes do

estágio de operações formais. A análise de tabelas de contingência tem a ver, por

exemplo, com o conceito de proporcionalidade, conceito complexo que tem

demandado estudos e pesquisas no ensino de matemática.

Sánchez Cobo, Estepa e Batanero (2000) fazem uma síntese ao se referirem

às pesquisas sobre correlação (associação), destacando vários trabalhos na área da

Psicologia que foram desenvolvidos por outros pesquisadores, tendo como foco

8 Versão consultada, Inhelder e Piaget (1976), referência no final. 9 Tabelas de contingência 2X2: Tabela de freqüência observada em que as linhas correspondem a uma variável de classificação e as colunas correspondem a outra variável de classificação;chamada também de tabela de dois critérios. Triola, 1999, p.388)

Page 40: CAPA DISSERTAÇÃO FINAL Mara Lucia

39

analisar a idéia de correlação (associação), usando a tabela de contingência 2x2

(SHAKLEE; TUCKER, 1980; CROCKER, 1981; BEYTH-MAROM, 1982)10. Outros

trabalhos foram desenvolvidos tendo como foco o estudo de como as teorias prévias

podem interferir no estudo de correlação (CHAPMAN; CHAPMAM,1969; JENNINGS;

AMABILE; ROSS, 1982; TROLIER; HAMILTON, 1986)11. Para esses autores quando

os dados do problema não coincidem com o que a pessoa espera, pode haver

conflitos cognitivos, que dificultam fazer as estimativas de correlação.

Não necessariamente, as pesquisas dentro da psicologia, abordam a

correlação a partir de tabelas de contingência. Há trabalhos que investigam a

capacidade de estimar a correlação a partir de diagramas de dispersão, ou de

conjuntos de pares de valores que evidenciam que, de modo geral, as pessoas só

identificam e são capazes de estimar correlações fortes.

As tabelas de contingência 2X2 são amplamente empregadas e os trabalhos

envolvendo juízos sobre a existência ou não de associação entre duas variáveis

podem ser classificados segundo o objetivo do estudo: 1) estratégias empregadas

para resolver o problema; 2) influência das teorias prévias; 3) exatidão dos

julgamentos de associação; 4) contexto de apresentação dos dados. Segundo

Estepa e Sanchéz Cobo (2001a), merecem destaque os trabalhos sobre a influência

das teorias prévias. Muitas vezes, a existência de uma correlação é fundamentada

apenas em nossas próprias teorias, sem evidências empíricas que as sustentem, o

que é conhecido como “correlação ilusória”. Por outro lado, pode ocorrer o fenômeno

denominado “ilusão de controle”, consistindo em uma expectativa de sucesso

pessoal que é avaliada inapropriadamente, como superior à probabilidade objetiva

de ocorrer sucesso. De acordo com os autores, os julgamentos sobre a existência

ou não de associação são influenciados por muitos fatores, como o formato dos

dados e o fato da correlação ser ou não forte. (ESTEPA; SANCHÉZ COBO, 2001a,

b).

Na Educação Matemática, em particular na Educação Estatística, as

investigações sobre correlação e regressão têm como foco principal o estudo das

concepções dos estudantes e das estratégias utilizadas quando resolvem problemas

de associação. As pesquisas identificaram junto a estudantes pré-universitários

10 Citados em Sánchez Cobo, Estepa e Batanero (2000).Ver referência no final. 11 Idem 3.

Page 41: CAPA DISSERTAÇÃO FINAL Mara Lucia

40

quatro tipos diferentes de concepções errôneas acerca da associação estatística:

determinística, unidirecional, local e causal. (ESTEPA, 2007)

Na concepção de alguns alunos, a associação é determinística: assim,

quando existe mais de um valor para a variável dependente, os alunos costumam

afirmar que as variáveis são independentes entre si.

Para alguns alunos, a associação é unidirecional e somente ocorre quando a

associação é positiva. Os alunos consideram como independentes as variáveis se a

associação é negativa.

Na concepção de alguns alunos, a associação é local; adotam uma parte dos

valores presentes em um conjunto de dados, para fazer a análise da associação, e

generalizam a conclusão de que existe associação para todo o conjunto de dados.

Alguns alunos só admitem a existência de relação causal entre variáveis. Se

tal relação não existe, as variáveis não se relacionam.

Durante a abordagem do tópico de correlação e regressão, percebe-se que

uma boa parte dos alunos tem dificuldades no entendimento desses conceitos,

apoiando-se muito no senso comum (as chamadas concepções espontâneas) e,

talvez, avançando pouco no conhecimento científico dos conceitos.

De modo geral, os livros buscam chamar a atenção do leitor para o fato de

que adotar uma concepção causal da correlação pode levar a conclusões sem

sentido e os autores costumam exemplificar isso. Barbetta, por exemplo, destaca:

É importante ressaltar que o conceito de correlação refere-se a uma associação numérica entre duas variáveis, não implicando necessariamente uma relação de causa e efeito, ou mesmo numa estrutura com interesses práticos (BARBETTA, 2001, p. 274).

Apesar da observação feita com ênfase nos livros didáticos, os estudantes

tendem a interpretar a correlação entre variáveis na tentativa de explicações de

causa e feito. O papel do professor é muito importante no sentido de alertar para

essa interpretação apressada e sem fundamentação, bem como para as demais

concepções, determinística, unidirecional, ou local, que restringem o conceito de

correlação.

No processo de ensino e aprendizagem de correlação e regressão, o aluno

precisa desenvolver um olhar mais reflexivo em relação às representações gráficas

que lhe são oferecidas, no sentido de que, ele mesmo possa examinar os dados e, a

Page 42: CAPA DISSERTAÇÃO FINAL Mara Lucia

41

partir deles fazer, por exemplo, análises em relação a tendências evidenciadas nas

“nuvens de pontos”.

Como professora, tenho observado que os alunos fazem a interlocução entre

as disciplinas estudadas por eles, antes da abordagem de correlação e regressão,

isto é, com as disciplinas que no caso especifico envolvem a representação gráfica

e, conseqüentemente, a leitura visual de dados. Uma interlocução maior com as

disciplinas de Cálculo e Cálculo Numérico poderia contribuir para que, aos poucos,

os alunos pudessem desenvolver um amadurecimento dos processos de leitura e

interpretação visual. Na realidade, a análise visual da existência ou não de

correlação e regressão entre duas ou mais variáveis, sejam elas lineares ou não-

lineares, envolve habilidade de abstração por parte dos alunos.

A falta de compreensão por parte dos alunos dos conceitos de correlação e

regressão pode ter como uma das causas, o fato de que às vezes os professores

não direcionam o ensino de forma a permitir uma abordagem do tema através de

exemplos, com uma maior ênfase nas representações gráficas. Durante o ensino de

correlação e regressão, na maioria das vezes enfatiza-se o lado puramente

matemático, isto é, utilizam-se com freqüência os algoritmos, sempre com o sentido

principal de calcular, comprometendo os aspectos interpretativos dos resultados.

Essa abordagem evidencia concepções de Matemática e de Estatística que

espelham uma visão tradicional do ensino-aprendizagem. A concepção de

Matemática que, aqui se adota, contrasta com a anterior e pode ser expressa

através das palavras de Estepa e Sánchez Cobo (2001a).

“[...] consideramos a Matemática como atividade de resolução de problemas, socialmente compartilhada, como sistema conceitual logicamente organizado e como linguagem simbólica” (ESTEPA; SÁNCHEZ COBO, 2001a, p.4).

De certa forma, essa abordagem pode não estar presente na formação básica

do aluno, de modo particular na forma, por exemplo, em que são apresentados os

conceitos estatísticos.

O trabalho aqui relatado é uma tentativa de possibilitar que alunos de um

curso de engenharia tenham experiências de, a partir de situações-problema

exploradas primeiro de modo intuitivo e visual, construirem os conceitos de

correlação e regressão, sem que o enfoque único seja o uso de fórmulas.

Page 43: CAPA DISSERTAÇÃO FINAL Mara Lucia

42

3 LEITURA E INTERPRETAÇÃO DE DADOS NO ENSINO E APRE NDIZAGEM DE

ESTATÍSTICA

As informações provenientes da mídia escrita ou televisiva sejam elas

relacionadas às esferas políticas, sociais, científicas, ou a outros campos de atuação

do homem, invadem constantemente o nosso dia-a-dia. Essas informações, na

maioria das vezes, disponibilizam dados estatísticos relativos a situações do

cotidiano da vida dos cidadãos.

Essa diversidade de informação geralmente acontece de forma rápida,

exigindo-se do usuário competência durante a leitura e a interpretação desses dados

informativos. Tais informações são apresentadas aos leitores, na maioria das vezes,

em forma de tabelas ou de gráficos, sendo que a análise e interpretação dos

mesmos demandam do leitor certa cautela, pois podem existir variáveis presentes

em tais informações que, de certa forma, induzem o leitor a aceitar a veracidade dos

fatos.

No campo acadêmico, mais especificamente, na área de ensino-

aprendizagem de Estatística, a riqueza das informações na forma de tabelas ou

gráficos deve ser explorada incentivando a leitura e a interpretação dos dados. Essa

leitura e interpretação de dados exigem do aluno senso crítico conhecimentos do

conteúdo estatístico e também conhecimentos prévios a respeito de tabelas e

gráficos.

Ao longo da História, desenvolveram-se técnicas e procedimentos variados de

análise estatística de dados. Segundo Batanero (2001), até o início do século XX, a

Estatística se restringia a análises exploratórias dos dados, limitadas a um estudo

descritivo dos dados. A partir do século XX, a Estatística começou utilizar métodos

da Inferência Estatística, tendo como referência os trabalhos desenvolvidos,

sobretudo por Fisher no período de 1920 a 1930, com a introdução do teste de

hipóteses (BATANERO, 2001).

Com os avanços teóricos dentro da própria Estatística, atingindo níveis mais

sofisticados, as análises e interpretações de dados estatísticos são cada vez mais

requisitadas e de forma minuciosa, em quase todas as áreas científicas. A

Inferência Estatística começou a trilhar uma fase de grande aplicação,

Page 44: CAPA DISSERTAÇÃO FINAL Mara Lucia

43

principalmente por fornecer sustentação à análise, à interpretação, à previsão, na

tomada de decisões sobre determinada situação, com determinado grau de

confiabilidade.

Durante muitos anos, conviveu-se, entretanto, com poucos recursos

tecnológicos para trabalhar com grandes massas de dados estatísticos, o que de

certa forma tornava o trabalho dos cálculos exaustivo para alunos e professores e

para todos que necessitavam de lançar mão de recursos da Estatística.

Atualmente, computadores cada vez mais potentes, além de refinados

softwares dão rapidez e confiabilidade aos cálculos que usam grandes volumes de

dados. Assim, contamos com vários softwares com aplicações em Estatística, como

por exemplo, SAS, SPSS, STATISTICA, S–PLUS e SIMSTAT, e planilhas, dentre as

quais se destacam as do EXCEL e BR-OFFICE. Esses recursos desempenham um

papel importante nas aplicações da Estatística Descritiva e na Inferência Estatística,

pois oferecem ao aluno funções que otimizam a confecção de vários tipos de

gráficos, permitindo um foco do ensino na leitura e interpretação de dados

estatísticos. Todo esse avanço tecnológico trouxe para a estatística e seu ensino um

novo enfoque, que prioriza o desenvolvimento do pensamento e da linguagem

visual, sustentado pelo pensamento inferencial.

Essa demanda de tratamento da informação, com novos processos e

ferramentas, influencia e leva a redirecionamentos curriculares, refletindo-se desde a

Escola Básica até Ensino Superior, fato a ser discutido na primeira seção desse

capítulo. A segunda seção tem como foco os níveis de leitura e interpretação de

dados, apresentando as categorias de Curcio (1997) que constituem o principal

referencial teórico da pesquisa desenvolvida. Finalmente, na terceira seção são

apresentados os resultados da análise de quatro livros didáticos, descrevendo-se a

abordagem dada ao tema correlação e regressão. Os exercícios relativos a esse

conteúdo são classificados de acordo com a ênfase dada aos mesmos,

considerando-se as categorias de Curcio acerca de leitura e interpretação de dados.

Page 45: CAPA DISSERTAÇÃO FINAL Mara Lucia

44

3.1 A análise e interpretação de dados: da Escola B ásica ao Ensino Superior

O volume de informações com o qual uma pessoa tem de lidar no mundo de

hoje exige uma formação adequada para tal. Torna-se imprescindível saber lidar

com uma massa de dados, organizando-os e resumindo de forma que possam ser

analisados e interpretados. Essa ênfase no tratamento da informação refletiu-se nas

orientações curriculares dos diversos países, que passaram a atribuir ao

desenvolvimento do raciocínio estatístico um papel de destaque.

Tomando por base, por exemplo, o National Council of Teachers of

Mathematics (NCTM), os princípios e diretrizes para o ensino (Standards for School

Mathematics) apontam quatro grandes competências a serem desenvolvidas desde

a pré-escola até a série final de escolaridade obrigatória:

• “Formular questões que podem estar relacionadas a dados, coletar,

organizar e dispor dados relevantes para respondê-las;

• Selecionar e usar métodos estatísticos apropriados para analisar dados;

• Desenvolver e avaliar inferências e predições baseadas em dados;

• Entender e aplicar conceitos básicos de probabilidade; (NATIONAL

COUNCIL OF TEACHERS OF MATHEMATICS, 2000, tradução nossa)12.

Dentre os vários blocos de conteúdos matemáticos recomendados para cada

série, o NCTM adotou como foco para o desenvolvimento profissional, durante os

anos de 2007 e 2008, os estudos de “Análise de dados e Probabilidade”, discutindo

acerca das diferentes formas de promover um maior entendimento sobre o tópico,

sua importância, bem como das maneiras de desenvolvê-lo ao longo das várias

séries. Segundo as orientações do NCTM a “Análise de dados e probabilidade” não

se resume a apenas mais um tópico a ser lecionado a cada ano, consistindo numa

maneira de lidar com a informação. A abordagem inicial é bastante simples, de

forma a ser acompanhada por crianças bem jovens. À medida que os estudantes

evoluem, as questões se tornam mais complexas, incentivando-os a trabalhar com

grandes populações, maneiras de descrever as tendências centrais, a dispersão dos

12 … formulate questions that can be addressed with data and collect, organize, and display relevant data to answer them; select and use appropriate methods to analyze data; develop and evaluate inferences and predictions that are based on data; understand and apply basic concepts of probability.

Page 46: CAPA DISSERTAÇÃO FINAL Mara Lucia

45

dados e várias formas de representação gráfica. Espera-se ainda que os estudantes

venham a lidar não apenas com um conjunto de dados, mas com mais de um

conjunto, estabelecendo comparações entre os mesmos, compreendendo que

diferentes amostras de uma mesma população variam, mas de forma a permitir que

se façam predições e inferências. Objetiva-se a longo prazo que os estudantes

sejam capazes de desenhar experimentos que os ajudem a responder questões,

além de avaliar conclusões feitas a partir de dados.

Da mesma forma, no Brasil (1998), os Parâmetros Curriculares Nacionais

advogam uma ênfase no desenvolvimento de uma série de competências para lidar

com as informações.

As orientações para o ensino de matemática desde as séries iniciais

destacam a importância da leitura com entendimento de informações, apresentadas

na forma de tabelas e gráficos. No caso específico da Estatística que tem as suas

orientações inclusas nos PCN’s de Matemática, há um bloco denominado

Tratamento da Informação.

No ensino fundamental, a criança deve ser estimulada a coletar dados que

fazem parte do seu do seu dia-a-dia e organizá-los, através de tabelas e gráficos e a

partir deles poder tirar informações. Um exemplo para tal situação seria a realização

de uma coleta de dados referente ao consumo de pães na parte da manhã, na casa

de cada criança, pertencente a uma determinada turma. As crianças a partir da

coleta desses dados poderiam apresentá-los, através de uma tabela e de um

gráfico, por exemplo, de colunas, e posteriormente buscar informações, usando o

gráfico construído e responder, sobre a quantidade de pães, consumido em cada

casa na parte da manhã. Outra maneira de explorar esta tabela e esse gráfico seria

destacar na casa de qual aluno tem-se o maior consumo de pães. Podem-se

explorar também, a partir desses dados, observando as freqüências, as primeiras

idéias de probabilidades.

O objetivo da introdução das idéias básicas de estatística, de acordo com os

PCN’s de 1a à 4a séries é motivar a criança a coletar dados, apresentá-los através

de tabelas e gráficos sejam eles de barras, colunas, pictóricos ou em outras formas

de representações. Motivar a criança a desenvolver o espírito investigativo, a

conjecturar e a redigir textos que expressam as suas interpretações a partir dos

dados manipulados por eles. A busca de informações, pela criança, através das

tabelas e gráficos, nesse momento é fundamental para seu desenvolvimento e

Page 47: CAPA DISSERTAÇÃO FINAL Mara Lucia

46

amadurecimento intelectual. Explorar algumas idéias elementares de probabilidades,

como o número de ocorrências de uma determinada situação, ou a exploração da

média aritmética é também fundamental.

As orientações relativas aos conteúdos de matemática da 5a à 8a séries

apresentam a mesma ênfase anterior. A partir dessa fase da escolaridade, já é

possível, também, explorar as idéias de média aritmética, moda, mediana, variância

e desvio padrão e o estudo da ocorrência do acaso, através do cálculo de

probabilidades. Nestas séries, os alunos já se apóiam em teorias matemáticas, que

dão sustentação para justificar qualquer afirmação dada por eles a respeito da

análise e interpretação de exercícios propostos.

No Ensino Médio, a apresentação dos dados coletados pelos alunos, pode

ser feita através de tabelas estatísticas, que exigem o conhecimento formal do

conteúdo estatístico para a sua confecção. As idéias exploradas nas séries

anteriores, de forma mais intuitiva, no Ensino Médio exigem uma maior formalização

de acordo com a linguagem estatística. O aluno pode inferir a partir de uma dada

situação, sempre levando em consideração a sustentação teórica, para as

inferências feitas. As representações gráficas agora são mais elaboradas e o uso de

softwares com funções estatísticas possibilita ao aluno o cálculo das medidas

estatísticas, como também a construção de vários tipos de gráficos estatísticos.

Neste momento, deve-se dar maior ênfase à análise e interpretação dos dados, pois

os valores obtidos para as medidas estatísticas, como também os gráficos não

dizem nada para o aluno, se não forem analisados e interpretados dentro de um

contexto. Os estudos de análise combinatória podem ser aprofundados, bem como o

cálculo de probabilidades.

Os Parâmetros Curriculares Nacionais para o Ensino Médio propõem

orientações complementares (BRASIL, 2000), incentivando que sejam trabalhados

os seguintes conteúdos estatísticos: descrição de dados; representações gráficas;

análise de dados; medidas de tendência central, as medidas de dispersão ou pode-

se dizer de variabilidade. O documento destaca a importância de que o aluno

desenvolva as competências de:

1. Identificar formas para descrever e representar dados numéricos e informações de natureza social, econômica, política, científico-tecnológica ou abstrata.

Page 48: CAPA DISSERTAÇÃO FINAL Mara Lucia

47

2. Ler e interpretar dados e informações de caráter estatístico, apresentados em diferentes linguagens e representações, na mídia ou em outros textos e meio de comunicação.

3. Obter médias e avaliar desvios de conjuntos de dados ou

informações de diferentes naturezas. 4. Compreender e emitir juízos sobre informações estatísticas de

natureza social, econômica, política ou científica, apresentadas em textos, notícias, propagandas, censos, pesquisas e outros meios. (BRASIL, 1998, p.127).

A partir do que foi exposto, pode-se dizer que no Brasil, a Escola Básica

explicita hoje uma ênfase no ensino de conteúdos da Estatística, a serem

trabalhados como parte do currículo de Matemática desde as séries iniciais.

Durante o processo de ensino-aprendizagem do conteúdo da Estatística, do

Ensino Fundamental ao Ensino Médio, a ênfase dada é a exploração gráfica e o

cálculo das medidas estatísticas descritivas. Os PCN’s também apontam as

vantagens do uso dos recursos tecnológicos, como calculadoras e computadores

nas escolas de Ensino Fundamental e Ensino Médio, mesmo cientes de que em

algumas escolas a presença de tais ferramentas é ainda muito incipiente. Essas

ferramentas apresentam, a cada momento, níveis mais altos de sofisticação. As

calculadoras, por exemplo, permitem construir gráficos e calcular medidas

estatísticas. Os computadores se expandiram e modernizaram, permitindo o uso de

softwares educacionais ou não educacionais, com funções estatísticas, acopladas e

facilmente manipuladas, tanto para o esboço de gráficos diferenciados, como para a

realização dos cálculos e medidas. Não se deve esquecer, entretanto, que o uso das

ferramentas tecnológicas apenas agiliza o cálculo das medidas estatísticas e

confecção de gráficos, mas o que realmente deve ser explorado são a análise e

interpretação dos dados.

Na Educação Superior, o ensino de Estatística teve seu berço em escolas de

engenharia, conforme destacado no Capítulo 2. Entretanto, é curioso notar que as

diretrizes curriculares para a engenharia, não explicitam a necessidade de uma

formação nessa área. A necessidade de estudos estatísticos pode ser apenas

inferida a partir, por exemplo, das competências e habilidades que os egressos do

curso devem ter adquirido, entre as quais: aplicar conhecimentos matemáticos,

científicos, tecnológicos e instrumentais à engenharia; projetar e conduzir

Page 49: CAPA DISSERTAÇÃO FINAL Mara Lucia

48

experimentos e interpretar resultados; avaliar criticamente a operação e a

manutenção de sistemas; comunicar-se eficientemente nas formas escrita, oral e

gráfica (BRASIL, 2001).

Em sua tese de doutorado, Ara (2006) analisa a ênfase a ser dada em um

primeiro curso de Estatística. Ele apresenta pontos destacados pela American

Statistical Association (ASA) e pela Mathematical Association of América (MAA).

Segundo Tom More, em notas divulgadas na MAA Online, já em 1992, George Cobb

articulou os princípios para a reforma do ensino de estatística, que integram as

orientações curriculares de hoje. Essas orientações citadas por Ara (2006), são

encontradas em Garfield et al (2002) e aqui resumidas:

• Mais dados e conceitos, menos receitas e repetições, buscando na

medida do possível a automatização dos cálculos, usando pacotes

estatísticos modernos.

• Enfatizar o pensamento estatístico: a importância na obtenção dos

dados, de preferência reais, a onipresença da variabilidade e sua

medida e modelagem.

• Visar a uma aprendizagem ativa, que incentiva o desenvolvimento de

projetos, o trabalho em grupo, apresentações orais e escritas.

Garfield e colaboradores (2002) colocam:

Pensamos que a pesquisa pode encorajar a investigação de como ajudar os estudantes a desenvolverem o pensamento estatístico e como verificar se os estudantes têm ou não essa habilidade. Uma possibilidade é encorajar os professores de estatística a conduzirem pesquisas de alta qualidade em sala de aula, usando seus próprios alunos e classes. (tradução nossa)13

O trabalho aqui relatado foi desenvolvido pela pesquisadora em sua própria

sala de aula, pautando-se nas recomendações de Garfield et al. (2002), tendo por

meta possibilitar aos alunos vivenciarem experiências estatísticas coletivas, com um

foco na leitura e interpretação de dados, a partir de uma abordagem intuitiva dos

conceitos de correlação e regressão.

13 We think that research should be encouraged to investigate how to help students develop statistical thinking, and how to assess whether or not students have this ability. One possibility is to encourage statistics instructors to conduct high quality classroom research using their own students an classes.

Page 50: CAPA DISSERTAÇÃO FINAL Mara Lucia

49

3.2 Níveis de compreensão e interpretação de dados

A leitura e a interpretação de dados têm sido o foco de várias pesquisas,

entre as quais destacam-se os trabalhos de Curcio (1987, 1996) e de Friel Curcio e

Bright (1991). Curcio investigou os níveis de compreensão e interpretação de

gráficos, apontando as habilidades exigidas, de acordo com as seguintes categorias:

ler os dados; ler dentro dos dados; ler além dos dados14.

A categoria ler os dados consiste numa leitura dos dados na forma em que

são apresentados no gráfico. Demanda, essencialmente, a habilidade de localizar

valores, sem realizar interpretações acerca do dado disponível.

Ler dentro dos dados consiste na leitura feita a partir dos dados

apresentados, envolvendo destrezas de ordem quantitativa e conhecimentos

adquiridos anteriormente. As operações matemáticas elementares podem ser de

grande utilidade neste tipo de leitura, que requer habilidades de leitura integrada e

comparativa dos dados.

Ler além dos dados é uma leitura que envolve inferência, isto é, demanda que

previsões sejam feitas. As informações relativas às previsões não estão visíveis no

gráfico. Este tipo de leitura demanda, normalmente, do leitor, um conhecimento

teórico mais refinado.

A exemplificação a seguir busca tornar mais claras as categorias de Curcio,

uma vez que elas serão fundamentais no desenvolvimento de todo o trabalho.

Como primeiro exemplo, consideremos a situação:

Suponha que uma Microempresa X apresentou no ano de 2006, a quantidade de

arruelas produzidas nos seguintes meses: março, abril, maio e junho.

14 Batanero (2001) atribui a Curcio uma quarta categoria denominada ler por detrás dos dados, consistindo numa avaliação do contexto em que os dados foram coletados. Segundo Watson e Moriitz (2001) essa categoria teria sido proposta por Shaughnessy, Garfield e Greer. Essa quarta categoria não foi explorada, considerando-se que análises da validade e completude dos dados não foram objeto do trabalho desenvolvido.

Page 51: CAPA DISSERTAÇÃO FINAL Mara Lucia

50

Meses (X)

Quantidade de arruelas (Y)

junhomaioabrilmarço

300

250

200

150

100

50

0

294

254264

224

Gráfico 6: Produção mensal de arruelas no período d e março a junho

Fonte: Microempresa X

As seguintes questões poderiam ser postas, a partir do Gráfico 6:

1) Qual a quantidade de arruelas produzidas no mês de abril? Uma pergunta deste tipo refere-se a ler os dados, isto é, conhecendo o eixo das abscissas (x), é possível responder imediatamente à pergunta, apenas observando o eixo das ordenadas (y).

2) Determine a quantidade total de arruelas produzidas nos meses de

março e junho. Este tipo de leitura envolve conhecimento das operações matemáticas elementares, logo exige a habilidade de ler dentro dos dados.

3) Observando o Gráfico 6, qual seria a quantidade de arruelas produzidas no mês de julho? O aluno pode a partir da análise visual dos valores correspondentes a cada coluna, inferir a respeito da possível quantidade de arruelas a serem produzidas no mês julho, levando-se em consideração os meses de março, abril, maio e junho. Este tipo de questão pressupõe ler além dos dados, pois exige do leitor inferir a respeito de uma situação que não está presente no Gráfico 6.

Sendo correlação e regressão o foco desta dissertação, será dado um exemplo abordando tal conteúdo, de forma a compreender a classificação de tarefas de acordo com as categorias de Curcio.

Page 52: CAPA DISSERTAÇÃO FINAL Mara Lucia

51

Suponhamos que seja proposta uma segunda situação:

As notas de Matemática e de Estatística de determinada turma de uma Escola

foram levantadas e apresentadas na forma do gráfico seguinte:

Notas de Matemática (X)

Notas de Estatística (Y)

98765432

9

8

7

6

5

4

9

8

7

66

5

44

Gráfico 7– Notas de Estatística e Matemática da Tur ma 1 - 2004

Fonte: Secretaria da Escola A - Belo Horizonte - (Dados fictícios). Uma questão a se propor poderia ser:

a) Qual o valor da nota de Estatística do aluno que obteve 3 pontos em

Matemática?

A questão expressa claramente a intenção de se verificar se o aluno é

capaz de ler os dados. O aluno faz a leitura do gráfico identificando a

informação solicitada, a nota de estatística, (localizada no eixo vertical), a

partir do conhecimento da nota de matemática (localizada no eixo

horizontal) e utilizando seus conhecimentos acerca de localização de

pontos no sistema cartesiano.

Outra pergunta poderia exigir um segundo nível de leitura gráfica:

b) Observando a distribuição de pontos, você consegue perceber alguma

tendência ou padrão?

A questão permite ao aluno ler dentro dos dados, isto é, verificar se a

Page 53: CAPA DISSERTAÇÃO FINAL Mara Lucia

52

distribuição de pontos, ou seja, a nuvem de pontos dada pode ser ajustada

a uma função, ou ainda, se os dados evidenciam uma tendência e também

se a relação que existe entre as variáveis, no caso as notas é direta

(crescente) ou inversa (decrescente).

Finalmente, o nível de leitura ler além dos dados pode ser explorado ao se

perguntar:

c) Determine a curva que melhor se ajuste à distribuição de pontos

apresentada e, a partir dela, responda qual o valor da nota esperada de

Estatística para o aluno que obteve 10 pontos em Matemática.

O aluno é convidado a inferir sobre a situação proposta, recorrendo a

conhecimentos adquiridos por ele anteriormente. No caso, é de se esperar que

o aluno obtenha a curva de regressão e faça a estimativa a partir da mesma.

As categorias de Curcio, embora desenvolvidas para análise e compreensão

de gráficos, podem ser adequadas também à análise de dados, apresentados

através de outras formas, de modo particular, através de tabelas.

Suponhamos que seja dada a Tabela 5 correspondente ao Gráfico 6

anteriormente apresentado.

Tabela 5: Produção mensal de arruelas no período de março a junho - 2006

Meses Quantidade de arruelas Março 224 Abril 264 Maio 254 Junho 294

Fonte: Microempresa X- Belo Horizonte - (Dados fict ícios).

O aluno, ao observar a Tabela 5, pode determinar a quantidade de arruelas

produzidas em qualquer um dos quatro meses presentes na tabela. Esse tipo de

leitura realizada a partir dos elementos explícitos na tabela pode ser classificado em

uma das categorias de Curcio que se refere em ler os dados.

Outra categoria de Curcio que pode ser explorada usando a Tabela 5 é ler

dentro dos dados, isto é, se o aluno for convidado a informar a produção média de

arruelas produzidas pela Microempresa X. Nesse caso, o aluno terá que utilizar o

seu conhecimento matemático elementar.

Page 54: CAPA DISSERTAÇÃO FINAL Mara Lucia

53

A categoria de Curcio ler além dos dados pode ser abordada pelo aluno

quando ele inferir, por exemplo, fazendo uma previsão para uma possível produção

para a quantidade de arruelas produzidas no mês de junho. O aluno terá que

observar os valores e para o exemplo dado ele poderá observar que do mês de

março a abril ocorreu um aumento de 20 unidades na produção de arruelas, do mês

de abril a maio houve uma queda de 10 unidades na produção de arruelas e que do

mês de maio a junho ocorreu um acréscimo de 40 unidades na produção. Essas

variações ocorridas nos 4 meses podem possibilitar o aluno inferir a respeito do mês

ausente na tabela.

Suponhamos que seja dada a Tabela 6, correspondente ao gráfico 7 com as

notas de Matemática e Estatística de alunos de determinada escola.

Tabela 6: Notas de Matemática e Estatística – Turma 1 - Escola A - 2004

Notas

Matemática Estatística

2 4

3 4

4 5

5 6

6 6

7 7

8 8

9 9

Fonte: Secretaria da Escola A - 2004 - B elo Horizonte - (Dados fictícios).

Pode-se solicitar que seja determinada a nota de Estatística do aluno que

obteve 4 pontos em Matemática, procedimento que exige entender a forma de

disposição dos dados na tabela 6 para ler os dados. No caso, isso significa localizar

na primeira coluna a nota 4, situada na terceira linha e ler na segunda coluna, na

mesma linha, a nota correspondente de Estatística. Embora essa habilidade seja

considerada elementar, é por vezes novidade para alunos mais jovens, não

habituados a lidar com esse tipo de representação de dados através de tabelas.

A categoria de Curcio ler dentro dos dados pode ser explorada, quando se

pergunta ao aluno, por exemplo: qual a variação das notas de Matemática? As

melhores notas são de Matemática ou de Estatística?

Page 55: CAPA DISSERTAÇÃO FINAL Mara Lucia

54

O aluno nesse momento faz a leitura dentro dos dados, comparando dados e

realizando operações matemáticas elementares, para responder à questão.

A categoria ler além dos dados pode ser explorada, usando a Tabela 6,

quando o aluno é convidado, por exemplo, a inferir a respeito da nota de Estatística

de um aluno que obteve 10 pontos em Matemática.

O aluno pode inferir a respeito da possível nota de Estatística tendo

conhecimento das variações presentes na segunda coluna da Tabela 6, que

corresponde às notas de Estatística, ou se ele tem conhecimento em determinar a

equação da reta que melhor descreve o conjunto de dados, referentes às notas de

Matemática e Estatística.

As atividades propostas de certa forma podem ser classificadas como

elementares. No entanto, a simples habilidade de ler os dados dispostos em uma

tabela, decorre de um processo de codificação e decodificação de informações, de

um entendimento acerca da disposição tabular. Da mesma forma, a localização de

dados em um gráfico.

De modo geral, as principais dificuldades apresentadas pelos alunos com

relação à leitura de gráficos e tabelas são relacionadas com os dois níveis de

compreensão: ler dentro dos dados e principalmente ler além dos dados. Na

realidade, esses dois níveis demandam o desenvolvimento de habilidades mais

complexas de comparar, operar com os dados e inferir a partir dos dados fornecidos.

Curcio (1987) desenvolveu um trabalho com alunos da 4a e 7a séries 15

indagando acerca da influência na compreensão das relações matemáticas

expressas nos gráficos de fatores como: conhecimentos prévios do aluno acerca do

tema a que se refere o gráfico; conhecimentos prévios do conteúdo matemático do

gráfico, ou seja, dos conceitos numéricos, relações e operações envolvidos;

conhecimentos prévios dos diversos tipos e formas de gráficos; sexo; desempenho

matemático e de leitura. Os resultados apontaram que todas as variáveis, exceto

sexo, são bons préditores da compreensão gráfica de alunos das duas séries

pesquisadas. Como esperado parece haver diferenças de performance dos dois

grupos de alunos, tendo em vista a idade: alunos da 7a série de modo geral

apresentam maiores conhecimentos prévios sobre gráficos e suas formas.

15 A 4a e 7a séries nos Estados Unidos, correspondem ao 2º e 4º ciclos do Ensino Fundamental no Brasil, compreendendo 9 anos de escolaridade.

Page 56: CAPA DISSERTAÇÃO FINAL Mara Lucia

55

Em particular, interessam nesse estudo os resultados de Curcio (1987) que

destacam a importância dos conhecimentos prévios do aluno acerca do tema a que

se refere o gráfico, do conteúdo matemático do gráfico e dos diversos tipos de

gráficos. Educar, estatisticamente, para a leitura e interpretação de dados demanda

esforços no sentido de conhecer e monitorar as dificuldades evidenciadas pelos

estudantes.

Batanero e colaboradores (1994) ao estudarem os erros e dificuldades na

compreensão de conceitos elementares da estatística situam a investigação dentro

do contexto da didática de ensino da estatística, destacando a importância de

conhecimentos prévios, apoiando-se na teoria de aprendizagem significativa

de Ausubel e na teoria dos obstáculos epistemológicos de Brousseau.

As dificuldades de leitura e interpretação de dados podem ser entendidas e

interpretadas a partir dos obstáculos cognitivos de Brousseau discutidos por Igliori

(1999).

A noção de obstáculo epistemológico foi introduzida na Educação Matemática

por Brousseau, que se inspirou nas idéias de Bachelard.16

Para Brousseau um obstáculo epistemológico é “ligado á resistência de um

saber mal-adaptado, no sentido de Bachelard” (IGLIORI, 1999, p.99) e considerado

como uma possibilidade para interpretação de erros cometidos pelos estudantes no

entendimento de determinado tópico em matemática.

Igliori (1999) destaca os três tipos de obstáculos, que segundo Brousseau

podem ser de natureza ontogenética, didática ou ainda epistemológica. Obstáculos

ontogênicos relacionam-se a limitações neurofisiológicas do sujeito, quando do seu

desenvolvimento; obstáculos didáticos dependem das escolhas de situações

educativas; obstáculos epistemológicos são aqueles constitutivos do conhecimento

pretendido.

O entendimento do conceito de obstáculos demanda um estudo aprofundado.

A literatura aponta vários exemplos, no sentido de tornar mais claro o conceito,

como por exemplo, em Igliori (1999) e em Batanero et al. (1994).

Na leitura e interpretação de dados, os alunos apresentam dificuldades que

podem ser classificadas como obstáculos ontogênicos, relacionados ao

16 Bachelard foi um filósofo francês, que em 1938 escreveu o livro “A formação do espírito científico”, onde o conceito de obstáculo epistemológico aparece pela primeira vez, relacionado ao conhecimento científico, instalando-se a partir de um conhecimento não questionado.

Page 57: CAPA DISSERTAÇÃO FINAL Mara Lucia

56

desenvolvimento cognitivo dos estudantes. Assim, os estudantes podem apresentar

dificuldades de entendimento das formas de apresentação de dados, pelo fato de

ainda não terem desenvolvido estruturas de abstração e representação de

informações na forma de gráficos ou tabelas. Podem, por exemplo, não ter

compreendido a representação cartesiana de pontos, o que dificultaria o

entendimento de um gráfico de dispersão.

Há outro conjunto de dificuldades que podem estar relacionadas com as

escolhas didáticas dos professores ao proporem as situações de ensino. A

antecipação de símbolos e formas, por exemplo, para o cálculo da reta de

regressão, sem uma paralela abordagem conceitual e visual pode comprometer o

entendimento, ou ainda a apresentação de dados totalmente fora do contexto

cultural dos alunos. É comentado o fato de que muitos dos cursos de Estatística são

desenvolvidos a partir de tabelas e gráficos relativos a temas que não são de

interesse dos alunos, e esses não consideram importante se esforçar por entendê-

los. Mesmo livros indicados para um determinado curso, não necessariamente

apresentam exercícios com dados relativos à área do curso. Cabe ao professor

selecionar os exercícios mais adequados.

Finalmente, um conjunto de dificuldades na leitura e interpretação de dados

pode estar ligado a obstáculos epistemológicos, por exemplo, da construção do

conceito de associação entre variáveis, preso à idéia de uma relação causal.

De maneira especial, os obstáculos didáticos são de interesse nessa

pesquisa, que objetiva apresentar uma proposta de abordagem introdutória aos

estudos de correlação e regressão em cursos de engenharia. A análise de como o

tema é abordado em alguns textos didáticos é feita a seguir, dentro da perspectiva

de que o livro didático é uma escolha educativa, gera uma situação didática que

pode facilitar ou dificultar o entendimento conceitual de determinado conteúdo pelo

aluno.

Page 58: CAPA DISSERTAÇÃO FINAL Mara Lucia

57

3.3 Correlação e regressão em textos didáticos: uma análise a partir dos níveis

de leitura e interpretação de dados

Em sua tese de doutorado, Ara (2006) analisou alguns dos principais textos

didáticos de Estatística, adotados em cursos de engenharia, constatando a

predominância de uma concepção determinística da realidade, onde se priorizam o

aspecto matemático e as técnicas, em detrimento de uma abordagem conceitual

para entendimento da realidade.

No presente trabalho, foram analisados quatro livros que discorrem sobre o

tema Correlação e Regressão, sendo dois deles específicos da área de engenharia.

O tema foi analisado em cada livro com o objetivo de verificar em que medida

a forma de apresentação do mesmo favorece o desenvolvimento das habilidades de

leitura e interpretação de dados, adotando-se para tal análise os níveis de Curcio

(1987), anteriormente discutidos: 1) ler os dados; 2) ler dentro dos dados; 3) ler além

dos dados.

A análise foi desenvolvida em duas etapas. A primeira etapa consistiu na

análise da exposição teórica sobre Correlação e Regressão (em especial a Linear)

feita pelos autores, ou seja, da forma e foco adotados na apresentação dos

principais conceitos e propriedades e a exemplificação feita (exercícios resolvidos).

A segunda etapa compreendeu a análise dos exercícios propostos nas várias

seções dos livros que abordam o tema correlação e regressão. Cada exercício

proposto foi analisado, objetivando-se identificar a ênfase do mesmo, a partir dos

níveis de leitura de dados de Curcio. Os quadros de classificação dos exercícios são

apresentados no Apêndice A.

Convém ressaltar que, a rigor, para resolver qualquer exercício pressupõe-se

uma leitura de dados. Quando nesse trabalho o exercício foi classificado como não

tendo ênfase na leitura de dados, é porque essa categoria possui uma conotação

diferente na visão de Curcio; as questões propostas não demandavam as

habilidades, por exemplo, de localizar o valor de uma variável, conhecendo a outra.

Para tornar mais claro o procedimento adotado na categorização dos

exercícios, ilustramos a classificação a partir de um exercício extraído de um dos

livros analisados (MONTEGOMERY; RUNGER, 2003, Livro 1, p.210, 10.9).

Page 59: CAPA DISSERTAÇÃO FINAL Mara Lucia

58

Um artigo no Journal of Sound and Vibration (Vol.151, 1991, pp.383-394)

descreveu um estudo investigativo da relação entre exposição ao barulho e

hipertensão. Os seguintes dados são representativos daqueles reportados no artigo.

Tabela 7: Aumento da Pressão Sanguínea e Nível de P ressão Sonora

Aumento da Pressão Sanguínea (mmHg)

Nível de Pressão Sonora (dB)

1 60 0 63 1 65 2 70 5 70 1 70 4 80 6 80 2 80 3 80 5 85 4 89 6 90 8 90 4 90 5 90 7 94 9 100 7 100 6 100

Fonte: Livro 1, p.210, 10.9 Desenhe um diagrama de dispersão de Y (aumento da pressão sangüínea) versus X

(nível da pressão sonora). Parece razoável propor um modelo de regressão linear

simples para essa situação?

(a) Ajuste o modelo de regressão linear simples usando o método dos mínimos

quadrados.

(b) Encontre o aumento médio previsto para a pressão sangüínea, associado

ao nível de pressão sonora de 85 dB.

O exercício contém as duas categorias de Curcio, isto é, ler dentro dos dados

e ler além dos dados.

A seguir procede-se à análise de cada um dos quatro livros:

Livro 1: Estatística aplicada e probabilidade para engenheiros

Autores: Douglas MONTEGOMERY e George C. Runger

Editora: LTC – Livros Técnicos e Científicos

Ano: 2003.

Page 60: CAPA DISSERTAÇÃO FINAL Mara Lucia

59

O livro analisado é adotado na instituição onde ocorreu a pesquisa, em todos

os cursos de engenharia. Mesmo havendo edição mais recente do livro, foi feita a

análise da segunda edição, por ser ela utilizada pelos alunos nos cursos de

engenharia: Mecânica, Eletrônica, Mecatrônica, Controle e Automação e Civil.

O livro consta de 14 capítulos, apêndices e índice. Dos 14 capítulos teóricos

que totalizam 386 páginas, o capítulo 10 aborda Regressão Linear e Correlação em

25 páginas, que correspondem a 6,48% do total de páginas de desenvolvimento

teórico.

Os autores iniciam o capítulo fazendo uma abordagem da análise de

regressão através de um exemplo, que envolve pureza do oxigênio (y) produzido em

um processo químico e a porcentagem de hidrocarbonetos (x) que estão em um

condensador principal da unidade de destilação.

Inicialmente, os autores usam o diagrama de dispersão para mostrar como

os pares ordenados se distribuem no sistema cartesiano. A disposição dos pares

ordenados no sistema cartesiano permite aos alunos usarem suas habilidades

intuitivas no sentido de reconhecer uma tendência, ou melhor, imaginar qual curva

que melhor se ajustaria aos dados e como realizar futuras previsões.

Percebe-se que esse tipo de abordagem gráfica envolve as categorias de

Curcio, que são: ler os dados, quando o aluno observa os pares ordenados no

diagrama de dispersão; ler dentro dos dados, quando o aluno percebe uma

tendência ao examinar os dados e ler além dos dados, quando o aluno associa a

tendência identificada através dos dados com equações de curvas conhecidas por

eles, que possibilitam fazer previsão.

Após a exploração de regressão, através do diagrama de dispersão, os

autores formalizam o conceito de regressão linear, apresentando o método dos

mínimos quadrados e deduzindo os valores dos coeficientes da reta de regressão

através do uso de noções do Cálculo Diferencial, em particular das derivadas

parciais. Esse método possibilita determinar os interceptos da melhor reta que se

ajusta aos dados no diagrama de dispersão. Os autores usam o mesmo exemplo

comentado anteriormente para determinar a equação da reta que melhor se ajusta

aos dados e fazem a representação desta reta no diagrama de dispersão.

No capítulo, os autores exploram as propriedades dos estimadores dos

mínimos quadrados, isto é, os coeficientes de regressão da reta que melhor se

ajusta aos dados e fazem a estimação da variância populacional.

Page 61: CAPA DISSERTAÇÃO FINAL Mara Lucia

60

Percebe-se por parte dos autores certa preocupação com os exageros

cometidos pelos alunos com relação ao uso de regressão, fato que leva os autores a

alertarem para o fato de que os alunos devem ter cautela ao detectar a associação

entre duas variáveis. Mesmo existindo uma forte relação entre as variáveis, isso não

implica relação de causa e efeito, isto é, pode existir uma terceira variável oculta que

influencia todo processo. Os autores introduzem testes de hipóteses para os

coeficientes de regressão, como um instrumento para verificar se o modelo de curva

de ajuste aos dados é adequado. No caso específico de regressão linear, se a

inclinação for igual a zero, isto significa que não existe relação entre as variáveis.

O capítulo também aborda intervalos de confiança, que servem para calcular

os limites de confiança para os coeficientes de regressão, procedimento também útil

para investigar a adequação do modelo de regressão. Os autores fazem uma

abordagem do intervalo de confiança para a resposta média, que é uma maneira de

inferir a respeito do parâmetro média populacional quando se desconhece o seu

valor. Um intervalo determinado dessa forma parte da suposição de que a média da

variável aleatória Y tenha relação com X de acordo uma equação linear.

Os autores também usam o coeficiente de determinação, R² para verificar

qual o ajuste de reta de regressão, ou melhor, quanto da variabilidade dos dados

observados da variável dependente (y) é apreendido pela equação de regressão.

Em seguida, os autores exemplificam um ajuste de modelo linear, feito

indevidamente, quando os dados não mostram uma tendência linear no diagrama de

dispersão.

A abordagem de correlação é feita ao final do capítulo 10. Sem exploração

do conteúdo, através de diagramas de dispersão, exploram-se testes de hipótese e

intervalos de confiança para a correlação linear, somente em função de fórmulas. Os

autores ao explorarem regressão linear e correlação linear fazem uma exposição de

cunho matemático, não se preocupando em explorar um raciocínio mais intuitivo;

poucos gráficos são apresentados no estudo da correlação.

Conforme exposto anteriormente, os vários exercícios do livro foram

classificados de acordo com a ênfase em cada uma das categorias de Curcio.

O Gráfico 8 apresenta a síntese da classificação feita de acordo com as

categorias de Curcio. (Quadro 1, Apêndice A).

Page 62: CAPA DISSERTAÇÃO FINAL Mara Lucia

61

Número de exercicíos (Y)

Categorias (X)

C2

Ler além dos dadosLer dentro dos dadosLer dados

NãoSimNãoSimNãoSim

80

70

60

50

40

30

20

10

0

2

75

2

75

64

13

Gráfico 8: Níveis de leitura e interpretação de dad os nos exercícios do Livro 1

Fonte: Quadro 1 – Apêndice A . De acordo com o Gráfico 8, conclui-se que, entre todos os exercícios do livro

que abordam correlação e regressão, as categorias de Curcio mais presentes são:

ler dentro dos dados e ler além dos dados. Para essas duas categorias, o número de

“Sim” é elevado comparativamente à categoria ler os dados.

Livro 2: ESTATÍSTICA: para os cursos de engenharia e informá tica

Autores: Pedro Alberto BARBETTA; Marcelo Menezes REIS; Antônio Cezar

BORNIA

Editora: Editora Atlas S.A

Ano: 2004

O livro 2 não foi adotado em nenhum semestre nos cursos de engenharia da

instituição. A edição é a única que explora o conteúdo estatístico direcionado para a

área de engenharia, tendo sido, por esse motivo, escolhido pela pesquisadora

O livro consta de 11 capítulos, anexo, respostas de exercícios, apêndices e

bibliografia. Dos 11 capítulos teóricos que totalizam 351 páginas, o capítulo 11

aborda Correlação e Regressão em 30 páginas, que correspondem a 8,55% do total

de páginas de desenvolvimento teórico.

Page 63: CAPA DISSERTAÇÃO FINAL Mara Lucia

62

Os autores iniciam o capítulo, explorando Correlação através de três

diagramas de dispersão, referentes a um exemplo de queima de massa cerâmica

para pavimentação, de 18 corpos de prova que foram analisados usando três

variáveis: X1 = retração linear (%), X2 = resistência mecânica (MPa) e X3 =

absorção de água (%). Em seguida, exploram o cálculo do coeficiente de correlação

de Pearson.

Eles iniciam Regressão linear usando um exemplo que se refere ao Índice de

octanagem (Y) e quantidade de aditivo (%) (X), mostrando através do diagrama de

dispersão a tendência dos pares ordenados.

Os autores utilizam o método dos mínimos quadrados para determinar as

fórmulas que permitem o cálculo dos parâmetros da reta que melhor se ajusta aos

dados representados no diagrama de dispersão. Neste capítulo, são tratados

assuntos como: análise do modelo, teste de hipótese para a declividade da reta,

análise de resíduos, transformação logarítmica e intervalos de confiança.

O Gráfico 9 apresenta a síntese da classificação dos exercícios feita de

acordo com as categorias de Curcio. (Quadro 2, Apêndice A).

Número de exercícios (Y)

Categorias (X)

C7

Ler além dos dadosLer dentro dos dadosLer dados

NãoSimNãoSimNãoSim

9

8

7

6

5

4

3

2

1

0

2

8

1

99

1

Gráfico 9: Níveis de leitura e interpretação de dad os nos exercícios do Livro 2

Fonte: Quadro 2 – Apêndice A

Page 64: CAPA DISSERTAÇÃO FINAL Mara Lucia

63

De acordo com os valores apresentados no Gráfico 9, o número de exercícios que

corresponde à maior quantidade de “Sim” é relativo à categoria ler dentro dos dados.

Livro 3: Noções de Probabilidade e Estatística

Autores: Marcos Nascimento Magalhães; Antônio Carlos Pedroso Editora:

Editora da Universidade de São Paulo, edição 6.

Ano: 2007

O livro foi escolhido por ser adotado em outra instituição de ensino, em Belo

Horizonte, em um Curso de Engenharia de Produção.

O livro consta de 9 capítulos, bibliografia e índice remissivo. Os capítulos

teóricos totalizam 352 páginas, sendo que os autores introduzem Associação no

capítulo 5, em 30 páginas, o que corresponde a 8,53% das 352 páginas.

Os autores introduzem a associação entre variáveis, usando como exemplo,

notas de inglês e português de 15 alunos, do primeiro ano do Ensino Médio,

considerando os alunos que obtiveram nota superior a 7 pontos. Os autores

inicialmente usam o diagrama de dispersão para explorar associação entre duas

variáveis. Em seguida, abordam probabilidade condicional para variável aleatória

discreta e independência de variáveis aleatórias, para trabalhar a dependência linear

quando o conjunto de dados é grande e tem poucas variações entre essas

observações, acarretando com isso algumas dificuldades para se fazer a análise dos

pares ordenados no diagrama de dispersão. Neste capítulo, os autores definem

coeficiente de correlação de Pearson e apresentam a fórmula que permite calcular

esse coeficiente. Eles dão continuidade ao estudo de variáveis aleatórias discretas

através de propriedades, isto é, provando e exemplificando cada uma delas. Tais

propriedades permitem esclarecer se existe ou não dependência entre duas

variáveis. O capítulo 5 explora o cálculo de correlação entre variáveis através da

covariância. A covariância mostra o tipo de relacionamento entre duas variáveis, isto

é, se elas caminham no mesmo sentido, ou se elas caminham em sentido contrário,

mas não define o grau de intensidade desse relacionamento. Se, por exemplo, o

valor que representa a covariância for positivo, isso indica que, para as variáveis X e

Y, quando X cresce Y também cresce, logo as variáveis caminham no mesmo

sentido.

Os autores no capítulo 9, Tópicos Especiais, no item 9.5, abordam Regressão

Linear, em 9 páginas o que corresponde a 2,56% das 352 páginas.

Page 65: CAPA DISSERTAÇÃO FINAL Mara Lucia

64

No item 9.5, os autores dão um exemplo para a aplicação de Regressão

Linear, usando dados que se referem à criação de gado. Para o exemplo, foram

utilizados 15 bois, da mesma raça e mesma idade, provenientes da região Bocaina –

São Paulo. Cada boi recebeu certa quantidade de substância(X) (em mg/l) e após 30

dias, foi observado o ganho de peso (Y) de cada boi (em Kg). O diagrama de

dispersão, construído a partir desses dados mostra que valores baixos de

substância (X) se associam a valores baixos de ganho de peso (Y) e valores altos de

substância (X) se associam a valores altos de ganho de peso (Y), mostrando assim

uma tendência a partir dos pares ordenados no diagrama de dispersão. É sugerido

um ajuste de reta que passe o mais próximo possível dos pares ordenados e para

isso usam o método dos mínimos quadrados para determinar os parâmetros desta

reta. Em seguida, eles determinam a equação da reta de regressão e representam a

mesma no diagrama de dispersão. Os autores fazem a interpretação dos parâmetros

e abordam teste de hipóteses, para verificar se a quantidade de substância (X) tem

influência sobre o ganho de peso (Y).

O Gráfico 10 apresenta a síntese da classificação dos exercícios do livro feita

de acordo com as categorias de Curcio. (Quadro 3, Apêndice A).

Número de exercícios (Y)

Categorias (X)

C11

Ler além dos dadosLer dentro dos dadosLer dados

NãoSimNãoSimNãoSim

20

15

10

5

0

15

3

0

18

17

1

Gráfico 10: Níveis de leitura e interpretação de da dos nos exercícios do Livro 3 Fonte: Quadro 3 – Apêndice A

Page 66: CAPA DISSERTAÇÃO FINAL Mara Lucia

65

Semelhantemente ao Livro 2, percebe-se que a categoria mais explorada nos

exercícios é ler dentro dos dados.

Livro 4: Encontro com o acaso – um primeiro curso d e análise de

dados e inferência

Autores: Christoper J. Wild; George A.F.

Editora: LTC – Livros Técnicos e Científicos

Ano: 2000

O livro foi selecionado pela forma de abordagem do tema, isto é, em dois

capítulos, sendo que no capítulo 3, os autores tratam o assunto de maneira intuitiva

e, no capítulo 12, de maneira formal. Os dois capítulos se completam com ênfase na

leitura e interpretação de dados estatísticos, foco do trabalho aqui apresentado.

O livro consta de 14 capítulos e apêndices. Dos 14 capítulos teóricos que

totalizam 377 páginas, o capítulo 3, Ferramentas Exploratórias de Relação, discorre

o assunto em 25 páginas que correspondem a 6,63% do total de páginas de

desenvolvimento teórico, sendo que 11 páginas abordam teoricamente o foco da

pesquisa, o que corresponde a 2,98% de teoria a respeito da exploração da análise

de variáveis quantitativas.

Os autores iniciam o capítulo oferecendo uma visão geral, isto é, o que será

abordado em cada seção. Eles iniciam a exploração de relação entre duas variáveis

citando como exemplo uma tabela já utilizada no capítulo 2, que contém informações

de um grupo de homens que foram atendidos no Hospital Greenlane em Auckland,

após sofrerem ataque cardíaco. As duas variáveis envolvidas para explorar o

diagrama de dispersão são: Volsis17 e Voldia18. É feita uma análise de como os

valores pequenos de Volsis estão associados a valores pequenos de Voldia e como

os valores altos de Volsis estão associados a valores altos de Voldia, mostrando

uma tendência linear. Os autores mencionam alguns softwares que possibilitam a

construção de gráficos de dispersão, por exemplo, o Minitab, o Excel, o R e o Splus,

sendo que a maior parte dos gráficos apresentados, no capítulo 3, são provenientes

17 Volume sistólico final, uma medida do tamanho do coração. É calculada a partir da figura da silhueta bidimensional do ventrículo esquerdo, na sua menor parte. 18 Volume diastólico final, o mesmo que Volsis, exceto por usar a maior silhueta.

Page 67: CAPA DISSERTAÇÃO FINAL Mara Lucia

66

do software de distribuição gratuita R.

Os autores fazem um comentário da impressão sobreposta, isto é, os valores

das observações, quando apresentados no diagrama de dispersão ficam tão

próximos, que não permitem ao leitor uma leitura fiel dos dados no diagrama de

dispersão. Uma maneira de amenizar tal situação é fazer a apresentação dos dados

observados através de círculos abertos.

Os autores utilizam os dados das tabelas: 3.1.1 Mortes e Radiações no Leite

após Chernobyl; 3.1.2 Tempo de Processamento e Cargas de Trabalho nos

Computadores; 3.1.3 Poluentes em Emissões de Gases de Descarga de Veículos e

3.1.4 Marcas Olímpicas Vitoriosas nos 1500 metros para homens (1900 – 1988),

para explorar as relações entre as variáveis, no diagrama de dispersão e verificar a

existência ou não de uma tendência.

Usando as mesmas tabelas citadas anteriormente, os autores exploram

variáveis aleatórias, isto é, variáveis para as quais não se consegue prever o

resultado até que o experimento não seja finalizado, por exemplo, lançamento de

uma moeda 3 vezes. As variáveis não são aleatórias quando são controladas pelo

seu experimentador, por exemplo, partidas de ônibus de Belo Horizonte a São

Paulo.

A utilidade da Regressão é destacada, explorando-se a tendência e a

dispersão dos dados, usando vários diagramas de dispersão. Nesse momento, os

autores usam círculos abertos para indicar os pontos no diagrama de dispersão e

colocam ênfase nos possíveis ajustes dos dados através de curvas desenhadas a

mão. Em um dos diagramas, eles chamam a atenção do leitor para curvas

pontilhadas abaixo e acima dos possíveis limites de dispersão dos dados e mostram

os valores fora desta faixa, denominados como sendo valores atípicos19.

Os autores exploram as relações consideradas como sendo fortes ou

relações consideradas fracas através da análise visual e a associação entre essas

variáveis, salientando quando as variáveis estão associadas de forma negativa e

quando as variáveis estão associadas de forma positiva.

No capítulo 3, os autores discorrem, ainda, a respeito dos perigos da

predição, mostram outras tendências em diversos diagramas de dispersão.

19 Entende-se por valores atípicos os valores que destoam completamente dos valores que compõe um conjunto de dados.

Page 68: CAPA DISSERTAÇÃO FINAL Mara Lucia

67

Outro capítulo do livro analisado pela pesquisadora, quanto à abordagem do

conteúdo e exercícios usados para exemplificar cada seção e os exercícios

propostos pelos autores, é o capítulo 12, Relações entre Variáveis Quantitativas:

Regressão e Correlação.

Os autores fizeram inicialmente um breve resumo do que compõe o capítulo.

Este capítulo consta de 35 páginas, que correspondem a 9,28% do total de páginas

de desenvolvimento teórico. Os autores dão início ao capítulo comentando de que

forma foram explorados os conteúdos Regressão e Correlação no capítulo 3 e em

seguida formalizam o que seja Regressão e Correlação. Exploram as relações de

causa e efeito, alertando o leitor de que uma forte relação entre as variáveis não

significa necessariamente uma relação de causa e efeito. Para o estudo de

Regressão, os autores mostram através de vários diagramas de dispersão que o

melhor ajuste aos dados pode ser uma reta e fazem a interpretação de sua

inclinação.

Neste capítulo, também, outros modelos de curvas de tendência são

explorados por meio de diagramas de dispersão, entre eles a aproximação pela

curva exponencial.

Após a exploração dos diversos tipos de diagramas, os autores falam do

método dos mínimos quadrados, que permite determinar os parâmetros da reta que

melhor se ajusta ao conjunto de dados apresentados no diagrama de dispersão.

O gráfico 11 refere-se ao Quadro 4 que se encontra no Apêndice A,

expressando as quantidades de exercícios propostos pelos autores, classificados de

acordo com as categorias de Curcio.

Page 69: CAPA DISSERTAÇÃO FINAL Mara Lucia

68

Número de exercicíos (Y)

Categorias (X)

C2

Ler além dos dadosLer dentro dos dadosLer dados

NãoSimNãoSimNãoSim

120

100

80

60

40

20

0

85

30

62

53

110

5

Gráfico 11: Níveis de leitura e interpretação de da dos nos exercícios do Livro 4

Fonte: Quadro 4 – Apêndice A.

De acordo com Gráfico 11, as colunas que apresentam maior destaque em

“Não”, considerando as categorias de Curcio, são ler os dados e ler além dos dados.

3.3.1 Análise comparativa dos quatro livros e concl usões

De acordo com os quatro gráficos, percebe-se que os Livros 1, 2 e 3 dão ênfase a

uma das categorias de Curcio que é ler dentro dos dados. Essa categoria explora a

habilidade do aluno no sentido de utilizar os seus conhecimentos para fazer uma

leitura dos dados apresentados. Este tipo de leitura envolve destrezas de ordem

quantitativa e conhecimentos adquiridos anteriormente. As operações matemáticas

elementares podem ser de grande utilidade neste tipo de leitura, que requer

habilidades em comparar os dados.

Um dos fatores que pode justificar a presença marcante dessa categoria de

Curcio talvez seja o fato do Livro 1 e do Livro 2 serem direcionados para a área de

engenharia e o Livro 3, um livro preparado para um público mais geral de ciências

biológicas, exatas e humanas. Dessa forma, tais livros incentivam cálculos com os

dados.

Page 70: CAPA DISSERTAÇÃO FINAL Mara Lucia

69

O Livro 4 é o único dos quatro livros que aborda o conteúdo correlação e

regressão em dois momentos. No capítulo 3, os autores exploram a relação entre

duas variáveis de forma intuitiva e, no capítulo 12, eles exploram formalmente essa

relação entre duas variáveis. Por se tratar de um livro que dá ênfase a explorar o

lado intuitivo e propor mais questões teóricas como exercício, as categorias de

Curcio de ler os dados, ler dentro dos dados e ler além dos dados não são tão

freqüentes de acordo com o gráfico 9. Nos dois capítulos analisados pela

pesquisadora observou-se que os autores propõem uma grande quantidade de

exercícios ao aluno, que conduzem a sínteses teóricas. O Gráfico 9 evidencia uma

pequena quantidade de exercícios que explora a categoria ler os dados. Uma

possível justificativa para esse fato seja a abordagem intuitiva dada pelos autores ao

Capítulo 3 do livro, sem enfatizarem o cálculo através do uso de fórmulas. O Livro 4

foi elaborado para áreas de marketing, finanças, economia, ciências sociais, físicas,

biológicas e médicas e tem um objetivo diferenciado dos livros 1, 2 e 3. O foco é

explorar o raciocínio intuitivo.

A Tabela 8 sintetiza o total dos exercícios de cada livro classificados segundo

as categorias de Curcio.

Tabela 8: Freqüência das categorias de Cu rcio nos exercícios dos quatro livros

Livros Categorias Livro 1 Livro 2 Livro 3 Livro 4 Total

Ler dados 13 1 1 5 20 Ler dentro dos dados 75 9 18 53 155 Ler além dos dados 75 8 3 30 116 Total 163 18 22 88 291 Fonte: Tabela do Apêndice A. Tabela 9: Percentual das categorias de Curcio nos e xercícios dos quatro livros em relação ao total geral.

Livros Categorias Livro 1 Livro 2 Livro 3 Livro 4 Total

Ler dados 4,47% 0,34% 0,34% 1,72% 6,87% Ler dentro dos dados 25,77% 3,1% 6,19% 18,21% 53,27% Ler além dos dados 25,77% 2,75% 1,03% 10,31% 39,86% Total 56,01% 6,19% 7,56% 30,24% 100% Fonte: Tabela do Apêndice A.

A tabela construída a partir do total geral dos exercícios propostos pelos

autores, nos quatro livros (291), evidencia que a categoria mais presente nos

exercícios é ler dentro dos dados. Percebe-se, ainda no Livro 1, a maior evidência

das categorias de Curcio.

Page 71: CAPA DISSERTAÇÃO FINAL Mara Lucia

70

A Tabela 10 apresenta como os exercícios se distribuem percentualmente,

dentro de cada livro, de acordo com as categorias de Curcio.

Tabela 10: Percentual dos exercícios segundo as categorias de Curcio por livro Livros Categorias

Livro 1 Livro 2 Livro 3 Livro 4 Ler dados 7,98% 5,56% 4,54% 5,68% Ler dentro dos dados 46,01% 50% 81,82% 60,23% Ler além dos dados 46,01% 44,44% 13,64% 34,10% Total 100% 100% 100% 100%

Fonte: Tabela do Apêndice A.

1. Dentre os exercícios propostos no Livro 1, verifica-se que a

proporcionalidade é a mesma nas categorias ler dentro dos dados e ler

além dos dados. Assim sendo, o Livro 1, adotado no curso de

engenharia onde a pesquisadora atua como professora, pode ser

considerado adequado, do ponto de vista de uma abordagem do tema

com ênfase na leitura e interpretação de dados.

Também, no Livro 2, as mesmas duas categorias ler dentro dos dados e ler

além dos dados são predominantes. Nos Livros 3 e 4, as habilidades de leitura e

interpretação de dados mais exploradas nos exercícios, são aquelas relativas à

leitura dentro dos dados.

Dos quatro livros analisados, o Livro 4 diferencia–se dos demais por ter uma

forma de explorar o conteúdo de correlação e regressão em dois capítulos, sendo

que inicialmente o faz de forma exploratória e posteriormente formalizando os dois

conteúdos. Por essa razão, o livro constituiu-se em uma fonte de idéias importante

para a elaboração de atividades numa linha investigativa, incentivando uma análise

visual de gráficos e tabelas. Isso foi importante tanto para as seqüências de

atividades aplicadas, como para a ampliação das seqüências que integram a

proposta didático-metodológica para o ensino e aprendizagem de correlação e

regressão em cursos de engenharia com foco na leitura e interpretação de dados,

apresentada no Apêndice B.

Page 72: CAPA DISSERTAÇÃO FINAL Mara Lucia

71

4 O DESENHO METODOLÓGICO DA PESQUISA

A presente pesquisa teve como foco uma investigação acerca de tipos de

estratégias didáticas que possam favorecer um melhor entendimento dos conceitos

de correlação e regressão junto a estudantes de engenharia.

Os estudos teóricos desenvolvidos evidenciaram que tais estratégias

poderiam estar fundamentadas na leitura e interpretação de dados, enfatizando

inicialmente uma análise exploratória mais intuitiva, para aos poucos evoluir para

uma análise a partir de técnicas estatísticas mais elaboradas.

No sentido de conhecer mais de perto as abordagens didáticas utilizadas no

ensino do tema, foram analisados quatro livros didáticos, alguns deles integrando a

bibliografia de cursos de engenharia.

Assim, a questão de pesquisa foi inicialmente recortada, consistindo em

verificar quais as estratégias didáticas presentes no livro texto, e em que medida

essas estratégias apresentavam um foco na análise e interpretação de dados.

Paralelamente a esse estudo, foi desenvolvido um trabalho empírico cujo

desenho metodológico é apresentado a seguir. Na primeira seção, é discutido o

contexto da pesquisa, caracterizando-se os participantes, a disciplina e o curso. A

segunda e terceira seções discutem os instrumentos e fases de coleta de dados e os

critérios de análise adotados.

4.1 O contexto da pesquisa

A pesquisa foi desenvolvida junto aos alunos do quarto período do curso de

Engenharia Mecânica, turno da noite, de uma instituição particular de ensino,

localizada no Estado de Minas, Belo Horizonte.

A maior parte dos alunos que participaram da pesquisa são alunos que

trabalham durante todo o dia. A maioria atua em empresas de grande porte. Esses

alunos têm apenas um semestre de estudos estatísticos.

A disciplina, nomeada no curso como “Probabilidade e Estatística I”, tem uma

carga horária de 60 horas, totalizando 4 aulas por semana. A ementa propõe que se

Page 73: CAPA DISSERTAÇÃO FINAL Mara Lucia

72

aborde: Estatística descritiva; Probabilidade; Variáveis aleatórias; Distribuições

discretas; Distribuições contínuas; Amostragem; Inferência estatística; Estimação;

Teste de hipótese; Análise de regressão simples; Controle e gerenciamento de

processos.

A disciplina tem por objetivos: a) propiciar ao futuro engenheiro fundamentos básicos

de estatística no contexto da engenharia; b) dar ao aluno condições para que ele

desenvolva o raciocínio estatístico nas aplicações dos problemas dentro do contexto

da engenharia; c) motivar o aluno a usar calculadora e computador em seus

trabalhos estatísticos. Os conteúdos são distribuídos através das unidades, em

número de doze, apresentadas detalhadamente no Anexo A. A disciplina não prevê

aulas conduzidas em laboratório, utilizando qualquer um dos “softwares” disponíveis.

O tema abordado durante a pesquisa realizada pela professora-pesquisadora nas

duas atividades aplicadas, em duas turmas, ocorreu durante um curto período de

tempo, devido ao fato de correlação e regressão serem ministradas em 8 horas, de

acordo com o plano de ensino da disciplina.

Antes de cursar a disciplina Probabilidade e Estatística I, os alunos que

participaram da atividade aplicada pela professora-pesquisadora já haviam cursado

as seguintes disciplinas: Cálculo I e Geometria Analítica e Álgebra Linear no primeiro

período, Cálculo II no segundo período, Cálculo III e Cálculo Numérico no terceiro

período, sendo que tais disciplinas utilizam calculadoras científicas durante as suas

aulas e, também, tem acesso a alguns softwares. Pode-se concluir que embora os

alunos do quarto período não tenham aula de laboratório com aplicações na

disciplina Probabilidade e Estatística I, alguns já utilizam ou têm acesso a softwares

estatísticos e a calculadoras científicas.

4.2 Os instrumentos e fases de coleta de dados

Duas atividades foram aplicadas em sala de aula, sendo que uma no primeiro

semestre de 2007; e outra, no segundo semestre de 2007.

É importante ressaltar que as atividades foram aplicadas em turmas distintas,

mas com características similares tendo como objetivos: 1) propiciar uma atividade

investigativa, explorando os níveis de leitura e interpretação de dados, a partir das

Page 74: CAPA DISSERTAÇÃO FINAL Mara Lucia

73

categorias de Curcio (1987); 2) explorar as idéias de correlação linear e regressão

linear a partir de uma abordagem intuitiva; 3) motivar a apresentação formal dos

conceitos de correlação e regressão.

Pretenderam-se dessa forma, respostas a algumas indagações advindas da

prática docente da pesquisadora. Uma aula onde os alunos são solicitados a testar

conjecturas, apresentar argumentos, pode motivar a introdução de um conteúdo

estatístico, no caso, o conteúdo de correlação e regressão? Os conhecimentos

prévios dos alunos acerca dos dados, dos tipos de gráficos, dos conceitos

matemáticos demandados são relevantes? O tipo de dados envolvido nos gráficos e

tabelas tem influência no maior ou menor envolvimento dos alunos?

Na primeira atividade, foi escolhido um conjunto de dados disponibilizado em

um dos textos didáticos analisados no Capítulo 3 (Livro 1), a partir do qual foram

propostas tarefas de acordo com os objetivos especificados anteriormente.

Para a segunda atividade, a pesquisadora obteve os resultados experimentais

da temperatura da água de três coletores solares de banho para residência,

fornecidos por um grupo de pesquisa em energia solar da mesma instituição de

ensino particular, onde foi realizada a pesquisa.

As duas atividades diferem entre si. Na primeira atividade, os dados

envolvidos, embora relativos a uma situação de engenharia, foram selecionados de

um exercício proposto em um texto didático. A segunda atividade traz elementos

mais próximos ao cotidiano do aluno. Os dados foram trabalhados pela professora-

pesquisadora através de técnicas de amostragem. Antes da aplicação da segunda

atividade, a pesquisadora explicou aos alunos todo o processo de coleta dos dados,

realizado pelas pessoas que atuam no grupo de pesquisa em energia solar e,

posteriormente, como ela própria retirou as três amostras dos três coletores. Os

alunos envolvidos nessa atividade já tinham conhecimento das técnicas de

amostragem e, assim, o ideal seria que eles também tivessem participado desse

processo. Dessa forma, estaríamos em consonância com as recomendações dos

Parâmetros Curriculares Nacionais e dos Standars do National Council of Teachers

of Mathematics (NCTM), propondo situações que contemplam desde a coleta à

organização dos dados e após a apresentação dos mesmos, à realização das

possíveis inferências. Quando os estudantes acompanham todo um processo de

coleta de dados, teria sentido discutir também questões relativas a uma quarta

categoria de leitura e interpretação de dados, chamada ler por detrás dos dados,

Page 75: CAPA DISSERTAÇÃO FINAL Mara Lucia

74

que consiste numa avaliação do contexto onde os dados foram coletados20. No

contexto desse trabalho, a categoria de análise ler por detrás dos dados não se

aplica, uma vez que não foi possível que os próprios alunos realizassem a coleta de

dados, por questões de inadequação da carga horária da disciplina. De qualquer

forma os dados utilizados na segunda atividade tinham mais sentido para os alunos,

uma vez que haviam sido coletados por colegas seus, trabalhando como estagiários

em um projeto da instituição a que pertenciam.

As duas atividades foram desenvolvidas em grupo; alguns poucos alunos, na

segunda atividade, optaram por realizar o trabalho individualmente.

As duas atividades foram planejadas, tendo como referência as categorias de

leitura e interpretação de dados de Curcio, discutidas no capítulo 3, sendo que o

foco principal foi explorar a relação entre duas variáveis e a possibilidade de

visualização por parte do aluno de uma equação matemática que explicasse tal

relação, a partir da análise gráfica. Os alunos fizeram os registros escritos em folhas

especiais fornecidos pela professora-pesquisadora. Nas duas atividades, eles

discutiram entre si durante 100 minutos e responderam às questões propostas e

devolveram uma das folhas de registros à pesquisadora. Nas duas atividades, os

alunos receberam duas cópias do material impresso e foi pedido a eles que fizessem

as mesmas anotações nas duas folhas, para que eles tivessem o material para o

próximo encontro, já que uma delas seria entregue à pesquisadora. Dessa forma, a

professora-pesquisadora teria acesso aos registros dos alunos nas várias etapas,

possibilitando estabelecer comparações e verificar eventuais avanços e

reconstruções dos conceitos abordados durante todo o processo.

As duas atividades foram socializadas num segundo momento, ocorrido em

um encontro de cerca de 100 minutos.

O processo de socialização nas duas atividades foi gravado em fitas de áudio,

constituindo mais um instrumento de coleta de dados que contribuiu para a análise

das questões propostas pela professora-pesquisadora. Posteriormente, a

apresentação do conteúdo de correlação e regressão foi realizada pela professora-

pesquisadora de maneira formal.

20 Ver nota de rodapé de número 3, no Capítulo 3.

Page 76: CAPA DISSERTAÇÃO FINAL Mara Lucia

75

Para facilitar a leitura do relato da pesquisa, optou-se por apresentar as

atividades nos dois capítulos seguintes, onde se detalham os objetivos de cada uma

delas, bem como se analisam os resultados.

Embora as orientações acerca dos estudos de estatística em cursos de

graduação apontem a importância da incorporação de atividades de cunho

investigativo, incentivando a pesquisa e o questionamento, o ensino de Estatística

evidencia ainda uma abordagem tradicional, com apresentação dos conceitos,

principais propriedades e proposição de exercícios.

As atividades desenvolvidas objetivaram romper com essa abordagem

tradicional, buscando incorporar uma abordagem mais intuitiva, com foco na leitura e

interpretação de dados.

As atividades desenhadas estão adequadas às tendências metodológicas

evidenciadas em alguns textos didáticos e se apóiam, com certeza, nas premissas

de Garfield et al (2002), apontadas no Capítulo 2, de se utilizar mais dados e

conceitos, menos receitas e se incentivar uma aprendizagem ativa, com atividades

nas quais o aluno trabalhe coletivamente.

Apenas uma atividade foi aplicada a cada turma, devido ao fato de a carga

horária da disciplina ser insuficiente. Mesmo assim, os registros sinalizam a

importância da abordagem metodológica adotada.

A proposta final de abordagem do tema correlação e regressão em cursos de

engenharia, apresentada no Apêndice B, reformula ampliando as tarefas aplicadas.

4.3. Critérios de análise de dados

As duas atividades foram analisadas de acordo com as categorias de Curcio

(1987), já que as questões propostas foram desenhadas de forma a focalizar uma ou

outra categoria.

Para a categoria ler os dados, a pesquisadora nas duas atividades procurou

elaborar questões que explorassem a habilidade do aluno em fazer análises

gráficas, procedendo à leitura dos dados de forma literal, sem se preocupar com a

interpretação desses dados. De acordo com Curcio (1987), essa categoria explora a

Page 77: CAPA DISSERTAÇÃO FINAL Mara Lucia

76

habilidade do aluno a partir do momento em que ele é capaz de localizar valores

presentes no próprio gráfico.

A categoria ler, dentro dos dados, consiste na leitura feita a partir dos dados

apresentados, requer interpretações, o uso do conhecimento já adquirido

anteriormente. O conhecimento das operações matemáticas elementares pode

colaborar de forma significativa para esse tipo de leitura. O objetivo das questões

propostas pela pesquisadora nas duas atividades foi observar as idéias intuitivas dos

alunos, após a observação dos pares ordenados em cada diagrama de dispersão.

Neste tipo de leitura, o aluno pode perceber a existência de dependência direta ou

inversa entre as variáveis, isto é, se elas são diretamente proporcional ou

inversamente proporcional. A percepção de uma tendência nesse momento é

fundamental para o entendimento do aluno, no que se refere à dependência direta

ou inversa entre as variáveis, sendo que isto requer a leitura comparativa dos dados

apresentados.

A categoria ler além dos dados possibilita ao aluno fazer inferências, isto é,

previsões. As informações relativas a essas previsões não estão presentes no

gráfico. Este tipo de leitura exige do leitor, um conhecimento teórico mais profundo.

As questões elaboradas pela pesquisadora, utilizando as categorias de Curcio

ler além dos dados, objetivaram também verificar até que ponto o aluno era capaz

de fazer uma interlocução com as disciplinas de matemática já cursadas antes da

disciplina Probabilidade e Estatística I, como por exemplo, o Cálculo Numérico, que

trabalha em alguns momentos com ajuste de curvas a pares ordenados.

Os dois capítulos seguintes apresentam cada uma das atividades, detalhando

as várias etapas desde a elaboração das mesmas atividades, sua condução em sala

e a análise do processo.

Page 78: CAPA DISSERTAÇÃO FINAL Mara Lucia

77

5 PRIMEIRA SEQÜÊNCIA DE ATIVIDADES: TESTANDO IDÉIAS

Participaram das atividades 57 estudantes do quarto período de um curso de

Engenharia ofertado no turno da noite, por uma instituição particular de ensino de

Belo Horizonte, Minas Gerais. A seqüência de atividades foi aplicada no primeiro

semestre de 2007. É conveniente ressaltar que os alunos envolvidos nesta atividade

já haviam cursado disciplinas básicas como Cálculo Diferencial e Integral, Geometria

Analítica e Álgebra Linear e Cálculo Numérico, que integram a grade curricular do

curso de Engenharia onde foi desenvolvida a pesquisa. Considerando-se as atuais

orientações didáticas e principalmente os livros didáticos, tais disciplinas deveriam

ser desenvolvidas de forma a propiciar que o aluno conheça e utilize diferentes

formas de representação das idéias matemáticas, o que demandaria uma atenção

especial à construção, análise e interpretação de gráficos.

5.1 A seqüência de atividades

Os alunos tiveram acesso a uma tabela (Tabela 11) e a três diagramas de

dispersão - Gráficos 12,13 e 14. A atividade consistiu na análise e na interpretação

de dados amostrais, relativos aos resultados de dezoito ensaios, em corpos de

prova, no processo de queima de massa de cerâmica para pavimentação.

As atividades foram elaboradas, visando diagnosticar os níveis de leitura e

interpretação de dados dos estudantes e, ao mesmo tempo, incentivar o

desenvolvimento de habilidades de acordo com as categorias de Curcio (1987): ler

dentro dos dados; ler além dos dados, discutidos no capitulo 3.

Foram registrados os dados relativos a três variáveis indicadas na Tabela 11

como: X1 representando a retração linear (%); X2 representado a resistência

mecânica (MPa); X3 representando a absorção de água (%).

Page 79: CAPA DISSERTAÇÃO FINAL Mara Lucia

78

Tabela 11: Resultados de 18 ensaios, em corpos de p rova, durante o processo de queima de

massa de cerâmica para paviment ação

Ensaio X1 X2 X3 Ensaio X1 X2 X3

1 8,7 38,42 5,54 10 13,24 60,24 0,58 2 11,68 46,93 2,83 11 9,10 40,58 3,64 3 8,30 38,05 5,58 12 8,33 41,07 5,87 4 12,00 47,04 1,10 13 11,34 41,94 3,32 5 9,5 50,9 0,64 14 7,48 35,53 6,00 6 8,58 34,10 7,25 15 12,68 38,42 0,36 7 10,68 48,23 1,88 16 8,76 45,26 4,14 8 6,32 27,74 9,92 17 9,93 40,70 5,48 9 8,20 39,20 5,63 18 6,5 29,66 8,98

Fonte: Barbetta, Reis e Bornia, 2004, p.317.

Os gráficos seguintes foram elaborados a partir da Tabela 11 e recebem uma

denominação especial no campo estatístico de diagramas de dispersão e permitem

explorar se existem relações entre as variáveis consideradas duas a duas: retração

linear (%) e resistência mecânica (MPa); retração linear (%) e absorção de água (%);

resistência mecânica (MPa) e absorção de água (%).

Re t ra ção line a r (%) (X )

Resistência mecânica (MPa) (Y)

14131211109876

60

55

50

45

40

35

3029,66

40,70

45,26

38,42

35,53

41,9441,07 40,58

60,24

39,20

27,74

48,23

34,10

50,90

47,04

38,05

46,93

38,42

Gráfico 12: Diagrama 1 - Primeira Seqüência de Ativ idades

Fonte: Tabela 11

Page 80: CAPA DISSERTAÇÃO FINAL Mara Lucia

79

R e t r a ç ã o lin e a r (% ) ( X )

Aborção de água (%) (Y)

1 41 31 21 11 09876

1 0

8

6

4

2

0

8 ,98

5 ,4 8

4 ,14

0 ,3 6

6 ,00

3 ,32

5 ,87

3 ,6 4

0 ,58

5 ,6 3

9 ,9 2

1 ,8 8

7 ,25

0 ,6 4

1 ,1 0

5 ,58

2 ,8 3

5 ,54

Gráfico 13– Diagrama 2 - Primeira Seqüência de Ativ idades

Fonte: Tabela 11

Resistência mecânica (MPa) (X)

Aborção de água (%) (Y)

60555045403530

10

8

6

4

2

0

8,98

5,48

4,14

0,36

6,00

3,32

5,87

3,64

0,58

5,63

9,92

1,88

7,25

0,64

1,10

5,58

2,83

5,54

Gráfico 14: Diagrama 3- Primeira Seqüência de Ativi dades

Fonte: Tabela 11

Page 81: CAPA DISSERTAÇÃO FINAL Mara Lucia

80

Questões propostas e objetivos: Discuta com seus colegas e resolva as tarefas propostas, registrando as

observações e justificando suas conclusões.

1) Olhe atentamente os diagramas de dispersão que foram dados e registre suas

observações.

O objetivo da questão 1 foi verificar se o aluno tinha a habilidade de fazer uma

leitura literal dos dados, isto é, ler os dados, não se preocupando com a

interpretação dos pares ordenados da distribuição bivariada.

2) Observe cada diagrama. Procure descrever como os pares ordenados se

distribuem.

O objetivo da questão proposta foi observar as idéias intuitivas dos alunos, após

a observação de como os pares ordenados se distribuíam em cada diagrama de

dispersão, fazendo a leitura dentro dos dados. Esta leitura envolve compreensão

e interpretação dos pares de valores no diagrama, como também a comparação

de quantidades envolvidas e traquejo matemático, de tal maneira que a leitura

gráfica faça o aluno perceber a existência de uma dependência direta ou inversa

entre as variáveis, isto é, se elas são diretamente proporcionais ou são

inversamente proporcionais;

3) Observe cada diagrama. Você percebe a existência de relacionamento entre as

variáveis em cada diagrama? Justifique de acordo com o entendimento que tem

de cada gráfico.

O objetivo da questão foi levar o aluno a intuir a respeito do relacionamento entre

duas variáveis, isto é, a existência ou não de associação entre elas, a partir da

análise gráfica de diagramas de dispersão. Esta questão também envolve a

categoria de Curcio (1987), ler dentro dos dados.

4) Utilizando as informações da tabela e o terceiro diagrama de resistência

mecânica (MPa) e absorção de água (%),você é capaz de verificar se a

resistência mecânica (MPa) causa algum efeito sobre a absorção de água no

processo de queima de massa de cerâmica para pavimentação em corpos de

prova? Argumente acerca do questionamento levantado.

Pretendeu-se com a questão que o aluno fizesse a leitura dentro dos dados,

Page 82: CAPA DISSERTAÇÃO FINAL Mara Lucia

81

sendo capaz de levantar conjecturas sobre a possibilidade da variação de uma

variável ser causada pela variação da outra.

5) Observando os diagramas você considera possível estabelecer um modelo

matemático que descreva como variam: a) retração linear (%) e resistência

mecânica (Mpa); a) retração linear (%) e absorção de água (%); c) resistência

mecânica (Mpa) e absorção de água (%). Justifique sua resposta.

O objetivo da questão foi que a partir de sua ótica, ao observarem os três

diagramas, os alunos pudessem fazer uma conexão com conceitos

matemáticos, já estudados por eles em disciplinas básicas, como Cálculo

Diferencial e Integral, Cálculo Numérico e Geometria Analítica e Álgebra Linear,

explorando assim a categoria ler dentro dos dados.

6) Você acha possível fazer uma previsão o valor de absorção da água (%),

conhecendo o valor da resistência mecânica (MPa) ?Justifique a sua resposta.

O objetivo da questão foi verificar se os alunos fazem uma leitura além dos

dados, isto é, se são capazes de levantar conjecturas e fazer inferências a partir

de dados fornecidos.

5.2 Desenvolvimento das atividades e análise dos re sultados

A atividade foi conduzida por etapas. Na primeira etapa, durante duas aulas

de 100 minutos, os alunos discutiram em grupos de quatro e cinco alunos as

questões propostas e registraram suas respostas por escrito. Cada grupo entregou

um registro com a síntese dos resultados obtidos, e manteve um registro similar para

o desenvolvimento da segunda etapa. Durante a primeira fase, os alunos ainda não

tinham o conhecimento dos conceitos estatísticos envolvidos; os gráficos de

dispersão, por exemplo, eram novidade para a maioria deles. Assim, as

interpretações e argumentações escritas dadas por eles, naquele momento, foram

sustentadas por idéias intuitivas.

Page 83: CAPA DISSERTAÇÃO FINAL Mara Lucia

82

A segunda etapa, correspondente à socialização dos resultados, foi realizada

em dois momentos. No primeiro momento, foram discutidas as três primeiras

questões e, logo em seguida, a professora-pesquisadora apresentou o conteúdo

formal do tema correlação. No segundo momento, foram discutidas as três últimas

questões e foi realizada a abordagem formal do conceito de regressão. As

discussões ocorridas nos dois momentos foram gravadas em áudio.

Os registros escritos dos grupos recolhidos na primeira etapa e os registros

em áudio dos dois momentos da segunda etapa constituíram os dados que foram

analisados pela professora-pesquisadora, a partir das categorias de leitura e

interpretação de dados de Curcio (1987), discutidos no capítulo 3 e que orientaram a

elaboração das questões propostas. Durante todo o processo da aplicação da

atividade investigativa, o objetivo foi detectar as idéias intuitivas dos alunos acerca

de relações entre variáveis, estabelecendo a partir das mesmas uma ponte para a

introdução dos conceitos de correlação e regressão.

Inicialmente, foi proposto aos componentes dos doze grupos que discutissem

entre si os diagramas de dispersão que foram dados e registrassem as suas

observações.

As respostas de oito grupos - G12, G11, G10, G9, G8, G6, G5 e G4 -

concentraram-se na seguinte análise: “No primeiro diagrama observou-se que

quanto maior a retração linear, maior a resistência mecânica; no segundo diagrama

quanto maior a retração linear menor será a absorção de água; no terceiro diagrama

quanto maior a resistência mecânica menor será a absorção de água; se traçarmos

uma linha com as médias dos valores percebemos que o primeiro gráfico em relação

aos outros dois, há um afastamento maior dos pontos”.

O grupo G7 argumentou que não existia uma relação entre as variáveis nos

três diagramas de dispersão. O grupo G1 afirmou que a questão proposta era

incoerente, sem ter dado nenhuma justificativa. Os grupos G2 e G3 observaram que

todos os três diagramas mostravam uma tendência a uma curva específica, sem

justificativas; falaram de parábola no caso do primeiro diagrama, de retas no caso

dos outros dois diagramas. Percebeu-se certa preocupação por parte dos grupos em

falar em crescimento ou decrescimento das variáveis envolvidas na primeira

questão, do que propriamente um comentário mais livre das observações de acordo

com os diagramas. Os alunos fizeram mais uma leitura dentro dos dados na ótica de

Curcio (1987), do que a leitura literal dos dados. A preocupação dos alunos durante

Page 84: CAPA DISSERTAÇÃO FINAL Mara Lucia

83

as observações dos pares ordenados nos três diagramas foi mais de interpretar os

dados.

Na segunda questão, proposta aos alunos o foco de interesse era que eles

observassem como os pares ordenados se distribuíam. Os grupos G2, G3, G4, G6,

G7, G8, G9, G10 e G11 afirmaram que no primeiro diagrama a relação entre as

variáveis era diretamente proporcional e, no segundo e terceiro diagramas, a relação

entre as variáveis era inversamente proporcional.

O grupo G1 argumentou que nos Diagramas 1 e 2, os dados eram dispersos

e os resultados pareciam alocados (comparados) erroneamente; já no Diagrama 3,

havia os dados eram dispostos de forma mais coerente. O grupo G12 observou que

os pares ordenados se distribuíam aleatoriamente em todos os gráficos, ou seja, não

parecia haver uma seqüência lógica. O grupo G5 argumentou que os pares

ordenados se distribuíam de forma a sugerir a formação aproximada de uma reta.

Percebeu-se uma dificuldade em comentar a respeito do posicionamento dos

pares ordenados no diagrama de dispersão; pareceu haver uma tendência dos

alunos por avaliações do tipo certo ou errado. Alguns grupos observaram uma

tendência a partir do pares ordenados presentes em cada diagrama, na tentativa de

ler dentro dos dados.

Na questão número 3, após a observação de cada diagrama, os alunos

deveriam verificar se havia a existência de relação entre as variáveis em cada

diagrama e apresentar uma justificativa para a resposta dada. Os grupos G1, G7 e

G8 não detectaram a existência de relação entre as variáveis. O grupo G7 justificou

a falta de relacionamento, alegando a distribuição aleatória dos pares ordenados

detectada em cada diagrama de dispersão, fato que chama atenção quando se

compara a resposta dada pelo grupo à questão 1. Da mesma forma, o grupo G8

argumentou pela não existência de relação entre as variáveis em nenhum diagrama

O grupo G1 justificou que de acordo com os diagramas observados puderam

verificar a presença de grandes variações dos pares ordenados e a presença de

pares discrepantes, devido talvez a medições errôneas, fato que não permitia

verificar a relação entre as variáveis em nenhum diagrama. Essa argumentação

mantém uma maior coerência com a resposta dada à questão 1.

Os demais grupos argumentaram a favor da existência de um relacionamento

observável nos três diagramas. O primeiro diagrama de retração X resistência

mostrava uma tendência a uma curva decrescente. Nos gráficos de retração X

Page 85: CAPA DISSERTAÇÃO FINAL Mara Lucia

84

absorção e resistência X absorção, evidenciava-se uma tendência a uma curva

crescente. Percebeu-se que a maioria dos grupos foi capaz de, a partir da análise

gráfica dos dados, inferir acerca do relacionamento entre as variáveis envolvidas.

Intuir a partir da analise gráfica foi um ótimo exercício para o aluno em termos de

verificação de relacionamento entre as variáveis envolvidas no estudo. Esta questão

teve a intenção de explorar a categoria de Curcio (1987) ler dentro dos dados.

Na questão número 4, foi pedido aos alunos que utilizando as informações da

tabela e o terceiro diagrama de resistência mecânica (MPa) e absorção de água (%),

verificassem a existência de uma relação de causa e efeito da resistência mecânica

(MPa) sobre a absorção de água no processo de queima de massa de cerâmica

para pavimentação em corpos de prova. Dez dos 12 grupos responderam que sim e

argumentaram que à medida que a resistência mecânica aumentava, a absorção de

água diminuía. O grupo G7, respondeu que não havia relação constante entre

resistência mecânica e a capacidade de absorção de água de cada corpo de prova e

exemplificou, usando os dados da tabela: corpo 1: 38,42 (MPa) = 5,54%; corpo 2:

46,93 (MPa) = 2,83% e corpo 12: 41,07 (MPa) = 5,87%. O grupo G10 respondeu

que: “Não. A absorção de água causa e efeito sobre a resistência mecânica, uma

vez que permite menor (%) de água e maior resistência”. Percebe-se que o grupo

argumentou em sentido contrário ao não relacionamento alegado.

A respeito da existência de uma relação causa e efeito, observa-se que os

grupos responderam, de acordo com a localização dos pares ordenados no

diagrama de dispersão. Como a atividade investigativa foi aplicada sem que tivesse

havido uma abordagem formal do conteúdo, os estudantes não sabiam, por

exemplo, que variáveis ocultas podem interferir no processo em questão.

Na questão número 5, após a observação dos diagramas, os alunos deveriam

se posicionar em relação ao estabelecimento de um possível modelo matemático

que descrevesse como variam: a) retração linear (%) e resistência mecânica (MPa);

b) retração linear (%) e absorção de água (%); c) resistência mecânica (MPa) e

absorção de água (%) e que justificassem suas respostas. Os grupos G4, G5, G6 e

G11, apresentaram a equação reduzida da reta e não deram justificativas. Os

grupos G1, G2, G3, G7, G8 e G10 responderam que não é possível estabelecer um

modelo matemático para os três diagramas, pois os pares ordenados são muito

dispersos. Os grupos G9 e G12 responderam ser possível estabelecer um modelo

matemático dos três diagramas, através de regressão linear. Percebe-se que os

Page 86: CAPA DISSERTAÇÃO FINAL Mara Lucia

85

grupos detectaram tendência ao ajuste de reta, sendo que alguns deles

mencionaram a palavra regressão, por ser um assunto já tratado em outras

disciplinas do curso de Engenharia Mecânica. O objetivo da questão proposta aos

alunos era que a partir de sua ótica ao observarem os três diagramas, fizessem uma

conexão entre as disciplinas já cursadas, relacionando a questão com conteúdos

das disciplinas básicas, como Cálculo Diferencial e Integral, Cálculo Numérico e

Geometria Analítica e Álgebra Linear. O ajuste de um modelo matemático aos três

diagramas envolve conceitos estatísticos mais refinados. Esta questão exigia ler

dentro dos dados, mas estabelecendo uma interlocução mais elaborada com idéias

matemáticas trabalhadas previamente.

A última questão, número 6, indagava se era possível fazer uma previsão o

valor de absorção da água (%), conhecendo a resistência mecânica (MPa). Nove

grupos responderam que era possível fazer uma previsão conhecendo uma equação

matemática e tendo uma de suas variáveis.

O grupo G1 alegou que sim, por análise de regressão; o grupo G11 afirmou

ser possível fazer uma aproximação linear do gráfico, obtendo-se uma reta e através

desta reta, sendo possível, encontrar o valor da absorção de água, conhecendo os

valores da resistência mecânica. O grupo G7 afirmou que não era possível, pois

afinal de contas não existia nenhuma relação matemática entre essas duas

variáveis. A resposta mantém uma coerência em relação à resposta dada na

questão anterior.

Os grupos G2, G3, G4, G5, G6, G8, G9, G10 e G12, concluíram que é

possível fazer uma previsão de uma variável conhecendo a outra e analisaram que

duas variáveis podem ter um relacionamento diretamente proporcional ou

inversamente proporcional. Com a visualização de um modelo matemático

associado à distribuição dos pares ordenados nos três diagramas de dispersão, os

alunos perceberam a possibilidade de inferir a partir do modelo ajustado. O objetivo

da questão número 6, era que os alunos levantassem conjecturas, argumentando,

numa leitura além dos dados, inferindo a partir das informações disponíveis.

Nos dois momentos da atividade, os alunos comentaram que não tinham

vivenciado em sala de aula, até aquele momento, experiências dessa natureza:

iniciar um assunto explorando idéias de forma intuitiva, em seguida realizar uma

socialização das idéias e ter acesso a uma exposição formal do conteúdo. As

duplas, em sua maioria, acharam que essa forma de abordagem contribuiu para um

Page 87: CAPA DISSERTAÇÃO FINAL Mara Lucia

86

melhor entendimento da teoria de correlação e regressão, quando foi formalizada

pela professora-pesquisadora. Alguns alunos acharam que a atividade aplicada não

contribuiu de forma significativa para o ensino aprendizagem de correlação e

regressão e justificaram que o curso de Engenharia Mecânica é da área de exatas.

Essa colocação pode ser interpretada como uma preferência explícita por aulas

expositivas, onde sempre o professor apresenta, ou “transmite” conhecimentos já

prontos, característica comum de algumas aulas de cursos de exatas.

Lendo várias vezes os registros dos alunos e ouvindo várias vezes as

gravações, a professora-pesquisadora concluiu que ao apresentarem suas idéias

para os colegas, os grupos se limitaram a repetir o que haviam registrado por

escrito. Talvez esse fato se explique considerando que de modo geral há uma

preocupação do aluno com o erro ou o acerto. Isso pode ter influenciado os alunos a

ficarem presos às respostas anteriormente acordadas no grupo e anotadas na folha

que usavam no debate. Por outro lado, era a primeira vez que se viam diante de

uma situação em que eram chamados a expor suas idéias, e a reação diante do

novo é por vezes de evitar os confrontos da “zona de risco”, e retornar à zona de

comodidade.

O papel da professora-pesquisadora foi fundamental para instigar os alunos

para que levantassem conjecturas. Entre as principais conjecturas, os alunos

falaram a respeito: dos pontos discrepantes, em especial no diagrama 1 e do fato

que os pares ordenados estavam mais concentrados entre as faixas 8 e 9. Alguns

alunos destacaram a tendência evidenciada de aumento da retração linear e

correspondente diminuição da absorção de água no diagrama 2. Os grupos

consideraram que os diagramas 2 e 3 permitiam identificar mais facilmente uma

tendência que consideraram linear, referindo-se a uma proporcionalidade existente

entre as variáveis. Alegaram ainda que no terceiro diagrama ocorria “um processo

inverso” do primeiro gráfico, querendo se referir aos sentidos opostos de uma

tendência crescente no primeiro e decrescente no terceiro gráfico. A discussão

ocorrida evidenciou que na realidade as três primeiras questões eram interligadas. A

primeira questão foi elaborada de forma a ser uma questão mais aberta. Os alunos

poderiam registrar suas idéias de modo mais livre e, por vezes, apresentavam

comentários relativos à segunda e terceira questões.

Debatidas as três primeiras questões, a professora pesquisadora fez a

introdução formal do conteúdo de correlação, apresentando a teoria que permite a

Page 88: CAPA DISSERTAÇÃO FINAL Mara Lucia

87

determinação do coeficiente r, coeficiente de Pearson. Questões relativas ao

significado do coeficiente e da escala que permite classificar uma correlação como

inexistente, fraca, moderada ou forte foram discutidas.

O debate teve continuidade num segundo momento, com a abordagem das

demais questões e a apresentação formal do conteúdo de regressão linear. Foi

interessante destacar a postura de um dos alunos (C). O aluno calculou em casa os

coeficientes de correlação para cada uma das três situações ilustradas nos

diagramas. O mais interessante é que o aluno optou por fazer manualmente os

cálculos, não lançando mão das fórmulas viabilizadas nas calculadoras.

Da mesma forma que no primeiro momento de socialização, após retomar

sintetizando as discussões e formalização acerca do cálculo de correlação, a

professora-pesquisadora orientou o debate acerca das questões 4, 5 e 6,

introduzindo a regressão linear formalmente, usando para ilustrar o diagrama de

dispersão 1.

Foram apresentados os coeficientes da reta de regressão, procedendo-se à

interpretação dos mesmos, de forma que os alunos entendessem o que a equação

falava acerca da variação da resistência mecânica, considerando-se a variação da

retração linear. Nesse momento, foi retomada a conjectura levantada por alguns

grupos no primeiro momento de socialização, de que 60,24 seria um valor

discrepante. Foi então possível verificar que a reta de regressão passava pelo ponto

discrepante. Neste caso, o valor discrepante ocupa a mesma tendência dos outros

pontos do diagrama, isto indica que o ponto discrepante não afeta os mínimos

quadrados.

A importância de uma abordagem na forma proposta é percebermos que é

possível explorar os dados intuitivamente e, posterior, de maneira formal,

valorizando as idéias intuitivas dos estudantes e ressaltando a importância de

estudos aprofundados, ampliando os conhecimentos, no caso conhecimento de

estatística. A partir da abordagem adotada, foi possível perceber o crescimento dos

alunos, estabelecendo um diálogo entre a prática e a teoria, entre as idéias iniciais

intuitivas e a teoria apresentada, atribuindo significado às fórmulas aprendidas.

Após a formalização do conteúdo de correlação e Regressão Linear, a

professora-pesquisadora elegeu um exercício proposto no livro texto dos alunos,

para que eles o resolvessem em casa. Nesta mesma aula, a professora-

Page 89: CAPA DISSERTAÇÃO FINAL Mara Lucia

88

pesquisadora aplicou um trabalho em dupla para ser entregue ao final da aula. Tais

atividades aplicadas pela professora-pesquisadora encontram-se no Anexo B.

O trabalho em dupla aplicado aos alunos envolveu tarefas que demandavam

ler e interpretar os dados, de acordo com as três categorias de Curcio. Procurou-se

também fixar pontos relativos: 1) à implicação ou não de causalidade, para uma

correlação elevada; 2) à interpretação do sinal ora negativo ora positivo do

coeficiente linear de Pearson; 3) à interpretação do sinal antes do termo b, isto é, o

coeficiente angular da reta; 4) ao entendimento do que é uma reta de regressão.

Durante a correção do trabalho, a professora-pesquisadora observou que,

mesmo o aluno tendo o conhecimento prévio da interpretação do coeficiente

angular, do sinal ora positivo, ora negativo da reta, e também a interpretação do

sinal do coeficiente linear de Pearson, os alunos apresentam dificuldades de

compreensão desses conteúdos.

A experiência conduzida viabilizou o aperfeiçoamento das atividades e sua

ampliação para elaboração da proposta apresentada no Apêndice B.

Page 90: CAPA DISSERTAÇÃO FINAL Mara Lucia

89

6 SEGUNDA SEQUÊNCIA DE ATIVIDADES: MODELANDO DADOS REAIS

A segunda seqüência de atividades foi aplicada a 43 alunos do quarto

período, de um curso de Engenharia ofertado no turno da noite, por uma instituição

particular de ensino de Belo Horizonte, Minas Gerais.

Os trabalhos foram desenvolvidos durante o segundo semestre de 2007 e os

alunos que participaram apresentavam características semelhantes às dos alunos

que participaram da primeira seqüência didática: cursavam o mesmo curso, no

mesmo turno, com o mesmo currículo e eram na sua maioria alunos trabalhadores.

Entretanto, a atividade desenvolvida era outra. Pretendia-se que os alunos

lidassem com dados mais próximos da sua realidade, objetivando-se, dessa forma

um maior envolvimento dos mesmos; até então os dados utilizados para estudar

Estatística eram retirados dos livros didáticos.

6.1 A seqüência de atividades

Para elaborar a seqüência de atividades, a pesquisadora teve acesso a

resultados experimentais de três coletores solares para residências, fornecidos por

um laboratório de pesquisas da mesma instituição onde o trabalho aqui relatado foi

desenvolvido.

O processo de circulação da água no coletor solar envolve as variáveis: vazão

mássica da água através do coletor solar (medida em litros/minuto); temperatura Tfe

de entrada da água no coletor; temperatura Tfs da água ao sair do coletor; a

temperatura ambiente Tamb, todas as temperaturas medidas, em graus Celsius.

Os dados obtidos informavam os valores de duas variáveis. A primeira

variável fornecia a razão entre a diferença da temperatura de entrada e da

temperatura ambiente (Tfe-Tamb) e a radiação G que incide no plano do coletor,

expressa em W/m². A segunda variável informava a Eficiência térmica percentual do

coletor. A Eficiência térmica do coletor solar depende da quantidade de calor que é

transferida para a água e da taxa de energia que incide no plano do coletor.

Page 91: CAPA DISSERTAÇÃO FINAL Mara Lucia

90

Os coletores eram semelhantes ao da Figura 1.

Figura 1 – Esquema de uma instalação de aquecimento solar de água de pequeno porte operando em termossifão, (circulaç ão natural da água), composto de caixa d’água, coletor solar e re servatório térmico - Acervo GREEN SOLAR.

Foi realizada uma filtragem de dados relativos a resultados experimentais de

leituras da temperatura da água em três coletores solares.

Para cada coletor, foi retirada uma amostra de 60 dados.

As tabelas seguintes (Tabela 12, Tabela 13 e Tabela 14) apresentam os

resultados experimentais de três coletores solares de banho para residência,

observados em um laboratório por um grupo de pesquisa em energia solar.

Correspondendo a cada tabela, foi elaborado um gráfico (Gráfico 15, Gráfico

16 e Gráfico 17), denominado diagrama de dispersão. O diagrama de dispersão

permite explorar o relacionamento entre as duas variáveis: (Tfe-Tamb)/G e

Eficiência, para cada coletor.

Page 92: CAPA DISSERTAÇÃO FINAL Mara Lucia

91

Tabela 12: Coletor solar 1

(Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%)

0,038302 42,54 0,003488 64,39 0,038757 42,66 0,001024 64,39 0,03015 47,17 -0,000663 64,62 0,034942 47,17 -0,001486 64,62 0,026993 50,74 -0,000653 64,85 0,002457 50,86 -0,000486 64,85 0,006162 53,00 0,000964 65,07 0,00252 53,04 0,000071 65,07 0,011593 55,1 -0,000084 65,25 0,018763 55,1 -0,000604 65,26 -0,001985 56,48 -0,000784 65,43 0,016777 56,49 -0,001445 65,43 -0,001466 57,48 -0,000895 65,61 -0,001197 57,49 -0,000143 65,61 0,022629 58,39 -0,001084 65,83 0,014403 58,41 -0,001139 65,83 0,00748 59,13 -0,001052 66,14 -0,001172 59,13 -0,000832 66,15 -0,001589 59,96 -0,000921 66,53 -0,000043 59,96 -0,001414 66,54 0,000015 61,24 -0,000085 66,99 -0,000701 61,28 -0,000802 66,99 -0,000138 62,32 -0,004947 67,32 -0,001285 62,34 -0,000461 67,32 -0,000365 63,12 0,000061 67,57 0,00012 63,12 0,001081 67,57 0,000707 63,66 -0,000956 67,82 -0,000052 63,66 -0,000356 67,82 -0,000297 64,08 -0,000501 68,02 -0,000092 64,08 0,000103 68,03

Fonte: Grupo de pesquisa em energia solar

Page 93: CAPA DISSERTAÇÃO FINAL Mara Lucia

92

(Tfe-Tamb)/G(ºC/W/m²) (X)

Eficiência (%) (Y)

0,040,030,020,010,00

70

65

60

55

50

45

40

Gráfico 15: Diagrama 1 - Segunda Sequência de Ativ idades

Fonte: Tabela 12

Tabela 13: Coletor solar 2

(Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%)

0,000168 18,42 0,00048 54,76 0,000879 26,28 0,000361 54,98 -0,000334 30,91 0,000214 55,19 -0,001473 34,69 0,000335 55,38 -0,001 37,39 0,002426 55,6 0,027093 39,58 0,003692 55,78 0,045684 41,04 0,000115 55,99 -0,000347 42,27 0,00623 56,2 0,023285 43,18 -0,00136 56,41 0,00047 44,05 -0,00033 56,62 0,017484 44,9 -0,00013 56,8 0,022991 45,63 -0,00022 57,05 -0,001094 46,22 -0,00061 57,26 0,01948 46,79 -0,00152 57,49 0,017529 47,38 -0,00123 57,71 0,001057 48 -0,00208 57,92 0,019767 48,67 0,000194 58,15 -0,004138 49,37 -0,0022 58,41 0,010447 49,93 0,000027 58,68 0,01 50,58 -0,00024 58,88 0,010918 51,15 -0,00106 59,17 0,018762 51,61 -0,00021 59,5 0,000315 52,09 0,00075 59,83 0,014495 52,54 0,002493 60,25 -0,000249 53,05 0,02284 60,75 0,003671 53,49 -0,00259 61,31 0,001069 53,84 -0,00176 61,89 0,000202 54,09 -0,00387 63,11 0,000752 54,32 -0,00355 65,04 0,005348 54,56 -0,0012 66,81

Fonte: Grupo de pesquisa em energia solar

Page 94: CAPA DISSERTAÇÃO FINAL Mara Lucia

93

(Tfe-Tamb)/G(ºC/W/m²) (x)

Eficiência (%) (Y)

0,050,040,030,020,010,00

70

60

50

40

30

20

Gráfico 16: Diagrama 2 – Segunda Sequência de Ativi dades

Fonte: Tabela 13

Tabela 14: Coletor solar 3 (Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%)

0,005979 13,84 0,009208 58,93 0,010541 13,92 0,037157 58,93 0,045003 25,44 0,000977 59,62 0,044706 25,62 0,007791 59,62 0,010871 31,57 -0,00171 60,15 0,054318 31,6 0,000843 60,15 0,003456 37,24 0,000015 60,54 0,022438 37,35 0,014826 60,54 0,052909 41,76 0,001259 61,09 0,058798 41,76 0,001607 61,1 0,005657 44,58 0,007728 61,6 0,05537 44,62 0,001115 61,6 0,001972 47,43 0,001523 62,06 0,047406 47,46 0,010089 62,07 0,000389 50,16 -0,00178 62,38 0,036059 50,17 0,007626 62,4 0,000969 52,14 -0,00028 62,83 0,038529 52,14 0,017262 62,84 0,005982 53,42 0,008992 63,13 0,00536 53,43 0,001797 63,15 0,026445 54,57 0,001257 63,56 0,023699 54,59 0,003548 63,59 0,021565 55,55 0,00145 63,96 0,01176 55,6 0,002111 63,98 0,000842 56,49 0,00364 64,4 0,067976 56,5 0,001461 64,43 0,014577 57,39 -0,00217 64,86 0,00126 57,4 0,02313 64,92 0,021093 58,28 0,004789 65,62 0,006712 58,29 -0,00086 65,66

Fonte: Grupo de pesquisa em energia sol ar

Page 95: CAPA DISSERTAÇÃO FINAL Mara Lucia

94

(Tfe-Tamb)/G(ºC/W/m²) (x)

Eficiência (%) (Y)

0,070,060,050,040,030,020,010,00

70

60

50

40

30

20

10

Gráfico 17: Diagrama 3 – Segunda Sequência de Ativi dades

Fonte: Tabela 14

Questões propostas Discuta com seus colegas e resolva as questões propostas, registrando as

observações.

1) Observe o Diagrama 1 e descreva qual o tipo de relação, (direta ou inversa)

existente entre as duas variáveis? Justifique.

2) Com base no Diagrama 2, procure descrever como os pares ordenados se

distribuem.

3) Observe o Diagrama 1, você acha possível dizer, de acordo com os seus

conhecimentos prévios, qual variável pode ser considerada dependente e qual

variável pode ser considerada independente. Justifique.

4) Observe o Diagrama 3, quantos são os valores correspondentes à eficiência que

estão no intervalo de variação de X de 0,05 a 0,06? Qual o maior valor de

eficiência térmica nesse intervalo?

5) Usando o Diagrama 1, marque onde você acredita estar localizado o valor

mediano e o valor médio em Eficiência (%) e explique o que cada um representa

na Estatística.

6) Observe os três diagramas, você considera possível estabelecer um modelo

matemático que descreva como variam Eficiência e (Tfe-Tamb)/G ?

7) Em qual diagrama, você percebe melhor um possível ajuste de um modelo

matemático. Justifique.

Observe o Diagrama 1 e faça uma estimativa para o valor da eficiência térmica,

Page 96: CAPA DISSERTAÇÃO FINAL Mara Lucia

95

quando o valor da abscissa for igual a 0,02?

Na elaboração dessa segunda atividade, pretendeu-se, da mesma forma

quando da montagem da primeira atividade, que os alunos desenvolvessem a

habilidade de leitura e interpretação de dados. As atividades, no seu conjunto,

objetivaram que os alunos tivessem que ler os dados, ler dentro dos dados e ler

através dos dados, categorias apontadas por Curcio (1987). Essas categorias foram

utilizadas para a elaboração das tarefas e para posterior análise dos resultados.

6.2 Desenvolvimento da seqüência de atividades e an álise dos resultados

A seqüência de atividades foi conduzida em duas etapas. Na primeira

etapa, durante duas aulas de 100 minutos, os alunos discutiram as questões

propostas, registrando por escrito suas idéias intuitivas. Participaram do processo 19

duplas, nomeadas como D1, D2, até D19 e outros 04 alunos, que optaram por

participar individualmente da atividade, referenciados como I 20, I 21, I 22 e I 23.

Para facilitar o debate que ocorreria no segundo momento, todas as duplas e alunos

mantiveram uma cópia do registro com a síntese dos resultados obtidos. Durante

essa fase, os alunos ainda não tinham tido qualquer apresentação dos conteúdos

estatísticos de correlação e regressão, nem de diagramas de dispersão. O objetivo

da atividade, desenhada na forma de atividade investigativa foi proporcionar aos

alunos que explorassem os dados, levantando conjecturas, argumentando acerca

das idéias intuitivas sugeridas pelos gráficos de distribuição dos pares ordenados,

ou sobre os dados dispostos nas tabelas.

A segunda etapa, correspondente à socialização dos resultados, foi

realizada em dois momentos. No primeiro momento, foram discutidas as oito

questões e logo em seguida a professora-pesquisadora apresentou o conteúdo

formal do tema correlação e regressão. No segundo momento, deu-se continuidade

às discussões e foi feita a apresentação formal do conteúdo. Os dois momentos

foram gravados em áudio. Todas as questões foram analisadas e comentadas pela

professora-pesquisadora, levando-se em consideração as respostas escritas e as

gravações em áudio.

Page 97: CAPA DISSERTAÇÃO FINAL Mara Lucia

96

Na primeira questão, foi solicitado aos alunos que observassem o

Diagrama1 na tentativa de verificar se havia algum tipo de relação (direta ou inversa)

entre as duas variáveis: a primeira expressa pela razão (Tfe-Tamb)/G e a segunda

correspondendo à Eficiência do coletor. Dezesseis duplas, assim como os 04 alunos

que trabalharam individualmente responderam de forma bem objetiva, afirmando

que à medida que a variável (Tfe -Tamb)/G (X) aumenta, a Eficiência (Y) diminui.

Isso informa uma relação inversa entre as duas variáveis. As duplas D 7, D 11 e D

19 ao explorarem o Diagrama 1 registraram que:

”Inversa. Observando o digrama 1 é possível notar que quanto maior (Tfe -Tamb)/G(ºC/W/m2) (X), menor é a Eficiência (%) (Y) do processo, pois aquecerá uma água que já foi anteriormente aquecida”. (D7). “Altos valores de eficiência estão localizados em regiões de baixos valores da outra variável, logo: nota-se que a relação entre as variáveis é inversamente proporcional”. (D 11) “Inversa. Quanto maior a temperatura da água menor a eficiência do processo já que estava aquecendo uma água aquecida anteriormente”. (D 19)

A questão 1 pode ser analisada de acordo com a categoria de Curcio ler

dentro dos dados. Percebeu-se que os alunos fizeram a leitura dos dados

localizando os pares ordenados do diagrama e efetuando também uma comparação

entre as quantidades envolvidas, de tal maneira que a leitura levou-os a identificar a

existência de uma relação de dependência entre as variáveis; foram capazes de

perceber que as grandezas envolvidas eram inversamente proporcionais.

Na questão 2, os alunos deviam observar o Diagrama 2, e descrever como

os pares ordenados se distribuíam. A questão envolvia tanto a leitura dos dados

quanto a leitura dentro dos dados, pois o aluno era instigado a identificar valores no

diagrama, a analisar, interpretar e fazer comparações de valores.

As respostas, de modo geral, foram semelhantes. Esse foi o caso das duplas

D 1, D 2, D 3, D 5, D 6, D 7, D 9, D 10, D 12, D 13, D 14, D 16, D 17, D 18, D 19 e

dos trabalhos individuais I 20, I 22 e I 23. A idéia geral apontada foi que, quando

(Tfe-Tamb)/G) (X) está próxima de zero, ocorre uma maior concentração de pontos

no eixo da Eficiência (Y) em torno de 40% a 60%. Os pontos restantes concentram-

se entre X=0,01 e X=0,03, sendo que apenas um ponto está próximo de X=0,05,

correspondendo a uma eficiência de aproximadamente 40%. Para as demais duplas

Page 98: CAPA DISSERTAÇÃO FINAL Mara Lucia

97

D 4, D 8, D11 e D15, assim como para o aluno I 21, os pontos do Diagrama 2 se

distribuíam de forma desordenada.

A questão 3 procurou saber se a partir da representação dos pares ordenados

expressa no Diagrama 1, o aluno seria capaz de identificar qual variável poderia ser

considerada como independente. O objetivo era que os alunos interpretassem os

dados do diagrama, relacionando a questão levantada com os estudos de Geometria

Analítica, em particular a representação gráfica de funções, onde o eixo dos X

corresponde à variável independente. Todas as duplas identificaram que a variável

eficiência era a variável dependente, mas não foram capazes de justificar, limitando-

se a afirmar que a eficiência térmica dependia de (Tfe-Tamb)/G). Houve uma dupla

(D 5) que afirmou que a eficiência dependia de ∆T/G, demonstrando, pelo menos,

ter entendido o que representava o numerador na fórmula (Tfe-Tamb)/G). Na

tentativa de elaborar justificativas, algumas duplas fizeram afirmativas inadequadas,

sem qualquer sustentação teórica como, por exemplo: “A variável temperatura é

independente, pois não é influenciada por outra variável” (D 10). Na mesma linha,

situa-se a colocação de outra das duplas: “A Eficiência é uma constante

dependente, pois ela depende de fatores...” (D 7). Os alunos parecem não se

apossar da linguagem matemática, não atribuindo significado aos termos: o que

levaria os alunos a fazerem a leitura dos dados e afirmarem ser a eficiência uma

constante?

Apenas a dupla D1 justificou a afirmativa com base em uma forma padrão,

estudada anteriormente: “A eficiência é a variável dependente [...], pois a eficiência

está no eixo das ordenadas e de acordo com os conhecimentos prévios a ordenada

representa a variável dependente.”

Na questão 4, foi pedido aos alunos que a partir do Diagrama 3,

respondessem quantos pontos correspondentes à Eficiência (%) (Y) estariam

localizados no intervalo [0,05, 0,06] da variável X. A questão solicitava ainda a

identificação do maior valor de eficiência térmica nesse mesmo intervalo.

Todos os participantes identificaram os 4 pontos no intervalo de variação de X

de 0,05 a 0,06. Entretanto, ao indicarem a maior ordenada, correspondente à

eficiência térmica, os alunos I 21, I 22 e I 23, assim como as duplas D 2, D 9, D 11,

D 12, D13, D 14, D 16, e D 18, informaram como maior valor para a ordenada Y, um

valor superior a 50%. Esse fato pode evidenciar uma falta de entendimento do

enunciado, uma leitura pouco cuidadosa da questão, ou ainda a pressa em

Page 99: CAPA DISSERTAÇÃO FINAL Mara Lucia

98

responder, sem utilizar, por exemplo, uma régua para facilitar a leitura, ou mesmo

recorrer à Tabela 14. É curioso o fato que nenhum aluno recorreu à Tabela 14, que

poderia tornar mais precisa a resposta, localizando a ordenada máxima local como

sendo y = 44,62 correspondendo a x = 0,0537. A reflexão sugere uma modificação

da questão e de outras, no sentido de que os alunos utilizem e sejam incentivados a

utilizar não apenas os diagramas de dispersão, mas também as tabelas. O fato é

relevante, considerando-se que a questão 4 era um convite a que o aluno fizesse a

leitura literal dos dados, habilidade elementar, mas essencial para leituras mais

elaboradas tanto dentro quanto além dos dados.

A questão 5, convidava o aluno a identificar no diagrama os possíveis valores

correspondentes ao valor mediano e ao valor médio da distribuição, e a explicar o

que cada um representa na Estatística, objetivando-se, assim, a retomada de

conceitos anteriormente estudados. De modo geral, os participantes definiram a

mediana e a média e atribuíram valores aproximados às duas medidas, usando

apenas a representação gráfica da distribuição de pontos, ou seja, o Diagrama 1.

Novamente não fizeram qualquer tentativa de obtenção do valor das medidas a

partir das informações da Tabela 12. A leitura dentro dos dados foi por vezes

comprometida por falta de conhecimentos prévios. É o caso das duplas D 11, D 14 e

D 18 que conceituaram inadequadamente as duas medidas, chamando de mediana

o que representa a média e vice-versa.

Na questão 6, foi pedido aos alunos que observassem os três diagramas, na

tentativa de analisar a possibilidade de estabelecer um modelo matemático que

descrevesse como as grandezas Eficiência (%) (Y) e(Tfe -Tamb)/G (X) variavam. A

questão 7 indagava em qual dos diagramas era possível verificar melhor um

possível ajuste de um modelo matemático que descrevesse os dados. As duas

questões objetivavam incentivar o aluno a ler dentro dos dados, interpretando

informações gráficas e comparando os diagramas. Entre os participantes, 11 duplas

e um aluno (I 22) consideraram não ser possível estabelecer um modelo matemático

para a descrição dos dados, alegando alguns poucos que os dados eram muito

dispersos. As duplas D 1, D 4, e D 12 justificaram ser possível um ajuste a partir do

uso de técnicas estatísticas de regressão polinomial. Em particular, a dupla D1

concluiu que: a partir do diagrama 1 pode-se obter a equação de uma reta

decrescente; no diagrama 2, a equação de uma parábola e, no diagrama 3, os

alunos não mencionaram o modelo matemático, possível somente com o uso de

Page 100: CAPA DISSERTAÇÃO FINAL Mara Lucia

99

recursos computacionais. Quanto à questão 7, todos os alunos afirmaram ser

possível ajustar um modelo matemático, afirmando uma menor dispersão dos dados.

Grande parte dos participantes percebeu uma linearidade dos pontos da distribuição

amostral. Entretanto, nas respostas a essa questão, assim como em outras

respostas pode-se verificar uma imprecisão e falta de rigor de linguagem. Apenas a

dupla D1 apresentou uma resposta mais elaborada: “O primeiro diagrama, porque

ele obedece praticamente uma função linear decrescente, sendo mais fácil de se

aproximar por uma reta”. Mesmo assim evidenciam-se imprecisões no registro

escrito. De modo geral, as respostas apontam o pouco costume dos alunos de

escrever suas idéias sobre um assunto, alertando para a necessidade de uma

atenção do professor para o fato, propondo sempre que possível que os alunos

exercitem o poder de argumentação escrito.

A questão 8 solicitava a observação do Diagrama 1 e a estimativa de um valor

da eficiência térmica, quando o valor da abscissa fosse igual a 0,02. As respostas

das duplas e dos trabalhos individuais possibilitaram verificar que os alunos fizeram

uma estimativa para o valor da eficiência térmica no intervalo de 50% a 58%, para o

valor da abscissa igual a 0,02. A dupla D5 foi a única a responder que para o valor

de x em questão não existia eficiência térmica e não justificou a resposta.

Lendo e relendo os registros dos alunos e ouvindo as gravações, a

professora-pesquisadora percebeu que os grupos se limitaram a repetir o que

haviam registrado por escrito, quando foi realizada a socialização das respostas.

Esse fato era de se esperar, de acordo com os resultados da primeira seqüência

(Capítulo 5), uma vez que o trabalho foi desenvolvido em outro semestre, com uma

turma de alunos que apresentavam características similares aos alunos que

participaram da primeira seqüência. Em particular, era para aqueles alunos uma

novidade, uma aula em que primeiro registravam por escrito suas idéias e depois

expunham para os colegas. Mais uma vez, os alunos manifestavam receios de errar,

preferindo recorrer às anotações previamente feitas e apenas repeti-las.

O papel da professora-pesquisadora foi novamente imprescindível, no sentido

de que as falhas evidenciadas nos registros escritos pudessem ser corrigidas, assim

como as lacunas, por falta de conhecimentos prévios. Esse foi, por exemplo, o caso

da discussão acerca da média e da mediana.

Os alunos durante a segunda atividade não mencionaram em nenhum

momento a existência ou não de valores discrepantes presentes nos três diagramas.

Page 101: CAPA DISSERTAÇÃO FINAL Mara Lucia

100

O que eles questionaram com muita freqüência foi o fato de haver nos diagramas

uma enorme concentração de valores próximos da origem (0,0). Esta concentração

se deve ao fato de que é nesse momento que ocorrem mais ensaios e também ao

fato da temperatura de entrada da água (Tfe) no coletor ser aproximadamente igual

à temperatura ambiente (Tamb). Durante o processo de socialização, alguns alunos,

observando os três diagramas, mencionaram que o Diagrama 1 a partir de X= 0,01

mostrava uma tendência linear, considerando-se a disposição dos valores, o que

não acontecia nos Diagramas 2 e 3.

Percebeu-se durante as duas atividades desenvolvidas pela professora-

pesquisadora que os alunos falavam mais a respeito do coletor solar do que no

conteúdo estatístico, já visto por eles em unidades anteriores, que estava sendo

abordado na atividade proposta pela professora-pesquisadora. O objetivo era, a

partir da exploração intuitiva dos dados através dos gráficos, caminhar no sentido da

formalização dos conteúdos de Correlação Linear e Regressão Linear. Muitos

alunos se mostravam bem familiarizados com o coletor solar residencial, fato que

não ocorreu na outra turma quando se aplicou a primeira atividade, a respeito do

“processo de queima de massa de cerâmica para pavimento”. Provavelmente, os

dados envolvidos na primeira seqüência de atividades não tinham muito a ver com

situações do cotidiano do aluno. A apresentação formal dos conteúdos foi feita pela

professora-pesquisadora, dentro dos mesmos moldes adotados quando do

desenvolvimento da primeira seqüência de atividades: apresentou-se a teoria,

deduzindo as fórmulas e foram feitos os cálculos dos coeficientes de correlação

(relativos aos dados de cada coletor), bem como estabelecidas as retas de

regressão para cada conjunto de dados.

Durante a aplicação da segunda seqüência de atividades, assim como da

primeira, observou-se que a exploração dos conteúdos estatísticos de correlação e

regressão, primeiramente a partir de uma abordagem intuitiva, para posterior

formalização das idéias pode facilitar o entendimento, além de motivar a

aprendizagem. O trabalho, na forma conduzida, possibilitou ainda que os alunos

fizessem conexões entre conteúdos de matemática e de estatística, começando a

perceber melhor a importância de interligar disciplinas e conceitos anteriormente

estudados.

Page 102: CAPA DISSERTAÇÃO FINAL Mara Lucia

101

7 CONCLUSÃO

A pesquisa aqui relatada, de caráter qualitativo, foi desenvolvida junto a

alunos, do quarto período, de um curso noturno de engenharia, de uma instituição

particular de ensino de Minas Gerais. Ela teve como objetivo investigar

possibilidades de uma abordagem metodológica para o ensino-aprendizagem de

correlação e regressão em turmas de graduação de um curso de engenharia,

construída a partir de um enfoque inicial mais intuitivo do assunto.

Duas seqüências de atividades foram aplicadas em turmas distintas, mas com

características similares tendo como objetivos: 1) propiciar uma atividade

investigativa, explorando os níveis de leitura e interpretação de dados, a partir das

categorias de Curcio (1987); 2) explorar as idéias de correlação linear e regressão

linear a partir de uma abordagem intuitiva; 3) motivar a apresentação formal dos

conceitos de correlação e regressão.

Também foram analisados quatro livros que discorrem sobre o tema

Correlação e Regressão, sendo dois deles específicos da área de engenharia,

objetivando-se verificar em que medida a forma de apresentação do assunto

favorece o desenvolvimento das habilidades de leitura e interpretação de dados,

adotando-se para tal análise os níveis de Curcio (1987): 1) ler os dados; 2) ler dentro

dos dados; 3) ler além dos dados.

A forma com que foram desenhadas as seqüências de atividades pretendeu

introduzir uma abordagem investigativa no ensino de correlação e regressão,

levando o aluno a refletir sobre questões novas, levantar conjecturas, verificar a

validade das mesmas, argumentando sobre resultados, socializar idéias estatísticas

(PONTE, 2003).

O processo ensino-aprendizagem continua, por vezes, a ser visto de uma

maneira fragmentada. Percebe-se claramente a resistência de grande parte dos

educadores e mesmo dos alunos em relação a mudanças na forma de ensinar e

aprender.

Na perspectiva construtivista que norteou a presente pesquisa, torna-se

necessária uma renovação do ensino-aprendizagem. As práticas pedagógicas que

respeitam a concepção de aprendizagem fundamentada nessa visão fundamentam-

Page 103: CAPA DISSERTAÇÃO FINAL Mara Lucia

102

se no fato que o conhecimento é fruto do coletivo e nasce da prática e a ela retorna

(GIUSTA, 1985).

Essa concepção de aprendizagem começará a ser realidade na sala de aula

na medida em que se fornecerem aos professores elementos essenciais para a

mudança. E isso se torna possível na medida em que os próprios professores

experimentem como estudantes, essas novas abordagens de ensino e que as

experiências sejam suficientemente fortes, para desafiarem muitos anos de um

ensino tradicional (FOSNOT, 1998). Uma nova prática de ensino-aprendizagem,

numa abordagem construtivista exige uma mudança qualitativa no ensino e uma

mudança de postura por parte do professor que passa a atuar como um mediador.

Durante a aplicação das duas seqüências de atividades e no processo de

socialização, foi detectado pela professora-pesquisadora que o aluno não tem o

hábito de explorar gráficos e quando o faz, a sua preocupação reside em saber se a

sua exploração está correta ou não. Esse fato chama a atenção para que ao

desenhar atividades a serem desenvolvidas em sala de aula sobre o tema

correlação e regressão, seja dada uma ênfase às representações gráficas, com o

intuito de que o aluno faça a leitura dos pares ordenados, explore as possíveis

tendências, a partir da disposição desses pares ordenados, consiga perceber o

motivo do coeficiente linear de Pearson ser ora positivo, ora negativo e que ele

intuitivamente seja capaz de perceber a partir dos pares ordenados no diagrama de

dispersão uma linha imaginária ajustada a esses ou passando bem próximo deles.

Todas essas percepções prévias são importantes para o aluno antes do

conhecimento formal do conteúdo não só de correlação e regressão, mas de outros

tópicos tanto da Estatística, como de outras disciplinas.

Durante todo o processo, a professora-pesquisadora surpreendeu-se como

essa forma de abordagem metodológica do assunto, primeiramente explorando as

idéias intuitivas do aluno, para posterior formalização. Outro fator enriquecedor para

a professora-pesquisadora foi ter trabalhado num primeiro momento com dados

provenientes de um livro didático, mas num segundo momento poder utilizar dados

reais, mais ligados ao contexto do curso e do aluno. Foi possível perceber que os

alunos ficam mais interessados e comprometidos, o que reafirma propostas

metodológicas na forma de projetos estatísticos, em que o aluno realiza desde a

seleção dos dados, e por vezes a coleta, desenvolvendo a partir daquele conjunto

de dados, uma série de estudos estatísticos, envolvendo desde o tratamento

Page 104: CAPA DISSERTAÇÃO FINAL Mara Lucia

103

descritivo, até o tratamento inferencial dos dados. As reflexões oriundas de trabalho

desenvolvido alertam para a importância de não inibir a capacidade do aluno de

intuir a respeito de uma situação, introduzindo antecipadamente um tratamento

formal da teoria. É possível melhorar o nosso trabalho em sala de aula com

qualidade e responsabilidade, trabalhando na medida do possível, a partir de uma

abordagem intuitiva, sem nos descuidarmos da sistematização formal, necessária

para que o aluno incorpore as idéias estatísticas, sua linguagem própria e rigor.

Algumas limitações da pesquisa devem ser apontadas. A pesquisa abordou

apenas de modo introdutório o tema correlação e regressão, não discutindo uma

série de assuntos correlatos como, por exemplo, intervalo de confiança e teste de

hipóteses, tendo em vista a carga horária da disciplina, insuficiente para isso. Da

mesma forma, a insuficiência de carga horária dificultou que o processo de aplicação

ocorresse com tempo suficiente para perceber melhor as idéias intuitivas dos alunos

e dialogar a respeito, tendo em conta também a resistência do aluno durante a

abordagem investigativa, uma vez que ele está acostumado a receber com

freqüência o conteúdo de maneira pronta e formalizada.

Quebrar os paradigmas que levam à preocupação do aluno em estar

respondendo certo e, na maior parte das vezes, ficar ansioso ao lidar com a

exploração dos dados, em especial com diagramas de dispersão, foi um desafio;

durante o processo investigativo poucos alunos conseguem perceber a riqueza da

atividade exploratória, mas após a formalização do conteúdo, a maior parte deles

muda a forma de avaliação a respeito da atividade investigativa, e confessa que a

experiência enriquece muito o processo de aquisição do conhecimento, isto é, a

transposição do intuitivo para o formal.

Espera-se que o trabalho desenvolvido se some a outros ampliando

estratégias didáticas para o ensino de correlação e regressão em cursos

introdutórios de estatística, em especial em cursos de engenharia. A proposta final

apresentada no Apêndice B amplia as seqüências de atividades testadas em sala,

oferecendo novas possibilidades de abordagem introdutória do tema correlação e

regressão.

A partir da pesquisa desenvolvida e aqui apresentada, outros trabalhos podem ser

feitos, ampliando os estudos, por exemplo, através da exploração na forma de

atividades investigativas de outros tipos de correlação e também a exploração de

testes de hipótese e intervalos de confiança para regressão.

Page 105: CAPA DISSERTAÇÃO FINAL Mara Lucia

104

REFERÊNCIAS

ARA, Amilton Braio. O Ensino de Estatística e a Busca do Equilíbrio ent re os Aspectos Determinísticos e Aleatórios da Realidade. 2006, Tese (Doutorado).Universidade de São Paulo.

BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais . 4 ed.rev. Florianópolis: Ed. da UFSC, 2001, 338p.

BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística: para os cursos de engenharia e informática. São Paulo: Atlas, 2004. 410p.

BATANERO, Carmem. Didáctica de la Estadística. Granada: Universidad de Granada, 2001, 208 p.

BATANERO, C., ESTEPA, A., GODINO, J.D. y Green, D.Y Green , D. R. Intuitive strategies and preconceptions about association in contigency tables. Journal for Research in Mathematics Education, v. 27, n.2, p.151 – 169, 1996.

BATANERO, C., GODINO, J.D., HOLMES, P.y VALLECILOS, A. Errores y dificuldades em la comprensión de los conceptos estadísticos elementales. International Journal of Mathematics Education in S cience and Tecnology , 1994, n. 25, v.4, p. 527-547.

BIFI, R. Carlos. Estatística em um Curso de Administração de Empresas: Mobilização dos Conceitos Estatísticos de Base. São Paulo, 2006. 124p.Dissertação de Mestrado em Educação Matemática – Pontifícia Universidade Católica de São Paulo, São Paulo.

BRASIL. Ministério da Educação e do Desporto. Parâmetros Curriculares do Ensino Fundamental , Brasilia: MEC/SEMTEC, 1998

BRASIL. Ministério da Educação. Secretaria de Educação Média e Tecnológica. Parâmetros curriculares Nacionais: ensino médio. Brasilia: MEC/SEMTEC. 1998

BRASIL, PCN+ Disponível em http://portal.mec.gov.br/cne/2002, Acesso em 23 de maio de 2008.

Page 106: CAPA DISSERTAÇÃO FINAL Mara Lucia

105

BRASIL. CNE. Diretrizes Curriculares Nacionais dos Cursos de Eng enharia . Disponível em http://www.engenharia.ufjf.br/documentos/cne112002.pdf. Acesso em 23 de maio de 2008.

CAZORLA, Irene. A relação entre a habilidade viso-pictórica e o dom ínio de conceitos estatísticos contidos em gráficos, 2002. Tese (Doutorado). Universidade Estadual de Campinas, Campinas

CURCIO, Frances R. Comprehension of Mathematical Relationships Expressed in Graphs. Journal for Research in Mathematics Education, v. 18, n. 5, p. 382-398. 1987

CURCIO, Frances R. ; ARTZT, Alice F. Assessing Students’ Ability to Analuze Data: Reaching beyond Computation. Mathematics Teac her, v. 89, p. 668-673. Nov. 1996

ESTEPA, A., BATANERO, C. Concepciones iniciales sobre la associación estadística. Ensenñanza de las Ciencias , v.13, n.2, p.155 – 170, 1995..

ESTEPA, A.Y BATANERO,C. Judgments of correlation in scatterplots: students’ intuitive strategies and preconceptions . Hiroshima Journal of MathematicsEducation, 1996, n.4, p.25 - 41.

FOSNOT, Catherine Twomey. Construtivismo: Teoria, perspectiva e prática . Porto Alegre: Artmed, 1998.

FRIEL, Susan N.; CURCIO Frances R. BRIGHT. GEORGE W. Critical Factors

Influencing Comprehension and Instructional Implications. Jounal for Research in

Mathematics Education, v.32, n.2, p. 124-158. 2001

GARFIELD, Joan; HOGG, Bob; SCHAU, Candace. First Courses in Statistical

Science: The Status of Educational Reform Efforts. Journal of Statistics Education,

Volume 10, Number 2 (2002), Disponível em: www.amstat.org/publications/jse/v10n2

/garfield.html. Acesso em 20 de junho de 2008.

Page 107: CAPA DISSERTAÇÃO FINAL Mara Lucia

106

GARFIELD, Joan et al.First Course in Statistical Science: The Status of Educational Reform Efforts. Journal of Statistics Education , v. 10, n. 2. Disponível em: www.amstat.org/publications/jse/v10n2/garfield.html. Acesso em 03 de maio de 2008.

GIUSTA, Agnela da S. Concepções de Aprendizagem e Práticas Pedagógicas. Educação em Revista , v.1, p. 24-31, 1985.

INHELDER B. e PIAGET J. Da lógica da criança à lógica do adolescente: ensai o sobre a construção das estruturas operatórias forma is . São Paulo: Pioneira, 1976, 259p.

IGLIORI, Sonia. A noção de obstáculo epistemológico e a Educação matemática. In: MACHADO Silvia (Org.). Educação Matemática : uma introdução. São Paulo: PUC-SP, 1999, p. 89-113

LEVIN, Jack; FOX, James Alan. Estatística para Ciências Humanas. 9.ed. São Paulo: Prentice – Hall, 2004.

MAGALHÃES, Marcos Nascimento, LIMA, Antônio Carlos Pedroso de. Noções de Probabilidade e Estatística , 6 ed. São Paulo, Editora da Universidade de São Paulo, 2007. – (Acadêmica; 40)

MEMÓRIA, José Maria Pompeu, Breve História da Estatística , Brasília, DF: Embrapa Informação Tecnológica, 2004.

MONTGOMERY, Douglas C., RUNGER, George C.. Estatística Aplicada e Probabilidade Para Engenheiros , 2 ed., Rio de Janeiro: LTC - Livros Técnicos e Científicos, c2003. 463p.

MOORE , David S. , Preparing Graduate Students to Teach Statistics. Introduction. The American Statistician , 2005, v. 59, n. 1. Disponível em: http://www.stat.purdu e.edu/~dsmoore/articles/TeachPrep.pdf> Acesso em: 23 de maio de 2008.

Page 108: CAPA DISSERTAÇÃO FINAL Mara Lucia

107

PEREIRA, Jose Severo; MORETTIN, Pedro A. Las Estadísticas brasileñas y la enseñanza de la Estadística en Brasil. Estadística Española. V.33, n, 128. op. 559 – 574 , 1991. Disponível em: http://www.mat.ufrjs.br/~viali/estatistica/mat2006/mate Rial/textos/Severo-Morettin.pdf. Acesso em: 20 de fevereiro de 2008

PAIS, Luis Carlos. Didática da Matemática: Uma análise da influência f rancesa . Belo Horizonte: Autêntica, 2001, 128 p.

NATIONAL COUNCIL OF TEACHERS OF MATHEMATICS. Standards for School Mathematics , 2000. Disponível em: http://standards.nctm.org/document/chapter3/ data.htm. Acesso em 23 de maio de 2008.

PARDAL, Paulo. Primórdios do Ensino de Estatística no Brasil e na UERJ [Reimpresso da “Revista do Instituto Histórico e Geográfico Brasileiro”. Rio de Janeiro, 154(378):1–152, jan./mar. 1993.] Disponível em: http://www.redeabe. org.br/pardal.pdf Acesso em 20 de fev. 2008

PONTE, João Pedro; BROCARDO, Joana; OLIVEIRA, Hélia. Investigações matemáticas na sala de aula . Belo Horizonte:Autêntica, 2003. 151p. (Tendências em educação matemática ;7 )

SÁNCHEZ Cobo, F. T.; ESTEPA, A. Y BATANERO, C. Un estudio experimental de la estimación de la correlación a partir de diferentes representaciones. Ensenãnza de las Ciencias , v.18, n.2, p.297 – 310, 2000.

SÁNCHEZ, Cobo, F. T.; ESTEPA, A. Correlación y regresión en los primeros cursos universitarios . Jornades Europees d’Estadística, 2001, p.273-288 Disponível em http://www.caib.es/ibae/esdeveniment/jornades_10_01/doc/Estepa-Jornadas-Mallorca.doc>>. Acesso em 19/10/2006.

SÁNCHEZ, Cobo, F. T.; ESTEPA, A. Empirical Research on the Understanding Association and Implications for the Training of Researchers. In BATANERO, C (ed) Training of Researchers in the Use of Statistics, 2001b Granada, Spain, p. 37-51. International Association

STEVENSON, William J., Estatística Aplicada à Administração . São Paulo: Harper & Row do Brasil, 1981.

TRIOLA, Mario F. Introdução à estatística . 7. ed. Rio de Janeiro: LTC - Livros Técnicos e Científicos, c1999. 410p.

Page 109: CAPA DISSERTAÇÃO FINAL Mara Lucia

108

NATIONAL COUNCIL OF TEACHERS OF MATHEMATICS. Standards for School Mathematics, 2000. Disponível em: http://www.standards.nctm.org/document/chap ter3/data.htm. Acesso em: 23 de maio de 2008. VENDRAMINI, Claudette Maria Medeiros. Dificuldades em Matemática e solução de problemas de Estatística . In: Encontro Paulista de Educação Matemática V, 1998. Disponível em http://www.sbempaulista.org.br/epem/anais/mesas_redondas/

mr14-Claudette.doc. Acesso em 12 de junho de 2008.

WATSON, Jane M.; MORITZ, Jonathan B. Development os Reasoning Associated with Pictographs: Representing, interpreting, an predicting. Educational Studies in Mathematics, v. 48, p.47-81, 2001

WILD, Christopher J., SEBER, George A. F. Encontros com o Acaso: Um Primeiro Curso de Análise de Dados e Inferência , Rio de Janeiro: LTC - Livros Técnicos e Científicos, c2004. 411p.

WODEWOTZKI, Maria Lúcia L: JACOBINI, Otávio Roberto. O Ensino de Estatística no Contexto da Educação Matemática. In: BICUDO M. A.; BORBA M. C. Educação Matemática: pesquisa em movimento. São Paulo: Cortez, 2004, p. 232-249

Page 110: CAPA DISSERTAÇÃO FINAL Mara Lucia

109

APÊNDICES

Page 111: CAPA DISSERTAÇÃO FINAL Mara Lucia

110

APÊNDICE A – Quadro de classificação dos exercícios

No Quadro 1 é apresentada uma classificação dos exercícios resolvidos e

propostos pelos autores.

Páginas; Seção Numero dos exercícios.

Ler os dados Ler dentro dos dados

Ler além dos dados

208; Seção 10.2 10.1 Não Sim Sim 209; Seção 10.2 10.2 Não Sim Sim 209; Seção 10.2 10.3 Não Sim Sim 209; Seção 10.2 10.4 Não Sim Sim 209; Seção 10.2 10.5 Não Sim Sim 209; Seção 10.2 10.6 Não Sim Sim 210; Seção 10.2 10.7 Não Sim Sim 210; Seção 10.2 10.8 Sim Sim Sim 210; Seção 10.2 10.9 Não Sim Sim 210; Seção 10.2 10.10 Não Sim Sim 211; Seção 10.2 10.11 Não Sim Sim 211; Seção 10.2 10.12 Não Sim Sim 211; Seção 10.2 10.13 Não Não Sim 211; Seção 10.2 10.14 Sim Sim Sim 211; Seção 10.2 10.15 Não Sim Sim 211; Seção 10.2 10.16 Não Sim Sim 211; Seção 10.2 10.17 Sim Não Sim 215; Seção 10.5 10.18 Não Sim Sim 215; Seção 10.5 10.19 Não Sim Sim 215; Seção 10.5 10.20 Não Sim Sim 215; Seção 10.5 10.21 Não Sim Sim 216; Seção 10.5 10.22 Não Sim Sim 216; Seção 10.5 10.23 Não Sim Sim 216; Seção 10.5 10.24 Não Sim Sim 216; Seção 10.5 10.26 Não Sim Sim 216; Seção 10.5 10.27 Não Sim Sim 216; Seção 10.5 10.28 Não Sim Sim 216; Seção 10.5 10.29 Não Sim Sim 216; Seção 10.5 10.30 Sim Sim Sim 219; Seções 10.6 e 10.7 10.31 Não Sim Sim 219; Seções 10.6; e 10.7 10.32 Não Sim Sim 219; Seções 10.6 e10.7 10.33 Não Sim Sim 219; Seções 10.6 e 10.7 10.34 Não Sim Sim 219; Seções 10.6 e 10.7 10.35 Não Sim Sim 219; Seções 10.6 e 10.7 10.36 Não Sim Sim 219; Seções 10.6 e 10.7 10.37 Não Sim Sim 219; Seções 10.6 e 10.7 10.38 Não Sim Sim 219;Seções 10.6 e 10.7 10.39 Não Sim Sim 219;Seções 10.6 e 10.7 10.40 Não Sim Sim 219;Seções 10.6 e 10.7 10.41 Não Sim Sim 223; Seção 10.8 10.42 Sim Sim Sim 223; Seção 10.8 10.43 Sim Sim Sim 223; Seção 10.8 10.44 Sim Sim Sim 223; Seção 10.8 10.45 Sim Sim Sim 223; Seção 10.8 10.46 Sim Sim Sim 223; Seção 10.8 10.47 Sim Sim Sim 223; Seção 10.8 10.48 Sim Sim Sim

Page 112: CAPA DISSERTAÇÃO FINAL Mara Lucia

111

(continuação) 223; Seção 10.8 10.49 Sim Sim Sim 223; Seção 10.8 10.50 Sim Sim Sim 223; Seção 10.8 10.51 Não Sim Sim 223; Seção 10.8 10.52 Não Sim Sim 224; Seção 10.8 10.53 Não Sim Sim 224; Seção 10.8 10.54 Não Sim Sim 226; Seção10.10 10.55 Não Sim Sim 226; Seção10.10 10.56 Não Sim Sim 226; Seção 10.10 10.57 Não Sim Sim 227; Seção10.10 10.58 Não Sim Sim 227; Seção10.10 10.59 Não Sim Sim 227; Seção10.10 10.60 Não Sim Sim 227; Seção10.10 10.61 Não Sim Sim 227; Seção10.10 10.62 Não Sim Sim 227; E.S. 10.63 Não Sim Não 227; E.S. 10.64 Não Sim Sim 227; E.S. 10.65 Não Sim Sim 227; E.S. 10.66 Não Sim Sim 228; E.S. 10.67 Não Sim Sim 228; E.S. 10.68 Não Sim Não 229; E.S. 10.69 Não Sim Sim 229 ;E.S. 10.70 Não Sim Sim 229;E.M. 10.71 Não Sim Sim 229; E.M. 10.72 Não Sim Sim 229; E.M. 10.73 Não Sim Sim 229; E.M. 10.74 Não Não Sim 229; E.M. 10.75 Não Sim Sim 229; E.M. 10.76 Não Sim Sim 229; E.M. 10.77 Não Sim Sim

Quadro 1: Classificação à luz de Curcio (1987) dos exercícios propostos. Fonte: Livro 1 No Quadro 2 é apresentada uma classificação dos exercícios resolvidos e propostos pelos autores:

Páginas; Numero do

exercício.

Ler os dados Ler dentro dos

dados

Ler além dos

dados

323 1 Não Sim Sim 323 2 Não Não Não 323 3 Sim Sim Sim 324 4 Não Sim Sim 344 5 Não Sim Sim 344 6 Não Sim Sim 344 7 Não Sim Sim 345 8 Não Sim Sim 345 9 Não Sim Sim 346 10 Não Sim Não

Quadro 2: Classificação à luz de Curcio (1987) dos exercícios propostos. Fonte: Livro 2

Page 113: CAPA DISSERTAÇÃO FINAL Mara Lucia

112

No Quadro 3 é apresentada uma classificação dos exercícios resolvidos e propostos pelos autores:

Páginas; Seção Numero do

exercício.

Ler os dados Ler dentro dos

dados

Ler além dos

dados

154; 5.3 3 Não Sim Não 155; 5.3 5 Não Sim Não 155; 5.3 6 Não Sim Não 155; 5.3 7 Não Sim Não 156 ;5.3 8 Não Sim Não 157; 5.3 11 Não Sim Não 163; 5.3 36 Não Sim Não 340; 9.5 1 Não Sim Não 340; 9.5 2 Não Sim Não 341; 9.5 3 Sim Sim Sim 349; 9.6 22 Não Sim Não 349; 9.6 23 Não Sim Não 350; 9.6 24 Não Sim Sim 350; 9.6 25 Não Sim Sim 350; 9.6 26 Não Sim Não 351; 9.6 27 Não Sim Não 351; 7.6 28 Não Sim Sim 352; 7.6 30 Não Sim Não

Quadro 3: Classificação à luz de Curcio (1987) dos exercícios propostos. Fonte: Livro 3 No Quadro 4 é apresentada uma classificação dos exercícios resolvidos e propostos pelos autores: T – Exercícios de teste E – Exercícios propostos

Páginas; Seção Numero do

exercício.

Ler os

dados

Ler dentro

dos dados

Ler além dos

dados

66; 3.1.1 T 1 Não Não Não 66; 3.1.3 T 2 Não Não Não 66; 3.1.1 T 3 Não Não Não 66; 3.1.1 T 4 Não Não Não 66; 3.1.1 E 1a até 1i Não Não Não 70; 3.1.2 T 1 Não Não Não 70; 3.1.2 T 2 Não Não Não 70; 3.1.2 T 3 Não Não Não 70; 3.1.2 T 4 Não Não Não 70; 3.1.2 T 5 Não Não Não 70; 3.1.2 T 6 Não Não Não 70; 3.1.2 T 7 Não Não Não 70; 3.1.2 T 8 Não Não Não 70; 3.1.2 T 9 Não Não Não 70; 3.1.2 E 1 Não Sim Não 70; 3.1.2 E 2 Não Sim Não 70; 3.1.2 E 3 Não Sim Não 70; 3.1.2 E 4 Não Sim Não 72; 3.1.3 T 1 Não Não Não 72; 3.1.3 T 2 Não Não Não 72; 3.1.3 T 3 Não Não Não

Page 114: CAPA DISSERTAÇÃO FINAL Mara Lucia

113

(continuação) 72; 3.1.3 E 1 Não Não Sim 72; 3.1.3 E 2 Não Não Sim 72; 3.1.3 E 3 Não Não Sim 77; 3.2 T 1 Não Não Não 77; 3.2 T 2 Não Não Não 77; 3.2 T 3 Não Não Não 77; 3.2 T 4 Não Não Não 77; 3.2 E 1 Não Sim Não 77; 3.2 E 2 Não Sim Não 79; 3.3 T 1 Não Não Não 79; 3.3 T 2 Não Não Não 79; 3.3 E 1 Não Não Não 79; 3.3 E 2 Não Sim Não

82; Exercícios para revisão 1 Não Sim Sim 82; Exercícios para revisão 2 Não Sim Sim 82; Exercícios para revisão 3 Não Sim Sim 82; Exercícios para revisão 4 Sim Sim Sim 82; Exercícios para revisão 5 Não Sim Sim 82; Exercícios para revisão 6 Não Sim Não 82; Exercícios para revisão 7 Sim Sim Não 82; Exercícios para revisão 8 Não Sim Não 82; Exercícios para revisão 9 Não Sim Não 82; Exercícios para revisão 10 Não Sim Não 308; 12.1.3 E a; b Sim Sim Sim

308; 12.1 T 1 Não Não Não 308; 12.1 T 2 Não Não Não 308; 12.1 T 3 Não Não Não 308; 12.1 T 4 Não Não Não 308; 12.1 T 5 Não Não Não 308; 12.1 T 6 Não Não Não 308; 12.1 T 7 Não Não Não 308; 12.1 T 8 Não Não Não 312; 12.2 T 1 Não Não Não 312; 12.2 T 2 Não Sim Não 312; 12.2 T 3 Não Sim Sim 312; 12.2 T 4 Não Sim Não 312; 12.2 T 5 Não Sim Não

312; 12.2 A Não Sim Sim 312; 12.2 B Não Sim Sim

312; 12.2 T C Não Sim Não 315; 12.3 T 1 Não Não Não 315; 12.3 T 2 Não Sim Não 315; 12.3 T 3 Não Não Não 315; 12.3 T 4 Não Não Sim 315; 12.3 E A Não Sim Não 315; 12.3 E B Não Sim Não 315; 12.3 E C Não Sim Não 315; 12.3 E D Não Sim Não

318; 12.4.1T 1 Não Não Não 318; 12.4.1T 2 Não Não Não 318; 12.4.1T 3 Não Não Não 318; 12.4.1T 4 Não Não Não 318; 12.4.1T 5 Não Não Não 323; 12.4.2 T 1 Não Não Não 318; 12.4.1T 2 Não Não Não 318; 12.4.1T 3 Não Não Não 318; 12.4.1T 4 Não Não Não

Page 115: CAPA DISSERTAÇÃO FINAL Mara Lucia

114

(continuação)

323; 12.4.2 T 5 Não Não Não

323; 12.4.2 E 1 Não Sim Sim 323; 12.4.2 E 2 Não Sim Não 324; 12.4.3 T 1 Não Não Não 324; 12.4.3 T 2 Não Não Não 324; 12.4.3 T 3 Não Não Não 324; 12.4.3 T 4 Não Não Não 325; 12.4.3 E Não Sim Sim 327; 12.4.4 T 1 Não Não Não 327; 12.4.4 T 2 Não Não Não 327; 12.4.4 T 3 Não Não Não 327; 12.4.4 T 4 Não Não Não 327; 12.4.4 T 5 Não Não Não 327; 12.4.4 E 1 Não Sim Sim 327; 12.4.4 E 2 Não Sim Sim 327; 12.4.4 E 3 Não Sim Sim 327; 12.4.4 E 4 Não Sim Sim 327; 12.4.4 E 5 Não Sim Sim

331; 12.5 T 1 Não Não Não 331; 12.5 T 2 Não Não Não 331; 12.5 T 3 Não Não Não 331; 12.5 T 4 Não Não Não 331; 12.5 E A Não Sim Não 331; 12.5 E B Sim Sim Não 331; 12.5 E C Não Sim Não 331; 12.5 E D Não Sim Não 331; 12.5 E E Não Sim Não

332; Exercício Revisão 1 Não Sim Sim 333; Exercício Revisão 2 Não Sim Sim 333; Exercício Revisão 3 Não Sim Sim 333; Exercício Revisão 4 Não Sim Sim 334; Exercício Revisão 5 Não Sim Sim 334; Exercício Revisão 6 Não Sim Sim 335; Exercício Revisão 7 Sim Sim Sim 336; Exercício Revisão 8 Não Sim Sim 337; Exercício Revisão 9 Sim Sim Sim 338; Exercício Revisão 10 Não Sim Sim

Quadro 4: Classificação à luz de Curcio (1987) dos exercícios e testes propostos. Fonte: Livro 4

Page 116: CAPA DISSERTAÇÃO FINAL Mara Lucia

115

APÊNDICE B

UMA PROPOSTA DIDÁTICO-METODOLÓGICA PARA O ENSINO-

APRENDIZAGEM DE CORRELAÇÃO E REGRESSÃO EM CURSOS DE

ENGENHARIA COM FOCO NA LEITURA E INTERPRETAÇÃO DE D ADOS .

Page 117: CAPA DISSERTAÇÃO FINAL Mara Lucia

116

SUMÁRIO

INTRODUÇÃO 117

BASES TEÓRICAS 120

SEQUÊNCIAS DE ATIVIDADES 126

ANÁLISE DE LIVROS DIDÁTICOS 141

REFERÊNCIAS 151

Page 118: CAPA DISSERTAÇÃO FINAL Mara Lucia

117

1 INTRODUÇÃO

Apresentamos a seguir uma proposta metodológica de abordagem do tema

correlação e regressão em cursos de engenharia, com um foco na leitura e

interpretação de dados.

A proposta leva em conta as orientações dos Parâmetros Curriculares

Nacionais (Brasil, 1998, 2000), assim como as orientações do National Council of

Teachers of Mathematics (USA, 2000).

Tomando por base, por exemplo, o National Council of Teachers of

Mathematics (NCTM), os princípios e diretrizes para o ensino (Standards for School

Mathematics) apontam quatro grandes competências a serem desenvolvidas desde

a pré-escola até a série final de escolaridade obrigatória:

• “Formular questões que podem estar relacionadas a dados e coletar,

organizar e dispor dados relevantes para respondê-las;

• Selecionar e usar métodos estatísticos apropriados para analisar dados;

• Desenvolver e avaliar inferências e predições baseadas em dados;

• Entender e aplicar conceitos básicos de probabilidade”.(USA, NCTM,

2000, tradução nossa)21

Da mesma forma, no Brasil (1998,2000), os Parâmetros Curriculares

Nacionais advogam uma ênfase no desenvolvimento de uma série de competências

para lidar com as informações. As orientações para o ensino de matemática desde

as séries iniciais destacam a importância da leitura com entendimento de

informações, apresentadas na forma de tabelas e gráficos.

O objetivo da introdução das idéias básicas de estatística, de acordo com os

Parâmetros Curriculares Nacionais de 1a à 4a séries é motivar a criança a

desenvolver o espírito investigativo, a conjecturar e a redigir textos que expressam

as suas interpretações a partir de dados coletados e manipulados por eles. As

orientações relativas aos conteúdos de matemática da 5a à 8a séries apresentam a

mesma ênfase anterior. As idéias exploradas nas séries anteriores, de forma mais

intuitiva, no ensino médio exigem uma maior formalização de acordo com a

21 … formulate questions that can be addressed with data and collect, organize, and display relevant data to answer them; select and use appropriate methods to analyze data; develop and evaluate inferences and predictions that are based on data; understand and apply basic concepts of probability.

Page 119: CAPA DISSERTAÇÃO FINAL Mara Lucia

118

linguagem estatística. O aluno pode inferir a partir de uma dada situação, sempre

levando em consideração a sustentação teórica de tais conteúdos. As

representações gráficas agora são mais elaboradas e o uso de softwares com

funções estatísticas possibilitam ao aluno o cálculo das medidas estatísticas, como

também a construção de vários tipos de gráficos estatísticos. Neste momento, deve-

se dar maior ênfase à análise e interpretação dos dados, pois os valores obtidos

para as medidas estatísticas, como também os gráficos não dizem nada para o

aluno, se não forem analisados e interpretados. Dessa forma, aos poucos os alunos

desenvolvem competências para descrever e representar dados numéricos e

informações, lendo e interpretando os mesmos através de recursos estatísticos,

comparando resultados, avaliando a variabilidade dos mesmos de forma a poder

emitir juízos acerca de informações de cunho social, político, econômico e científico,

que são disponibilizadas na mídia. (BRASIL, 1998, 2000).

No Ensino Superior, uma introdução à Estatística se faz presente em muitos

cursos superiores, como parte da grade curricular. Consideramos que um enfoque a

partir da leitura e interpretação de dados deva ser mantido, de forma que os alunos

possam incorporar as técnicas estatísticas como instrumentos valiosos na

interpretação de diversos fenômenos, instruindo a tomada de decisões.

As sequências de atividades que integram a proposta aqui apresentada foram

elaboradas de modo a viabilizar o desenvolvimento da habilidade de leitura e

interpretação de dados, e pensadas para serem desenvolvidas de acordo com as

seguintes etapas: 1) proposição de atividades investigativas para a introdução do

tema correlação e regressão linear, buscando incentivar os alunos a explorarem

livremente gráficos e tabelas, registrando por escrito suas idéias intuitivas; 2)

socialização das idéias intuitivas acerca de dados apresentados na forma de

gráficos e tabelas; 3) formalização das idéias sobre associação entre variáveis, feita

na forma de descoberta guiada, objetivando estabelecer formalmente o coeficiente

de correlação (linear) e a equação da reta de regressão; 4) apresentação de tarefas

para fixação do conteúdo e ampliação de idéias sobre a associação entre variáveis

quantitativas.

Pretendemos, dessa forma, propiciar aos alunos desenvolverem atividades de

investigação matemática, explorando os vários níveis de leitura e interpretação de

dados, no estudo de correlação linear e regressão linear a partir de uma abordagem

Page 120: CAPA DISSERTAÇÃO FINAL Mara Lucia

119

intuitiva, como forma de motivar a apresentação formal dos conceitos de correlação

e regressão e incentivar a pesquisa.

Apresentamos a seguir as bases teóricas da elaboração da proposta, de

modo particular, as categorias de leitura e interpretação de dados de Curcio (1987),

e as atividades de investigação matemática (PONTE, 2003; ERNEST, 1996).

As seqüências de atividades fundamentam-se em tarefas já testadas em sala

que são acrescidas de outras, no sentido de enriquecer as possibilidades de uso

desse material.

Embora a proposta tenha sido desenhada para utilização em um curso

introdutório de Estatística para engenheiros, acreditamos que possa ser facilmente

adaptada para utilização em outros cursos, bastando, para tanto, que novas tabelas

e gráficos sejam escolhidos de forma a terem sentido no contexto educacional de

desenvolvimento da proposta.

A compreensão de qualquer conteúdo estatístico depende muito da

conotação dada pelo professor em sala de aula, da ênfase conceitual e das

aplicações, que devem na medida do possível remeter a situações do contexto

cultural do aluno. Lidar com dados relacionados à sua área de interesse, pode levar

o aluno a um maior comprometimento em relação ao conteúdo abordado e talvez

motivá-lo a fazer a interpretação de tais dados.

Os autores.

Page 121: CAPA DISSERTAÇÃO FINAL Mara Lucia

120

2 BASES TEÓRICAS DA PROPOSTA

Segundo Garfield et al (2002) o ensino de Estatística deve pautar-se nos

seguintes princípios:

• Mais dados e conceitos, menos receitas e repetições, buscando na

medida do possível a automatização dos cálculos, usando pacotes

estatísticos modernos.

• Enfatizar o pensamento estatístico: a importância na obtenção dos

dados, de preferência reais, a onipresença da variabilidade e sua

medida e modelagem.

• Visar a uma aprendizagem ativa, que incentiva o desenvolvimento de

projetos, o trabalho em grupo, apresentações orais e escritas.

Garfield e colaboradores (2002) colocam:

Pensamos que a pesquisa pode encorajar a investigação de como ajudar os estudantes a desenvolverem o pensamento estatístico e como verificar se os estudantes têm ou não essa habilidade. Uma possibilidade é encorajar os professores de estatística a conduzirem pesquisas de alta qualidade em sala de aula usando seus próprios alunos e classes. (tradução nossa)22

As seqüências de atividades que integram essa proposta foram elaboradas de

forma a explorar a relação entre duas variáveis e a possibilidade de incentivar a

habilidade de leitura e interpretação de dados, apresentados na forma de tabelas e

gráficos.

2.1 Categorias de leitura e interpretação de dados

Tomamos por base as seguintes categorias de Curcio (1987): ler os dados; ler

dentro dos dados; ler além dos dados.

22 We think that research should be encouraged to investigate how to help students develop statistical thinking, and how to assess whether or not students have this ability. One possibility is to encourage statistics instructors to conduct high quality classroom research using their own students an classes.

Page 122: CAPA DISSERTAÇÃO FINAL Mara Lucia

121

A categoria ler os dados consiste numa leitura dos dados na forma em que

são apresentados no gráfico. Demanda, essencialmente, a habilidade de localizar

valores, sem realizar interpretações acerca do dado disponível.

Ler dentro dos dados consiste na leitura feita a partir dos dados

apresentados, envolvendo destrezas de ordem quantitativa e conhecimentos

adquiridos anteriormente. As operações matemáticas elementares podem ser de

grande utilidade neste tipo de leitura, que requer habilidades de leitura integrada e

comparativa dos dados.

Ler além dos dados é uma leitura que envolve inferência, isto é, demanda que

previsões sejam feitas. As informações relativas às previsões não estão visíveis no

gráfico. Este tipo de leitura demanda, normalmente, do leitor, um conhecimento

teórico mais refinado.

Apresentamos a seguir um exemplo, objetivando tornar mais claras as

categorias de Curcio, uma vez que foram fundamentais na elaboração das

seqüências de atividades aqui apresentadas.

Exemplo: Suponhamos que sejam fornecidas as notas de Matemática e de Estatística

de determinada turma de uma Escola.

Notas de Matemática (X)

Notas de Estatística (Y)

98765432

9

8

7

6

5

4

9

8

7

66

5

44

Gráfico 1 – Notas de Estatística e Matemática da Tu rma 1 - 2004

Fonte: Secretaria da Escola A - Belo Horizonte - (Dados fictícios).

Page 123: CAPA DISSERTAÇÃO FINAL Mara Lucia

122

Uma questão a se propor poderia ser:

a) Qual o valor da nota de Estatística do aluno que obteve 3 pontos em

Matemática?

A questão expressa claramente a intenção de se verificar se o aluno é capaz

de ler os dados. O aluno faz a leitura do gráfico identificando a informação

solicitada, a nota de estatística, (localizada no eixo vertical), a partir do

conhecimento da nota de matemática (localizada no eixo horizontal) e

utilizando seus conhecimentos acerca de localização de pontos no sistema

cartesiano.

Outra pergunta poderia exigir um segundo nível de leitura gráfica:

b) Observando a distribuição de pontos, você consegue perceber alguma

tendência ou padrão?

A questão permite ao aluno ler dentro dos dados, isto é, verificar se a

distribuição de pontos, ou seja, a nuvem de pontos dada pode ser ajustada a

uma função, ou ainda, se os dados evidenciam uma tendência e também se a

relação que existe entre as variáveis, no caso as notas é direta (crescente) ou

inversa (decrescente).

Finalmente, o nível de leitura ler além dos dados pode ser explorado ao se

perguntar:

c) Determine a curva que melhor se ajuste à distribuição de pontos

apresentada e, a partir dela, responda qual o valor da nota esperada de

Estatística para o aluno que obteve 10 pontos em Matemática.

O aluno é convidado a inferir sobre a situação proposta, recorrendo a

conhecimentos adquiridos por ele anteriormente. No caso, é de se esperar que

o aluno obtenha a curva de regressão e faça a estimativa a partir da mesma.

Page 124: CAPA DISSERTAÇÃO FINAL Mara Lucia

123

Ao invés do gráfico, poderia ser fornecida a Tabela 1.

Tabela 1: Notas de Matemática e Estatística – Turma 1 - Escola A - 2004

Notas

Matemática Estatística

2 4

3 4

4 5

5 6

6 6

7 7

8 8

9 9

Fonte: Secretaria da Escola A - 2004 - Belo Horizon te - (Dados fictícios).

Pode-se solicitar que seja determinada a nota de Estatística, do aluno que

obteve 4 pontos em Matemática, procedimento que exige entender a forma de

disposição dos dados na Tabela 1, para ler os dados. No caso, isso significa

localizar na primeira coluna a nota 4, situada na terceira linha e ler, na segunda

coluna, na mesma linha, a nota correspondente de Estatística. Embora essa

habilidade seja considerada elementar, é por vezes novidade para alunos mais

jovens, não habituados a lidar com esse tipo de representação de dados através de

tabelas.

A categoria de Curcio ler dentro dos dados pode ser explorada, quando se

pergunta ao aluno, por exemplo: Qual a variação das notas de Matemática? As

melhores notas são de Matemática ou de Estatística?

O aluno nesse momento faz a leitura dentro dos dados, comparando dados e

realizando operações matemáticas elementares, para responder à questão.

A categoria ler além dos dados pode ser explorada, usando a Tabela 1,

quando o aluno é convidado, por exemplo, a inferir a respeito da nota de Estatística

de um aluno que obteve 10 pontos em Matemática.

O aluno pode inferir a respeito da possível nota de Estatística tendo

conhecimento das variações presentes na segunda coluna da Tabela 1, que

corresponde às notas de Estatística, ou se ele tem conhecimento em determinar a

equação da reta que melhor descreve o conjunto de dados, referentes às notas de

Matemática e Estatística.

Page 125: CAPA DISSERTAÇÃO FINAL Mara Lucia

124

As atividades propostas podem ser classificadas, de certa forma, como

elementares. No entanto, a simples habilidade de ler os dados dispostos em uma

tabela, decorre de um processo de codificação e decodificação de informações, de

um entendimento acerca da disposição tabular. Da mesma forma a localização de

dados em um gráfico.

2.2 Atividade investigativa

Uma das tendências do Ensino de Estatística é de uma abordagem que

prioriza a investigação.

A investigação estatística acontece quando possibilitamos aos nossos alunos

o desenvolvimento da capacidade de analisar, interpretar e fazer conjecturas em

relação a dados quantitativos. E esse objetivo de promover o desenvolvimento de

um espírito investigativo pode ser atingido de diversas maneiras. (PONTE,

BROCARDO, OLIVEIRA, 2003).

Ponte (2003) classifica as tarefas matemáticas segundo dimensões, entre

elas o grau de dificuldade (fácil – difícil) e a estrutura (aberta – fechada). Para o

autor a atividade aberta leva o aluno a fazer reflexões e a ter novas idéias a respeito

da questão proposta, a levantar novas questões. Dentro das atividades abertas,

Ponte destaca dois tipos de tarefas: de exploração (mais fáceis); de investigação

(mais difíceis). Ao se iniciar uma atividade aberta, entretanto, não se consegue por

vezes classificar o grau de dificuldade que esta apresentará para o aluno.

Ernest (1996) apresenta uma reflexão acerca de investigações, resolução de

problemas e do que chama uma pedagogia baseada na inquirição para o ensino de

Matemática. Apresenta um quadro comparativo de três métodos, dentre os quais a

descoberta guiada. Numa descoberta guiada o aluno realiza investigações, mas é

levado a seguir as orientações do professor, que é o responsável por elaborar o

problema, ou propor objetivos, bem como por conduzir o aluno a obter a solução, ou

atingir a meta pretendida.

De modo geral atividades na forma de descoberta guiada são mais aceitas

entre alunos e professores e podem ser um instrumento pedagógico importante para

romper com paradigmas de um ensino centrado no professor. Caminhar em busca

Page 126: CAPA DISSERTAÇÃO FINAL Mara Lucia

125

do conhecimento exige muito mais do que temos como referência há anos, na nossa

escola tradicional. O deixar fluir na busca do aprender é o que faz o aluno

amadurecer, sendo capaz de refletir e conquistar a sua autonomia.

As seqüências de atividades aqui apresentadas apresentam uma estrutura

que inicialmente incentiva a exploração mais livre e num segundo momento

direciona o aluno com o objetivo de que formalize as idéias intuitivas iniciais.

Page 127: CAPA DISSERTAÇÃO FINAL Mara Lucia

126

3 SEQUÊNCIAS DE ATIVIDADES

3.1 Primeira seqüência 1a etapa - Proposição de atividades investigativas para introdução do tema

correlação e regressão linear

Procedeu-se à análise e interpretação de dados amostrais, relativos aos

resultados de dezoito ensaios, em corpos de prova, no processo de queima de

massa de cerâmica para pavimentação (Tabela 2).

Foram registrados os dados relativos a três variáveis indicadas na Tabela 2

como: X1 – representando a retração linear (%); X2 representado a resistência

mecânica (MPa); X3 representando a absorção de água (%).

Tabela 2: Resultados de 18 ensaios, em corpos de pr ova, durante o processo de queima de

massa de cerâmica para paviment ação

Ensaio X1 X2 X3 Ensaio X1 X2 X3

1 8,7 38,42 5,54 10 13,24 60,24 0,58 2 11,68 46,93 2,83 11 9,10 40,58 3,64 3 8,30 38,05 5,58 12 8,33 41,07 5,87 4 12,00 47,04 1,10 13 11,34 41,94 3,32 5 9,5 50,9 0,64 14 7,48 35,53 6,00 6 8,58 34,10 7,25 15 12,68 38,42 0,36 7 10,68 48,23 1,88 16 8,76 45,26 4,14 8 6,32 27,74 9,92 17 9,93 40,70 5,48 9 8,20 39,20 5,63 18 6,5 29,66 8,98

Fonte: Barbetta, Reis e Bornia, 2004, p.317.

Os gráficos seguintes foram elaborados a partir da Tabela 2 e recebem uma

denominação especial no campo estatístico de diagramas de dispersão e permitem

explorar se existem relações entre as variáveis consideradas duas a duas: retração

linear (%) e resistência mecânica (MPa); retração linear (%) e absorção de água (%);

resistência mecânica (MPa) e absorção de água (%).

Page 128: CAPA DISSERTAÇÃO FINAL Mara Lucia

127

Re t ra ção line a r (%) (X )

Resistência mecânica (MPa) (Y)

14131211109876

60

55

50

45

40

35

3029,66

40,70

45,26

38,42

35,53

41,9441,07 40,58

60,24

39,20

27,74

48,23

34,10

50,90

47,04

38,05

46,93

38,42

Gráfico 2: Diagrama 1

Fonte: Tabela 2

R e t r a ç ã o lin e a r (% ) ( X )

Aborção de água (%) (Y)

1 41 31 21 11 09876

1 0

8

6

4

2

0

8 ,98

5 ,48

4 ,14

0 ,36

6 ,00

3 ,32

5 ,87

3 ,64

0 ,58

5 ,63

9 ,92

1 ,88

7 ,25

0 ,64

1 ,10

5 ,58

2 ,83

5 ,54

Gráfico 3: Diagrama 2

Fonte: Tabela 2

Resistência mecânica (MPa) (X)

Aborção de água (%) (Y)

60555045403530

10

8

6

4

2

0

8,98

5,48

4,14

0,36

6,00

3,32

5,87

3,64

0,58

5,63

9,92

1,88

7,25

0,64

1,10

5,58

2,83

5,54

Gráfico 4: Diagrama 3

Fonte: Tabela 2

Page 129: CAPA DISSERTAÇÃO FINAL Mara Lucia

128

Questões propostas e objetivos Discuta com seus colegas e resolva as tarefas propostas, registrando as

observações e justificando suas conclusões.

1) Olhe atentamente os diagramas de dispersão que foram dados e registre

suas observações.

a)Procure descrever como os pares ordenados se distribuem.

b)Você percebe a existência de relacionamento entre as variáveis em

cada diagrama? Justifique de acordo com o entendimento que tem de

cada gráfico.

O objetivo da questão é verificar as idéias intuitivas dos alunos sobre os

gráficos apresentados, incentivando-os, num primeiro momento, a registrar

por escrito suas observações.

Nesse momento, o aluno pode fazer uma leitura literal dos dados, isto é, ler

os dados, não se preocupando com a interpretação dos pares ordenados,

mas pode também levantar conjecturas mais específicas sobre como se

comportam as variáveis.

A questão 1 pode também incentivar o aluno a observar como os pares

ordenados se distribuem em cada diagrama de dispersão, fazendo a leitura

dentro dos dados. Esta leitura envolve compreensão e interpretação dos

pares de valores no diagrama, como também a comparação de quantidades

envolvidas e um maior traquejo matemático, de tal maneira que o aluno possa

perceber a existência de uma dependência direta ou inversa entre as

variáveis. O aluno é incentivado a intuir a respeito do relacionamento entre

duas variáveis, isto é, a existência ou não de associação entre elas, a partir

da análise gráfica dos diagramas de dispersão.

2) Utilizando as informações da tabela e o terceiro diagrama de resistência

mecânica (MPa) e absorção de água (%),você é capaz de verificar se a

resistência mecânica (MPa) causa algum efeito sobre a absorção de água

no processo de queima de massa de cerâmica para pavimentação em

corpos de prova? Argumente acerca do questionamento levantado.

A questão exige a leitura dentro dos dados, incentivando o aluno a levantar

conjecturas sobre a possibilidade da variação de uma variável ser causada

Page 130: CAPA DISSERTAÇÃO FINAL Mara Lucia

129

pela variação da outra. Trata-se de um momento importante para que o

professor ressalte o fato que pode existir relacionamento entre variáveis sem

que, necessariamente, essa relação seja causal e, ao mesmo tempo,

destacar que a afirmativa da existência de uma relação causal não pode ser

feita apenas a partir de uma análise gráfica.

3) Observando os diagramas, você considera possível estabelecer um

modelo matemático que descreva como variam: a) retração linear (%) e

resistência mecânica (MPa); b) retração linear (%) e absorção de água

(%); c) resistência mecânica (MPa) e absorção de água (%). Justifique sua

resposta.

Ao observar os três diagramas, o aluno pode fazer uma conexão com

conceitos matemáticos já estudados em outras disciplinas, para desenvolver a

habilidade de ler dentro dos dados.

4) Você acha possível fazer uma previsão do valor percentual de absorção

de água, conhecendo a resistência mecânica (MPa)? Justifique a sua

resposta.

A questão objetiva verificar se os alunos fazem uma leitura além dos dados,

isto é, se são capazes de levantar conjecturas e fazer inferências a partir de

dados fornecidos.

2a etapa - Socialização das idéias intuitivas acerca de dados apresentados na forma

de gráficos e tabelas.

Essa etapa é imprescindível para incentivar a troca de idéias entre os grupos. Nesse

momento, o professor pode aproveitar para motivar a participação de grupos que

tiveram, por exemplo, dificuldades em registrar por escrito as idéias, além de propor

novas questões no sentido de que os alunos avancem nas conjecturas levantadas e

nas argumentações apresentadas.

3a etapa - Formalização das idéias sobre associação entre variáveis, feita na forma

de descoberta guiada, objetivando estabelecer formalmente o coeficiente de

correlação (linear) e a equação da reta de regressão.

Page 131: CAPA DISSERTAÇÃO FINAL Mara Lucia

130

O professor solicita aos alunos que retomem, por exemplo, o Diagrama 1.

1) Para analisar se existe uma tendência entre os pares de dados, é possível utilizar

as coordenadas dos valores médios das variáveis X e Y. Esse ponto de

coordenadas ),( yx é chamado, conforme já vimos, de centróide da distribuição.

a) Calcule esse ponto.

b) Desloque a origem do sistema de coordenadas para esse ponto, e

observe em quais quadrantes os pontos se concentram. Observando o

Diagrama 01, você considera que algum ponto se distancia muito do centróide?

Em caso afirmativo, justifique?

c) Refaça os itens a) e b) considerando os dados relativos aos Diagramas 2 e 3.

2) Calcule a soma )).(( yyxx −−∑ , isto é, a soma dos produtos dos desvios padrão

em relação a cada média.

3) Use a estatística do produto )).(( yyxx −−∑ para analisar a tendência dos pares

ordenados da distribuição (Diagrama 01)

4) Compare a resposta dada no exercício 03 com as observações do exercício 1b.

Registre suas idéias.

5) Para tornar o resultado obtido em 2) independente de uma escala particular

adotada, divida o resultado pelo produto do desvio padrão sx pelo desvio sy, e

multiplique por (n-1). O valor encontrado é chamado coeficiente de correlação r,

ou coeficiente de correlação linear de Pearson.

6) Mostre que a fórmula obtida para r pode ser escrita como :

−=

− −∑ ∑ ∑

∑ ∑ ∑ ∑2 2 2 2

n xy ( x)( y)r

n( x ) ( x) n y ( y)

7) Calcule o coeficiente de correlação r, para os dados do Diagrama 01.

8) Como pode ser classificada a correlação linear entre as variáveis? Justificar a

classificação, consultando o texto didático.

9) Pode-se afirmar que o valor 60,24 para a resistência mecânica corresponde a um

ponto discrepante do conjunto de pares ordenados do Diagrama 01? Experimente

calcular r, retirando esse ponto?

10) Refaça os exercícios 2,3,4,5,6,7 e 8, para os dados representados nos

Diagramas 2 e 3.

Page 132: CAPA DISSERTAÇÃO FINAL Mara Lucia

131

De modo geral, ao explorar a relação entre duas variáveis estamos

interessados em indagar acerca do comportamento de uma variável (Y), em função

de uma variável (X). Queremos entender melhor acerca do fato que diferentes

valores de X produzem diferentes valores de Y. Convém ressaltar que em dados

observacionais, o fato de existir uma relação forte entre duas variáveis, não significa

que haja uma relação de causa e efeito. A modelagem de regressão linear simples

que utilizamos aqui é apenas uma tentativa entre outras, para se estudar em

maiores detalhes o comportamento de uma variável (Y) em função de outra (X),

além de possibilitar fazer predições a respeito de Y, conhecendo-se a variação de X.

Na 1a etapa, fizemos alguns ensaios intuitivos nesse sentido, que agora serão

formalizados. Uma série de softwares disponibilizam o cálculo de retas de

regressão23. Nosso objetivo é entender um pouco acerca desses cálculos.

O professor solicita aos alunos que retomem, por exemplo, o Diagrama 1.

Ao observamos um diagrama de dispersão, analisando como os pares

ordenados se distribuem, podemos visualizar uma linha imaginária ascendente ou

descendente. No Diagrama 01, por exemplo, percebemos uma tendência

ascendente.

Através da teoria da regressão pode-se encontrar a equação da reta que

melhor se ajusta aos pontos do gráfico. A equação:

(1) xbby 10ˆ +=

é denominada equação de regressão ou reta de regressão. Os coeficientes

b0 e b1 podem ser obtidos pelo método dos mínimos quadrados e são obtidos

minimizando-se a função

(2) ∑ ∑ −−=−= 210

2 )()ˆ( xbbyyyD que representa a soma dos quadrados

das distâncias de y (valor observado) a y ( valor predito de y).

1) Utilize recursos do Cálculo Diferencial para mostrar que os valores dos

coeficientes b0 e b1 são:

(3) ( )( ) ( )( )

( ) ( )22

2

0

∑∑∑∑∑∑

−=

xxn

xyxxyb

23 É interessante que os alunos utilizem algum software a que tenham acesso para obter retas de regressão para diferentes conjuntos de dados. Uma outra possibilidade é usar applets como o disponível em: http://docentes.esa.ipcb.pt/estatistica/reglin/index.html .

Page 133: CAPA DISSERTAÇÃO FINAL Mara Lucia

132

(4) ( )( )

( ) ( )221

∑∑∑ ∑∑

−=

xxn

yxxynb

2) Se determinamos b1 utilizando a fórmula (4), podemos determinar b0 a partir da

fórmula (5) xbyb 10 −= . Justifique.

1) a) Observando o Diagrama 1, é possível afirmar que a reta que melhor se

ajusta aos dados, ao ser representada no diagrama está bem distante do ponto

correspondente a y= 60,24?

b) Verifique sua resposta da letra a).

2) Observando o diagrama 2, o que pode dizer a respeito do coeficiente angular

da reta que melhor se ajusta aos dados. Faça a interpretação deste coeficiente a

partir do diagrama. Determine o seu valor.

3) Dos três diagramas de dispersão, qual deles a partir de uma análise visual apresentaria um menor valor para a soma dos quadrados dos desvios dos valores de y observados e os estimados? Verifique se sua conjectura feita a partir da análise gráfica se confirma.

4a etapa - Tarefas para fixação do conteúdo e ampliação de idéias sobre a

associação entre variáveis quantitativas.

1) Esboce o gráfico de um diagrama em que a correlação entre as variáveis seja

praticamente nula. Como se distribuem os pontos, em relação ao centróide?24

2) Se o coeficiente de correlação r é próximo de zero, pode-se afirmar que não

existe correlação linear entre as variáveis? Justificar.

3) Calcule o coeficiente de correlação linear de Pearson de uma amostra em que

esteja presente um valor discrepante. Em seguida, calcule novamente o

coeficiente linear de Pearson, após retirar esse valor discrepante. O que pode se

afirmar a respeito desse valor discrepante?

4) Construa um diagrama de dispersão em que as variáveis apresentem uma

relação quase que perfeita entre elas. É possível afirmar somente a partir desse

diagrama que existe uma relação de causalidade entre elas? Explique.

5) As duas técnicas estatísticas estudadas, isto é, correlação linear e regressão

linear, podem estar em conexão com quais disciplinas do seu curso?

6) Considerando a sua turma de sala de aula, colete dados relativos a duas

24 Para isso use, por exemplo, o applet disponível em: http://www.mste.uiuc.edu/exner/java.f/leastsquares/#description

Page 134: CAPA DISSERTAÇÃO FINAL Mara Lucia

133

variáveis, que possam caracterizar cada aluno e represente esses dados no

diagrama de dispersão. Faça a interpretação desses dados no diagrama, em

relação ao grau de relação entre as variáveis e à tendência de variação

evidenciada. Em seguida calcule o coeficiente de correlação de Pearson e

verifique se a sua interpretação visual é confirmada a partir do uso formal do

conteúdo.

7) Analise os efeitos que a inclusão de novos pontos em um diagrama de

dispersão pode causar. Utilize gráficos para explicar.

8) Visualizando no diagrama de dispersão que o melhor ajuste a um conjunto de

pares ordenados é uma reta, você acha prudente após a determinação desta

equação de regressão fazer uma previsão para um dado valor da variável X que

seja bem discrepante do conjunto dados? Justifique.

Muitas outras questões podem ser elaboradas com o mesmo objetivo de fixar

conteúdos. O importante é que o professor esteja sempre refletindo sobre o trabalho

desenvolvido, para formular perguntas e propor tarefas que venham a sanar

dificuldades, clarear pontos teóricos, sempre na linha de promover a leitura e a

interpretação intuitiva de dados num primeiro momento, e instruída pela teoria num

segundo momento.

3.2 Segunda seqüência

1a etapa - Proposição de atividades investigativas para introdução do tema

correlação e regressão linear

As tabelas seguintes (Tabela 3, Tabela 4 e Tabela 5) apresentam os resultados

experimentais de três coletores solares de banho, para residência, observados em

um laboratório, por um grupo de pesquisa em energia solar. 25.

Correspondendo a cada tabela foi elaborado um gráfico (Gráfico 5, Gráfico 6 e

Gráfico 7), denominado diagrama de dispersão. O diagrama de dispersão permite

explorar o relacionamento entre as duas variáveis (Tfe-Tamb)/G e Eficiência, para

cada coletor.

25 Maiores informações podem ser obtidas em: Energia solar térmica: gestão de projetos em aquecimento solar de água para o setor residencial / Elizabete Marques Duarte Pereira – Belo Horizonte: PUC MINAS, 2001. 126p.

Page 135: CAPA DISSERTAÇÃO FINAL Mara Lucia

134

Tabela 3: Coletor solar 1

(Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%)

0,038302 42,54 0,003488 64,39 0,038757 42,66 0,001024 64,39 0,03015 47,17 -0,000663 64,62 0,034942 47,17 -0,001486 64,62 0,026993 50,74 -0,000653 64,85 0,02457 50,86 -0,000486 64,85 0,006162 53,00 0,000964 65,07 0,0252 53,04 0,000071 65,07 0,011593 55,1 -0,000084 65,25 0,018763 55,1 -0,000604 65,26 -0,001985 56,48 -0,000784 65,43 0,016777 56,49 -0,001445 65,43 -0,001466 57,48 -0,000895 65,61 -0,001197 57,49 -0,00143 65,61 0,022629 58,39 -0,001084 65,83 0,014403 58,41 -0,001139 65,83 0,00748 59,13 -0,001052 66,14 -0,001172 59,13 -0,000832 66,15 -0,001589 59,96 -0,000921 66,53 -0,00043 59,96 -0,001414 66,54 0,000015 61,24 -0,000085 66,99 -0,000701 61,28 -0,000802 66,99 -0,00138 62,32 -0,004947 67,32 -0,001285 62,34 -0,00461 67,32 -0,000365 63,12 0,000061 67,57 0,00012 63,12 0,001081 67,57 0,000707 63,66 -0,000956 67,82 -0,000052 63,66 -0,000356 67,82 -0,000297 64,08 -0,000501 68,02 -0,000092 64,08 0,00103 68,03

Fonte: Grupo de pesquisa em energia solar

(Tfe-Tamb)/G(ºC/W/m²) (X)

Eficiência (%) (Y)

0,040,030,020,010,00

70

65

60

55

50

45

40

Gráfico 5: Diagrama 4

Fonte: Tabela 3

Page 136: CAPA DISSERTAÇÃO FINAL Mara Lucia

135

Tabela 4: Coletor solar 2

(Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%)

0,000168 18,42 0,00048 54,76 0,000879 26,28 0,000361 54,98 -0,000334 30,91 0,000214 55,19 -0,001473 34,69 0,000335 55,38 -0,001 37,39 0,002426 55,6 0,027093 39,58 0,003692 55,78 0,045684 41,04 0,000115 55,99 -0,000347 42,27 0,00623 56,2 0,023285 43,18 -0,00136 56,41 0,00047 44,05 -0,00033 56,62 0,017484 44,9 -0,00013 56,8 0,022991 45,63 -0,00022 57,05 -0,001094 46,22 -0,00061 57,26 0,01948 46,79 -0,00152 57,49 0,017529 47,38 -0,00123 57,71 0,001057 48 -0,00208 57,92 0,019767 48,67 0,000194 58,15 -0,004138 49,37 -0,0022 58,41 0,010447 49,93 0,000027 58,68 0,01 50,58 -0,00024 58,88 0,010918 51,15 -0,00106 59,17 0,018762 51,61 -0,00021 59,5 0,000315 52,09 0,00075 59,83 0,014495 52,54 0,002493 60,25 -0,000249 53,05 0,02284 60,75 0,003671 53,49 -0,00259 61,31 0,001069 53,84 -0,00176 61,89 0,000202 54,09 -0,00387 63,11 0,000752 54,32 -0,00355 65,04 0,005348 54,56 -0,0012 66,81

Fonte: Grupo de pesquisa em energia solar

(Tfe-Tamb)/G(ºC/W/m²) (x)

Eficiência (%) (Y)

0,050,040,030,020,010,00

70

60

50

40

30

20

Gráfico 6: Diagrama 5 Fonte: Tabela 4

Page 137: CAPA DISSERTAÇÃO FINAL Mara Lucia

136

Tabela 5: Colet or solar 3

(Tfe-Tamb)/G Eficiência (Tfe-Tamb)/G Eficiência (ºC/W/m2) (%) (ºC/W/m2) (%) 0,005979 13,84 0,009208 58,93 0,010541 13,92 0,037157 58,93 0,045003 25,44 0,000977 59,62 0,044706 25,62 0,007791 59,62 0,010871 31,57 -0,00171 60,15 0,054318 31,6 0,000843 60,15 0,003456 37,24 0,000015 60,54 0,022438 37,35 0,014826 60,54 0,052909 41,76 0,001259 61,09 0,058798 41,76 0,001607 61,1 0,005657 44,58 0,007728 61,6 0,05537 44,62 0,001115 61,6 0,001972 47,43 0,001523 62,06 0,047406 47,46 0,010089 62,07 0,000389 50,16 -0,00178 62,38 0,036059 50,17 0,007626 62,4 0,000969 52,14 -0,00028 62,83 0,038529 52,14 0,017262 62,84 0,005982 53,42 0,008992 63,13 0,00536 53,43 0,001797 63,15 0,026445 54,57 0,001257 63,56 0,023699 54,59 0,003548 63,59 0,021565 55,55 0,00145 63,96 0,01176 55,6 0,002111 63,98 0,000842 56,49 0,00364 64,4 0,067976 56,5 0,001461 64,43 0,014577 57,39 -0,00217 64,86 0,00126 57,4 0,02313 64,92 0,021093 58,28 0,004789 65,62 0,006712 58,29 -0,00086 65,66

Fonte: Grupo de pesquisa em energia solar

(Tfe-Tamb)/G(ºC/W/m²) (x)

Eficiência (%) (Y)

0,070,060,050,040,030,020,010,00

70

60

50

40

30

20

10

Gráfico 7: Diagrama 6

Fonte: Tabela 5

Page 138: CAPA DISSERTAÇÃO FINAL Mara Lucia

137

Questões propostas

Discuta com seus colegas e resolva as questões propostas, registrando as

observações. As questões foram classificadas de acordo com as categorias de

Curcio: LD (Ler os dados); LDD (Ler dentro dos dados); LAD (Ler além dos dados).

8) Observe o Diagrama 4.

a) Descreva como os pares ordenados se distribuem. ( LD)

b) É possível identificar algum tipo de relação existente entre as duas variáveis?

Justifique. (LDD)

c) Você acha possível dizer qual a variável que pode ser considerada dependente e

qual variável que pode ser considerada independente? Justifique, lembrando de

seus estudos sobre gráficos de funções. (LDD)

d) Marque onde você acredita estar localizado o valor mediano e o valor médio em

Eficiência (%) e explique o que cada um representa na estatística. (LDD)

e) Justifique se os valores estimados graficamente são uma boa aproximação dos

valores reais dessas medidas, usando a Tabela 4. (LDD)

f) Você considera possível estabelecer um modelo matemático que descreva como

variam Eficiência e (Tfe-Tamb)/G ?(LDD)

g) Faça uma estimativa para o valor da eficiência térmica, quando o valor da

abscissa for igual a 0,02? (LD e LAD)

h) Trace uma reta que represente o melhor modelo para descrição dos dados.

(LDD).

9) Analise o Diagrama 5 e responda justificando:

a) Calcule a média dos valores de X e Y. Faça a representação desses valores no

Diagrama 5, e informe em quais quadrantes os pares ordenados se concentram.

(LDD)

b) De acordo com as informações da letra a, como você pode justificar o

relacionamento entre as variáveis X e Y? (LDD)

c) Observando o diagrama de dispersão, você percebe a presença de algum ponto

discrepante? Justifique. (LDD)

10) Analise o Diagrama 6 e responda justificando:

a) Quantos são os valores correspondentes à eficiência térmica que estão no

intervalo de variação de X de 0,05 a 0,06? (LD)

b) Estime o maior valor da eficiência térmica nesse intervalo? (LDD)

Page 139: CAPA DISSERTAÇÃO FINAL Mara Lucia

138

c) É possível saber exatamente qual esse valor? (LAD)

d) É possível estimar o valor da eficiência térmica, quando o valor da abscissa for

0,08? Justifique. (LAD)

2a etapa - Socialização das idéias intuitivas acerca de dados apresentados na forma

de gráficos e tabelas

Essa etapa objetiva incentivar a troca de idéias entre os grupos. Nesse momento, o

professor pode aproveitar para incentivar a participação de grupos que tiveram, por

exemplo, dificuldades em registrar por escrito as idéias, além de propor novas

questões no sentido de que os alunos avancem nas conjecturas levantadas e nas

argumentações apresentadas.

3a etapa - Formalização das idéias sobre associação entre variáveis, feita na forma

de descoberta guiada, objetivando estabelecer formalmente o coeficiente de

correlação (linear) e a equação da reta de regressão.

O professor solicita aos alunos que retomem a Tabela 4 e o Diagrama 4.

1) Para determinar o grau de relação entre duas variáveis é possível calcular a

covariância 1

))((

−−−

= ∑n

yyxxCOV ii

xy

Calcule a covariância para os dados da Tabela 4.

2) Para determinar o coeficiente de correlação de Pearson, basta dividir a

covariância pelo produto do desvio padrão Sx pelo desvio padrão Sy.

−=

− −∑ ∑ ∑

∑ ∑ ∑ ∑2 2 2 2

n xy ( x)( y)r

n x ( x ) n y ( y )

a) Mostre que r pode ser escrito como

b) De modo geral o coeficiente de correlação r é mais usado como indicador da

relação entre duas variáveis. Há alguma justificativa para isso?

11) Calcule r para os dados da Tabela 4.

12) Era de se esperar que r fosse negativo? Justifique.

13) Qual a quantidade de variação na eficiência (y) que é explicada pela relação

linear entre x e y? Para isso, calcule o coeficiente de determinação, elevando r

ao quadrado.

Page 140: CAPA DISSERTAÇÃO FINAL Mara Lucia

139

14) Compare os coeficientes de correlação r obtidos para cada um dos coletores.

Que interpretações é possível fazer? Esses resultados confirmam as

conjecturas feitas apenas por inspeção gráfica dos diagramas?

8) Observando os três diagramas, qual deles mostra uma tendência um pouco

próxima à linear? Caso exista, em que faixa de valores no eixo x, isso acontece?

A reta que melhor se ajusta a um conjunto de dados (1) xbby 10 += tem coeficientes

0b e 1b que podem ser determinados pela resolução do sistema de equações

(2)

+=

+=

∑ ∑ ∑∑ ∑

210

10

xbxbxy

xbnbx

chamadas equações normais da reta de mínimo quadrado (1).

9) Usando o Diagrama 4, e as equações (2) ajuste aos dados uma reta de

regressão. Faça a interpretação do coeficiente linear desta reta.

10) Ajuste aos diagramas 5 e 6 uma reta de regressão linear, compare com a reta

de regressão do diagrama 4 e informe, qual dos três diagramas apresenta um

ajuste razoável para reta. Justifique.

11) Usando a reta de regressão obtida para os dados do Diagrama 4, faça uma

previsão do valor de y para x=0,05.

4a etapa - Tarefas para fixação do conteúdo e ampliação de idéias sobre a

associação entre variáveis quantitativas.

1) Esboce o gráfico de um diagrama em que a correlação entre as variáveis seja

positiva e forte. Como se distribuem os pontos, em relação ao centróide?

2) Faça um gráfico em que os pares ordenados mostram uma tendência a uma linha

ascendente ou descendente e, em seguida, ajuste uma equação de regressão linear

aos dados. Faça a interpretação do seu coeficiente linear.

3) Construa um diagrama de dispersão em que exista uma correlação linear perfeita

entre as variáveis X e Y. Ajuste aos dados um modelo matemático e faça uma

previsão para a variável dependente, dado o valor da variável independente.

4) Construa três diagramas de dispersão, de tal maneira que o primeiro mostre a não

existência de correlação linear; o segundo uma fraca correlação linear negativa e o

terceiro diagrama uma perfeita correlação linear. A partir dos diagramas, em quais

deles é possível fazer uma previsão da variável dependente, conhecendo-se a

Page 141: CAPA DISSERTAÇÃO FINAL Mara Lucia

140

variável dependente?

5) Tendo como referência os pares ordenados em um diagrama de dispersão, é

possível detectar qual variável é considerada dependente? Justifique.

6) a) Ache o melhor valor predito de y para x= 6, sabendo que r=0,953, 4=y , n=20

e que a equação de regressão é ŷ=3,00+2,00x.

b) O valor obtido em a) permanece inalterado para qualquer valor de r? Justifique.

Conforme explicitamos, ao final da Primeira Seqüência, muitas outras

questões podem ser elaboradas. O papel do professor é preponderante para

acompanhar o desenvolvimento dos alunos e propor desafios ou tarefas que

resgatem as idéias centrais sobre correlação e regressão. As duas seqüências

apresentadas pretendem ser motivadoras, exemplificando um trabalho com um

tópico de Estatística, no caso, correlação e regressão, tendo como foco a leitura e

interpretação de dados.

Page 142: CAPA DISSERTAÇÃO FINAL Mara Lucia

141

4 Análise de livros didáticos

Apresentamos a seguir a análise de quatro livros que discorrem sobre o tema

Correlação e Regressão, sendo dois deles específicos da área de engenharia.

O tema foi analisado em cada livro com o objetivo de verificar em que medida

a forma de apresentação do mesmo favorece o desenvolvimento das habilidades de

leitura e interpretação de dados, adotando-se para tal análise os níveis de Curcio

(1987), anteriormente discutidos: 1) ler os dados; 2) ler dentro dos dados; 3) ler além

dos dados.

A análise foi desenvolvida em duas etapas. A primeira etapa consistiu na

análise da exposição teórica sobre Correlação e Regressão (em especial a Linear)

feita pelos autores, ou seja, da forma e foco adotados na apresentação dos

principais conceitos e propriedades e a exemplificação feita (exercícios resolvidos).

A segunda etapa compreendeu a análise dos exercícios propostos nas várias

seções dos livros que abordam o tema correlação e regressão. Cada exercício

proposto foi analisado, objetivando-se identificar a ênfase do mesmo, a partir dos

níveis de leitura de dados de Curcio.

Pretendemos que a análise apresentada possa ser um instrumento para

orientar a leitura dos livros, bem como facilitar escolhas de textos com uma

abordagem que priorize a leitura e interpretação de dados no desenvolvimento de

estudos de correlação e regressão.

4.1 Análise do Livro 1: Estatística aplicada e prob abilidade para engenheiros

Autores : Douglas MONTEGOMERY e George C. Runger

Editora: LTC – Livros Técnicos e Científicos

Ano: 2003.

O livro consta de 14 capítulos, apêndices e índice. Dos 14 capítulos teóricos

que totalizam 386 páginas, o capítulo 10 aborda Regressão Linear e Correlação em

25 páginas, que correspondem a 6,48% do total de páginas de desenvolvimento

teórico.

Page 143: CAPA DISSERTAÇÃO FINAL Mara Lucia

142

Os autores iniciam o capítulo fazendo uma abordagem da análise de

regressão através de um exemplo, que envolve pureza do oxigênio (y) produzido em

um processo químico e a porcentagem de hidrocarbonetos (x) que estão em um

condensador principal da unidade de destilação.

Inicialmente, os autores usam o diagrama de dispersão para mostrar como

os pares ordenados se distribuem no sistema cartesiano. A disposição dos pares

ordenados no sistema cartesiano permite aos alunos usarem suas habilidades

intuitivas no sentido de reconhecer uma tendência, ou melhor, imaginar qual curva

que melhor se ajustaria aos dados e como realizar futuras previsões.

Percebe-se que esse tipo de abordagem gráfica envolve as categorias de

Curcio, que são: ler os dados, quando o aluno observa os pares ordenados no

diagrama de dispersão; ler dentro dos dados, quando o aluno percebe uma

tendência ao examinar os dados e ler além dos dados; quando o aluno associa a

tendência identificada através dos dados com equações de curvas conhecidas por

eles, que possibilitam fazer previsão.

Após a exploração de regressão, através do diagrama de dispersão, os

autores formalizam o conceito de regressão linear, apresentando o método dos

mínimos quadrados e deduzindo os valores dos coeficientes da reta de regressão

através do uso de noções do Cálculo Diferencial, em particular das derivadas

parciais. Esse método possibilita determinar os interceptos da melhor reta que se

ajusta aos dados no diagrama de dispersão. Os autores usam o mesmo exemplo

comentado anteriormente para determinar a equação da reta que melhor se ajusta

aos dados e fazem a representação desta reta no diagrama de dispersão.

No capítulo, os autores exploram as propriedades dos estimadores dos

mínimos quadrados, isto é, os coeficientes de regressão da reta que melhor se

ajusta aos dados e fazem a estimação da variância populacional.

Percebe-se por parte dos autores certa preocupação com os exageros

cometidos pelos alunos com relação ao uso de regressão, feito que leva os autores

a alertarem para o fato de que os alunos devem ter cautela ao detectar a associação

entre duas variáveis. Mesmo existindo uma forte relação entre as variáveis, isso não

implica relação de causa e efeito, isto é, pode existir uma terceira variável oculta que

influencia todo processo. Os autores introduzem testes de hipóteses para os

coeficientes de regressão, como um instrumento para verificar se o modelo de curva

Page 144: CAPA DISSERTAÇÃO FINAL Mara Lucia

143

de ajuste aos dados é adequado. No caso específico de regressão linear, se a

inclinação for igual a zero, isto significa que não existe relação entre as variáveis.

O capítulo também aborda intervalos de confiança, que servem para calcular

os limites de confiança para os coeficientes de regressão, procedimento também útil

para investigar a adequação do modelo de regressão. Os autores fazem uma

abordagem do intervalo de confiança para a resposta média, que é uma maneira de

inferir a respeito do parâmetro média populacional, quando se desconhece o seu

valor. Um intervalo determinado dessa forma, parte da suposição de que a média da

variável aleatória Y tenha relação com X, de acordo uma equação linear.

Os autores também usam o coeficiente de determinação, R² para verificar

qual o ajuste de reta de regressão, ou melhor, quanto da variabilidade dos dados

observados da variável dependente (y) é apreendido pela equação de regressão.

Em seguida os autores exemplificam um a ajuste de modelo linear, feito

indevidamente, quando os dados não mostram uma tendência linear no diagrama de

dispersão.

A abordagem de correlação é feita ao final do capítulo 10. Sem exploração

do conteúdo através de diagramas de dispersão, exploram-se testes de hipótese e

intervalos de confiança para a correlação linear, somente em função de fórmulas. Os

autores ao explorarem regressão linear e correlação linear fazem uma exposição de

cunho matemático, não se preocupando em explorar um raciocínio mais intuitivo;

poucos gráficos são apresentados no estudo da correlação.

4.2 Análise do Livro 2: ESTATÍSTICA: para os cursos de engenharia e

informática

Autores: Pedro Alberto BARBETTA; Marcelo Menezes REIS; Antônio Cezar

BORNIA

Editora: Editora Atlas S.A

Ano: 2004

O livro consta de 11 capítulos, anexo, respostas de exercícios, apêndices e

bibliografia. Dos 11 capítulos teóricos que totalizam 351 páginas, o capítulo 11

Page 145: CAPA DISSERTAÇÃO FINAL Mara Lucia

144

aborda Correlação e Regressão em 30 páginas, que correspondem a 8,55% do total

de páginas de desenvolvimento teórico.

Os autores iniciam o capítulo explorando Correlação através de três

diagramas de dispersão, referentes a um exemplo de queima de massa cerâmica

para pavimentação, de 18 corpos de prova que foram analisados, usando três

variáveis: X1 = retração linear (%), X2 = resistência mecânica (MPa) e X3 = absorção

de água (%). Em seguida, exploram o cálculo do coeficiente de correlação de

Pearson.

Eles iniciam Regressão linear usando um exemplo que se refere ao Índice de

octanagem (Y) e quantidade de aditivo (%) (X), mostrando através do diagrama de

dispersão a tendência dos pares ordenados.

Os autores utilizam o método dos mínimos quadrados para determinar as

fórmulas que permitem o cálculo dos parâmetros da reta que melhor se ajusta aos

dados representados no diagrama de dispersão. Neste capítulo, são tratados

assuntos como: análise do modelo, teste de hipótese para a declividade da reta,

análise de resíduos, transformação logarítmica e intervalos de confiança.

4.3 Análise do Livro 3: Noções de Probabilidade e E statística

Autores: Marcos Nascimento Magalhães; Antônio Carlos Pedroso

Editora: Editora da Universidade de São Paulo, 6 ed.

Ano: 2007

O livro consta de 9 capítulos, bibliografia e índice remissivo. Os capítulos

teóricos totalizam 352 páginas, sendo que os autores introduzem Associação no

capítulo 5, em 30 páginas, o que corresponde a 8,53% das 352 páginas.

Os autores introduzem a associação entre variáveis, usando como exemplo,

notas de inglês e português de 15 alunos, do primeiro ano do ensino médio,

considerando os alunos que obtiveram nota superior a 7 pontos. Os autores

inicialmente usam o diagrama de dispersão para explorar associação entre duas

variáveis. Em seguida, abordam probabilidade condicional para variável aleatória

discreta e independência de variáveis aleatórias, para trabalhar a dependência linear

quando o conjunto de dados é grande e tem poucas variações entre essas

Page 146: CAPA DISSERTAÇÃO FINAL Mara Lucia

145

observações, acarretando com isso algumas dificuldades para se fazer a análise dos

pares ordenados no diagrama de dispersão. Neste capítulo, os autores definem

coeficiente de correlação de Pearson e apresentam a fórmula que permite calcular

esse coeficiente. Eles dão continuidade ao estudo de variáveis aleatórias discretas

através de propriedades, isto é, provando e exemplificando cada uma delas.Tais

propriedades permitem esclarecer se existe ou não dependência entre duas

variáveis. O capítulo 5 explora o cálculo de correlação entre variáveis através da

covariância. A covariância mostra o tipo de relacionamento entre duas variáveis, isto

é, se elas caminham no mesmo sentido ou se elas caminham em sentido contrário,

mas não define o grau de intensidade desse relacionamento. Se, por exemplo, o

valor que representa a covariância for positivo, isso indica que, para as variáveis x e

y, quando x cresce y também cresce, logo as variáveis caminham no mesmo

sentido.

Os autores no capítulo 9, Tópicos Especiais, no item 9.5, abordam Regressão

Linear, em 9 páginas o que corresponde a 2,56% das 352 páginas.

No item 9.5, os autores dão um exemplo para a aplicação de Regressão

Linear, usando dados que se referem à criação de gado. Para o exemplo foram

utilizados 15 bois, de mesma raça e mesma idade, provenientes da região Bocaina –

São Paulo. Cada boi recebeu certa quantidade de substância(x) (em mg/l) e, após

30 dias, foi observado o ganho de peso (y) de cada boi (em Kg). O diagrama de

dispersão, construído a partir desses dados, mostra que valores baixos de

substância (x) se associam a valores baixos de ganho de peso (y) e valores altos de

substância (x) se associam a valores altos de ganho de peso (y), mostrando assim

uma tendência a partir dos pares ordenados no diagrama de dispersão. É sugerido

um ajuste de reta que passe o mais próximo possível dos pares ordenados e, para

isso, usam o método dos mínimos quadrados para determinar os parâmetros desta

reta. Em seguida, eles determinam a equação da reta de regressão e representam a

mesma no diagrama de dispersão. Os autores fazem a interpretação dos parâmetros

e abordam teste de hipóteses, para verificar se a quantidade de substância (x) tem

influência sobre o ganho de peso (y).

Page 147: CAPA DISSERTAÇÃO FINAL Mara Lucia

146

4.4 Análise do Livro 4: Encontro com o acaso – um p rimeiro curso de análise

de dados e inferência

Autores: Christoper J. Wild; George A.F.

Editora: LTC – Livros Técnicos e Científicos

Ano: 2000.

O livro aborda o tema em dois capítulos, sendo que no capítulo 3 os autores

tratam o assunto de maneira intuitiva e, no capítulo 12, de maneira formal. Os dois

capítulos se completam com ênfase na leitura e interpretação de dados estatísticos,

foco do trabalho aqui apresentado.

O livro consta de 14 capítulos e apêndices. Dos 14 capítulos teóricos que

totalizam 377 páginas, o capítulo 3, Ferramentas Exploratórias de Relação, discorre

o assunto em 25 páginas que correspondem a 6,63% do total de páginas de

desenvolvimento teórico, sendo que 11 páginas abordam teoricamente o foco da

pesquisa, o que corresponde a 2,98% de teoria a respeito da exploração da análise

de variáveis quantitativas.

Os autores iniciam o capítulo oferecendo uma visão geral, isto é, o que será

abordado em cada seção. Eles iniciam a exploração de relação entre duas variáveis,

citando como exemplo uma tabela já utilizada no capítulo 2, que contém informações

de um grupo de homens que foram atendidos no Hospital Greenlane em Auckland,

após sofrerem ataque cardíaco. As duas variáveis envolvidas para explorar o

diagrama de dispersão são: Volsis26 e Voldia27. É feita uma análise de como os

valores pequenos de Volsis estão associados a valores pequenos de Voldia e como

os valores altos de Volsis estão associados a valores altos de Voldia, mostrando

uma tendência linear. Os autores mencionam alguns softwares que possibilitam a

construção de gráficos de dispersão, por exemplo, o Minitab, o Excel, o R e o Splus,

sendo que a maior parte dos gráficos, apresentados no capítulo 3, são provenientes

do software de distribuição gratuita R.

26 Volume sistólico final, uma medida do tamanho do coração. É calculada a partir da figura da silhueta bidimensional do ventrículo esquerdo, na sua menor parte. 27 Volume diastólico final, o mesmo que Volsis, exceto por usar a maior silhueta.

Page 148: CAPA DISSERTAÇÃO FINAL Mara Lucia

147

Os autores fazem um comentário da impressão sobreposta, isto é, os valores

das observações quando apresentados no diagrama de dispersão ficam tão

próximos, que não permitem ao leitor uma leitura fiel dos dados no diagrama de

dispersão. Uma maneira de amenizar tal situação é fazer a apresentação dos dados

observados através de círculos abertos.

Os autores utilizam os dados das tabelas: 3.1.1 Mortes e Radiações no Leite

após Chernobyl; 3.1.2 Tempo de Processamento e Cargas de Trabalho nos

Computadores; 3.1.3 Poluentes em Emissões de Gases de Descarga de Veículos e

3.1.4 Marcas Olímpicas Vitoriosas nos 1.500 Metros para Homens (1900 – 1988),

para explorar as relações entre as variáveis, no diagrama de dispersão e verificar a

existência ou não de uma tendência.

Usando as mesmas tabelas citadas anteriormente, os autores exploram

variáveis aleatórias, isto é, variáveis para as quais não se consegue prever o

resultado até que o experimento não seja finalizado, por exemplo, lançamento de

uma moeda 3 vezes. As variáveis não são aleatórias, quando são controladas pelo

seu experimentador, por exemplo, partidas de ônibus de Belo Horizonte a São

Paulo.

A utilidade da Regressão é destacada, explorando-se a tendência e a

dispersão dos dados, usando vários diagramas de dispersão. Nesse momento, os

autores usam círculos abertos para indicar os pontos no diagrama de dispersão e

colocam ênfase nos possíveis ajustes dos dados, através de curvas desenhadas a

mão. Em um dos diagramas, eles chamam a atenção do leitor para curvas

pontilhadas abaixo e acima dos possíveis limites de dispersão dos dados e mostram

os valores fora desta faixa, denominados como sendo valores atípicos28.

Os autores exploram as relações consideradas como sendo fortes ou

relações consideradas fracas, através da analise visual e a associação entre essas

variáveis, salientando quando as variáveis estão associadas de forma negativa e

quando as variáveis estão associadas de forma positiva.

No capítulo 3, os autores discorrem ainda a respeito dos perigos da predição,

mostram outras tendências em diversos diagramas de dispersão.

Outro capítulo do livro analisado pela pesquisadora quanto à abordagem do

conteúdo e exercícios usados para exemplificar cada seção e os exercícios

28 Entende-se por valores atípicos os valores que destoam completamente dos valores que compõem um conjunto de dados.

Page 149: CAPA DISSERTAÇÃO FINAL Mara Lucia

148

propostos pelos autores é o capítulo 12, Relações entre Variáveis Quantitativas:

Regressão e Correlação.

Os autores fizeram, inicialmente, um breve resumo do que compõe o capítulo.

Este capítulo consta de 35 páginas, que correspondem a 9,28% do total de páginas

de desenvolvimento teórico. Os autores dão início ao capítulo comentando de que

forma foram explorados os conteúdos Regressão e Correlação no capítulo 3 e, em

seguida, formalizam o que seja Regressão e Correlação. Exploram as relações de

causa e efeito, alertando o leitor de que uma forte relação entre as variáveis não

significa necessariamente uma relação de causa e efeito. Para o estudo de

Regressão, os autores mostram através de vários diagramas de dispersão que o

melhor ajuste aos dados pode ser uma reta e fazem a interpretação de sua

inclinação.

Neste capítulo, também outros modelos de curvas de tendência são

explorados por meio de diagramas de dispersão, entre eles a aproximação pela

curva exponencial.

Após a exploração dos diversos tipos de diagramas, os autores falam do

método dos mínimos quadrados, que permite determinar os parâmetros da reta que

melhor se ajusta ao conjunto de dados apresentados no diagrama de dispersão.

4.5 Análise comparativa dos quatro livros e conclus ões

A classificação dos exercícios de cada livro, segundo as categorias de Curci,

permitiu estabelecer algumas conclusões: os Livros 1, 2 e 3 dão ênfase a uma das

categorias de Curcio que é ler dentro dos dados. Essa categoria explora a habilidade

do aluno no sentido de utilizar os seus conhecimentos para fazer uma leitura dos

dados apresentados. Este tipo de leitura envolve destrezas de ordem quantitativa e

conhecimentos adquiridos anteriormente. As operações matemáticas elementares

podem ser de grande utilidade neste tipo de leitura, que requer habilidades em

comparar os dados.

Um dos fatores que pode justificar a presença marcante dessa categoria de

Curcio talvez seja o fato do Livro 1 e do Livro 2 serem direcionados para a área de

engenharia e o Livro 3, um livro preparado para um público mais geral de ciências

Page 150: CAPA DISSERTAÇÃO FINAL Mara Lucia

149

biológicas, exatas e humanas. Dessa forma, tais livros incentivam cálculos com os

dados.

O Livro 4 é o único dos quatro livros que aborda o conteúdo correlação e

regressão em dois momentos. No capítulo 3, os autores exploram a relação entre

duas variáveis de forma intuitiva e, no capítulo 12, eles exploram formalmente essa

relação entre duas variáveis. Por se tratar de um livro que dá ênfase a explorar o

lado intuitivo e propor mais questões teóricas como exercício, as categorias de

Curcio de ler os dados, ler dentro dos dados e ler além dos dados não são tão

freqüentes de acordo com o gráfico 9. Nos dois capítulos analisados pela

pesquisadora, observou-se que os autores propõem uma grande quantidade de

exercícios ao aluno, que conduzem a sínteses teóricas. O Gráfico 9 evidencia uma

pequena quantidade de exercícios que explora a categoria ler os dados. Uma

possível justificativa para esse fato é a abordagem intuitiva dada pelos autores ao

Capítulo 3 do livro, sem enfatizarem o cálculo através do uso de fórmulas. O Livro 4

foi elaborado para áreas de marketing, finanças, economia, ciências sociais, físicas,

biológicas e médicas e tem um objetivo diferenciado dos livros 1, 2 e 3. O foco é

explorar o raciocínio intuitivo.

A Tabela 6 sintetiza o total dos exercícios de cada livro, classificados segundo

as categorias de Curcio.

Tabela 6: Freqüência das categorias de Curcio nos e xercícios dos quatro livros

Livros Categorias Livro 1 Livro 2 Livro 3 Livro 4 Total

Ler dados 13 1 1 5 20 Ler dentro dos dados

75 9 18 53 155

Ler além dos dados

75 8 3 30 116

Total 163 18 22 88 291 Fonte: Miranda, M. L. (2008, p.71) Tabela 7: Percentual das categorias de Curcio nos e xercícios dos quatro livros em relação ao

total geral Livros Categorias

Livro 1 Livro 2 Livro 3 Livro 4 Total Ler dados 4,47% 0,34% 0,34% 1,72% 6,87% Ler dentro dos dados

25,77% 3,1% 6,19% 18,21% 53,27%

Ler além dos dados

25,77% 2,75% 1,03% 10,31% 39,86%

Total 56,01% 6,19% 7,56% 30,24% 100% Fonte: Miranda, M. L. (2008, p.71)

Page 151: CAPA DISSERTAÇÃO FINAL Mara Lucia

150

A Tabela 7 foi construída a partir do total geral dos exercícios propostos,

pelos autores, nos quatro livros (291) e evidencia que, a categoria mais presente nos

exercícios é ler dentro dos dados. Percebe-se ainda no Livro 1 a maior evidência

das categorias de Curcio.

A Tabela 8 apresenta como os exercícios se distribuem percentualmente,

dentro de cada livro, de acordo com as categorias de Curcio.

Tabela 8: Percentual dos exercícios, segundo as cat egorias de Curcio por livro Livros Categorias

Livro 1 Livro 2 Livro 3 Livro 4 Ler dados 7,98% 5,56% 4,54% 5,68% Ler dentro dos dados

46,01% 50% 81,82% 60,23%

Ler além dos dados

46,01% 44,44% 13,64% 34,10%

Total 100% 100% 100% 100% Fonte: Miranda, M. L. (2008, p.71)

Dentre os exercícios propostos no Livro 1, verifica-se que a proporcionalidade

é a mesma nas categorias ler dentro dos dados e ler além dos dados. Assim sendo,

o Livro 1, adotado no curso de engenharia onde a pesquisadora atua como

professora, pode ser considerado adequado, do ponto de vista de uma abordagem

do tema com ênfase na leitura e interpretação de dados.

Também, no Livro 2, as mesmas duas categorias ler dentro dos dados e ler

além dos dados são predominantes. Nos Livros 3 e 4 as habilidades de leitura e

interpretação de dados mais exploradas nos exercícios, são aquelas relativas à

leitura dentro dos dados.

Dos quatro livros analisados, o Livro 4 diferencia–se dos demais por ter uma

forma de explorar o conteúdo de correlação e regressão em dois capítulos, sendo

que inicialmente o faz de forma exploratória e posteriormente formalizando os dois

conteúdos. Por essa razão, o livro constituiu-se em uma fonte de idéias importante

para a elaboração de atividade, numa linha investigativa, incentivando uma análise

visual de gráficos e tabelas.

Page 152: CAPA DISSERTAÇÃO FINAL Mara Lucia

151

REFERÊNCIAS BARBETTA, Pedro Alberto; REIS, Marcelo Menezes; BORNIA, Antonio Cezar. Estatística: para os cursos de engenharia e informá tica . São Paulo: Atlas, 2004. 410p. CURCIO, Frances R. Comprehension of Mathematical Relationships Expressed in Graphs. Journal for Research in Mathematics Education , v. 18, n. 5, p. 382-393, 1987. ERNEST, Paul. Investigações, Resolução de Problemas e Pedagogia . In:P. Abrantes, L.C. Leal, J.P. Ponte (Eds.). Investigar para aprender matemática ,. Lisboa: Projecto MPT e APM, 1996, p. 25-48.

GARFIELD, Joan; HOGG, Bob; SCHAU, Candace. First Courses in Statistical

Science: The Status of Educational Reform Efforts. Journal of Statistics Education,

v.10, n. 2, 2002, Disponível em: <http://www.amstat.org/publications/jse/v10n2/

garfield.html>. Acesso em: 20 de jun. 2008.

PONTE, João Pedro.; BROCARDO, Joana; OLIVEIRA, Hélia. Investigações matemáticas na sala de aula . Belo Horizonte:Autêntica, 2003. 151p. (Tendências em educação matemática ;7 ) PONTE, João Pedro. Investigar, ensinar e aprender . Actas do ProfMat, 2003. (CD-ROM, p 25-39). Lisboa: APM.

NATIONAL COUNCIL OF TEACHERS OF MATHEMATICS. Standards for School Mathematics , 2000. Disponível em http://standards.nctm.org/document/chapter3/ data.htm. Acesso em 23 de maio de 2008.

Page 153: CAPA DISSERTAÇÃO FINAL Mara Lucia

152

ANEXOS

Page 154: CAPA DISSERTAÇÃO FINAL Mara Lucia

153

ANEXO A

Pontifícia Universidade Católica de Minas Gerais

Pró-Reitoria de Graduação

Plano de Ensino (2º semestre de 2008)

Curso: 3 - Engenharia Mecânica

Disciplina: 779 - PROBABILIDADE E ESTATISTICA I

Período: 4

Créditos: 4

Turno: noite

Carga

Horária:

TEÓRICA ( 60 horas )

Ementa

Estatística descritiva. Probabilidades. Variáveis a leatórias. Distribuições

Page 155: CAPA DISSERTAÇÃO FINAL Mara Lucia

154

discretas.Distribuições contínuas. Amostragens. Inf erência estatística: estimação; intervalo de confiança; teste de hipóteses (erros). Análise de regressão simples (inferência). Controle e gerenciamento de processos .

Objetivos

-Dar os fundamentos básicos da estatística,de modo a iniciar o futuro engenheiro nos aspectos estatísticos da engenharia -Desenvolver o raciocínio estatístico em problema da engenharia -Utilização da informática(máquina de calcular e mi crocomputador)junto ao trabalho estatístico

Métodos Didáticos

-Aulas expositivas com exemplos práticos acompanhan do os desenvolvimentos teóricos -Trabalhos individuais e em grupo em sala de aula

Unidades de Ensino

Unidade I - Introdução 1.1-Desenvolvimento histórico da Estatística 1.2-Objetivo e método da Estatística 1.3-Estatística nos cursos da Engenharia Unidade II - Medidas Estatísticas 2.1-Medidas de posição:conceito,interpretação,propr iedades e cálculo 2.2-Medidas de dispersão:conceito,interpretação,pro priedades e cálculo Unidade III - Distribuição de Frequência 3.1-Tabulação de dados 3.2-Construção de uma tabela de frequências 3.3-Separatrizes

Page 156: CAPA DISSERTAÇÃO FINAL Mara Lucia

155

3.4-Medida de posição e dispersão 3.5-Gráficos:histograma,polígono de frequência e og ivas Unidade IV - Técnicas de Amostragem 4.1-Tabela de números aleatórios 4.2-Amostragem aleatória simples 4.3-Amostragem aleatória estratificada 4.4-Amostragem aleatória sistemática 4.5-Amostragem aleatória por conglomerado Unidade V - Probabilidades 5.1-Conceitos fundamentais 5.2-Propriedades 5.3-Probabilidade condicional.Independência de even tos 5.4-Regra de Bayes Unidade VI - Variáveis Aleatórias 6.1-Conceito 6.2-Variável aleatória discreta e contínua 6.3-Função distribuição de probabilidades 6.4-Esperança e variância de uma variável aleatória Unidade VII - Distribuições Discretas 7.1-Distribuição binomial 7.2-Distribuição de Poisson 7.3-Distribuição hipergeométrica 7.4-Distribuição de Poisson como aproximação da dis tribuição binomial Unidade VIII - Distribuições Contínuas 8.1-Distribuição uniforme 8.2-Distribuição exponencial 8.3-Distribuição normal

Page 157: CAPA DISSERTAÇÃO FINAL Mara Lucia

156

8.4-Distribuição normal como da binomial,Poisson e hipergeométrica Unidade IX - Estimação de Parâmetros Populacionai s 9.1-Conceitos 9.2-Estimação Pontual 9.3-Estimação por intervalo de confiança(média,prop orção,variância) 9.4-Dimensionamento da amostra Unidade X - Teste de Hipóteses 10.1-Conceitos básicos 10.2-Erros 10.3-Teste para média,proporção e variância Unidade XI - Regressão Linear 11.1-Correlação Linear 11.2-O método dos mínimos quadrados 11.3-Predições Unidade XII - Controle de Processos 12.1-Gráficos de controle - Tendências 12.2-Indice de capacidade de processo.

Processo de Avaliação

3 PROVAS DE 25 PONTOS TRABALHOS TOTALIZANDO 25 PONTOS

Page 158: CAPA DISSERTAÇÃO FINAL Mara Lucia

157

PROVA REPOSITIVA: 25 PONTOS (atendimento aos casos de não comparecimento a uma das provas) REAVALIAÇÃO: 100 PONTOS

Descrição da Bibliografia Básica

MONTGOMERY, Douglas C.; RUNGER, George C. Estatisti ca aplicada e probabilidade para

engenheiros. Rio de Janeiro: LTC, 2003. 463p. ISBN 8521613601

Consta no acervo da PUC Minas

MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE, Norma Faris. Estatística

aplicada à engenharia. Rio de Janeiro: LTC, c2004. 335p. ISBN 8521613989

Consta no acervo da PUC Minas

Descrição da Bibliografia Complementar

MIRSHAWKA, Victor. Probabilidades e estatistica par a engenharia. São Paulo: Nobel,

1983-88. v.

Consta no acervo da PUC Minas

MORETTIN, Luiz Gonzaga. Estatistica basica : probab ilidade. 6.ed. Sao Paulo: Makron

Books, 1995. 185p. ISBN 8534603340 : (Broch.)

Consta no acervo da PUC Minas

Paiva, Antônio Fabiano de. Estatística/ Antonio Fab iano de Paiva. 2.ED. 1971.

Page 159: CAPA DISSERTAÇÃO FINAL Mara Lucia

158

Consta no acervo da PUC Minas

TRIOLA, Mario F. Introdução à estatística. 7. ed. R io de Janeiro: LTC - Livros

Técnicos e Científicos, c1999. 410p. ISBN 852161154 4

Consta no acervo da PUC Minas

WERKEMA, Maria Cristina Catarino. As ferramentas da qualidade no gerenciamento de

processos. 2. ed. Belo Horizonte: UFMG/EE: FCO, 199 5. 108p. ISBN 8585447133 :

(broch.)

Consta no acervo da PUC Minas

WERKEMA, Maria Cristina Catarino. Como estabelecer conclusões com confiança:

entendendo inferencia estatistica. Belo Horizonte: Ed. da UFMG: Fundação Christiano

Ottoni, 1996. 309p. ISBN 8585447281

Consta no acervo da PUC Minas

WOLF, Frank L. Elements of probability and statisti cs. 2. ed. New York: McGraw-

Hill, c1974. 450p.

Consta no acervo da PUC Minas

WONNACOTT, Thomas H.; WONNACOTT, Ronald J. Introduç ão a estatistica. Rio de

Janeiro: Livros Tecnicos e Cientificos, 1980. 589p. ISBN 8521600399 (broch.)

Consta no acervo da PUC Minas

ANEXO B

Trabalho – Engenharia Mecânica 1 – A tabela a seguir relaciona os pesos (em centenas de kg) e as taxas de consumo de combustível em rodovia (km/l) numa amostra de 10 carros de passeio novos. Peso 12 13 14 14 16 8 19 22 24 26 Consumo 16 14 14 13 11 12 09 09 08 06

Page 160: CAPA DISSERTAÇÃO FINAL Mara Lucia

159

a) Calcule o coeficiente de correlação de Pearson.

b) Considerando o resultado do item (a), como você avalia o relacionamento entre peso e consumo na amostra observada?

c) Para estabelecer uma equação de regressão, qual deve ser a variável

dependente e qual deve ser a variável independente? Justifique sua resposta.

d) Estabeleça a equação de regressão, considerando a resposta do item (c).

e) Apresente o diagrama de dispersão e a reta de regressão obtida em (d).

f) Você considera adequado o ajuste do modelo de regressão obtida em (d)? Justifique.

g) Qual o consumo esperado para um carro de 200 Kg? Lembrete: Os dados de

consumo na tabela estão em centenas de Kg.

h) Você considera seu estudo capaz de produzir o consumo esperado de um veículo com o peso de 700 kg? Justifique sua resposta.

2 – Uma correlação elevada implica causalidade? Explique. 3 – Que implica o sinal menos (-) antes do r? E antes de b? 4 – Que é reta de regressão?

Exercício retirado do livro:

ESTATÍSTICA: para os cursos de engenharia e inform ática

Autores: Pedro Alberto BARBETTA; Marcelo Menezes REIS; Antônio Cezar

BORNIA

Editora: Atlas S.A

Ano: 2004