15
QUESTIONÁRIO DE AVALIAÇÃO DOCENTE PELO DISCENTE: ANÁLISE DA CAPACIDADE DE AVALIAÇÃO Tomoe Daniela Hamanaka Gusberti (UFRGS) [email protected] Regina Vignatti (UFRGS) [email protected] Tania Poleth Aulestia Pillajo (UFRGS) [email protected] Wilson Pablo Medina Beltran (UFRGS) [email protected] Observam-se atualmente práticas com preocupações com a qualidade na educação superior, como a implementação de sistemas de qualidade, e/ou sistemas de avaliação. Conhecer a opinião de quem convive com a realidade universitária, os estudantees, é de suma importância neste contexto, pois a Universidade poderá direcionar a aplicação dos recursos disponíveis. Este trabalho consiste em um trabalho exploratório, com alguns dados resultantes da avaliação docente pelo discente. Conduziram-se análises estatísticas de forma a investigar se o processo de avaliação cumpre seu objetivo, ou seja, se há coerência entre os resultados. O escopo com esse trabalho é planejar e conduzir um experimento que responda aos seguintes questionamentos: (i) o conceito que o aluno obtém interfere na avaliação que ele realiza da atividade de ensino?; (ii) o questionário consegue distinguir infra-estruturas com qualidades nitidamente distintas? Em relação à averiguação da capacidade de avaliação do questionário, os resultados esperados eram: turmas com infraestruturas muito distintas apresentassem resultados de avaliações significativamente diferentes; e infraestruturas semelhantes, avaliação igual. Alguns resultados obtidos, porém, não foram totalmente condizentes com o esperado. Observou-se, por exemplo, que turmas com mesmas infra-estruturas a disposição avaliavam diferentemente. Por exemplo, observou-se que, embora as turmas tivessem à disposição o mesmo acervo de livros e tivesse a mesma necessidade, avaliavam diferentemente. Estes resultados indicam que há outros fatores influenciando na avaliação do aluno, que não somente a infra- estrutura. Também se observou que há, para algumas questões, atividades de ensino e turma, grande variabilidade das respostas, o que dificulta testes de inferência estatística. De forma paralela, investigou-se a possibilidade da influência do conceito obtido pelo estudante e o índice de ordenamento na avaliação, para verificar se há dados para respaldar a possibilidade de atribuir ponderação distinta a avaliação de alunos com conceitos melhores e/ou piores. Para avaliar XXX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO Maturidade e desafios da Engenharia de Produção: competitividade das empresas, condições de trabalho, meio ambiente. São Carlos, SP, Brasil, 12 a15 de outubro de 2010.

QUESTIONÁRIO DE AVALIAÇÃO DOCENTE PELO … · Determinar se existe uma relação linear entre o índice de ordenamento e a avaliação que ele realiza em certo quesito do formulário:

  • Upload
    dodieu

  • View
    223

  • Download
    0

Embed Size (px)

Citation preview

QUESTIONÁRIO DE AVALIAÇÃO

DOCENTE PELO DISCENTE: ANÁLISE

DA CAPACIDADE DE AVALIAÇÃO

Tomoe Daniela Hamanaka Gusberti (UFRGS)

[email protected]

Regina Vignatti (UFRGS)

[email protected]

Tania Poleth Aulestia Pillajo (UFRGS)

[email protected]

Wilson Pablo Medina Beltran (UFRGS)

[email protected]

Observam-se atualmente práticas com preocupações com a qualidade

na educação superior, como a implementação de sistemas de

qualidade, e/ou sistemas de avaliação. Conhecer a opinião de quem

convive com a realidade universitária, os estudantees, é de suma

importância neste contexto, pois a Universidade poderá direcionar a

aplicação dos recursos disponíveis. Este trabalho consiste em um

trabalho exploratório, com alguns dados resultantes da avaliação

docente pelo discente. Conduziram-se análises estatísticas de forma a

investigar se o processo de avaliação cumpre seu objetivo, ou seja, se

há coerência entre os resultados. O escopo com esse trabalho é

planejar e conduzir um experimento que responda aos seguintes

questionamentos: (i) o conceito que o aluno obtém interfere na

avaliação que ele realiza da atividade de ensino?; (ii) o questionário

consegue distinguir infra-estruturas com qualidades nitidamente

distintas? Em relação à averiguação da capacidade de avaliação do

questionário, os resultados esperados eram: turmas com

infraestruturas muito distintas apresentassem resultados de avaliações

significativamente diferentes; e infraestruturas semelhantes, avaliação

igual. Alguns resultados obtidos, porém, não foram totalmente

condizentes com o esperado. Observou-se, por exemplo, que turmas

com mesmas infra-estruturas a disposição avaliavam diferentemente.

Por exemplo, observou-se que, embora as turmas tivessem à disposição

o mesmo acervo de livros e tivesse a mesma necessidade, avaliavam

diferentemente. Estes resultados indicam que há outros fatores

influenciando na avaliação do aluno, que não somente a infra-

estrutura. Também se observou que há, para algumas questões,

atividades de ensino e turma, grande variabilidade das respostas, o

que dificulta testes de inferência estatística. De forma paralela,

investigou-se a possibilidade da influência do conceito obtido pelo

estudante e o índice de ordenamento na avaliação, para verificar se há

dados para respaldar a possibilidade de atribuir ponderação distinta a

avaliação de alunos com conceitos melhores e/ou piores. Para avaliar

XXX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO Maturidade e desafios da Engenharia de Produção: competitividade das empresas, condições de trabalho, meio ambiente.

São Carlos, SP, Brasil, 12 a15 de outubro de 2010.

2

se os dados sustentam tal possibilidade, realizou-se análise de

correlação. Observou-se, no entanto, que não há correlação linear

nítida entre conceitos transcritos de forma quantitativa, ou índice de

ordenamento com nenhuma das avaliações, quando agrupamos os

dados de todas as atividades de ensino. Finalmente, conduziu-se a

análise da variância, ANOVA. Uma atividade de ensino com uma

quantidade significativa de respostas foi selecionada, e os alunos

classificados quanto aos conceitos obtidos. A ANOVA foi utilizada

para avalia

Palavras-chaves: Instituição de ensino; avaliação docente pelo

discente; avaliação de desempenho; estatística

3

1. Introdução

Observam-se atualmente práticas com preocupações com a qualidade na educação superior,

como a implementação de sistemas de qualidade, e/ou sistemas de avaliação (DOBRZANSKI

E ROSZAK, 2007). De forma similar, a UFRGS apresenta diversas ações para avaliação.

Dentre estas ações, uma avaliação é conduzida com a participação do discente ao final de

cada semestre. A avaliação pelo discente na UFRGS é gerenciada pelo Centro de

Processamento de Dados – CPD. Esta avaliação representa uma importante ferramenta para a

Universidade, visto que dessa forma ela pode avaliar o desempenho das ações e estruturas de

ensino e identificaras áreas que carecem de investimento. Conhecer a opinião de quem

convive com a realidade universitária, os estudantes, é de suma importância neste contexto,

pois a UFRGS, poderá direcionar a aplicação dos recursos disponíveis.

Este trabalho foi conduzido com o apoio da Secretaria de Avaliação Institucional (SAI). Esta

secretaria possui o propósito de sistematizar a permanente avaliação (UFRGS, 2010).

Especificamente, consiste em um trabalho exploratório, com alguns dados resultantes da

avaliação docente pelo discente. Conduziram-se análises estatísticas de forma a investigar se o

processo de avaliação cumpre seu objetivo, ou seja, se há coerência entre os resultados. O

escopo com esse trabalho é planejar e conduzir um experimento que responda aos seguintes

questionamentos: (i) o conceito que o aluno obtém interfere na avaliação que ele realiza da

atividade de ensino?; (ii) o questionário consegue distinguir infra-estruturas com qualidades

nitidamente distintas?

A pesquisa conduzida visou uma análise preliminar em resposta à demanda da SAI. A

secretaria, por exemplo, em uma das reuniões em que o grupo participou, destacou a

possibilidade de conceder mais valor aos alunos com melhores conceitos, uma vez que

acredita que a avaliação que esses estudantes deveria ser mais valorizada. Outros testes foram

realizados, com o propósito de auxiliar a SAI, com ferramentas estatísticas, que consiste em

uma ferramenta útil na tomada de decisão, especificamente na análise de dados reais e

quantitativos. Com o auxílio destas ferramentas, podem-se conduzir uma tomada de decisão

baseado em dados, e não apenas em suposições.

2. Método

As principais áreas empregadas no trabalho são, primeiro, a estatística descritiva, que utiliza

números para descrever fatos, segundo, a estatística inferencial, que trabalha com a análise e

interpretação de informações coletadas a partir de amostras. Os objetivos específicos

estudados foram: (i) Desenvolvimento de um novo modelo de relatório para apresentar a

análise dos dados da avaliação, utilizando a estatística descritiva; (ii) Avaliar se turmas com

infra-estrutura sabidamente iguais avaliam a infra-estrutura de forma similar e turmas com

infra-estrutura sabidamente diferentes avaliam o item de forma significantemente diferentes.

Para isto, testou-se a avaliação do item infraestrutura de duas atividades de ensino distintas

com infra-estrutura distintas: a conclusão esperada era de que as avaliações fossem desiguais;

e testou-se a análise da avaliação do item infraestrutura em duas turmas da mesma atividade

de ensino: era esperado que as duas turmas efetuassem uma avaliação análoga; (iii)

Investigação da interferência do conceito obtido pelo estudante com a avaliação realizada por

ele: Suspeita-se que o conceito possa intervir na avaliação que o discente efetua; (iv)

Determinar se existe uma relação linear entre o índice de ordenamento e a avaliação que ele

realiza em certo quesito do formulário: o grupo deseja saber se há uma correlação entre as

variáveis.

4

O primeiro passo para a análise dos dados foi a junção dos dados em uma só tabela, uma vez

que, foram fornecidos dispersos em diferentes planilhas. Posteriormente, foram designadas as

variáveis a serem utilizadas nos objetivos específicos do trabalho, para então empregar a

estatística descritiva para proporcionar as informações das características da população, bem

como das subpopulações, como a média, variância, moda, desvio padrão, coeficiente de

variação, boxplot e gráficos.

Após esse passo, o grupo trabalhou com a inferência estatística. Primeiramente, o grupo

questionou se o percentual de alunos que preenchem a avaliação (tamanho de amostra) é

suficiente, avaliando a precisão possível para a inferência sobre a média da população. Em

seguida, foram realizados dois testes de hipóteses para averiguar se a variável grau de

avaliação do item infra-estrutura de duas atividades de ensino distintas era também desigual.

Outro teste também investigado, analogamente, se o grau de avaliação de duas turmas

diferentes de uma mesma atividade de ensino é idêntico.

Posteriormente, realizou-se análise de correlação para determinar quais variáveis tinham

alguma correlação. Para isto, o grupo definiu as variáveis índice de ordenamento e grau de

avaliação como relação a ser investigada mais importante, na medida em que a SAI tinha

intenções de dar mais valor à avaliação dos alunos com maiores conceitos.

Finalmente, conduziu-se a análise da variância, ANOVA. Uma atividade de ensino com uma

quantidade significativa de respostas foi selecionada, e os alunos classificados quanto aos

conceitos obtidos. A ANOVA foi utilizada para avaliar se o grau de avaliação dos estudantes

era influenciado pelos conceitos obtidos A, B, C ou D.

4. Resultados

Os dados utilizados são referentes aos semestres de 2008/2 e 2009/1, coletados através da

avaliação on-line, disponibilizada pela universidade ao estudante ao final de cada semestre

letivo. Os itens avaliados são agrupados em cinco áreas de avaliação: infra-estrutura,

atividade de ensino, professor e auto-avaliação. Cada um dos itens é subdividido em subitens.

O grau de avaliação possui cinco níveis, variando de um (concordo plenamente) a cinco

(discordo completamente).

Atualmente, o relatório disponibilizado aos professores e ao departamento contém uma tabela

os seguintes dados: quantidade de respostas, máximo, mínimo, média e desvio padrão.

Após a junção dos dados e elaboração da base para a análise, a codificação e descrição

resumida das atividades de ensino avaliadas são descritas na Figura 1.

Atividade de ensino Turma Avaliações Infra-estrutura

08/2 09/1

1 1 14 14 Regular, possui cadeiras e mesas, sem computador ou ar-condicionado

5 2 26 31

2 1 9 7

6 2 17 22

3 10 182 213

8 3 22 29 Ótima, com computador e ar condicionado

Figura 1: Codificação das atividades de ensino analisadas

Os dados estudados são divididos em variáveis categóricas e quantitativas. As Variáveis

categóricas ordinais compreendem o conceito obtido pelo estudante. Variáveis categóricas

nominais compreendem turma e atividade de ensino. Variáveis quantitativas compreendem o

grau de avaliação em cada um dos itens (e subitens) avaliados, e o índice de ordenamento.

5

Sendo que a primeira compreende uma variável discreta, e, a segunda, contínua.

4.1 Estatística descritiva

A Tabela 1 apresenta uma parte da estatística descritiva obtida que resume alguns itens das

avaliações das atividades de ensino. A tabela apresenta média, desvio padrão, tamanho da

amostra e coeficiente de variação, de algumas atividades e alguns critérios, segregadas pelo

semestre, porém sem segregar por turma.

Os valores de média observados indicam que há variabilidade entre as atividades de ensino e,

às vezes, entre semestres. Observa-se que a variabilidade das avaliações são diferentes

conforme questão ou atividade de ensino. Observamos, inclusive, itens de avaliação com

coeficiente de variação superior a 70%, especialmente em atividades que ocorreu baixa

resposta às avaliações.

Tabela 1: Estatística descritiva - atividades de ensino e avaliações

Critério Atividade Ensino

08/02 09/01

s CV n

s CV n Disc-cap

acidad

e

intelectu

al

5 3,833 1,239 32% 24 4,167 1,239 30% 24

6 3,571 1,555 44% 14 4,143 0,793 19% 21

8 4,429 0,746 17% 21 4,586 0,733 16% 29

3 3,677 1,388 38% 158 3,201 1,598 50% 174

1 4,500 1,092 24% 14 4,286 1,204 28% 14

2 2,125 1,642 77% 8 4,286 1,496 35% 7 Disc-realid

ade so

cial

5 3,400 1,635 48% 20 4,000 1,140 29% 21

6 3,700 0,949 26% 10 3,250 1,603 49% 12

8 4,278 1,074 25% 18 4,286 0,976 23% 28

3 3,168 1,535 48% 113 2,738 1,650 60% 126

1 3,909 1,700 43% 11 4,000 1,528 38% 13

2 1,714 1,496 87% 7 4,600 0,548 12% 5 IE-acerv

o

5 3,632 1,383 38% 19 3,750 1,653 44% 16

6 3,167 1,467 46% 12 3,412 1,583 46% 17

8 3,533 1,407 40% 15 4,063 1,237 30% 16

3 3,750 1,395 37% 124 3,689 1,504 41% 132

1 4,286 1,139 27% 14 4,231 1,013 24% 13

2 3,750 1,581 42% 8 4,667 0,516 11% 6 IE-b

iblio

teca

5 3,895 1,286 33% 19 4,158 1,302 31% 19

6 4,077 1,115 27% 13 3,867 1,246 32% 15

8 4,200 1,014 24% 15 4,231 0,927 22% 13

3 4,039 1,232 31% 128 4,024 1,287 32% 126

1 4,571 0,756 17% 14 4,385 1,193 27% 13

2 4,429 1,512 34% 7 5,000 0,000 0% 4 IE-sala d

e aula

5 2,542 1,414 56% 24 2,680 1,492 56% 25

6 3,429 1,089 32% 14 2,650 1,348 51% 20

8 4,905 0,301 6% 21 4,857 0,356 7% 28

3 4,013 1,116 28% 152 3,506 1,371 39% 168

1 3,923 1,553 40% 13 3,923 1,498 38% 13

2 3,500 1,773 51% 8 3,000 1,414 47% 6

Além da obtenção de média e desvio padrão, foram também elaborados boxplots que

permitem explorar a dispersão dos dados. Alguns resultados selecionados são apresentados a

6

seguir.

A Figura 2 apresenta o boxplot relacionado à questão “As condições da(s) sala(s) de aula colaboram para o desenvolvimento da disciplina”. Observa- se todas as turmas da

disciplina 8 indicam uma nítida satisfação com a adequação da sala de aula, o que é esperado,

já que este departamento disponibiliza salas com ar condicionado e computadores. Observa-se

uma grande variabilidade na percepção dos alunos em relação ao item nas demais disciplinas.

A disciplina 6 chama a atenção por esta variabilidade. A turma 3 e 1 do semestre 2008/02

parecem não concordar em percepção. A turma 1 apresenta percepção dos alunos entre notas

3 e 5, com mediana em 3. A turma 4 apresenta percepções entre 1 e 4, com os 50% centrais

entre 2 e 3,5. Não há informação que distinga a infra-estrutura disponível para as turmas.

Figura 2: boxplot com a dispersão das respostas à questão sala de aula (obtida utilizando SPSS 18.0)

A Figura 3 apresenta o boxplot com a resposta à questão “O acervo da biblioteca é suficiente e adequado para o desenvolvimento da disciplina”.

7

Figura 3: Boxplot com a dispersão das respostas à questão acervo (obtida utilizando SPSS 18.0)

A disciplina 8 parecem ilustrar algumas inconsistências da percepção dos alunos referentes a

alguns itens. Nitidamente, todas as turmas requerem o mesmo acervo, e a biblioteca e,

portanto acervo, disponível para as turmas é a mesma. No entanto, a Figura 3 ilustra

diferentes percepções entre as turmas 1, 4 e 7 de 2008/02. A turma 1 parece concordar na

adequação do acervo, enquanto a turma 7 afirmam entre notas 3 e 4, e a turma 4 avaliam de

forma mais variável, a partir da nota um. Isto parece indicar que há outros fatores

influenciando sobre a percepção dos alunos em relação a qualidade do acervo, uma vez que o

acervo disponível teoricamente seria o mesmo.

Observação similar é apresentada na Figura 4. Este apresenta o boxplot relacionado a resposta

à questão “As condições da biblioteca (espaço físico, horário, atendimento) colaboraram para o desenvolvimento da disciplina”. Observam-se, novamente, diferenças na resposta em relação à infra-estrutura da biblioteca, embora a biblioteca disponível e, portanto, seu espaço físico deveria ser o mesmo.

8

Figura 4: boxplot com a resposta à questão infra-estrutura - Biblioteca, para as disciplinas 3 e 8 (utilizando SPSS

18.0)

A representação na forma de boxplot indica que, em muitas turmas e muitos itens, há dados atípicos, que diferem significativamente dos demais. Estas suposições são testadas no item a seguir.

4.2 A avaliação consegue distinguir infra-estruturas sabidamente diferentes?

Qualquer instrumento de medição deveria ser capaz de distinguir objetos sabidamente

diferentes. Considerando o formulário de avaliação como o instrumento de medição, e as

escalas utilizadas, este trabalho conduziu uma investigação simples para testar se as respostas

fornecidas pelos discentes repercutem somente o que é de fato avaliado, ou se há outros

fatores influenciando. Para esta investigação, no entanto necessita-se que os mesmos itens

medidos fossem avaliados por algum instrumento-padrão para comparação. No entanto, para a

maioria dos itens tal instrumento não é disponível para as situações em análise. Um item

passível de avaliação de outras formas, segundo a percepção do grupo foram os itens

relacionados à infra-estrutura.

Neste item, algumas suposições realizadas como resultado da estatística descritiva,

especialmente análise do boxplot são testadas através de teste de hipótese. O objetivo foi

testar se as médias das avaliações da infraestrutura de uma mesma disciplina, de um

determinado quesito, são iguais, uma vez que duas turmas avaliaram o mesmo edifício, num

mesmo semestre. Se esta hipótese for aceita então poderia se concluir que o processo de

avaliação está alcançando o seu objetivo. Aplicou-se o teste de hipótese para comparação de

médias, variância desconhecida. Observa-se que não há evidências de que as variâncias são

iguais.

Tabela 2: estatísticas utilizadas para comparação de médias

Critério/questão Semestre Ativ – turma s n

As condições da(s) sala(s) de aula colaboram para o desenvolvimento da disciplina

2009/01 8 - 1 4,917

0,288

12

6 - 1 2,77 1,48 9

9

8 1 6 - 4 2,54

5 1,29

3 11

O acervo da biblioteca é suficiente e adequado para o desenvolvimento da disciplina.

2008/02 8–- 1 4,667

0,577 3

8 –7 3,428

1,134 7

8 –4 3,000

1,871 5

As condições da biblioteca (espaço físico, horário, atendimento) colaboraram para o desenvolvimento da disciplina.

2009/01 8 - 4 5,000

0,000 4

8 - 7 4,333

0,577 3

8 - 1 3,667

1,033 6

Tabela 3: resultados para comparação de médias, variâncias desconhecidas e diferentes (* significativo para α =

0,01; ** significativo para α = 0,05)

Critério/questão Semestre Ativ – turma GL T calc.

P valor T crítico (α = 0,05)

As condições da(s) sala(s) de aula colaboram para o desenvolvimento da disciplina

2009/01 8 –- 1 e 6 – 1* 8,571

4,271 0,001 2,306

6 – 1 e 6 –4 17,910 0,36

9 0,358 2,110

6 - 4 e 8 - 1* 11,096 5,94

6 <0,001 2,201

O acervo da biblioteca é suficiente e adequado para o desenvolvimento da disciplina.

2008/02 8 - 1 e 8 – 7** 9,898

2,280 0,024 2,262

8–- 7 e 8 – 4 7,092 0,45

6 0,331 2,365

8 - 4 e 8 – 1 5,763 1,85

1 0,062 2,571

As condições da biblioteca (espaço físico, horário, atendimento) colaboraram para o desenvolvimento da disciplina.

2009/01 8 –- 4 e 8 – 7 2,000

2,000 0,092 4,303

8 - 7 e 8 – 1 8,979 1,24

0 0,125 2,306

8 - 1 e 8 - 4** 5,000 3,16

2 0,013 2,571

As análises confirmam as suposições realizadas. Para a questão condição da sala de aula, a

turma da atividade de ensino 8 descordam na percepção da condição de sala de aula das

turmas da atividade 6. Entre as turmas da atividade 6, não há diferença significativa. Tal

observação indica que o instrumento consegue avaliar diferentemente as infra-estruturas sala

de aula.

Os itens seguintes, relacionados a questões acervo da bilioteca e condições da biblioteca

avaliaram turmas diferentes da mesma atividade de ensino (8). Teoricamente, o acervo e

condições da biblioteca, como a necessidades dos alunos em relação aos mesmos seriam

similares. Em relação ao acervo, algumas turmas possuem percepções similares, porém, a

turma 1 e 7 apresentam percepções significativamente diferentes a α = 0,05. Em relação às

condições da biblioteca, as turmas 1 e 4 também diferenciam-se significativamente a α = 0,05.

4.3 Variabilidade dos dados e tamanho de amostra para inferência estatística

Para fins de inferência estatística, a variabilidade dos dados define o tamanho ideal de

10

amostras, dada uma precisão almejada. Para se obter a mesma precisão e nível de confiança

na estimativa do intervalo de confiança para um parâmetro, por exemplo, quanto maior a

variabilidade dos dados, maior é o tamanho da amostra requerida. Assim, foi analisado o

tamanho da amostra necessário para fins de inferência de um item de avaliação em uma

disciplina.

Analisou-se o número de amostra suficiente para obter uma média de avaliação de uma

atividade de ensino, com uma confiabilidade de 95% e precisão de 0,5. A precisão de 0,5 foi

selecionada, visto que desta forma a coleta de dados permitirá distinguir entre todos os níveis

da avaliação. Para isso foi aplicado o método de intervalo de confiança para a média com

variância desconhecida, visto que, embora a população de usuários de uma atividade de

ensino seja os alunos das suas turmas, o nível de resposta às avaliações costuma ser inferior a

100 %.

Para fins de comparação, escolheram-se duas atividades de ensino, sem distinção de turmas,

uma com grande variabilidade, e outra com pequena variabilidade.

O par atividade de ensino e questão selecionado com menor variabilidade foi a questão infra-

estrutura e sala de aula, atividade de ensino 8, do período letivo 08/02. O desvio padrão,

conforme apresentado anteriormente na estatística descritiva, foi 0,301. Considerando 2

2

e

szn

, com α = 0,05 e erro (e) = 0,5, obtêm-se n = 1,392.

O par atividade de ensino e questão selecionado dentre as com maior variabilidade foi a

questão disciplina – realidade soicial, com s = 1,535, da atividade de ensino 3 do semestre

08/02. Obteve-se, para esta questão, nesta atividade, um tamanho de amostra ideal de n =

36,205. Considerando que esta atividade de ensino apresentava muitas turmas e obteve 113

respostas, ela permite inferir a avaliação, permitindo distinguir suas respostas das demais. No

entanto, observa-se que temos questões com variabilidade próximas a esta que não obtiveram

quantidade de respostas tão alta, mesmo agrupando as diversas turmas do período.

Este resultado demonstra que, em geral, somente é possível obter uma estimativa para a média

com erro maior que 0,5. Desta forma, pelo menos nas questões com variabilidade maior, uma

inferência segura não é possível, sendo recomendado um censo da população (obrigar todos

os alunos a responderem a avaliação).

4.4 Há correlação entre índice de ordenamento e grau de avaliação?

Inicialmente, investigou-se a existência ou não uma correlação R entre as variáveis índice de

ordenamento e grau de avaliação. Também foi incorporado a variável conceito traduzida da

seguinte forma: A = 10; B = 7; C = 6; D = 0; FF = 0; Quanto mais próximo de um positivo ou

negativo, mais forte é a correlação entre as variáveis. Quanto mais próximo de zero, menor é a

chance de ter alguma relação entre elas. Esse cálculo foi realizado com a ajuda de uma

ferramenta, o excel, e os resultados obtidos são apresentados na Tabela 4.

Observa-se que não há correlação linear nítida entre conceitos e índice de ordenamento com

nenhum dos itens de avaliação. No entanto é necessário considerar que a matriz de correlação

foi elaborada sem distinguir as diferentes atividades de ensino, semestres e turmas,

agrupando-os. Possivelmente muitos outros fatores além do conceito ou ordenamento

influenciam as avaliações, como as características da atividade de ensino, da infra-estrutura,

do professor, entre outros, que não permitem destacar a influência do conceito sobre a

avaliação.

11

A matriz de correlação permitiu também identificar uma alta correlação entre diversas

variáveis. A existência de correlação significa a avaliação de um item é influenciada pela

avaliação no outro item, ou que resultam de algo em comum. Assim, as variáveis altamente

correlacionadas podem significar que para o avaliador tais questões são redundantes, ou que

não consegue distingüí-las. De fato, observa-se que muitos pares de variáveis altamente

correlacionadas são pertencentes a uma mesma categoria de questões. Por exemplo, observou-

se correlação forte de 0,87 entre as variáveis prof-Conteudos (O professor trabalhou os

conteúdos da disciplina com clareza, destacando aspectos importantes da matéria) e Prof-

Objetividade (O professor desenvolveu as aulas com objetividade, utilizando recursos e

procedimentos apropriados); 0,82 entre Prof-Objetividade e Prof-Enriquec (O professor

enriqueceu as aulas com resultados de pesquisa e/ou material atualizado). Os pares que

apresentaram moderada correlação foram: 0,79 entre prof-Conteudos e Prof-Participação (O

professor incentivou a participação dos alunos, considerando o seu questionamento crítico e

suas contribuições); 0,78 entre Prof-Conteudos e Prof-Enriquec; 0,77 entre Prof-Participação

e Prof-relação com demais conteúdos (O professor possibilitou dinâmicas que favorecem

relações entre o conteúdo da disciplina com os demais conteúdos); e 0,77 entre Prof-Enriquec

e Prof-Participação.

Tabela 4: Matriz de correlação entre as questões (obtida com auxílio do MS Excel 2007)

conceito

ord

_in

d3

Auto

-apre

ndiz

ado

Auto

-esfo

rço

Auto

-pre

-req

uis

tios

Dis

c-c

am

pos d

e tra

balh

o

Dis

c-c

apacid

ade

inte

lectu

al

Dis

c-C

arg

a h

or

Dis

c-e

xerc

icio

s

Dis

c-o

bje

tivos

Dis

c-p

lano d

e e

nsin

o

Dis

c-r

ealid

ade s

ocia

l

IE-a

cerv

o

IE-b

iblio

teca

IE-labora

torio

IE-s

ala

de a

ula

IE-t

rabalh

os d

e c

am

po

Pro

f-C

arg

a h

or

Pro

f-C

onte

udos

Pro

f-crite

rios a

va

liação

Pro

f-D

isponib

Pro

f-E

nri

que

c

Pro

f-in

str

um

ento

s

de

avalia

ção c

om

pativeis

Pro

f-O

bje

tivid

ade

Pro

f-P

art

icip

ação

Pro

f-re

lação c

om

dem

ais

conte

údos

Pro

f-re

sultados

avalia

ções

conceito 1,00 ord_ind3 0,28 1,00

Auto-aprendizado 0,36 0,26 1,00 Auto-esforço 0,21 0,24 0,44 1,00

Auto-pre-requistios 0,20 0,15 0,41 0,39 1,00 Disc-campos de trabalho 0,19 0,12 0,58 0,20 0,24 1,00

Disc-capacidade intelectual 0,27 0,11 0,67 0,22 0,36 0,58 1,00 Disc-Carga hor 0,24 0,18 0,57 0,22 0,32 0,50 0,53 1,00

Disc-exercicios 0,24 0,17 0,57 0,20 0,33 0,60 0,61 0,48 1,00 Disc-objetivos 0,33 0,25 0,76 0,35 0,38 0,52 0,66 0,62 0,57 1,00

Disc-plano de ensino 0,23 0,15 0,47 0,07 0,21 0,38 0,39 0,50 0,39 0,49 1,00 Disc-realidade social 0,13 0,03 0,48 0,05 0,26 0,76 0,52 0,49 0,62 0,52 0,42 1,00

IE-acervo 0,07 0,12 0,37 0,10 0,26 0,43 0,32 0,41 0,33 0,30 0,38 0,45 1,00 IE-biblioteca -0,02 0,14 0,33 0,10 0,21 0,31 0,29 0,38 0,34 0,34 0,32 0,33 0,56 1,00

IE-laboratorio 0,01 0,17 0,51 0,00 0,29 0,61 0,54 0,60 0,72 0,47 0,52 0,71 0,63 0,66 1,00 IE-sala de aula 0,03 0,04 0,31 0,07 0,10 0,34 0,25 0,29 0,35 0,27 0,28 0,36 0,45 0,44 0,74 1,00

IE-trabalhos de campo 0,07 0,06 0,52 0,14 0,41 0,66 0,66 0,71 0,58 0,64 0,55 0,64 0,76 0,71 0,76 0,69 1,00 Prof-Carga hor 0,19 0,11 0,42 0,08 0,15 0,30 0,35 0,52 0,39 0,39 0,37 0,34 0,31 0,28 0,44 0,23 0,47 1,00

Prof-Conteudos 0,24 0,16 0,55 0,10 0,24 0,55 0,50 0,61 0,65 0,55 0,49 0,52 0,36 0,30 0,66 0,26 0,62 0,45 1,00 Prof-criterios avaliação 0,10 0,15 0,43 -0,03 0,21 0,39 0,38 0,46 0,50 0,41 0,51 0,42 0,39 0,37 0,63 0,28 0,60 0,47 0,62 1,00

Prof-Disponib 0,18 0,10 0,47 0,03 0,12 0,42 0,42 0,49 0,52 0,45 0,41 0,48 0,36 0,33 0,61 0,31 0,61 0,44 0,67 0,62 1,00 Prof-Enriquec 0,20 0,16 0,47 0,12 0,26 0,64 0,47 0,53 0,64 0,46 0,44 0,68 0,34 0,28 0,67 0,27 0,70 0,41 0,78 0,53 0,59 1,00

Prof-instrumentos avaliação 0,18 0,10 0,53 0,05 0,25 0,47 0,52 0,52 0,60 0,58 0,50 0,50 0,35 0,32 0,49 0,32 0,57 0,49 0,67 0,58 0,56 0,64 1,00

12

Prof-Objetividade 0,20 0,19 0,59 0,12 0,28 0,59 0,52 0,64 0,66 0,57 0,51 0,57 0,41 0,35 0,69 0,30 0,63 0,47 0,87 0,60 0,63 0,81 0,69 1,00 Prof-Participação 0,17 0,14 0,51 0,08 0,26 0,61 0,48 0,54 0,68 0,50 0,47 0,65 0,32 0,28 0,66 0,27 0,63 0,35 0,79 0,57 0,63 0,79 0,63 0,82 1,00

Prof-relação demais conteúdos 0,22 0,17 0,54 0,08 0,25 0,66 0,51 0,55 0,64 0,50 0,44 0,67 0,35 0,27 0,57 0,23 0,57 0,39 0,72 0,50 0,58 0,74 0,63 0,77 0,77 1,00

Prof-resultados avaliações 0,23 0,19 0,53 0,14 0,21 0,51 0,49 0,48 0,61 0,48 0,42 0,52 0,38 0,33 0,56 0,29 0,54 0,41 0,68 0,54 0,66 0,67 0,58 0,72 0,71 0,64 1,00

Observou-se correlação moderada entre variáveis do grupo referente à infra-estrutura. Por

exemplo: obteve-se 0,76 de correlação entre IE-trabalhos de campo (Os trabalhos de campo

contaram com os recursos necessários) e IE-laboratorio (As condições do(s) laboratório(s)

/ambulatório(s)/ clínica(s) colaboram para o desenvolvimento da disciplina) e 0,76 entre IE-

trabalhos de campo e IE-acervo (O acervo da biblioteca é suficiente e adequado para o

desenvolvimento da disciplina).

!!! 4.5 O conceito obtido interfere na avaliação realizada?

A Análise de Variância permite a comparação de vários grupos. A hipótese formulada pelo

grupo pretende averiguar se o conceito obtido pelo estudante pode interferir na avaliação que

ele realiza da atividade de ensino. Esse experimento foi desenhado da seguinte forma: a

variável de resposta compreende o grau de avaliação no subitem; O fator controlável

compreende a variável conceito; como nível de confiabilidade, estabeleceu-se 95%.

Conduziu-se ANOVA com todos os dados disponíveis de uma atividade de ensino com

tamanho razoável de dados (atividade de ensino com maior quantidade de turmas). A

atividade de ensino analisada é 3. O semestre analisado foi 2009/01. As diferentes turmas

foram agrupadas, sabendo-se que, como política da universidade, na existência de mais de

uma turma, há uma preocupação pelo regente da atividade de ensino em termos de

uniformização do conteúdo e práticas de avaliação. A variável utilizada para fins de análise

foi Prof-Enriquec (O professor enriqueceu as aulas com resultados de pesquisa e/ou material atualizado).

A Tabela 5 resume a contagem das avaliações realizadas e os conceitos obtidos pelos alunos.

Tabela 5: freqüência de grau de avaliação por conceito obtido

GrauAvaliacao A B C D FF

1 2 3 8 10

2 2 3 7 2 2

3 4 3 17 5

4 3 11 13 4 3

5 11 12 23 2 4

Realizando a análise, foi obtido o seguinte resultado:

Tabela 6: resultados da análise de variância com conceitos diferentes (obtida utilizando MS Excel

2007).

Fonte da variação SQ gl MQ F valor-P F crítico

Entre grupos 26,529 4 6,632 3,137 0,016 2,430 Dentro dos grupos 327,664 155 2,114

Total 354,1938 159

Para averiguar qual grupo influi sobre a média de avaliações, comparação múltipla de médias

13

foi realizada, utilizando MQR para estimativa da variância.

Figura 5: Intervalo de confiança para médias

Observa-se que o grupo que obteve notas FF ou D não diferem significativamente, em relação

a avaliação, entre si, no entanto, são significativamente diferentes dos grupos que obtiveram

conceitos A, B ou C, que avaliaram melhor a questão.

5. Discussão

Em relação à averiguação da capacidade de avaliação do questionário, os resultados esperados

eram: turmas com infraestruturas muito distintas apresentassem resultados de avaliações

significativamente diferentes; e infraestruturas semelhantes, avaliação igual.

Alguns resultados obtidos, porém, não foram totalmente condizentes com o esperado.

Observou-se, por exemplo, que turmas com mesmas infra-estruturas a disposição avaliavam

diferentemente. Por exemplo, observou-se que, embora as turmas tivessem à disposição o

mesmo acervo de livros e tivesse a mesma necessidade, avaliavam diferentemente. Estes

resultados indicam que há outros fatores influenciando na avaliação do aluno, que não

somente a infra-estrutura.

De forma paralela, investigou-se a possibilidade da influência do conceito obtido pelo

estudante e o índice de ordenamento na avaliação, para verificar se há dados para respaldar a

possibilidade analisada pelo SAI de atribuir ponderação distinta a avaliação de alunos com

conceitos melhores e/ou piores. Para avaliar se os dados sustentam tal possibilidade,

conduziu-se inicialmente a análise da correlação. Observou-se, no entanto, que não há

correlação linear nítida entre conceitos transcritos de forma quantitativa, ou índice de

ordenamento com nenhuma das avaliações, quando agrupamos os dados de todas as

atividades de ensino.

A análise na ANOVA foi conduzida com uma questão e com dados de apenas uma atividade

de ensino. Esta análise indicou que há uma influência significativa do conceito obtido pelo

aluno em relação ao nível de satisfação apresentada na avaliação respondida. Os resultados da

ANOVA diferem dos resultados da correlação, pois a ANOVA permite distinguir a influência

dos diferentes grupos de conceito, mesmo que a relação não seja linear.

4.6 Proposta de um novo relatório

Considerando as análises acima, sugere-se um novo modelo de relatório. O atual contém

poucos dados, não apresenta sequer recurso visual, que tem o poder de fácil análise de dados.

A adição do Box-plot permitirá a visualização da dispersão dos dados, além da existência de

14

simetria ou não, atualmente não viabilizado. Sugere-se a utilização do Boxplot, uma vez que

este permite a visualização dos resultados da estatística descritiva de forma mais rápida, além

de permitir a expressão de maior informação que meramente média, máximo, mínimo e

desvio padrão. Também foi incluído o coeficiente de variação, que é uma medida muito útil

que permite a comparação da variabilidade dos dados, ou seja se eles são mais homogêneos,

ou mais dispersos, sem o problema de escala que pode ocorrer na utilização do desvio-padrão.

Outro recurso sugerido foi a inserção da moda, que identifica o valor mais freqüente.

A Figura 6 ilustra a parte visual do relatório sugerido.

Relatório de Avaliação de Disciplinas pelo Discente - Por Disciplina * 200* /*

.... 40Sempre que possível foram estabelecidas relações entre conteúdos das disciplinas e os campos de trabalho da profissão. 41Sempre que possível os conhecimentos desenvolvidos na disciplina foram contextualizados na realizade social, econômica, política e/ou ambiental brasileira. 50A carga horária total da disciplina foi cumprida e bem aproveitada. 42As condições da(s) sala(s) de aula colaboram para o desenvolvimento da disciplina. 43As condições do(s) laboratório(s)/ambulatório(s)/clínica(s) colaboram para o desenvolvimento da disciplina. 44O acervo da biblioteca é suficiente e adequado para o desenvolvimento da disciplina. 45Os trabalhos de campo contaram com os recursos necessários. 46As condições da biblioteca (espaço físico, horário, atendimento) colaboraram para o desenvolvimento da disciplina. 47Eu possuía os pré-requisitos necessários para o bom acompanhamento da disciplina. 48Estou satisfeito com o que aprendi na disciplina. 49Dediquei o esforço necessário à disciplina.

Figura 6: exemplo de estrutura do relatório proposto

6. Considerações Finais

Os objetivos deste trabalho foram analisar o processo de avaliação docente pelo discente,

avaliando o relatório gerado atualmente e verificando a capacidade de distinção de situações

sabidamente diferentes. Os dados indicam que as questões parecem permitir distinguir infra-

estruturas nitidamente distintas (extremos). Porém, observou-se que a percepção dos alunos é

15

influenciada por diversos outros fatores, não explicados neste trabalho, que devem ser

considerados. Parece, por exemplo, que há uma significativa influência de algo que

denominamos aqui de cultura própria das turmas. Algumas turmas embora possuam a mesma

infra-estrutura à disposição (acervo bibliográfico, estrutura da biblioteca) e tenham

teoricamente a mesma necessidade em relação à mesma, pareciam avaliar diferentemente.

Também se observou que há, para algumas questões, atividades de ensino e turma, grande

variabilidade das respostas, o que dificulta testes de inferência estatística.

Em relação à suposição de ponderar mais alunos que obtiveram aprovação ou melhores

conceitos na atividade de ensino, a análise realizada em uma atividade de ensino indica que

há, de fato, influência do conceito obtido sobre a avaliação, no caso específico.

As conclusões aqui apresentadas baseiam-se em métodos estatísticos básicos, que apresentam

suas limitações. As inferências também foram realizadas utilizando apenas algumas das

variáveis, atividade de ensinos, turmas e questões disponíveis. Utilizou-se toda a base de

dados apenas na análise da correlação, nas demais apenas parte da base de dados. As análises

realizadas apresentaram resultados bastante interessantes e úteis. No entanto, a ampliação da

análise para uma quantidade maior de dados e a utilização de outros métodos poderia ser mais

adequada. Para algumas das situações analisadas, outros métodos estatísticos, como ANOVA

com mais de um fator, estatística não-paramétrica, entre outros, podem ser interessantes, ou

até mesmo mais adequados para a confirmação dos resultados aqui obtidos.

Agradecimentos

Os autores agradecem ao CPD (Centro de Processamento de Dados) e à SAI (Secretaria de

avaliação Institucional) da Universidade Federal do Rio Grande do Sul – UFRGS pelos dados

e atenção disponibilizada.

Referências

DOBRZANSKI & ROSZAK. Quality Management in university education. Journal of Achievements in

Materials and Manufacturing Engineering. Vol. 24, issue 2, october 2007.

UFRGS. Secretaria de Avaliação Institucional. Disponível em: http://www.ufrgs.br/sai/ acessado em março de

2010.

RIBEIRO, J.D.L. e TEN CATEN, C.S. Estatística Industrial. UFRGS/EE/PPGEP. Porto Alegre, RS, Brasil.

2000

Stevenson, Willian J. Estatística Aplicada à Administração; São Paulo; Harper e Row do Brasil; 1981.

Montgomery, Douglas C.; Runger, George C. Estatística Aplicada e Probabilidade para Engenheiros. Rio de

Janeiro, RJ; LTC; 2ª ed.; 2003.