Avaliação educacional (1): o que estamos medindo?
De
tempos em tempos, a temática da avaliação educacional, e suas conseqüências,
voltam a permear, intensa e extensamente, o cenário educacional brasileiro.
Exemplos disso são a prova Brasil, os exames vestibulares, que focalizam,
essencialmente, o conteúdo aprendido, bem como, a avaliação da excelência do
ensino, que, por sua vez, focaliza a qualidade do que é ensinado. Os resultados
destas avaliações têm importantes implicações sociais, econômicas e educacionais
para a qualificação do capital humano da nação. No caso da Prova Brasil, seus
principais indicadores revelam que, a maioria dos alunos das 4ª e 8ª séries, não consegue desempenhar simples operações
matemáticas, nem contextualizar textos curtos e rudimentares. No caso dos
exames vestibulares, discute-se se os mesmos devem focar os processos de
raciocínio, pensamento abstrato ou capacidade de lidar com a complexidade, ou,
apenas, conhecimento adquirido das diferentes disciplinas curriculares, ou
seja, discute-se se tais avaliações devem centrar-se na inteligência fluída ou na
inteligência cristalizada, respectivamente. No caso da avaliação da excelência
do ensino, procura-se analisar o desempenho dos professores em todas as suas
facetas, e quais de seus atributos podem ser melhorados para enriquecer o
processo de ensino-aprendizagem. Entretanto, independente de qual tipo de
avaliação seja empregada, a preocupação é com o valor diagnóstico, e preditivo,
de cada uma delas. Adicionalmente, se as mesmas são capazes de aferir
habilidades e conhecimentos importantes para vida adulta. Assim considerando, acho
importante analisar dois componentes fundamentais do processo de avaliação
educacional: (1) o que estamos de fato medindo e (2) quais as dimensões da
excelência do ensino que devem ser mensuradas. Consideremos o primeiro.
É a Psicometria o domínio de estudos
da avaliação psicológica e educacional. Esta, utilizando instrumentos
padronizados, compostos de um conjunto de tarefas ou atributos administrados
sob condições controladas, avalia o conhecimento, as habilidades, os
desempenhos e outras características psicológicas dos indivíduos ou fenômenos. Sendo
as avaliações, psicológica e educacional, campos dos mais amplos da psicologia aplicada,
representam, talvez, contribuições, das mais importantes, para a nossa
sociedade. Testes, escalas psicológicas e outras formas de avaliação são
freqüentemente utilizados em quase todos os processos envolvidos na avaliação
humana. Praticamente, todas as nossas atividades são avaliadas por algum tipo
de instrumento de medida (testes, escalas, inventários, questionários, provas,
exames, etc.). Somos avaliados nas escolas para monitorar o nosso desempenho e em
exames, os mais diversos, para nos habilitarmos ao exercício de nossas
profissões. Somos avaliados com o propósito de verificar alguma dificuldade de
aprendizagem e, também, para sermos, eventualmente, premiados ou promovidos no
trabalho, em função de nossos desempenhos, ou mesmo, para corrigirmos eventuais
distorções em nossas funções. Enfim, somos avaliados em tudo que desempenhamos,
ao longo de toda a vida.
Avaliações educacionais envolvem e
afetam indivíduos, instituições e sociedades como um todo. Fruto desta
importância, avaliadores tentam mensurar, o mais rigorosamente possível, tais
desempenhos. Entretanto, alguns desses instrumentos têm tornado-se
controvertidos pelo fato de muitas pessoas suspeitarem que eles sejam
enviesados (vejam, por exemplo, a controvérsia acerca dos testes de inteligência,
da progressão continuada e dos exames vestibulares, entre outros). A despeito disso,
todas as avaliações devem compartilhar um conjunto de propriedades, ou
características, comuns, tais como: devem ser fidedignas, válidas, padronizadas
e livres de vieses. E não há, certamente, outro aspecto do campo da psicologia
que apresentou tamanho impacto na vida dos indivíduos.
Uma avaliação consiste numa situação
experimental e padronizada, que serve de estímulo a um dado comportamento ou
constructo, que se pretende capturar. Usualmente, este é pontuado mediante uma
comparação estatística com comportamentos similares de outros indivíduos,
colocados, estes, na mesma situação. A partir dessa comparação, podem-se
classificar, ou ordenar, os indivíduos (ou mesmo uma escola, uma universidade,
um centro de pesquisa ou uma unidade de ensino) quantitativa e qualitativamente
em função do constructo sendo mensurado. O teste desempenha um tipo de
mensuração, mas, diferentemente do que ocorre com as medidas físicas, tais como,
comprimento e peso, há, em relação ao mesmo, uma confusão considerável sobre “o
quê”, de fato, o teste mede e “quão bem” ele faz isso. Um problema particular
reside no fato de que, aquilo que está sendo mensurado não é um objeto físico,
e, sim, uma variável/constructo interveniente, ou uma entidade hipotética. Por
exemplo, ao aferirmos um teste, para avaliação da qualidade e eficiência do
ensino, nós não podemos comparar diretamente o escore de um indivíduo, como o
professor avaliado pelo aluno, por exemplo, no teste, com o seu desempenho real
ou verdadeiro. Estamos restritos em verificar como os escores dos testes
diferenciam professores eficientes dos não-eficientes, em alguma dimensão
subjacente ao processo de ensino-aprendizagem. Em outras palavras, de acordo
com algumas dimensões, sejam estas, componentes ou fatores que compõem o
instrumento de avaliação, sobre como os professores eficientes se comportariam.
A avaliação de constructos iguais à qualidade do ensino, eficiência do
professor, desempenho acadêmico, inteligência, ou mesmo, da liderança, é
certamente limitada pela clareza com que somos hábeis em definir o significado
particular desses constructos, e isso tem se tornado um problema particular
para os instrumentos que visam avaliar as dimensões ou fatores que os compõem.
Assim, a rigor, devemos, primeiramente, estabelecer, conhecer e definir com
clareza as dimensões subjacentes ao constructo que pretendemos mensurar, ou
avaliar. Sem essa condição fundamental, qualquer instrumento se torna inócuo e
não deve ser levado a sério.
Todos os instrumentos de medida devem
possuir certas propriedades metrológicas. Estas, em essência, são similares
àquelas requeridas em outros, utilizados para fazer mensurações em diferentes domínios
do saber. Entretanto, tais instrumentos são iguais a outros de qualquer outra
ciência, no sentido de que, em ambos se fazem observações baseadas numa amostra
pequena, mas, cuidadosamente, escolhida, do comportamento do indivíduo. Sob este
aspecto, o avaliador procede como um químico que testa o teor carbônico de um
composto, a partir de uma pequena amostra, com a diferença de que, a amostra do
avaliador consiste numa série de comportamentos que se manifestam nas respostas
dos indivíduos. O valor prognóstico, ou diagnóstico, de um instrumento depende
do grau com que ele serve como indicador a respeito do comportamento futuro do
indivíduo. Trata-se, portanto, de fazer generalizações sobre o comportamento
futuro, a partir de resultados empíricos, obtidos numa pequena amostra, tal
como se faz em outras ciências. Deve-se notar, entretanto, que os itens de um
instrumento não precisam assemelhar-se, estritamente, ao comportamento real,
mas, que haja, apenas, uma correspondência empírica entre ambos.
Finalmente, é importante ficar claro
que este processo de avaliação tem três elementos essenciais. Primeiro, as
medições nunca são dos objetos ou pessoas, mas, sim, das propriedades,
atributos e características dos objetos, como, por exemplo, altura, largura ou
espessura de uma mesa, entre outros, ou das pessoas, como, por exemplo,
inteligência, liderança, desempenho acadêmico, dor e auto-estima, entre outros.
Segundo, as mensurações carregam informações sobre a quantidade das
características ou dos atributos possuídos por um objeto ou pessoa. Terceiro,
essencialmente, a medida pode ser definida como um processo de codificação, destas
características ou atributos de objetos ou pessoas, tais como, traços, estados,
atitudes, interesses, valores, habilidades, etc, que estão sendo mensurados, ou
avaliados, naquele momento.