sexta-feira, 6 de julho de 2012

Exames nacionais - apontamentos (9)

Algumas notas ainda sobre a parte relativa à falta de fiabilidade/fidelidade das classificações dos exames nacionais.

1. No decurso dos 30 anos que levo de docência redigi algumas dezenas de recursos de classificações atribuídas a exames nacionais realizados por alunos meus (e outros, que não eram meus), da disciplina de Filosofia, dos 11.º e 12.º anos. Como qualquer professor, sempre estive/estou à disposição dos alunos para, em caso de incompreensão da classificação obtida num exame, proceder à análise e à avaliação desse exame e, nas situações em que visse/veja motivos para apresentação de recurso, proceder à sua redacção. De todos os recursos apresentados resultaram subidas das classificações. Em alguns casos, as classificações subiram duas vezes — como resultado do 1.º recurso e depois como resultado do 2.º recurso. 
Algumas observações sobre estes factos:
i) Estes alunos tiveram a sorte de ver as classificações dos seus exames corrigidas, porque circunstancialmente o professor deles (neste caso, eu) ainda não tinha entrado de férias, aquando da saída dos resultados. Caso contrário, teriam ficado com as classificações que os penalizavam;
ii) Todavia, e inversamente, nenhum dos alunos que fez exames na 2.ª fase (antiga 2.ª chamada) usufruiu dessa possibilidade, porque circunstancialmente o professor deles (neste caso, eu), no momento da saída dos resultados, já estava de férias. E obter a ajuda de outro professor é muito difícil, pois nesse período quase todos os docentes estão a gozar o tempo de descanso a que têm direito;
iii) Os alunos que, mesmo na 1.ª fase, por um qualquer motivo circunstancial, não puderam solicitar o meu apoio ficaram, na prática, sem a possibilidade de recurso;
iv) O facto de todos os recursos apresentados terem sido atendidos levanta duas possibilidades, e nenhuma delas é boa:
  a) existia uma orientação superior no sentido de considerar positivamente qualquer recurso, e daí todos terem sido despachados favoravelmente — o que é uma possibilidade assustadora;
  b) houve um erro de todos os professores correctores (ao longo dos diversos anos) nas classificações atribuídas, e daí todas as classificações terem sido alteradas— o que  é uma possibilidade igualmente assustadora.
E não parece haver terceira hipótese, o que não deixa de ser igualmente assustador...
Houve também um caso em que redigi um recurso de uma classificação atribuída a um exame de 12.º ano de uma disciplina que nunca leccionei: Português. Do 1.º recurso, resultou uma subida da classificação, que considerei insuficiente. Redigi novo recurso, do qual resultou nova subida da classificação. 
Ora, algo deve estar profundamente errado para que esta situação tivesse ocorrido: alguém que não é professor da disciplina detecta erros na classificação de uma prova que dois professores da disciplina não detectam; ou, então, o primeiro professor classificador é que estava certo e o que prevaleceu foi a classificação incorrecta dos últimos classificadores; ou, ainda, não foi uma coisa nem outra que aconteceu, porque a classificação de um exame não é um exercício de preto ou branco. Mas se for esta última hipótese a verdadeira, é necessário tirar ilações disso, e não querer fazer dos exames uma coisa que eles não são: a derradeira e superlativa avaliação.


2. Para além do conhecimento que temos das múltiplas experiências realizadas em dezenas de países  sobre o modo como os professores classificam provas de exame, tive a oportunidade de participar em duas experiências dessa natureza. A primeira há cerca de dezasseis anos, a segunda recentemente.
Em ambas as situações, foi entregue a vinte professores o enunciado de uma prova, os respectivos critérios de classificação e a prova respondida pelo aluno. No primero caso, as classificações atribuídas oscilaram entre 7,6 e 14 valores e, no segundo caso, entre 7,2 e 15,6 valores. Desta última vez, nenhum professor envolvido era inexperiente e, contudo, 30% dos classificadores reprovaria o aluno e 21% atribuir-lhe-ia uma classificação superior a 15 valores.
Da reflexão e do debate ocorridos após o conhecimento dos resultados, saliento algumas conclusões:
a) divergente entendimento sobre a função dos critérios de classificação: função simplesmente reguladora vs função objectivamente normativa;
b) divergente grau de vinculação aos critérios definidos;
c) divergente modo de aplicação dos critérios, mesmo entre quem tem um entendimento idêntico da função dos mesmos.
Não tenho nenhuma dúvida sobre a seriedade com que todos os professores envolvidos classificaram a mesma prova, mas também não há nenhuma dúvida de que, em situação real, a possibilidade dos dois alunos, que viram as suas provas avaliadas, serem ou muito prejudicados ou muito beneficiados era elevadíssima. 
Ora esta é a realidade que não constitui novidade para ninguém, mas que é sistematicamente omitida, por alguns. Como também não é novidade para ninguém dizer que, num processo de avaliação contínua, os lapsos (termo agora em moda) ocorridos na classificação de um teste são estatisticamente pouco significativos, porque se diluem no conjunto dos diversos instrumentos de avaliação utilizados durante um ano lectivo. Já o mesmo não se pode dizer de um exame nacional com peso determinante na aprovação de um aluno. 
Conclusão: com uma fiabilidade/fidelidade classificativa baixa e com o instrumento «recurso» fragilizado, pelos circunstancialismos acima referidos, deveríamos falar de exames com muita parcimónia e humildade. E, sobretudo, não deveríamos transmitir para o público uma imagem dos exames que nada tem que ver com a realidade. Enganamos o público, enganamos os alunos e enganamo-nos a nós, professores.

(Continua).