Pionieri della valutazione
In Italia, il tema della valutazione scolastica entra nel dibattito pedagogico nel corso degli anni ’50 grazie agli studi pioneristici (almeno per il nostro Paese) di Luigi Calonghi e Aldo Visalberghi. A partire dagli anni ’60 e ’70 le indagini e gli studi si moltiplicano fino a consolidare un nuovo filone di ricerca, la docimologia.
Ma per comprendere meglio di cosa si parla dobbiamo fare qualche passo indietro e spostarci agli anni ’20 del secolo scorso, quando lo psicologo e pedagogista svizzero Edouard Claparède presentò a Parigi le 15 tesi della scuola attiva nell’ambito del Congresso di igiene mentale (giugno 1922).
Nella sua relazione scriveva:
“13) Le riforme qui preconizzate saranno possibili solo se il sistema degli esami verrà profondamente trasformato. La necessità dell’esame spinge molti insegnanti, loro malgrado, a sovraccaricare la memoria più che a sviluppare l’intelligenza. Salvo, forse, per un minimo di cognizioni indispensabili, gli esami dovrebbero essere soppressi, e sostituiti da una valutazione data in base ai lavori individuali fatti durante l’anno, oppure per mezzo di studi adeguati.
14) La psicologia sperimentale è in grado di fornire alla pedagogia pratica dei metodi adatti al controllo del valore dei metodi didattici e del rendimento scolastico. Essa ci fornisce anche dei metodi per la valutazione mentale (test mentali)”.
Il punto è che già allora molti pedagogisti e molti psicologi incominciarono a porsi due questioni fondamentali relative al problema della valutazione: come possiamo essere sicuri che le prove che usiamo in sede di esame siano valide e affidabili? La validità ha a che fare con l’esigenza che la prova “misuri” esattamente ciò che noi vogliamo misurare. Un esempio semplice per capire cosa intendiamo: uno studente potrebbe avere risultati scarsi in matematica se la prova è fatta solo di problemi e se le sue competenze linguistiche sono scarse. Cioè lo studente “va male” non perché non sa la matematica, ma perché ha difficoltà a capire il testo del problema.
Poi c’è un problema di affidabilità della prova. Anche qui facciamo un esempio: un righello rigido “millimetrato” è in genere uno strumento affidabile per misurare le lunghezze perché, entro certi limiti, il valore che fornisce (10,5 centimetri o 22,7) è indipendente dal soggetto che lo usa (misurare le lunghezze a spanne non è invece una operazione altrettanto affidabile). Le prime indagini scientifiche sulla valutazione scolastica si fanno risalire ad Henri Piéron ed Henri Laugier, che nel 1922, insieme con altri studiosi, condussero una ricerca sulla valutazione degli esami di licenza elementare.
Lo studio aveva ha coinvolto 117 alunni, era stata utilizzata una batteria di 6 prove diverse per valutare diverse capacità. I voti degli esami erano stati suddivisi in tre gruppi (A, B, C) che rappresentavano rispettivamente acquisizioni mnemoniche, capacità intellettuali e qualità extra-intellettuali.
Mettendo in relazione i risultati ottenuti da ciascun alunno nelle diverse capacità emergeva una correlazione molto significativa, come se esistesse un fattore generale che evidenzia i “bravi alunni”. A questo punto a Piéron sorse il sospetto che gli esiti dell’esame di licenza elementare potessero essere influenzati da una sorta di “effetto alone”: cioè gli esaminatori tendevano a valutare positivamente in una particolare prova gli alunni che ottenevano buoni risultati in altre prove.
Un altro celebre studio di Piéron risale alla metà degli anni Trenta: in quella occasione egli si occupò delle modalità di correzione da parte di insegnanti francesi degli esami finali della scuola secondaria (il baccalauréat). Lo studio esaminava le discrepanze nelle valutazioni assegnate dai correttori agli stessi elaborati; 30 insegnanti, divisi in 6 gruppi, correggevano 100 elaborati su diverse materie (francese, latino, inglese, matematica, filosofia, fisica) dando voti su una scala di 20 punti. Si scoprì che le differenze medie tra i voti assegnati dai vari correttori erano elevate (4 punti per inglese, matematica e fisica; 7 punti per francese e filosofia) e che gli scarti massimi arrivavano a 12-13 punti, indicando l'assenza di criteri di valutazione uniformi. In conclusione, la correzione degli elaborati risultava distorta da vari fattori soggettivi dei correttori; per ottenere un voto realmente rappresentativo sarebbe stato necessario un numero molto elevato di correttori (fino a 127 per la dissertazione filosofica).
Il dato interessante è che le distorsioni riguardavano persino le prove di matematica e di fisica, perché le valutazioni risultavano in qualche modo influenzate dalla attenzione che ciascun valutatore attribuiva alle caratteristiche delle prove. Non solo, ma emerse anche che ciascun valutatore tendeva ad usare a suo modo la scala di voti (per esempio alcuni apparivano “restii” ad usare i voti più alti, mentre altri usavano prevalentemente le votazioni “intermedie”). Fra i diversi correttori, insomma, c’era poca concordanza.
Indagini successive confermarono questa e altre distorsioni nelle procedure di valutazione degli alunni, tanto che ad un certo momento Piéron e i suoi collaboratori incominciarono a sostenere che i docenti destinati a far parte di commissioni d’esame o di concorso dovevano essere sottoposti a un adeguato programma di formazione specifica che comprendesse anche elementi di statistica.
Nel 1934 Piéron introduce ufficialmente il termine docimologia nel dibattito sulla valutazione, pubblicando insieme a Laugier ed altri il libro Études docimologiques sur le perfectionnement des examens et concours, in cui raccoglie gli esiti della ricerca alla quale abbiamo accennato ed altri studi sullo stesso argomento.
Siamo alla prima definizione della parola, come ricorda anche il dizionario Treccani.it: “Muovendo dalla preoccupazione di eliminare per quanto possibile l’elemento soggettivo del giudizio nelle prove di esame, la docimologia si occupa della rilevazione degli elementi da valutare, dell’allestimento delle tecniche più idonee per accertarli, dei metodi di misurazione, tabulazione e comparazione dei risultati”.
Per la verità questa nuova scienza veniva intesa da Piéron e dai suoi collaboratori più come un ramo della psicotecnica che si occupa dei test di intelligenza che come una pratica didattica finalizzata a migliorare l’apprendimento degli studenti e i “modi dell’insegnare”. Ma a Piéron va riconosciuto l’indubbio merito di aver iniziato ad affrontare il problema della valutazione scolastica in modo scientifico e sperimentale.