> FocusUnimore > numero 52 – novembre 2024

The READ-ME project: optimisation of automatic source reading processes for the history of contemporary Italy
The project ‘READ-ME Optimisation of automatic source reading processes for the economic, social and cultural history of contemporary Italy’, carried out by the Interdepartmental Research Centre on Digital Humanities of Unimore, has won a call for proposals that has enabled the project to obtain a grant of 200,000 euros, an amount entirely financed by the University. The project, co-ordinated by Prof. Matteo Al Kalak of the Department of Linguistic and Cultural Studies, aims to develop innovative algorithms to optimise and automate to the greatest extent possible the reading of a series of serial sources, useful for shedding light on the economic history of contemporary Italy in the period between the unification of the Italian state and the end of the 1950s (ca. 1860-1960).

Anche il progetto “READ-ME Ottimizzazione di processi di lettura automatica delle fonti per la storia economica, sociale e culturale dell’Italia contemporanea”, portato avanti dal Centro interdipartimentale di ricerca sulle Digital Humanities (DHMoRe) dell’Università degli studi di Modena e Reggio Emilia, è risultato vincitore di un bando a cascata che gli ha permesso di ottenere un’agevolazione di 200mila euro, importo interamente finanziato dall’Ateneo.

Il progetto, coordinato dal Prof. Matteo Al Kalak del Dipartimento di Studi Linguistici e Culturali di Unimore, si prefigge di elaborare algoritmi innovativi che consentano di ottimizzare e automatizzare nel maggior grado possibile la lettura di una serie di fonti di natura seriale, utili a gettare luce sulla storia economica dell’Italia contemporanea nel periodo compreso tra l’unificazione della penisola e la fine degli anni Cinquanta del Novecento (ca. 1860-1960).

Censimenti, estimi, registri delle imposte, rilevamenti dei redditi e altri documenti di questo genere sono in grado di fornire indicazioni preziose sulla mobilità sociale, la ricchezza e la povertà degli italiani in una prospettiva di medio-lungo periodo, che include eventi di enorme rilievo e influenza come le guerre mondiali e le crisi di fine Ottocento e del 1929; tuttavia, la dispersione delle fonti negli archivi statali, comunali e aziendali di tutta la penisola ne ostacola grandemente il reperimento, lo studio e la condivisione tanto con la cittadinanza quanto con la comunità scientifica.

Per contribuire alla soluzione del problema, gli storici che collaborano al progetto hanno individuato varie fonti atte a illustrare, attraverso un’analisi di tipo quantitativo, l’evoluzione della società e dell’economia italiane dall’Unità in poi. Tra queste, spiccano i ruoli del focatico (una delle principali imposte riscosse in Italia tra la fine degli anni Sessanta dell’Ottocento e il secondo dopoguerra) relativi ai comuni di Modena e soprattutto di Roma, i cui archivi ne hanno conservata una mole imponente.

Gli informatici hanno quindi cominciato a elaborare degli algoritmi prototipali, atti a testare l’applicazione di modalità HTR e/o OCR ai documenti descritti, in modo da favorirne un trattamento rapido e automatizzato, nel rispetto di standard qualitativi rigorosi.

Il processo prevede vari passaggi:

1) acquisizione delle riproduzioni digitali in alta definizione dei registri del focatico in formato pdf;

2) annotazione dei pdf da parte dei ricercatori, che trascrivono i contenuti di alcune pagine campione di ciascun registro in un’apposita maschera digitale messa a punto dagli informatici, in modo da allenare il software alla lettura corretta delle diverse grafie presenti nelle fonti;

3) verifica del grado di allenamento del software e dell’attendibilità dei risultati attraverso la lettura automatizzata di pagine campione e la discussione dei risultati nell’ambito di riunioni periodiche tra tutti i componenti del gruppo di ricerca.

“Per il Centro DHMoRe si tratta di un risultato importante nel segno dell’interdisciplinarità. Il Centro infatti favorisce fin dalla sua istituzione l’intreccio tra conoscenza umanistica e saperi scientifici. L’obiettivo di studiare e capire i meccanismi di ascesa sociale e le cause ed evoluzioni della ricchezza degli italiani è una sfida stimolante anche nel segno dell’utilità collettiva” – commenta il Prof. Matteo Al Kalak.

Il progetto READ-ME: ottimizzazione di processi di lettura automatica delle fonti per la storia dell’Italia contemporanea