Info
Abbracciando i principi FAIR dell’Open Science, la HumanitiesConnect Digital Library, avviata nel 2020, è un progetto collaborativo volto a creare un repertorio digitale che faciliti l’accesso e la citazione diretta di fonti rare a stampa custodite in tre biblioteche Max Planck. La piattaforma combina le scansioni ad alta risoluzione di 4.800 volumi con le loro trascrizioni eseguite con l'ausilio dell'intelligenza artificiale, consentendo una ricerca testuale completa su collezioni in continua crescita. Le trascrizioni sono generate e gestite da Transkribus, una soluzione software sviluppata dalla cooperativa europea READ-COOP che utilizza tecnologie neurali per il riconoscimento del testo e del layout. Ciò consente un continuo perfezionamento della trascrizione e l'annotazione dei contenuti direttamente dall'applicazione, nonché l'accesso al data mining tramite un'interfaccia di programmazione delle applicazioni (API), facilitando la ricerca nel campo delle Digital Humanities.
La collezione digitale comprende libri rari provenienti dalle biblioteche della Bibliotheca Hertziana – Istituto Max Planck per la Storia dell'Arte (Roma), del Kunsthistorisches Institut in Florenz – Max-Planck-Institut (Firenze) e del Max Planck Institute for the History of Science (Berlino). Inoltre, incorpora testi di pubblico dominio legati a progetti di ricerca. Inoltre, circa 900 volumi di letteratura di viaggio provenienti dal patrimonio della Bibliotheca Hertziana sono stati digitalizzati e aggiunti nel 2023. A breve seguiranno diverse centinaia di volumi digitalizzati su Roma e Napoli.
Partendo dalle caratteristiche standard di Transkribus, la Bibliotheca Hertziana ha collaborato con READ-COOP per sviluppare nuove importanti funzionalità. Per la trascrizione sono stati utilizzati i modelli neurali pubblici per i testi a stampa, ottimizzati per le specificità del linguaggio storico e degli stili tipografici. Le abbreviazioni nei testi posteriori al 1520 vengono espanse direttamente, mentre per i testi anteriori è stato applicato un nuovo modello basato su una tecnologia AI appositamente sviluppata che, pur mantenendo le abbreviazioni, annota contestualmente le espansioni. L'interfaccia online Read&Search di Transkribus è stata ottimizzata per la visualizzazione di libri antichi, con l'aggiunta di filtri basati su metadati quali autore, titolo e data di pubblicazione. Il livello di tolleranza della ricerca fuzzy può ora essere regolato per includere forme ortografiche o tipografiche alternative o declinazioni comuni nei testi antichi. Per la collezione di letteratura di viaggio è stato sviluppato un nuovo modello neurale per il riconoscimento del layout dei paragrafi. La HumanitiesConnect Digital Library invita gli studiosi a curare i volumi ripulendo il riconoscimento, annotando il testo e arricchendolo con il riconoscimento e il collegamento di entità denominate.
La HumanitiesConnect Digital Library, avviata e finanziata dal Dipartimento di Tristan Weddigen e diretta da Elisa Bastianello dell'unità Pubblicazioni digitali della Bibliotheca Hertziana, si è avvalsa del generoso sostegno dei responsabili e del personale delle biblioteche dei tre Istituti Max Planck citati e di READ-COOP.
Contatti: Elisa Bastianello (elisa.bastianello@biblhertz.it).