Mercanti medievali in Internet: le lettere dell'archivio Datini in GattoWeb
Contributo in Atti di convegno
Data di Pubblicazione:
2008
Abstract:
L'Archivio di Stato di Prato ha affidato nel 2003 all'Opera del Vocabolario Italiano l'allestimento di un corpus informatizzato contenente le lettere e i documenti editi dell'archivio Datini, con due specifiche richieste: la segnalazione di antroponimi e toponimi e una lemmatizzazione selettiva e tematica, che offrisse più chiavi di interrogazione ad un utente interessato non tanto a fenomeni linguistici quanto piuttosto a ritrovare nomi e fatti. L'intervento illustra il prodotto finale dei due anni di lavoro dedicati a tale corpus, i criteri seguiti per la lemmatizzazione, le caratteristiche e le modalità di interrogazione del programma di gestione testi Gatto, nella sua versione per Internet (GattoWeb). In particolare, dopo una breve nota informativa sui dati statistici del corpus, vengono presentati alcuni esempi volti a chiarificare le scelte seguite in lemmatizzazione in presenza di un corpus plurilinguistico e con tipiche modalità espressive; si insiste soprattutto sulla lemmatizzazione di antroponimi e toponimi, sull'uso di uno specifico campo di lemmatizzazione e di interrogazione del programma, il DISAMBIGUATORE, in relazione alle esigenze di una lemmatizzazione referenziale, e sulla rilevanza dei lemmi di secondo livello, i cosiddetti iperlemmi, che consentono di raggruppare i lemmi su base tematica, creando delle famiglie omogenee.
Tipologia CRIS:
04.01 Contributo in Atti di convegno
Keywords:
Italiano antico; Lessicografia italiana; Informatica umanistica
Elenco autori:
Artale, Elena
Link alla scheda completa:
Titolo del libro:
Prospettive nello studio del lessico italiano. Atti del IX Congresso SILFI (Firenze, 14-17 giugno 2006)