Modelli, metodi e strumenti per il trattamento automatico della lingua araba e per l'editing in ambienti collaborativi
Abstract
Data di Pubblicazione:
2014
Abstract:
La linguistica computazionale ha portato negli ultimi vent'anni a un profondo mutamento nello studio delle lingue e delle loro testimonianze scritte, spostando l'accento della ricerca da aspetti linguistico-formali all'uso linguistico in contesti comunicativi reali. Il presente contributo illustra l'impatto di questo cambio di prospettiva sullo studio della lingua araba, attraverso una rassegna di alcune attività di ricerca in corso presso l'Istituto di Linguistica Computazionale del CNR di Pisa:
I. acquisizione dei testi arabi tramite Optical Character Recognition (OCR) e sviluppo di strumenti per la correzione manuale del testo in ambienti collaborativi;
II. sviluppo di algoritmi e strumenti per l'analisi morfologica della lingua araba;
III. analisi delle dinamiche di acquisizione del lessico arabo mediante architetture bio-computazionali;
IV. sviluppo della WordNet dell'Arabo collegata a Princeton WordNet, ItalWordNet, LatinWordNet e alla nascente AncientGreek WordNet.
Queste attivit{ sono rivolte sia all'analisi delle caratteristiche linguistiche dell'arabo che allo studio della produzione letteraria araba e dei suoi rapporti storico-culturali con altre lingue. In particolare, il contributo intende illustrare la fertilità di un approccio metodologico che metta in relazione le dinamiche di acquisizione del lessico arabo, con la messa a punto di procedure di analisi ed edizione critica del testo e con i principi di organizzazione ontologica di una lingua ad alta produttività derivazionale.
Tipologia CRIS:
04.02 Abstract in Atti di convegno
Elenco autori:
Nahli, Ouafae; Pirrelli, Vito; Marzi, Claudia; DEL GRATTA, Riccardo; Boschetti, Federico
Link alla scheda completa:
Titolo del libro:
La metodologia della ricerca umanistica nell'ecosistema digitale - AIUCD 2014 Terzo convegno annuale