Data di Pubblicazione:
2014
Abstract:
Il lavoro che intendiamo presentare si iscrive all'interno di un Progetto di Ricerca Nazionale finanziato dal governo italiano, intitolato "Per una edizione digitale dei manoscritti di Ferdinand de Saussure", e volto a creare un prototipo di edizione digitale degli scritti autografi del grande linguista ginevrino. A tal fine, ogni manoscritto è stato digitalizzato, classificato e dotato di un link ipertestuale che rimanda alla sua trascrizione. Un sistema di gestione dei testi permette di consultare e annotare il singolo manoscritto e di effettuare studi filologici e critici sul corpus digitalizzato. Le concordanze per forma e per lemma prodotte per l'insieme dei testi forniscono un insieme di termini caratteristici dei quali viene descritta la semantica.
Accanto alla realizzazione di tale piattaforma filologica digitale, uno degli aspetti innovativi del progetto consiste nella creazione del primo thesaurus-lessico elettronico della terminologia linguistica saussuriana. Quest'ultima riceve per la prima volta una rappresentazione strutturata, con una definizione del contenuto semantico di ciascuno dei termini chiave del pensiero del maestro ginevrino ed un quadro esplicito della natura e dell'importanza dei legami che li uniscono. Tale fascio di informazioni dovrebbe contribuire in modo significativo a meglio conoscere ed interpretare il pensiero del padre della linguistica moderna.
L'architettura del lessico è ispirata al modello lessicale SIMPLE. Tra i modelli lessicali di maggior rilievo (WordNet, EuroWordNet, ItalWordNet, FrameNet, Pattern Dictionary, SIMPLE e Brandeis Semantic Ontology) esso è apparso essere il più adeguato, in quanto si distingue per alcuni importanti ed innovati aspetti. Il modello SIMPLE, infatti, ha permesso la realizzazione di lessici elettronici multilivello armonizzati per dodici lingue europee, imponendosi così come standard de facto nell'ambito della Lessicografia Computazionale. Successivamente ha fortemente ispirato lo standard ISO per i lessici del TAL Lexical Markup Framework.
La strutturazione del lessico ha necessitato anzitutto della creazione di una ontologia lessicale di dominio. A tal fine è stato adottato un approccio centrifugo: in un primo momento sono stati identificati i concetti centrali del dominio di interesse, i quali sono stati poi generalizzati o specificati. L'ontologia così modellizzata è attualmente costituita da 43 tipi semantici ed ha una profondità di 4 livelli.
Alcune classi semantiche sono state poi ulteriormente "specificate" in termini di tratti e/o relazioni semantiche obbligatorie (definitorie). Un insieme di cinquantotto relazioni semantiche permette di collegare le istanze delle differenti classi ontologiche, mentre trentadue tratti semantici codificano informazioni tipiche di una classe semantica nella sua interezza o di una specifica istanza.
La semantica lessicale di ciascuna delle istanze di una classe ontologica è rappresentata in una entrata lessicale, nella quale una ed una sola accezione di un termine, semplice o complesso, viene riccamente definita attraverso un vasto insieme di informazioni formalizzate ed altamente strutturate, che coprono un ampio ventaglio di aspetti semantici.
Il senso analizzato è anzitutto associato alla definizione data da Saussure stesso, e laddove non disponibile, a quelle di R. Godel e R. Engler. Per ogni lemma vengono specificati anche il periodo di attestazione, le fonti nelle quali occorre, la sua frequenza di occorrenza e le collocazioni nelle quali appare. La classificazione ontologica del termine rappresenta un dato essenziale al quale si aggiungono l'informazione concernente il dominio d'uso, il tipo di evento denotato (qualora si tratti di un evento), dei tratti semantici distintivi e una vasta rete di relazion
Tipologia CRIS:
04.01 Contributo in Atti di convegno
Keywords:
Saussure; SIMPLE; lessici computazionali
Elenco autori:
Giovannetti, Emiliano; Piccini, Silvia; Ruimy, Nilda
Link alla scheda completa: