Data di Pubblicazione:
2006
Abstract:
RecBoost è un sistema per la segmentazione di stringhe testuali che utilizza il meccanismo della classificazione progressiva, sviluppato in seno allICAR-CNR. Lidea di base è quella di costruire incrementalmente un insieme di regole di classificazione che permettano di associare ad ogni token presente nella stringa un campo dello schema di interesse. Il sistema permette, partendo da un file di testo contenente stringhe, di segmentare ogni stringa in accordo ad uno schema tabellare fornito anchesso in input. Il sistema è implementato in Java e si interfaccia a Database MS SQL.
Tipologia CRIS:
05.12 Altro
Keywords:
Text segmentation; classification; rule learning
Elenco autori:
Ortale, Riccardo; Folino, FRANCESCO PAOLO; Locane, Antonio; Manco, Giuseppe
Link alla scheda completa: