Skip to Main Content (Press Enter)

Logo CNR
  • ×
  • Home
  • Persone
  • Pubblicazioni
  • Strutture
  • Competenze

UNI-FIND
Logo CNR

|

UNI-FIND

cnr.it
  • ×
  • Home
  • Persone
  • Pubblicazioni
  • Strutture
  • Competenze
  1. Pubblicazioni

WebDocs: a real-life huge transactional dataset

Contributo in Atti di convegno
Data di Pubblicazione:
2004
Abstract:
This short note describes the main characteristics of WebDocs, a huge real-life transactional dataset we made publicly available to the Data Mining community through the FIMI repository. We built WebDocs from a spidered collection of web html documents. The whole collection contains about 1.7 millions documents, mainly written in English, and its size is about 5GB.
Tipologia CRIS:
04.01 Contributo in Atti di convegno
Keywords:
Frequent itemsets mining datasets
Elenco autori:
Orlando, Salvatore; Silvestri, Fabrizio; Lucchese, Claudio; Perego, Raffaele
Autori di Ateneo:
PEREGO RAFFAELE
Link alla scheda completa:
https://iris.cnr.it/handle/20.500.14243/58442
  • Dati Generali

Dati Generali

URL

http://ftp.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-126/
  • Utilizzo dei cookie

Realizzato con VIVO | Designed by Cineca | 26.5.0.0 | Sorgente dati: PREPROD (Ribaltamento disabilitato)