Salta al contenuto principale
Passa alla visualizzazione normale.

ALBERTO TROBIA

Gli algoritmi di classificazione per i Big Data e la loro valutazione

Abstract

La classificazione è uno degli obiettivi principali dell’analisi dei Big Data. In questo capitolo, presento la tecnica degli alberi decisionali. Ne riassumo, anzitutto, la logica di base e ne illustro, a partire da un semplice esempio, alcuni dettagli computazionali. Successivamente, utilizzando KNIME, una potente piattaforma user friendly per l’analisi dei Big Data, analizzo un dataset remoto su Amazon S3, mostro i principali risultati ottenuti e accenno ad alcune strategie più complesse d’analisi. Concludo il contributo con una panoramica sulle metriche e le tecniche più diffuse per valutare la bontà di un modello di classificazione e con un bilancio metodologico sulle applicazioni degli alberi decisionali nelle scienze sociali.