Unisteffo

Big data analytics

Fasi di elaborazione dei dati

Raccolta dati

I dati vengono massivamente raccolti da tutte le fonti disponibili.

Ad esempio, possono essere raccolti da:
  • Download diretto
  • Generazione via simulazione
  • Database pubblici
  • Richieste ad un'API
  • Scraping di pagine web dinamiche

Elaborazione dati

I dati raccolti vengono elaborati e puliti, trasformandoli in formati su cui sia possibile effettuare analisi.

Ad esempio, se i dati provengono da basi di dati diverse, vanno messi in una unica tabella con valori comparabili tra loro.

Analisi esploratoria

Vengono analizzati i dati in generale per farsi un'idea di come costruire i modelli successivamente.

Per aiutarsi nell'analisi, possono essere realizzate visualizzazioni, come grafici o mappe, che possono rappresentare alcune proprietà dei dati.

Questa è la fase in cui Matplotlib diventa utile!

Sviluppo modelli

la prof ha lasciato a metà il discorso

Verifica ipotesi

le slide non continuano oltre

Raccolta dati

Elaborazione dati

Analisi esploratoria

Sviluppo modelli

Verifica ipotesi