Giorgio
Pedrazzi


Pedrazzi
Data Scientist CINECA Adjunct
Contatto Email

BIO

Giorgio Pedrazzi ha ottenuto un Dottorato in Metodologia Statistica per la Ricerca Scientifica presso l’Università di Bologna. Attualmente lavora come Data Scientist presso la HPC Business Unit del CINECA ed è coinvolto nello sviluppo di applicazioni di Machine Learning per la clientela di CINECA, micro benchmark e mini-app per il progetto europeo “Oprecomp” e un nuovi modelli di framework ed architettura per il progetto europeo “Icarus”. Ha collaborato nello sviluppo di progetti Cineca di Data Mining per l’Autorità di Regolazione per Energia Reti e Ambiente e l’Agenzia delle Entrate. Ha sviluppato applicazioni di Text Mining per il Portale della Ricerca Italiana e, all’interno del progetto nazionale di ricerca ASTREA, ha contribuito allo sviluppo di tecniche di Information Extraction per il monitoraggio del sistema giuridico italiano attraverso l’analisi delle decisioni prese dalle Corti. È stato coinvolto nel progetto europeo “Papyrus: Cultural and historical digital libraries dynamically mined from news archives”.

CORSI

Le attività del laboratorio prevedono di affrontare il processo completo di Data Analytics partendo dalla fase di lettura  dei dati mediante diversi approcci, l’elaborazione dei modelli di analisi e la visualizzazione dei risultati. In particolare saranno approfonditi linguaggi di programmazione come R, Python e TensorFlow con particolare riferimento alla loro esecuzione in ambiente  di  Calcolo ad Alte Prestazioni (HPC). In questo contesto saranno utilizzate librerie per il calcolo parallelo (H2O) e il Deep Learning (Keras).

Verrano trattati anche programmi per la creazione di Workflow grafici per il Data Analytics come Knime ed Orange. Al termine verrà realizzato un progetto pratico partecipando ad una Kaggle competition.

 

___________________________________________________________________________________________________________________________________________________________________________________________

Corso tenuto dallo staff CINECA (Dipartimento Super Calcolo, Applicazioni e Innovazione
e Laboratorio Big Data e Analytics), coordinamento di Giorgio Pedrazzi.



Data Science