Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Scienze
PHYSICS OF DATA
Insegnamento
MANAGEMENT AND ANALYSIS OF PHYSICS DATASET (MOD. B)
SCP8082535, A.A. 2019/20

Informazioni valide per gli studenti immatricolati nell'A.A. 2019/20

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
PHYSICS OF DATA
SC2443, ordinamento 2018/19, A.A. 2019/20
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese MANAGEMENT AND ANALYSIS OF PHYSICS DATASET (MOD. B)
Sito della struttura didattica http://physicsofdata.scienze.unipd.it/2019/laurea_magistrale
Dipartimento di riferimento Dipartimento di Fisica e Astronomia "Galileo Galilei"
Obbligo di frequenza No
Lingua di erogazione INGLESE
Sede PADOVA

Docenti
Responsabile DONATELLA LUCCHESI FIS/01

Corso integrato di appartenenza
Codice Insegnamento Responsabile
SCP8082533 MANAGEMENT AND ANALYSIS OF PHYSICS DATASET (C.I.) DONATELLA LUCCHESI

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Sperimentale applicativo FIS/01 6.0

Organizzazione dell'insegnamento
Periodo di erogazione Annuale
Anno di corso I Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LEZIONE 6.0 48 102.0

Calendario
Inizio attività didattiche 30/09/2019
Fine attività didattiche 20/06/2020
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2018

Syllabus

Caratteristiche comuni al Corso Integrato

Prerequisiti: Elementi di analisi e algebra.
Fisica generale.
Statistica.
Elementi di base di programmazione.
Conoscenze e abilita' da acquisire: Conoscenze di base su sistemi operativi Unix
Conoscenza del calcolo distribuito.
Conoscenza del management di grandi moli di dati su architetture distribuite.
Capacita' di costruire un cluster con hardware a disposizione.
Management di dati sul cluster distribuito.
Analisi dei dati su cluster distribuito.
Modalita' di esame: Sviluppo di un progetto asseganto a fine corso. Presentzione e discussione del progetto, domande sul materiale presentato a lezione.
Criteri di valutazione: Valutazione del progetto consegnato: accuratezza dello svolgimento,completezza e correttezza dell'eleborato, sintesi.
Valutazione dell'esposizione: sintesi, completezza, correttezza e accuratezza nella presentazione.
Valutazione delle risposte: correttezza, completezza e accuratezza.

Caratteristiche proprie del modulo

Contenuti: Part 1) Distributed computing
Distributed Computing systems and the Grid paradigm
Computing Models
Dask principles
Setup of a cluster with Dask
Data movement and analysis on dask cluster
Machine learning on a dask cluster
Part 2) Data Management
Data Workflows in scientific computing
Storage Models
Data management components:
-Name Servers and databases
-Data Access protocols
-Reliability
-Availability
-Access Control and Security
-Cryptography
Authentication, Authorization, Accounting
Scalability
-Cloud storage
-Block storage
Analytics
Data Replication
Data Caching
Monitoring, Alarms
Quota
Attivita' di apprendimento previste e metodologie di insegnamento: Lezioni frontali e sopratutto esercizi ed esempi in laboratorio di informatica
Eventuali indicazioni sui materiali di studio: Saranno rese disponibili le slides usate durante le lezioni con referenze a testi e articoli open access
Testi di riferimento: