Corsi di Laurea Corsi di Laurea Magistrale Corsi di Laurea Magistrale
a Ciclo Unico
Scuola di Ingegneria
BIOINGEGNERIA
Insegnamento
COMPUTATIONAL GENOMICS - GENOMICA COMPUTAZIONALE
INP7080567, A.A. 2019/20

Informazioni valide per gli studenti immatricolati nell'A.A. 2018/19

Principali informazioni sull'insegnamento
Corso di studio Corso di laurea magistrale in
BIOINGEGNERIA
IN0532, ordinamento 2011/12, A.A. 2019/20
N0
porta questa
pagina con te
Crediti formativi 6.0
Tipo di valutazione Voto
Denominazione inglese COMPUTATIONAL GENOMICS
Dipartimento di riferimento Dipartimento di Ingegneria dell'Informazione (DEI)
Obbligo di frequenza No
Lingua di erogazione INGLESE
Sede PADOVA
Corso singolo È possibile iscriversi all'insegnamento come corso singolo
Corso a libera scelta È possibile utilizzare l'insegnamento come corso a libera scelta

Docenti
Responsabile BARBARA DI CAMILLO INF/01

Mutuazioni
Codice Insegnamento Responsabile Corso di studio
INP9087773 COMPUTATIONAL GENOMICS BARBARA DI CAMILLO IN0521
INP9087773 COMPUTATIONAL GENOMICS BARBARA DI CAMILLO IN2371
INP9087773 COMPUTATIONAL GENOMICS BARBARA DI CAMILLO IN2371

Dettaglio crediti formativi
Tipologia Ambito Disciplinare Settore Scientifico-Disciplinare Crediti
CARATTERIZZANTE Ingegneria biomedica ING-INF/06 6.0

Organizzazione dell'insegnamento
Periodo di erogazione Secondo semestre
Anno di corso II Anno
Modalità di erogazione frontale

Tipo ore Crediti Ore di
didattica
assistita
Ore Studio
Individuale
LEZIONE 6.0 48 102.0

Calendario
Inizio attività didattiche 02/03/2020
Fine attività didattiche 12/06/2020
Visualizza il calendario delle lezioni Lezioni 2019/20 Ord.2011

Syllabus
Prerequisiti: Conoscenza di base di statistica e fondamenti di informatica
Conoscenze e abilita' da acquisire: L'obiettivo formativo è
1. L'acquisizione di metodologie generali per l'analisi statistica e per il data mining di dati high-throughput genomici
2. La capacità di applicare ai dati reali queste metodologie attraverso l'uso di algoritmi e software

Conoscenze da acquisire:
1. Nozioni base di biologia molecolare e tecnologie del sequenziamento
2. Preprocessing e Normalizzazione dei dati
3. Nozioni di statistica di base e test statistici
4. Metodologie di clustering e classificazione
5. Linguaggio R

Abilità da acquisire:
1. capacità di applicare le suddette metodologie all'ambito ampiamente interdisciplinare quale la genomica, in particolare ai dati di espressione (RNA-sequencing) e alle varianti genetiche.
2. Capacità di risolvere un problema complesso scomponendolo in sottoproblemi più semplici e di implementare la soluzione in linguaggio R.

Competenze: capacità di decidere in maniera autonoma quale metodologia applicare a dati diversi; di valutare in maniera critica i risultati ottenuti; di comunicare le motivazioni delle proprie scelte; di organizzare il lavoro di programmazione in maniera fruibile da altri utenti
Modalita' di esame: Scritto
Criteri di valutazione: Le conoscenze acquisite verranno valutate tramite l'esame scritto. In particolare, l'abilità di applicare le metodologie studiate, verra' valutata tramite la capacità di implementare in linguaggio R la soluzione di problemi.
Contenuti: Il corso affronta la soluzione di problemi biologici a livello molecolare con metodi matematici, ricorrendo a nozioni di statistica e intelligenza artificiale.

Contenuti del corso:

1. Studio dalle tecnologie high-throughput per l'analisi del genoma e del trascrittoma (DNA and RNA-sequencing)

2. Preprocessamento dei dati. Tecniche per la quantificazione della riproducibilità e del rumore sperimentale. Metodi di normalizzazione e riscalatura.

3. Metodi di selezione di geni differenzialmente espressi e degli SNP associati al tratto fenotipico in esame: test statistici adattati al problema dell'analisi dei dati genomich high-throughput.

4. Interpretazione funzionale dei risultati: Annotazione funzionale e test di arricchimento funzionale.

Clustering: metodi basati su distanza (Clustering Gerarchico, Metodi K-means, Self-Organizing Maps) e su modello (Clustering Maximum Likelihood e Bayesiano).

Metodi di classificazione: Support Vector Machine (e/o reti neurali). Feature Selection. Problema della stabilità dei biomarcatori.

Lezioni in laboratorio: Utilizzo di dati sperimentali e funzioni di Bioconductor (ambiente R) per l'analisi di dati di espressione genica.
Attivita' di apprendimento previste e metodologie di insegnamento: - Lezioni frontali
- Lezioni in laboratorio in cui si applica la teoria vista a lezione sui dati reali
- Implementazione in linguaggio R degli algoritmi visti a lezione e degli script utili all'analisi dei dati
- Attività di analisi dei dati in cui viene richiesto allo studente di prendere autonomamente decisioni sul tipo di analisi da eseguire e di valutare la bontà dei risultati
Eventuali indicazioni sui materiali di studio: Dispense delle lezioni e materiale (testi e articoli) disponibili su web tramite piattaforma elearning
Testi di riferimento:
  • Bishop, Pattern recognition and machine learning. --: --, 2006. Testo utile per approfondire gli argomenti relativi alla classificazione Cerca nel catalogo

Didattica innovativa: Strategie di insegnamento e apprendimento previste
  • Lecturing
  • Laboratory
  • Problem based learning
  • Case study
  • Working in group
  • Questioning
  • Problem solving
  • Quiz o test a correzione automatica per feedback periodico o per esami
  • Utilizzo di video disponibili online o realizzati
  • Learning journal

Didattica innovativa: Software o applicazioni utilizzati
  • Moodle (files, quiz, workshop, ...)
  • R

Obiettivi Agenda 2030 per lo sviluppo sostenibile
Istruzione di qualita' Lavoro dignitoso e crescita economica