Elementi di Bioinformatica (2019-20)

Elenco delle lezioni

# Docente Data Argomento Materiale Esercizi Soluzioni
A1 GDV 2/10 Pattern Matching. Algoritmo Bit-parallel per pattern matching esatto. Gusfield 1.1, 4.1, 4.2.[1-2]    
A2 GDV 3/10 Richiamo linguaggio C. Karp-Rabin: algoritmo e implementazione. Cenni di Python.   parole  
P1 RR 7/10 Introduzione a Python. Stringhe, liste e tuple Introduzione a Python, Stringhe, liste e tuple Esercizio 1, File di input Soluzione
A3 GDV 9/10 Richiami shell Linux. Make Gusfield 4.4    
A4 GDV 10/10 Suffix array e Suffix tree: definizioni. Suffix array e Suffix tree: relazioni. LCP. Calcolo della sottostringa comune più lunga di 2 stringhe. Gusfield 5, 5.1, 5.2, 5.3, 5.4, 7.4. dispensa slides    
A5 GDV 17/10 Suffix array: pattern matching. Implementazione di pattern matching su suffix array. Gusfield 7.14    
P2 RR 21/10 Dizionari e insiemi Dizionari e insiemi Esercizio 2 Soluzione
A6 GDV 23/10 Ricerca della sottostringa comune più lunga di k stringhe: algoritmo e implementazione Gusfield 7.4    
P3 RR 28/10 Espressioni regolari. Introduzione alla Bioinformatica. Esercizio di parsing del formato EMBL Espressioni regolari Esercizio 3, File di input Soluzione
A7 GDV 30/10 Range minimum query      
A8 GDV 31/10 Allineamento globale di 2 sequenze. Needleman-Wunsch. Allineamento locale di 2 sequenze. Smith-Waterman Gusfield 11.2, 11.3, 11.4, 11.6, 11.7    
P4 RR 4/11 Espressioni regolari. Espressione genica. Esercizio di parsing del formato EMBL   Esercizio 4, File di input, File del codice genetico Soluzione
A9 GDV 6/11 Allineamento globale come caso generale di distanza di edit e LCS Gusfield 11.6, 11.6.[1-2], 1.1, 4.1, 4.2.[1-2]    
A10 GDV 7/11 Allineamento con banda. Allineamento con gap Gusfield 12.2.3, 12.2.4, 11.8    
P5 RR 18/11 Esercizi di parsing del formato standard GTF (annotazione di un gene)   Esercizio 5, File GTF di input, File FASTA della genomica di riferimento Soluzione
A11 GDV 20/11 Implementare algoritmi di programmazione dinamica.      
A12 GDV 21/11 Allineamento multiplo. Controllo di versione (git). Python, FFI, Cython. Gusfield 14.1, 14.[5-6]    
A13 GDV 27/11 Sequenziamento: grafi di de Brujin Gusfield 16.18    
A14 GDV 28/11 Sequenziamento: string graphs Gusfield 16.14, 16.15, 16.16, 16.17.1, 16.17.2    
P6 RR 2/12 Esercizi di parsing del formato standard GTF (annotazione di un gene)   Esercizio 6, File GTF di input, File FASTA della genomica di riferimento Soluzione
A15 GDV 4/12 Filogenesi basata su caratteri Gusfield 17.3, 17.6.1. Jones&Pevzner Capitolo 10    
A16 GDV 5/12 Filogenesi basata su distanze. Neighbor-joining. Gusfield 17.1 17.2 17.4    
P7 RR 9/12 Esercizi di parsing del formato standard FASTQ (qualità dei dati di sequenziamento)   Esercizio 7, File FASTQ di input Soluzione
A17 GDV 11/12 Modelli di evoluzione. Max likelihood. Felsenstein X.2, X.8    
A18 GDV 12/12 Genotipi e Aplotipi: singolo individuo.      
P8 RR 16/12 Esercizi con Biopython   Esercizi Biopython, File FASTQ di NGS reads, File FASTA con sequenza genomica, File FASTA di ESTs, File EMBL di mRNA  
A19 GDV 18/12 Genotipi e Aplotipi: pedigree.      

Le lezioni su argomenti algoritmici si tengono il Mercoledì dalle 9.10 alle 10.30 e il Giovedì dalle 9.30 alle 12.00. Inizio lezioni: 2/10.

Le lezioni su Python si tengono nel LAB718 (edificio U7) a partire da Lunedì 7 ottobre.

Risorse online

Viene usato Github per gestire i programmi che vengono sviluppati o analizzati. Tutto il materiale (sia slide che i programmi) si troveranno nel repo lezioni.

Le note scritte del docente a lezione sono qui.

Azure Notebooks

Azure notebooks of the course

Linux shell

Elenco comandi della shell

Materiale C

Materiale Python

  1. Installare conda, scegliendo la versione per Python 3

License

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.