Temario
Bloque I: 15 hrs
Introducción a la bioinformática, linux y lenguajes de programación más utilizados en bioinformática (Augusto Cesar Poot, 1era semana)
● Introducción a la bioinformática
○ Definición, objetivos y aplicaciones.
● Introducción a linux
○ regex
○ bash
○ sed
○ awk
○ grep
● Programación estructurada, introducción a los lenguajes de programación
○ R
○ Perl
○ Python
Bloque II: 15 hrs
Teoría y metodologías necesarios para el entendimiento de los programas aplicados a la bioinformática (Mirna Vazquez Rosas Landa, 2da semana)
● Bases de datos de nucleótidos y proteínas
○ NCBI
○ Herramientas de búsqueda basadas en similitud.
○ BLAST
● Alineamientos de secuencias
○ Pareados y Múltiples
● Homología y filogenia
○ Tipos de relación entre las secuencias (Homólogas, ortólogos y parálogos)
● Reconstrucciones filogenéticas
○ Nucleótidos vs aminoácidos
○ Modelos de substitución
○ Inferencia con métodos de distancia
○ Inferencia con ML
Bloque III: 30 hrs
Tecnologías de nueva generación Next Generation Sequencing (NGS) y procesamiento de datos (Valerie De Anda, Gabriel Yaxal y Mirna Vázquez)
III.A) Formatos de secuenciación, manejo y limpieza de datos
● Tecnologías de Secuenciación de DNA.
○ Primera generación (Sanger)
○ Segunda generación (454, Illumina, Ion Torrent)
○ Tercera generación (PacBio)
● Construcción y características de librerías (amplicones, genomas, metagenomas)
○ shotgun
○ pairedend
○ matepair
● Manejo de datos de NGS. Formatos de archivo, identificadores, modelos de error y calidad. Herramientas de transformación y preprocesado. Control de calidad y filtrado de lecturas.
○ Plataformas 454, Illumina, Ion Torrent y PacBio
○ Lecturas tipo pairedend y matepair
III. B) Análisis de genomas.
● Algoritmos para ensamble de genomas de novo.
○ Técnicas y algoritmos para lecturas de un solo tipo
○ Técnicas y algoritmos para ensambles híbridos
○ Ensambladores de Genomas : Velvet (Illumina) , Newbler (454), MIRA (454) SOAP de novo . Ejemplos de uso y características del output.
● Remapeo de lecturas y técnicas de validación de ensambles.
○ Comparación con genomas de referencia –MUMMER. ACT
○ Alineadores: BOWTIE, MAUVE
○ Visualización: IGV, artemis
● Anotación de Genomas. Modelos de genes en procariontes y eucariontes.
○ rRNA y tRNA (RNAmmer)
○ CDSs, intrones/exones
○ Predictores de genes genomas: AUGUSTUS, Glimmer3
○ Predictores de genes en metagenomas: Fragene Scan
○ Anotaciones automáticas y manuales: de genomas RAST, PROKKA
○ Anotaciones automaticas y manuales de metagenomas: MGRAST, METAREP
○ Bases de datos para anotación: Blast2Go
● Genómica comparada
○ Análisis de ortólogos
● DeNoGap
● Get Homologous
○ Inferencia de eventos de recombinación y pruebas de selección.
III. C) Análisis de comunidades y el manejo de datos derivado de estrategias como la metagenómica.
● Amplicones de 16s
○ Qiime
○ Uparse
○ Mothur
● Metagenomica
○ Ensambladores de Metagenomas: Metavelvet, SOAP
○ Anotación automatizada. Metarep, MgRast. Como funcionan?
○ Bases de datos para los análisis taxonómicos y funcionales :
○ Análisis taxonómicos (con o sin ensamblaje) MetaPhlan, Phylosift, LCA
○ Análisis funcional (bases de datos)
○ Metagenómica comparativa. (Caso tipo Sulfur Score)