TEMARIO

Bloque I: 15 hrs

Introducción a la bioinformática, linux y lenguajes de programación más utilizados en bioinformática (Augusto Cesar Poot, 1era semana)

● Introducción a la bioinformática

○ Definición, objetivos y aplicaciones.

● Introducción a linux

○ regex

○ bash

○ sed

○ awk

○ grep

● Programación estructurada, introducción a los lenguajes de programación

○ R

○ Perl

○ Python

Bloque II: 15 hrs

Teoría y metodologías necesarios para el entendimiento de los programas aplicados a la bioinformática (Mirna Vazquez Rosas Landa, 2da semana)

● Bases de datos de nucleótidos y proteínas

○ NCBI

○ Herramientas de búsqueda basadas en similitud.

○ BLAST

● Alineamientos de secuencias

○ Pareados y Múltiples

● Homología y filogenia

○ Tipos de relación entre las secuencias (Homólogas, ortólogos y parálogos)

● Reconstrucciones filogenéticas

○ Nucleótidos vs aminoácidos

○ Modelos de substitución

○ Inferencia con métodos de distancia

○ Inferencia con ML

Bloque III: 30 hrs

Tecnologías de nueva generación Next Generation Sequencing (NGS) y procesamiento de datos (Valerie De Anda, Gabriel Yaxal y Mirna Vázquez)

III.A) Formatos de secuenciación, manejo y limpieza de datos

● Tecnologías de Secuenciación de DNA.

○ Primera generación (Sanger)

○ Segunda generación (454, Illumina, Ion Torrent)

○ Tercera generación (PacBio)

● Construcción y características de librerías (amplicones, genomas, metagenomas)

○ shotgun

○ pairedend

○ matepair

● Manejo de datos de NGS. Formatos de archivo, identificadores, modelos de error y calidad. Herramientas de transformación y preprocesado. Control de calidad y filtrado de lecturas.

○ Plataformas 454, Illumina, Ion Torrent y PacBio

○ Lecturas tipo pairedend y matepair

III. B) Análisis de genomas.

● Algoritmos para ensamble de genomas de novo.

○ Técnicas y algoritmos para lecturas de un solo tipo

○ Técnicas y algoritmos para ensambles híbridos

○ Ensambladores de Genomas : Velvet (Illumina) , Newbler (454), MIRA (454) SOAP de novo . Ejemplos de uso y características del output.

● Remapeo de lecturas y técnicas de validación de ensambles.

○ Comparación con genomas de referencia –MUMMER. ACT

○ Alineadores: BOWTIE, MAUVE

○ Visualización: IGV, artemis

● Anotación de Genomas. Modelos de genes en procariontes y eucariontes.

○ rRNA y tRNA (RNAmmer)

○ CDSs, intrones/exones

○ Predictores de genes genomas: AUGUSTUS, Glimmer3

○ Predictores de genes en metagenomas: Fragene Scan

○ Anotaciones automáticas y manuales: de genomas RAST, PROKKA

○ Anotaciones automaticas y manuales de metagenomas: MGRAST, METAREP

○ Bases de datos para anotación: Blast2Go

● Genómica comparada

○ Análisis de ortólogos

● DeNoGap

● Get Homologous

○ Inferencia de eventos de recombinación y pruebas de selección.

III. C) Análisis de comunidades y el manejo de datos derivado de estrategias como la metagenómica.

● Amplicones de 16s

○ Qiime

○ Uparse

○ Mothur

● Metagenomica

○ Ensambladores de Metagenomas: Metavelvet, SOAP

○ Anotación automatizada. Metarep, MgRast. Como funcionan?

○ Bases de datos para los análisis taxonómicos y funcionales :

○ Análisis taxonómicos (con o sin ensamblaje) MetaPhlan, Phylosift, LCA

○ Análisis funcional (bases de datos)

○ Metagenómica comparativa. (Caso tipo Sulfur Score)

CURSO DE BIOINFORMATICA

// Instituto de Ecologia

// UNAM

Temario

Bloque I: 15 hrs

Bloque II: 15 hrs

Bloque III: 30 hrs