FACULTAD DE CIENCIAS NATURALES Y EXACTAS
UNIVERSIDAD DE BUENOS AIRES
Fecha: 14 al 21 de julio
Carga horaria: 50 horas
En las clases teóricas se impartirán los conocimientos necesarios para entender los algoritmos que se implementan en programas de reconstrucción filogenética, así como los procesos a nivel organísmico, genómico y genético que pueden provocar incongruencias entre árboles de genes y árboles de especies. En las clases prácticas se enseñarán programas de reconstrucción filogenética que utilizan tanto criterios de parsimonia como probabilísticas.
Docente: Dra. Viviana Confalonieri
Colaboradores: Dra. Alexandra Gottlieb, Lic. Marcela Rodriguero y Lic. Diego Caraballo.
Inscripción: www.inscripciones.fcen.uba.ar
Distribución horaria: Lunes a Viernes, de 9 a 17:30 horas.
Puntos para el doctorado: 2
Informacion: bibilu@ege.fcen.uba.ar
Fundamentos y Objetivos
Desde que J. Watson y F. Crick propusieron en 1953 un modelo de la estructura del ácido desoxirribonucleico (ADN) que coincidía con las evidencias experimentales, los científicos han aceptado que esta molécula, presente en todos los seres vivos, es la depositaria de la información genética. En ella no sólo están escritas las instrucciones para construir, mantener y reproducir un ser vivo, sino que además están impresas las señales filogenéticos que permitirán desentrañar la historia evolutiva de los organismos.
En las últimas dos décadas el análisis filogenético basado en caracteres del ADN ha pasado de ser una rara curiosidad a ser una herramienta sumamente poderosa en el terreno de la biología evolutiva moderna. Este enorme crecimiento fue fomentado no sólo por el desmesurado caudal de datos moleculares disponibles de cualquier tipo de organismo, que crece a diario, sino que además por el desarrollo tecnológico que ha tenido la informática, y en particular la bioinformática. Asociado a este crecimiento se han desarrollado algoritmos cada vez más sofisticados, que permiten analizar filogenéticamente matrices de caracteres y de taxones cada vez más grandes. Estos nuevos algoritmos no sólo aplican el criterio Hennigniano tradicional de Máxima Parsimonia, sino que aplican otras metodologías especialmente diseñadas para caracteres moleculares como Máxima Verosimilitud y Análisis Bayesiano.
Ya en el año 1989, Stephen Gould, famoso paleontólogo de la universidad de Harvard, profetizaba que las filogenias moleculares se convertirían en la herramienta fundamental en el establecimiento de relaciones evolutivas, sobre todo en aquellos casos en donde los métodos tradicionales de morfología comparada habían fallado. Esta predicción se ha cumplido ampliamente, aplicándose el análisis filogenético molecular a la resolución de problemas biológicos que van mucho mas allá de la clasificación de los organismos, como puede ser la interpretación de datos provenientes de proyectos genomas, el patrón epidemiológico viral en poblaciones humanas, la elaboración de evidencias en casos judiciales de individuos infectados con HIV.
El presente curso tiene por objeto enseñar los aspectos teóricos y prácticos de la reconstrucción filogenético basada en caracteres moleculares, abordando las distintas metodologías de análisis y criterios de los que se disponen en la actualidad, y las ventajas y desventajas asociadas a la utilización de este tipo de caracteres. En este sentido, se brindarán los conocimientos genéticos básicos necesarios para comprender ciertos aspectos conflictivos de las filogenias moleculares, como son la presencia de genes ortólogos y parálogos, los pseudogenes, los fenómenos de transferencia horizontal e hibridación, la poliploidía, “lineage sorting”, etc. Además de las aplicaciones de las filogenias en el campo de la sistemática, este curso tiene por objeto enseñar aspectos teóricos y prácticos de sus aplicaciones en otros campos como la filogeografía, coevolución y biogeografía.
Objetivos generales del curso:
1) Comprender los fundamentos lógicos, epistemológicos y metodológicos que subyacen al análisis y síntesis de la información utilizada con el propósito de esclarecer las relaciones de parentesco entre los organismos.
2) Comprender los principios evolutivos que subyacen a la elaboración de los algoritmos utilizados en reconstrucciones filogenéticas.
3) Aprender a utilizar las herramientas informáticas mas comúnmente usadas para la construcción de árboles, en particular aquellos que provienen del análisis de caracteres moleculares.
Unidad 1. ADN, Genes y Genomas.
Estructura química del ADN y ARN. Organización estructural de los genes y genomas. Estructura física del genoma de procariontes y de eucariontes. ADN nuclear y mitocondrial. Tipos de secuencias: secuencias repetidas dispersas y en tandem, pseudogenes, elementos móviles, etc. Organización jerárquica del genoma: genes divididos en exones e intrones; familias multigénicas; superfamilias multigénicas; genes homeóticos.
Unidad 2: Filogenias moleculares: elección de la fuente de caracteres.
Variabilidad de secuencias y rango taxonómico a analizar. Análisis por sitios de restricción y por secuenciación. Cloroplastos: Rearreglos estructurales de cloroplastos y sus implicancias en el análisis filogenético. Genes de cloroplastos y rango taxonómico de utilidad: rbcL, atpB, matK, mdhF, 16rDNA, región espaciadora atp-rbcL. Secuencias nucleares y su rango taxonómico de utilidad: genes ribosomales ADNr18s, ADNr26s, ADNr5.8s, ITS, IGS, 5s y genes espaciadores. Otros genes nucleares. Genes mitocondriales.
Unidad 2: Criterios de Máxima Parsimonia (MP) y su aplicación en filogenias moleculares.
Objetivos de la cladística. El concepto Hennigiano. Caracteres plesiomórficos y apomórficos. Sinapomorfías y autoapomorfías. El principio de Parsimonia. Longitud de los cladogramas. Caracteres congruentes, consistentes y homoplásicos. Grupos monofiléticos, Polifiléticos y parafiléticos. Congruencia de caracteres y homología. Homoplasias: convergencias, pararlelismos y reversiones. Distinción entre cladogramas y árboles evolutivos. Terminología de árboles. Arboles con raíz y sin raíz.
Unidad 4: Reconstrucción filogenético en base a MP.
Construcción en base a apomorfías compartidas: Argumentación Hennigiana o regla de la inclusión/exclusión. Arboles de Wagner. Problemas de los árboles de Wagner. Métodos exactos: Búsqueda Exhaustiva y Búsqueda “Branch and Bound”. Métodos heurísticos. Adición por pasos. Permutación de ramas. Métodos NNI, SPR y TBR. El problema de las islas. Arboles óptimos locales y globales. Nuevas tecnologías de análisis: Ratchet, Tree Fusing, Tree Drifting, Sectorial Searches. Polaridad “a priori” y “a posteriori”. La comparación con el grupo externo. El criterio ontogenético y otros métodos de polarización “a priori”. Polaridad y enraizamiento “a posteriori”. Programas de Computación en cladística: TNT, PAUP*, y otros.
Unidad 5: Optimización, medidas de ajuste y pesado de caracteres.
Criterios de optimización. Parsimonia de Wagner o de Farris. Parsimonia de Fitch. Parsimonia de Dollo. Matrices de Sankoff. Optimización de caracteres (fast, slow y unambiguous). Medidas de ajuste de los caracteres: longitud del cladograma; índice de consistencia; índice de retención; índice de consistencia reescalado. Pesado de caracteres: “a priori” y “a posteriori”. Pesado “a priori” en caracteres moleculares: entre posiciones y dentro de cada posición. El caso del gen ADNr 18s: distribución y frecuencia de delecciones e inserciones; “stems”, loops y cambios compensatorios de bases; dominios variables y dominios conservados. Desvíos en tasas de transición y transversión. Pesado “a posteriori”: Pesado sucesivo y Pesos implicados.
Unidad 6: Consenso y medidas de soporte
Consenso estricto. Consenso de componentes combinables. Consenso de Adams. Consenso de Mayoría. Problemas de los árboles de consenso. Soportes a nivel de todo el árbol. Distribución de la longitud de los cladogramas. PTP. T-PTP. Soportes a nivel de ramas individuales. Largo de rama. Soporte de Bremer. Procesos de aleatorización para medir soporte de ramas. Método “bootstrap” y “Jacknifing”. Ventajas y desventajas de los distintos métodos.
Unidad 7: Filogenias moleculares y el concepto de homología.
Árboles de genes y árboles de especies. Homologías y duplicaciones. Genes ortólogos y genes parálogos. Homología y poliploidía. Hibridación e introgresión. Homología y recombinación genética. Tipos de alineación. Alineación global y local. Alineación visual. Métodos de alineación por matrices de punto y por similitud. Método de Alineación dinámico de Needleman y Wunsch. Parámetros de penalidad de apertura y extensión de “gaps”. Los “gaps” como caracteres filogenéticos. Alineamientos estáticos vs. Alineamientos dinámicos: método de optimización directa. Programas informáticos.
Unidad 8: Hipótesis filogenéticas conflictivas.
Evaluación de árboles a partir de distintas fuentes de caracteres: métodos combinados, de consenso y de combinación. Congruencia topológica y congruencia de caracteres. Mediciones cuantitativas de la incongruencia entre árboles. Significación estadística. Causas de conflicto. Genes ortólogos y parálogos. Tasas heterogéneas entre taxa y entre sitios. Composición de bases sesgadas. Causas de origen organísmico: evolución morfológica convergente. Transferencia horizontal.
Modelos de evolución molecular: modelo de Jukes-Cantor, K2P, F81, HKY85 y GTR. Aplicación de modelos en la construcción de matrices de distancias. Análisis de agrupamiento. UPGMA y Neighbor-Joining. Programas informáticos.
Unidad 10: Métodos Probabilísticos: Máxima Verosimilitud y Análisis Bayesiano.
Definición de verosimilitud. Máxima verosimilitud aplicada a filogenias. Test de razón de verosimilitudes (Likelihood Ratio Test). Estadística clásica vs. Estadística Bayesiana. Probabilidad subjetiva. Teorema de Bayes. Probabilidades “a priori” y “a posteriori” . Distribución de probabilidades discretas y continuas. Estadística Bayesiana aplicada a filogenias. Cadenas de Markov de Montecarlo. Cálculo de probabilidades posteriores en filogenias. Algoritmo de Metropolis Hastings. Período “burn-in”. Programas informáticos.
Unidad 11: Reloj Molecular
Estimación de tasas de sustitución nucleotídica. Pruebas de homogeneidad de tasas entre linajes. Aplicación de relojes moleculares cuando existe heterogeneidad de tasas entre linajes. Calibración del reloj. Criticas al uso de relojes moleculares.