Regiones genómicas implicadas en la metilación diferencial del ADN

  1. Barturen Briñas, Guillermo
Dirigida por:
  1. Michael Hackenberg Director
  2. José Lutgardo Oliver Jiménez Director

Universidad de defensa: Universidad de Granada

Fecha de defensa: 09 de junio de 2014

Tribunal:
  1. Rafael Lozano Ruiz Presidente
  2. Francisco Perfectti Álvarez Secretario
  3. Carmelo Ruiz Rejón Vocal
  4. Pedro A. Bernaola Galván Vocal
  5. Fuencisla Matesanz del Barrio Vocal
Departamento:
  1. GENÉTICA

Tipo: Tesis

Resumen

RESUMEN (Castellano) Introducción La metilación del ADN es la marca epigénetica por excelencia. Consiste en la unión covalente de un grupo metilo al carbono 5 de las citosinas, dando lugar a metilcitosinas, descritas por algunos autores como ¿la quinta base del ADN¿1. En mamíferos, esta marca epigenética se encuentra sobre todo en los dinucleótidos CpG, que aparecen metilados en la mayor parte del genoma2. La excepción son las islas CpG (CGIs), regiones abiertas de la cromatina, con una elevada densidad de CpGs y libres de metilación, lo que permite la interacción con el ADN3, 4. Aproximadamente el 70% de los genes humanos presentan CGIs, entre los que figuran la totalidad de los genes domésticos y un 40% de los genes tejido específicos5, 6. La metilación puede variar entre diferentes tejidos, individuos o tipos celulares. El mecanismo subyacente es la regulación de la interacción de diferentes proteínas con el ADN. Básicamente, la metilación interviene en la transcripción de los genes y mantiene la estabilidad del genoma. Sin embargo, estas funciones pueden regularse de diferentes maneras: * Regulación de la transcripción: o Regulando la interacción del complejo de la ARN polimerasa con los promotores7. o Interviniendo en mecanismos de splicing alternativo8. o Regulando la unión de factores de transcripción a regiones potenciadoras9 y aisladoras10. * Estabilidad genómica: o Silenciando elementos repetidos como retrotransposones11. o Participando en la compensación de dosis de cromosomas sexuales12 y en la impronta de genes autosómicos13. Observando los múltiples mecanismos reguladores en los que se encuentra implicada la metilación, no es de extrañar que se hayan encontrado patrones aberrantes de metilación asociados a un gran número de enfermedades14, entre las que destacan diferentes tipos de tumores. Objetivos El objetivo principal de esta Tesis es la identificación y caracterización de regiones diferencialmente metiladas, que puedan servir como marcadores epigenéticos. Ello exige como requisito imprescindible disponer de mapas de metilación en genoma completo (metilomas) de alta calidad y procedentes de diferentes tejidos. Solo así se puede llevar cabo el estudio comparado de los mismos e identificar las regiones diferencialmente metiladas. Además, se sabe que la densidad de CpGs juega un papel crítico tanto en la unión de los factores de transcripción (TFs) como en la determinación del estado de metilación del ADN15, 16. Sin embargo, ni las herramientas existentes ni los estudios realizados en múltiples tejidos tienen en cuenta esta importante característica. Así pues, otro objetivo de esta Tesis ha sido la mejora del algoritmo CpGcluster17, dando lugar a un nuevo algoritmo (WordCluster18), capaz de identificar islas CpG (CGIs) estadísticamente significativas y con una alta densidad de CpGs. Desarrollo teórico y Resultados El primer paso fue el desarrollo de las herramientas bioinformáticas necesarias para la generación de metilomas de alta calidad a partir de datos de secuenciación masiva de ADN tratado con bisulfito: NGSmethPipe19 y MethylExtract20. El primer programa permite preprocesar y alinear las lecturas cortas frente al genoma de referencia, mientras que el segundo infiere los niveles de metilación de citosinas individuales y las variaciones de un solo nucleótido (SNVs) a partir de dichos alineamientos. Ambos programas incorporan rigurosos controles de calidad, de forma que los metilomas generados para diferentes tejidos, especies o estados patológicos sean comparables. Asimismo, fue necesario el desarrollo de una base de datos relacional (NGSmethDB21, 22) para el almacenamiento, gestión y explotación de toda la información generada. Actualmente, NGSmethDB contiene metilomas para 6 especies y 114 tejidos y/o condiciones diferentes, para lo que sido necesario procesar 40 terabytes de lecturas. El algoritmo desarrollado, WordCluster, presenta importantes ventajas con respecto a los métodos clásicos de identificación de CGIs, destacando entre ellas la delimitación de dominios de metilación más cortos pero estadísticamente significativos y homogéneos, y el que sus predicciones se asocian de manera más específica tanto con elementos reguladores, como con regiones conservadas del genoma23. El estudio estadístico de la metilación diferencial en las CGIs predichas por WordCluster ha permitido establecer que el uso combinado de la prueba exacta de Fisher y la binomial negativa es el mejor método para identificar DMIs (islas CpG diferencialmente metiladas). La mayoría de las DMIs pueden ser de dos tipos: DMIs-M (metiladas en la mayoría de los tejidos y no-metiladas en algún tejido) y DMIs-U (metiladas solamente en algún tejido y no-metiladas en el resto). El análisis funcional mediante el enriquecimiento en términos GO (Gene Ontology) muestra que las DMIs-U parecen estar implicadas en procesos de desarrollo y diferenciación, mientras que las DMIs-M se asocian con funciones tejido-específicas. Por último, los estudios de enriquecimiento de las DMIs en elementos reguladores han revelado importantes diferencias con respecto a otras DMRs24 (Regiones diferencialmente metiladas), recientemente identificadas sin tener en cuenta la densidad de CpGs. Entre estas diferencias destacan el elevado enriquecimiento de las DMIs en promotores y exones y su empobrecimiento en intrones, así como la significativa menor proporción de DMIs-M asociadas con TFBSs cuando se las compara con las DMRs. Cabe destacar también que las DMIs-U solapan en mucho mayor grado con los TFBSs que las DMIs-M. Todas estas importantes características encontradas en las DMIs sugieren que WordCluster puede ser el algoritmo adecuado para preseleccionar las regiones a analizar en futuros estudios de metilación diferencial. La Tesis se encuentra disponible en: http://bioinfo2.ugr.es/Publicaciones/tesis_GB.pdf