Inferencia de patrones de regulación a partir de datos ómicos

  1. López Domínguez, Raúl
Dirigida por:
  1. Pedro María Carmona Sáez Codirector
  2. Marta Alarcón Riquelme Codirectora

Universidad de defensa: Universidad de Granada

Fecha de defensa: 23 de junio de 2023

Tribunal:
  1. Fátima Al-Shahrour Presidente/a
  2. Juan Manuel Melchor Rodríguez Secretario
  3. María Adoración Martín Gómez Vocal

Tipo: Tesis

Resumen

La necesidad de conocer cómo interaccionan las biomoléculas entre sí y como afectan dichas interacciones al funcionamiento global de un tejido o célula es uno de los aspectos clave que, en los últimos años, están ganando cada vez más importancia. Uno de los elementos más importantes en el contexto de las redes de regulación son los factores de transcripción (TFs). Estas proteínas son esenciales en el buen funcionamiento de la regulación de la transcripción ya que se unen a ciertas regiones del genoma, principalmente asociadas a regiones codificantes, y actúan activando o inhibiendo la transcripción de un gen determinado. A lo largo de esta tesis doctoral, los trabajos realizados se han centrado en el análisis de datos ómicos, principalmente transcriptómica, en el contexto de las enfermedades autoinmunes y, de forma más específica, en lupus eritematoso sistémico. Esta enfermedad se caracteriza por ser una patología heterogénea en la que tiene lugar una respuesta inmune contra células y órganos del propio individuo. Sobre lupus y datos ómicos se han desarrollado múltiples estudios tanto para identificar biomarcadores, estratificar pacientes o buscar tratamientos potenciales. En el contexto de los TFs, se sabe que muchas de las mutaciones asociadas a la enfermedad se han localizado en pacientes de lupus se encuentran en regiones reguladoras, como los sitios de unión de los TFs. A pesar de este conocimiento, no se aporta información acerca de cómo afectan estas mutaciones a la actividad de dichos TFs. Por este motivo, en esta tesis se han aplicado una serie de técnicas que permiten inferir la actividad de los TFs en base a la expresión de los genes que están regulando (también conocidos como genes diana). Para ello era necesario conocer qué genes son regulados por cada TF, cuya información se localiza en múltiples bases de datos y se obtienen a partir de una gran cantidad de artículos publicados. El conjunto de genes regulados por cada TFs (también llamado regulones) se obtuvo utilizando la base de datos desarrollada por DoRothEA que incluye interacciones de fuentes muy diversas y que se clasifican en base a la credibilidad. Para inferir las actividades de los TFs de cada muestra utilizando los niveles de expresión de sus genes diana se utilizó el método desarrollado por VIPER (Virtual Inference of Protein-activity by Enriched Regulon). Sin embargo, como trabajo previo a la inferencia de los TFs se realizó una recopilación de datos ómicos públicos de tipo caso-control disponibles en el repositorio público más conocido: NCBIGEO. Este trabajo permitió el desarrollo de ADEx, una herramienta online con datos ómicos procesados atendiendo a un mismo método estandarizado y con varios análisis de dichos datos: expresión diferencial, análisis de rutas, inferencia de redes o meta-análisis. Posteriormente, elegimos uno de los estudios incluidos en ADEx con datos transcripcionales de lupus así como los datos de otra cohorte a la que tuvimos acceso gracias a nuestra colaboración con la doctora Michelle Petri, de la Universidad Johns Hopkins. Estos dos conjuntos de datos transcripcionales se utilizaron para inferir las actividades de los TFs en los pacientes de lupus y controles sanos. Las actividades de todos los individuos de lupus se utilizaron para estratificar pacientes y, en ambos estudios se localizaron dos grupos muy diferenciados, que además presentaban diferencias clínicas con respecto a las proporciones de algunos tipos celulares como neutrófilos y linfocitos. Finalmente, mediante análisis de actividad diferencial, localizamos una firma robusta de 14 TFs que se encontraban diferencialmente activados en lupus con respecto a controles. Dada la importancia que se observó en cuanto a los tipos celulares, se decidió aplicar un análisis similar al anterior pero en datos transcripcionales de célula única, con el fin de analizar en profundidad los TFs en los que existen diferencias a nivel de tipo celular. Para ello, se utilizó un conjunto de datos público alojado en NCBI GEO y se aplicó un protocolo de procesamiento en línea con lo más estándar en el campo. Además, se añadió una capa adicional, la inferencia de actividad de rutas de señalización. Aunque este trabajo se encuentra incompleto, se han hallado resultados relevantes, principalmente relativos a tipos celulares en los que hay patrones de actividad diferentes.