Computational and statistical methods for integrated analysis of biomedical data

  1. Martorell Marugán, Jordi
Supervised by:
  1. Pedro María Carmona Sáez Director
  2. Victor Gonzalez Rumayor Director

Defence university: Universidad de Granada

Fecha de defensa: 27 April 2021

Committee:
  1. Ignacio Rojas Ruiz Chair
  2. Carlos Cano Gutiérrez Secretary
  3. Salvador Jesús Capella Gutiérrez Committee member
  4. Ana Conesa Cegarra Committee member
  5. Fátima Sánchez Cabo Committee member
Department:
  1. ESTADÍSTICA E INVESTIGACIÓN OPERATIVA

Type: Thesis

Abstract

Durante los últimos años, las nuevas tecnologías ómicas han revolucionado el paradigma de la investigación biomédica, pasando de estudiar unos pocos elementos concretos basándose en hipótesis previas a estudiar sistemas completos como el genoma o el transcriptoma, generando hipótesis a partir de los datos. Este cambio ha creado la necesidad de un nuevo perfil en la investigación biomédica, el del bioinformático o biólogo computacional, que combina conocimientos de biología, informática y estadística para analizar estas grandes cantidades de datos y desarrollar nuevos métodos analíticos. En este contexto de generación de datos masivos, se crearon distintos repositorios públicos en los que los investigadores pueden subir los datos que generan en sus estudios con el fin de garantizar la reproducibilidad de sus resultados y de que puedan ser usados en otros estudios retrospectivos. Durante los últimos años, la cantidad de datos almacenados en repositorios públicos ha crecido exponencialmente gracias al abaratamiento de las tecnologías necesarias para generarlos. Uno de los repositorios más usados es el Gene Expression Omnibus (GEO), mantenido por el NCBI. GEO contiene los datos generados en todo tipo de proyectos ómicos, incluyendo datos de expresión, metilación o secuenciación de ADN, entre otros. La disponibilidad de toda esta gran cantidad de información ofrece un recurso inestimable para generar y contrastar hipótesis mediante el uso o integración de estos datos. No obstante, para ello se requieren metodologías estadísticas y computaciones apropiadas que puedan ser aplicadas para la integración de información. Entre las estrategias para reanalizar datos públicos se encuentra el meta-análisis, que es la combinación de los resultados de distintos estudios mediante técnicas estadísticas apropiadas con el fin de aumentar el poder estadístico y de resolver discrepancias entre estudios, entre otras aplicaciones. El objetivo principal de esta tesis doctoral ha sido el desarrollo de métodos computacionales para la integración de conjuntos de datos heterogéneos y de distinto origen, con el objeto de analizarlos conjuntamente mediante metodologías de metaanálisis y análisis integrado de datos.