Análisis integrado de datos ómicos en enfermedades autoinmunes
- Toro Domínguez, Daniel
- Marta Alarcón Riquelme Doktormutter
- Pedro María Carmona Sáez Co-Doktorvater
Universität der Verteidigung: Universidad de Granada
Fecha de defensa: 16 von Oktober von 2019
- José Antonio López Escámez Präsident/in
- Ignacio Rojas Ruiz Sekretär
- Manuel Martínez Bueno Vocal
- Joaquín Dopazo Blázquez Vocal
- Fátima Al-Shahrour Vocal
Art: Dissertation
Zusammenfassung
RESUMEN (Castellano) Introducción En las últimas décadas, el desarrollo de las técnicas de generación masiva de datos, o técnicas ómicas, ha supuesto un punto de inflexión en el avance del conocimiento científico, cambiando el paradigma científico y el modo de abordar la generación de hipótesis. Estas técnicas permiten analizar grandes conjuntos de datos biológicos y generar conclusiones a partir de ellos, lo que ha llevado a categorizar la investigación biomédica como una ciencia de datos. Una de estas técnicas es la transcriptómica, con la cual se puede medir de manera global los eventos de expresión génica de todos los genes en una o un conjunto de muestras biológicas. La expresión génica es un reflejo directo de qué mecanismos moleculares están activados o inhibidos en un determinado contexto, y, por ende, prácticamente cualquier estado biológico posee patrones de expresión génica diferenciadores. Junto con el potencial de las técnicas de generación masiva de datos, su abaratamiento ha causado un crecimiento exponencial en su uso y el almacenamiento de los datos en repositorios públicos, los cuales están disponibles para que cualquier investigador pueda analizarlos. Esto ha creado la necesidad de desarrollar nuevas técnicas que hagan posible tanto el manejo y procesado como la explotación e interpretación de los datos. Las ómicas por tanto van obligatoriamente unidas al concepto de bioinformática, el cual se define como la aplicación de tecnologías computacionales y la estadística a la gestión y análisis de datos biológicos. Esta combinación resulta tremendamente útil para el estudio de enfermedades, donde se pueden identificar y caracterizar los patrones de expresión génica y las funciones moleculares ligadas directamente a la patología. En esta tesis doctoral se han aprovechado las ventajas que nos ofrecen la transcriptómica y la bioinformática a la hora de generar nuevo conocimiento en enfermedades autoinmunes, una serie de patologías consideradas raras, por su baja incidencia en la población, y complejas, por su carácter multigénico y multifactorial. Además, se ha aprovechado la disponibilidad de usar datos almacenados en bases de datos públicas, lo que permite trabajar con grandes conjuntos de datos y generar resultados más robustos y sistemáticos, resolviendo el problema de que, generalmente, y debido a la baja prevalencia de estas enfermedades en la población, se suele trabajar con cohortes pequeñas de pacientes. Objetivos Los trabajos realizados durante el desarrollo de la tesis se contextualizan dentro de dos marcos principales con dos objetivos diferentes. Primero, consideramos que dentro de las enfermedades autoinmunes existen ciertos patrones moleculares comunes, por lo que el primer objetivo es identificar y caracterizar los patrones de expresión génica homogéneos entre varias enfermedades autoinmunes (lupus eritematoso sistémico, artritis reumatoide y síndrome de Sjögren) y dentro de una misma enfermedad (lupus) de forma robusta entre diferentes estudios. Por otra parte, aunque observamos que hay mecanismos genéticos comunes dentro de lupus y entre diferentes patologías autoinmunes, desde el punto de vista clínico se observa una enorme heterogeneidad sintomatológica, serológica y de progresión de las enfermedades, y que se ve reflejada además en una respuesta diferencial a fármacos entre los diferentes pacientes. Este hecho, da pie a hipotetizar sobre la existencia de patrones de expresión génica diferentes entre los distintos pacientes. El segundo marco conceptual de esta tesis se enfoca en el estudio de la heterogeneidad dentro de una misma enfermedad, con el objetivo de estratificar o agrupar los pacientes en subgrupos más homogéneos genética y molecularmente, reduciendo así la heterogeneidad global. Desarrollo teórico y Resultados Con el primer trabajo recogido en la tesis, buscamos identificar los patrones genéticos homogéneos entre 3 enfermedades autoinmunes diferentes, el lupus eritematoso sistémico, la artritis reumatoide y el síndrome de Sjögren, mediante el uso de técnicas de meta-análisis basado en expresión génica. Como resultados, obtuvimos una serie de mecanismos moleculares de los cuales había sido descrita su relevancia en alguna de las enfermedades de manera individual, como la ruta de señalización de interferón tipo I o la apoptosis celular, y otras rutas biológicas aún no relacionadas con la autoinmunidad o no ampliamente estudiadas, como la desregulación en los procesos de translación proteica. En el segundo trabajo nos centramos sólo en lupus y continuamos con la búsqueda de los patrones homogéneos entre diferentes pacientes, con el objetivo de identificar nuevos fármacos candidatos para tratar esos patrones conservados dentro de la enfermedad mediante el uso de técnicas de reutilización de fármacos in sílico. Con este trabajo, propusimos una serie de nuevos posibles tratamientos con capacidad de revertir la firma genética patológica, entre los cuales había algunos en fases iniciales de estudio clínico, como los inhibidores de la ruta de la fosfoinositol quinasa. El tercer artículo englobado en la tesis doctoral es un trabajo pionero desarrollado en lupus, pero aplicable en cualquier otra enfermedad compleja, donde desarrollamos un enfoque de estratificación de pacientes usando datos longitudinales de expresión, y en el que obtuvimos y replicamos 3 subgrupos homogéneos de progresión de la enfermedad dentro del lupus. Estos grupos fueron formados de acuerdo a cómo varia la expresión genética cuando la actividad de la enfermedad aumenta. La caracterización clínica nos mostró que en dos de los grupos el porcentaje de neutrófilos aumenta cuando la actividad de la enfermedad aumenta, mientras que en el tercer grupo es el porcentaje de linfocitos el que aumenta con la actividad de la enfermedad. Este hallazgo representa dos mecanismos de progresión de la enfermedad totalmente distintos. Además, estos grupos obtenidos mostraban diferencias significativas en cuanto a sintomatología clínica. Por ejemplo, entre otras, los grupos relacionados con neutrófilos mostraban un mayor número de casos de desarrollo de nefritis proliferativa, mientras que el grupo dirigido con linfocitos se asociaba a una mayor comorbidad con otras enfermedades autoinmunes, como el síndrome de Sjögren. Esta estratificación puede tener gran relevancia clínica, pudiendo usarse para el estudio de respuesta a fármacos dentro de cada grupo específicamente. Por tanto, en esta tesis se han definido patrones de expresión génica comunes entre 3 enfermedades autoinmunes diferentes, se ha realizado un análisis de búsqueda de nuevos fármacos candidatos para el lupus basándonos en los mecanismos genéticos compartidos entre los diferentes pacientes, y se han definido 3 subgrupos de pacientes de lupus, caracterizados por mecanismos diferentes de progresión de la enfermedad. SUMMARY (English) Introduction In recent decades, the development of massive data generation techniques, or omic techniques, has been a turning point in the advancement of scientific knowledge, changing the scientific paradigm and how to approach the generation of hypotheses. These techniques allow to analyze large sets of biological data and generate conclusions from them, which has led to categorize biomedical research as a data science. One of these techniques is transcriptomics, with which the gene expression events of all genes can be measured globally in one or a set of biological samples. Gene expression is a direct reflection of which molecular mechanisms are activated or inhibited in a given context, and, therefore, any biological state has differentiating gene expression patterns. Together with the potential of high throughput data generation techniques, its drop in price has caused an exponential growth in its use and the storage of data in public repositories, which are available for any researcher to analyze. This has created the need to develop new techniques that make possible the handling and processing as well as the exploitation and interpretation of the data. The omics are therefore bound to the concept of bioinformatics, which is defined as the application of computational technologies and statistics to the management and analysis of biological data. This combination is extremely useful for the study of diseases, where you can identify and characterize the patterns of gene expression and molecular functions directly linked to the pathology. In this doctoral thesis the advantages offered by transcriptomics and bioinformatics have been taken advantage to generate new knowledge in autoimmune diseases, a series of pathologies considered rare, due to their low incidence in the population, and complex, due to their multigenic character and multifactorial. In addition, the availability of using data stored in public databases has been exploited, which allows working with large data sets and generating more robust and systematic results, solving the problem that, generally, and due to the low prevalence of these diseases in the population, usually work with small cohorts of patients. Objectives The works carried out during the development of the thesis are contextualized within two main frameworks with two different objectives. First, we consider that within autoimmune diseases there are certain common molecular patterns, so the first objective is to identify and characterize homogeneous gene expression patterns among several autoimmune diseases (systemic lupus erythematosus, rheumatoid arthritis and Sjögren's syndrome) and within the same disease (lupus) robustly between different studies. On the other hand, although we observe that there are common genetic mechanisms within lupus and between different autoimmune pathologies, from the clinical point of view there is an enormous symptomatic, serological and disease progression heterogeneity, and that it is also reflected in a response drug differential between different patients. This fact gives rise to hypothesize about the existence of different gene expression patterns among the different patients. The second conceptual framework of this thesis focuses on the study of heterogeneity within the same disease, with the aim of stratifying or grouping patients into more homogeneous subgroups genetically and molecularly, thus reducing global heterogeneity. Theoretical Development and Results With the first work collected in the thesis, we seek to identify the homogeneous genetic patterns between 3 different autoimmune diseases, systemic lupus erythematosus, rheumatoid arthritis and Sjögren's syndrome, through the use of meta-analysis techniques based on gene expression. As a result, we obtained a series of molecular mechanisms of which its relevance in some of the diseases had been described individually, such as the signaling pathway of type I interferon or cell apoptosis, and other biological pathways not yet related to autoimmunity, or not widely studied, such as deregulation in protein translation processes. In the second work we focus only on lupus and continue with the search for homogeneous patterns among different patients, with the aim of identifying new candidate drugs to treat those patterns preserved within the disease through the use of in silico drug repurposing techniques. With this work, we proposed a series of new possible treatments with the ability to reverse the pathological gene signature, among which there were some in the early stages of clinical study, such as inhibitors of the phosphoinositol kinase pathway. The third article included in the doctoral thesis is a pioneering work developed in lupus, but applicable in any other complex disease, where we developed a patient stratification approach using longitudinal expression data, and in which we obtained and replicated 3 homogeneous subgroups of progression of the disease within lupus. These groups were formed according to how gene expression changes when disease activity increases. The clinical characterization showed us that in two of the groups the percentage of neutrophils increases when the activity of the disease increases, while in the third group it is the percentage of lymphocytes that increases with the activity of the disease. This finding represents two completely different mechanisms of disease progression. In addition, these groups obtained showed significant differences in clinical symptoms. For example, among others, the neutrophil-related groups showed a greater number of cases of proliferative nephritis development, while the lymphocyte-directed group was associated with greater comorbity with other autoimmune diseases, such as Sjögren's syndrome. This stratification can have great clinical relevance, being able to be used for the study of drug response within each group specifically. Therefore, in this thesis common gene expression patterns have been defined among 3 different autoimmune diseases, a search analysis of new candidate drugs for lupus has been performed based on the molecular mechanisms shared between the different patients, and we have defined 3 subgroups of lupus patients, characterized by different mechanisms of disease progression.