Analysis and visualization of multidimensional cancer genomics data

  1. Schroeder, Michael
Dirigida por:
  1. Núria López Bigas Director/a
  2. Abel González Pérez Codirector/a

Universidad de defensa: Universitat Pompeu Fabra

Fecha de defensa: 21 de noviembre de 2014

Tribunal:
  1. José Manuel Corpas Nogales Presidente
  2. Eduardo Eyras Jimenez Secretario/a
  3. Holger Heyn Vocal

Tipo: Tesis

Teseo: 374331 DIALNET lock_openTDX editor

Resumen

El cáncer es una enfermedad compleja causada por alteraciones somáticas del genoma y epigenoma de las células tumorales. La proliferación de nuevas tecnologías de secuenciación, junto a un incremento del capital destinado a la investigación, ha generado una gran cantidad de datos genómicos relacionados con el cáncer. La disponibilidad de estos datos ofrece nuevas posibilidades para entender mejor las propiedades moleculares del cáncer. El análisis y la interpretación de estos datos para un paciente requiere nuevas soluciones tanto en el procesamiento computacional como en su visualización. Estas soluciones deben facilitar la interpretación del cáncer y el descubrimiento de nuevas dianas terapéuticas. Sin embargo, el gran volumen de datos supone nuevos retos importantes en cuanto a análisis, facilidad de exploración y visualización. En este ámbito se presentan en la tesis varias soluciones analíticas y de visualización organizadas en diferentes secciones. De la parte analítica se introducen dos métodos que aprovechan esta gran disponibilidad de datos genómicos de cáncer: OncodriveROLE, un procedimiento para clasificar genes "drivers" del cáncer según si su modo de acción es la activación o la pérdida de función del producto génico; y MutEx, un estadístico para medir la tendencia de las mutaciones somáticas a la exclusión mutua. Intentamos facilitar la exploración y visualización de los datos genómicos con nuevas herramientas de visualización: i) Heatmaps interactivos de Gitools con datos genómicos de cáncer producidos a gran escala y preparados para ser explorados, ii) jHeatmap, un heatmap interactivo para la web capaz de mostrar datos genómicos de cáncer multidimensionales y diseñado para su inclusión en portales web; y iii) SVGMap, un servidor web para trasladar datos en figuras SVG customizadas, útil para la traslación de medidas experimentales en un modelo visual. Este trabajo contribuye al campo de genética del cáncer en varios aspectos: La herramienta OncodriveROLE permite saber en que modo un gen ¿driver¿ actúa en la tumorigénesis, lo cual es útil para modelos de la enfermedad tanto como en la priorización de posibles nuevas dianas para el tratamiento de la enfermedad. Con el desarrollo de MutEx y su inclusión en la herramienta Gitools se proporciona una algoritmo estadístico a la comunidad que permite cuantificar la probabilidad de exclusión mutua de varios eventos. En el contexto de alteraciones ¿drivers¿ lo proponemos como herramienta para confirmar módulos de genes que actúen como proceso tumorigénico. La herramienta Gitools permite cargar datos propios, o datos genómicos de cáncer preparados para luego visualizarlos e interpretarlos. Importantes mejoras han abierto nuevas posibilidades: el mejor manejo de memoria hacen posible la exploración de datos más grandes, la interacción con los datos y anotaciones (clínicas y genómicas) facilitan la comprensión de las interrelaciones de los datos. JHeatmap es una solución de heatmaps interactivos analogica a Gitools, pero diseñada como modulo para tecnologías web. Así es posible ofrecer y comunicar datos de una complejidad considerable al resto de la comunidad científica de manera rápida, telematizada y eficaz. El desarrollo de SVGMap permite que un científico traduzca sus datos a un gráfico que pueda representar su modelo biológico. El servidor se encarga de organizar los datos y la interfaz deja elegir los datos que se traducen a la imagen y facilitar su interpretación. Gonzalez-Perez, A. et al., 2013. IntOGen-mutations identifies cancer drivers across tumor types. Nature Methods, 10(11), pp.1081¿1082. Gundem, G. et al., 2010. IntOGen: integration and data mining of multidimensional oncogenomic data. Nat Meth, 7(2), pp.92¿93. Hanahan, D. & Weinberg, R.A., 2011. Hallmarks of Cancer: The Next Generation. Cell, 144(5), pp.646¿674. Hanahan, D. & Weinberg, R.A., 2000. The hallmarks of cancer. Cell, 100(1), pp.57¿70. Hudson, T.J. et al., 2010. International network of cancer genome projects. Nature, 464(7291), pp.993¿998. Perez-Llamas, C. & Lopez-Bigas, N., 2011. Gitools: Analysis and Visualisation of Genomic Data Using Interactive Heat-Maps. PLoS ONE, 6(5), p.e19541. Schroeder, M.P., Gonzalez-Perez, A. & Lopez-Bigas, N., 2013. Visualizing multidimensional cancer genomics data. Genome Medicine, 5(1), p.9. The Cancer Genome Atlas Research Network et al., 2013. The Cancer Genome Atlas Pan-Cancer analysis project. Nature Genetics, 45(10), pp.1113¿1120.