Recuperación de Información para la Web de las Cosas

  1. Manta Caro, Héctor Cristyan
Dirigida por:
  1. Juan Manuel Fernández Luna Director

Universidad de defensa: Universidad de Granada

Fecha de defensa: 24 de abril de 2023

Tipo: Tesis

Resumen

La Internet y las tecnologías Web han evolucionado notablemente desde su conceptualización, cambiando nuestras vidas y la sociedad en numerosos aspectos. La creación de la Red de Redes y la World Wide Web (www) han además posibilitado una base tecnológica crucial para el progreso de la sociedad digital y la construcción de las ciudades inteligentes. Hoy en día, emergen nuevos paradigmas que enmarcan una nueva era, el de la Internet y la Web de las Cosas. Esto se debe a la posibilidad de interconectar a la Internet no solamente dispositivos tradicionales como lo son los teléfonos inteligentes, los ordenadores portátiles, la computación de tipo móvil y ubicua, sino también cualquier objeto en el mundo real. Esta hiperconexión de objetos animados o inanimados en el mundo real ofrece además la posibilidad de publicar servicios de tipo Web sobre estos objetos con la finalidad de proveer contenido altamente dinámico y datos en tiempo real a los usuarios finales acerca del estado o las acciones permitidas sobre estos. En la actualidad, la Internet de las Cosas (IoT) engloba alrededor de 12 mil millones de dispositivos interconectados, y se esperan unos 16.5 mil millones para 2025 y más de 25 mil millones de cosas para el 2030. El IoT describe tecnologías y disciplinas de investigación que habilitan a la Internet adentrarse en el mundo real de objetos físicos que se interconectan transparentemente y adoptan cierta inteligencia. A través de IoT se obtiene información sobre propiedades, estados y características de las cosas para así accionar sus funcionalidades de forma telemática. La Web de las Cosas (WoT) propone la abstracción de entidades del mundo real en una especie de “avatar” Web virtual o "gemelo" Web inteligente, con el fin de adquirir, procesar y presentar información en tiempo real en relación con este avatar y con la capacidad de conectarse y controlar cosas en el mundo real a través de este. De estos paradigmas complementarios puede surgir una nueva generación de servicios, y muchos de estos también apoyados en la infraestructura de las nuevas redes 5G y 6G. Uno de ellos, crucial para nuestra interacción diaria con este nuevo ciber mundo inteligente, es la Recuperación de Información (RI), principalmente en la forma de motores de búsqueda, que también puede evolucionar hacia herramientas mucho más poderosas. Estos sistemas proporcionarán la capacidad de encontrar información relevante y pertinente sobre las cosas en el mundo real a través de sus abstracciones. Sobre esta base, debe definirse una nueva arquitectura de este tipo de servicios con la sinergia y los desafíos que ambos IoT y WoT imponen, debido a su colosal tamaño e inaudito dinamismo. Desde lo fundamental, los simuladores son una herramienta esencial para investigar y desarrollar nuevos sistemas, arquitecturas o protocolos. Los simuladores han jugado un papel clave en la historia, impulsando el desarrollo de Internet y la Web y sus componentes. Este documento destaca la opinión acerca que la investigación basada en la simulación continuará participando en la evolución de los paradigmas asociados con el IoT y WoT, así como de los sistemas de RI. La aparición de tales paradigmas implica una redefinición, reconstrucción hacia la evolución de los sistemas RI actuales, enfrentando así los nuevos desafíos. Por consiguiente, es esencial desarrollar modelos abstractos de representación Web por medio de la simulación para establecer nuevos enfoques en RI para WoT. Y así construir mecanismos de experimentación y validación de estos enfoques por medio de colecciones sintéticas dinámicas que mimeticen el comportamiento WoT por medio de simulación. Existe aún un desafío latente debido a la heterogeneidad de propuestas que han surgido en el modelado y concepción misma en la arquitectura de WoT, en diferentes niveles, desde el mecanismo de representación Web, el lenguaje de descripción de cosas, hasta el enriquecimiento semántico alrededor de WoT. Todos estos niveles heterogéneos tienen un impacto directo en la construcción de los sistemas RI comúnmente presentados en la forma de motores de búsqueda para IoT o WoT, donde podrían tomarse diferentes direcciones para resolver los problemas de adaptabilidad a WoT para un campo particular de aplicación vía la especialización del sistema RI, su generalización. En cuanto a los principios y arquitectura RI no se evidencia un estudio a profundidad de las técnicas y estrategias de los sistemas RI en su idoneidad y adaptabilidad, dadas las características de dinamismo de la WoT, considerando los requerimientos que impone y los desafíos esperados. En este trabajo doctoral se describe: Una propuesta para modelarWoT basada en una representación XML estructurada. Este modelo ha sido diseñado con flexibilidad y modularidad para permitir la representación de múltiples escenarios, siendo la fuente conceptual para el futuro desarrollo de sistemas RI. Un simulador de eventos discretos, nombrado SIM.WoT cuyo objetivo final es encapsular las dinámicas esperadas de la WoT para el desarrollo de sistemas de RI. El simulador genera una colección sintética de documentos XML en tiempo real que contienen contextos espacio-temporales e información textual con dimensiones altamente dinámicas. El simulador se caracteriza por su flexibilidad y versatilidad para representar escenarios del mundo real y ofrece una perspectiva única para la RI. Una propuesta de RI para la WoT que contempla las etapas claves de indexación, puntuación y presentación, denominada IR.WoT. Se describen en este trabajo las consideraciones de diseño, implementación en la nube y experimentación con base en una colección de documentos XML sintética a partir de simulación. Un estudio de adaptabilidad de los paradigmas y conceptos de la RI convencional al contexto de la WoT en la forma de una Revisión Sistemática de Literatura (RSL) y actualización del estado del arte a 2022. Construcción de un Dataset abierto que como resultado de la RSL contiene los datos y análisis de los motores de búsqueda y de los mecanismos de RI para la IoT y WoT en la literatura científica. Un reporte de experimentación de las etapas de indexación y recuperación en una propuesta de motor de búsqueda IR.WoT junto con una propuesta de evaluación. Finalizando con un análisis de resultados, recomendaciones con base en los resultados experimentalers, conclusiones y trabajo futuro.