Desarrollo de algoritmos para la estructuración dinámica de información y su aplicación a la detección de sucesos

  1. PONS PORRATA, AURORA
Supervised by:
  1. Rafael Berlanga Director
  2. Jose Ruiz Shulcloper Co-director

Defence university: Universitat Jaume I

Fecha de defensa: 21 June 2004

Committee:
  1. José M. Iñesta Quereda Chair
  2. María José Aramburu Cabo Secretary
  3. Paolo Rosso Committee member
  4. Maria Jose Alfonseca Cabo Committee member
  5. José Samos Jiménez Committee member

Type: Thesis

Teseo: 106702 DIALNET

Abstract

La motivación fundamental de esta tesis es el problema de la detección de tópicos, cuyo objetivo es identificar en un flujo continuo de noticias, aquéllas que pertenecen a un nuevo tópico o a uno conocido previamente. En el trabajo se presenta un sistema de detección de tópicos en línea, denominado JERARTOP, que va más allá de un sistema tradicional de detección, ya que permite identificar no sólo los tópicos presentes en un flujo de noticias sino también los posibles sucesos más pequeños que ellos comprenden. Este sistema clasifica, además, en un conjunto de temáticas pre-definidas a cada tópico detectado y proporciona un resumen de los contenidos asociados en cada uno de ellos. Con este fin, se proponen tres nuevos algoritmos de agrupamiento incrementales: Compacto Incremental, Fuertemente Compacto Incremental y Jerárquico Incremental que construyen grupos disjuntos, solapados y jerarquías de grupos respectivamente. Estos algoritmos permiten la manipulación de objetos mezclados, no imponen restricciones a la función de semejanza ni a la forma de los grupos y son independientes del orden de presentación de los objetos. Además se propone un método de construcción automática de resúmenes a partir de una partición de conjuntos de documentos. Nuestro método emplea el cálculo de los testores típicos como su operación primaria y, a partir de ellos, construye el resumen de cada grupo.