YAM^2a multidimensional conceptual model
- Abelló Gamazo, Albert
- Fèlix Saltor Soler Director
- José Samos Jiménez Director
Defence university: Universitat Politècnica de Catalunya (UPC)
Fecha de defensa: 04 October 2002
- Antoni Olivé Ramon Chair
- Ernest Teniente López Secretary
- Pedro Blesa Pons Committee member
- Juan Trujillo Mondéjar Committee member
- Mohand-Said Hacid Committee member
Type: Thesis
Abstract
ABRSTRACT<br><br> This thesis proposes YAM^2, a multidimensional conceptual model for OLAP(On-Line Analytical Processing). It is defined as an extension of UML (Unified Modeling Language). The aim is to benefit from Object-Oriented concepts and relationships to allow the definition of semantically rich multi-star schemas. Thus, the usage of Generalization, Association, Derivation, and Flow relationships (in UML terminology) is studied.<br> An architecture based on different levels of schemas is proposed and the characteristics of its different levels defined. The benefits of this architecture are twofold. Firstly, it relates Federated Information Systems with Data Warehousing, so that advances in one area can also be used in the other. Moreover, the Data Mart schemas are defined so that they can be implemented on different Database Management Systems, while still offering a common integrated vision that allows to navigate through the different stars.<br> The main concepts of any multidimensional model are facts and dimensions. Both are analyzed separately, based on the assumption that relationships between aggregation levels are part-whole (or composition) relationships. Thus, mereology axioms are used on that analysis to prove some properties.<br> Besides structures, operations and integrity constraints are also defined for YAM^2. Due to the fact that, in this thesis, a data cube is defined as a function, operations (i.e. Drill-across, ChangeBase, Roll-up, Projection, and Selection) are defined over functions. Regarding the set of integrity constraints, they reflect the importance of summarizability (or aggregability) of measures, and pay special attention to it.<br><br> ------------------------- <br><br> RESUMEN<br><br> Esta tesis propone YAM^2, un modelo conceptual multidimensional para OLAP (On-Line Analytical Processing). Éste se define como una extensión de UML (Unified Modeling Language). La intención es beneficiarse de los conceptos y relaciones de la Orientación a Objetos para permitir la definición de esquemas multi-estrella semánticamente ricos. Así, se estudia la utilización de relaciones de tipo Generalization, Association, Derivation, y Flow (en terminología UML).<br> Se propone también una arquitectura basada en diferentes niveles de esquemas, y se estudian las características de cada uno de esos niveles. De esta arquitectura se obtienen dos beneficios. Primeramente, relaciona los Sistemas de Información Federados con los Almacenes de Datos, de manera que los avances en una de las áreas se puedan utilizar en la otra. Además, los esquemas de los Almacenes de Datos Departamentales son definidos de forma que estos se pueden implementar sobre diferentes Sistemas de Gestión de Bases de Datos, al mismo tiempo que ofrecen una visión común e integrada, que permite navegar entre las diferentes estrellas.<br> Los principales conceptos de cualquier modelo multidimensional son los hechos y las dimensiones. Ambos son estudiados de forma independiente, basado en la asunción de que las relaciones entre los niveles de agregación son de tipo parte-todo (o composición). Así, los axiomas de la mereología son utilizados en ese análisis para demostrar algunas propiedades.<br> Juntamente con las estructuras, operaciones y restricciones de integridad son también definidas para YAM^2. Debido al hecho de que, en esta tesis, un cubo de datos es definido como una función, la operaciones (Drill-across, ChangeBase, Roll-up, Projection, y Selection) son definidas sobre funciones. Respecto al conjunto de restricciones de integridad, estas reflejan la importancia de la sumarizabilidad (o agregabilidad) de las medidas, y presta especial atención a ello.<br><br> -------------------------- <br><br> RESUM <br><br> Aquesta tesi proposa YAM^2, un model conceptual multidimensional per OLAP (On-Line Analytical Processing). El model es defineix com una extensió d'UML (Unified Modeling Language). La intenció és aprofitar conceptes i relacions de la Orientació a Objectes per permetre la definició d'esquemes multi-estrella semànticament rics. Així, s'estudia la utilització de relacions del tipus Generalization, Association, Derivation, i Flow (utilitzant la terminologia d'UML).<br> Es proposa una arquitectura basada en diferents nivells d'esquemes i es defineixen les característiques dels nivells. Els beneficis d'aquesta arquitectura tenen dues vessants. Primerament, relaciona els Sistemes d'Informació Federats amb els Magatzems de Dades, de manera que els avenços en els primers es puguin utilitzar en els segons. A més, els Magatzems de Dades Departamentals es defineixen de manera que es puguin implementar en Sistemes Gestors de Bases de Dades diferents, al mateix temps que ofereixen una visió integrada que permet navegar a través de diferents estrelles.<br> Els principals conceptes de qualsevol model multidimensionals són els fets i les dimensions. Ambdós són analitzats de forma separada, basat en l'assumpció que les relacions entre els nivells d'agregació són de tipus part-tot (o composició). Així, els axiomes de la mereologia són utilitzats en l'anàlisi per provar algunes propietats.<br> Juntament amb les estructures, operacions i restriccions d'integritat han estat definides per YAM^2. Degut al fet que, en aquesta tesi, un cub de dades es definit com una funció, les operacions (Drill-across, ChangeBase, Roll-up, Projection, i Selection) són definides sobre funcions. Respecte al conjunt de restriccions d'integritat, aquestes reflecteixen la importància de la sumaritzabilitat (o agregabilitat) de les mesures, i paren especial atenció a ella.