Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura...
-
Upload
dionisio-armendariz -
Category
Documents
-
view
21 -
download
2
Transcript of Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura...
![Page 1: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/1.jpg)
Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo a factores de negocio seleccionados, proveyendo el mecanismo para la rápida y uniforme tiempo de respuesta de las complejas consultas. Estos datos organizados en Cubos, son la materia prima que el DataWare House almacena.
![Page 2: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/2.jpg)
![Page 3: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/3.jpg)
Es sin duda, la más sencilla y común, consiste en realizar una sumarización o resumen de todas las transacciones comprendidas en el período de tiempo seleccionado y transportar el resultado como una única transacción hacia el DW.
![Page 4: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/4.jpg)
El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo. Con lo que se consigue una carga de datos en etapas que están entrelazadas por los datos en tiempo y pueden depender una de otras.
![Page 5: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/5.jpg)
COLECCIÓN DE DATOSDimensiones Variables
![Page 6: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/6.jpg)
Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de análisis de las variables (forman parte de la tabla de dimensiones). Son catálogos de información complementaria necesaria para la presentación de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la información general complementaria a cada uno de los registros de la tabla de hechos.
![Page 7: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/7.jpg)
También llamadas “indicadores de gestión”, son los datos que están siendo analizados. Forman parte de la tabla de hechos. Más formalmente, las variables representan algún aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numéricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a la variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones poseen una granularidad menor, tomando como valores un conjunto de elementos menor que el de las variables; ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas), “el tiempo” (medido en días, horas, semanas, etc.), ...
![Page 8: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/8.jpg)
construir un cubo de información sobre el indice de ventas (variable a estudiar) en función del producto vendido, la provincia, el mes del año y si el cliente está casado o soltero (dimensiones). Tendríamos un cubo de 4 dimensiones.
![Page 9: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/9.jpg)
•Beneficios•Gastos•Ventas
•producto (diferentes tipos o denominaciones de productos)•localidades (o provincia, o regiones, o zonas geográficas)•tiempo (medido de diferentes maneras, por horas, por días, por meses, pr años, ...)•tipo de cliente(casado/soltero, joven/adulto/anciano, ...)
![Page 10: Son subconjuntos de datos de un almacén de datos, organizado y sumarizado dentro de una estructura multidimensional. Los datos se sumarizan de acuerdo.](https://reader034.fdocuments.mx/reader034/viewer/2022051109/54a34180a95467c80c8b47b6/html5/thumbnails/10.jpg)
#. Son elementos claves en OLAP (Online Analytic Processing), una tecnología que provee rápido acceso a datos en un almacén de datos (DWH).#. Proveen un mecanismo para buscar datos con rapidez y tiempo de respuesta uniforme independientemente de la cantidad de datos en el cubo o la complejidad del procedimiento de búsqueda.#. Para definir un Cubo, se selecciona una o varias clases objetivo y se seleccionan las medidas (Campos de interés a los usuarios del cubo) dentro de esta clase.#.. Las dimensiones están compuestas de uno o mas campos de otra clase. Las dimensiones proveen la descripción categórica por el cual las medidas son separadas para su análisis por los usuarios del cubo.#. Las dimensiones son categorías descriptivas por los cuales los datos numéricos (Dimensiones) en un cubo, son separados para su análisis.#. Las medidas, son datos numéricos de interés primario para los usuarios del cubo.