Que Es Datawarehouse

8
¿Que es Datawarehouse? Un Datawarehouse es una base de datos relacional que está diseñado para la consulta y análisis de datos. La ventaja principal de este tipo de sistemas se basa en su concepto fundamental que es la estructura de la información. Este concepto significa el almacenamiento de información homogénea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales. Este además de una base de datos relacional, es un entorno de almacenamiento de datos que incluye una solución de extracción, transporte, transformación y carga (ETL), un procesamiento analítico en línea del motor (OLAP), herramientas de análisis de clientes y otras aplicaciones que gestionan el proceso de recopilación de datos y la entrega a los usuarios de negocios. Modelo Inmon En el paradigma de Bill Inmon se ve la necesidad de transferir la información de los diferentes sistemas transaccionales de las organizaciones a un lugar centralizado donde los datos pueden ser utilizados para el análisis. También le añade 4 características importantes a su paradigma, las cuales son: 1. Orientado a temas: Los datos en la base de datos están organizados de tal manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí. 2. Integrado: La base de datos contiene los datos de todos los sistemas operacionales de la organización, y dichos datos deben ser consistentes. 3. No volátil: La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura, y se mantiene para futuras consultas.

description

Que es dw

Transcript of Que Es Datawarehouse

Que es Datawarehouse?Un Datawarehouse es una base de datos relacional que est diseado para la consulta y anlisis de datos. La ventaja principal de este tipo de sistemas se basa en su concepto fundamental que es la estructura de la informacin. Este concepto significa el almacenamiento de informacin homognea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales.Este adems de una base de datos relacional, es un entorno de almacenamiento de datos que incluye una solucin de extraccin, transporte, transformacin y carga (ETL), un procesamiento analtico en lnea del motor (OLAP), herramientas de anlisis de clientes y otras aplicaciones que gestionan el proceso de recopilacin de datos y la entrega a los usuarios de negocios.Modelo InmonEn el paradigma de Bill Inmon se ve la necesidad de transferir la informacin de los diferentes sistemas transaccionales de las organizaciones a un lugar centralizado donde los datos pueden ser utilizados para el anlisis. Tambin le aade 4 caractersticas importantes a su paradigma, las cuales son:1. Orientado a temas: Los datos en la base de datos estn organizados de tal manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s.2. Integrado: La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes.3. No voltil: La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas.4. Variante en el tiempo: Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.La informacin debe de estar muy bien detallada ya que los Datawarehouse departamentales o datamarts son tratados como subconjuntos de este Datawarehouse corporativo, que son construidos para cubrir todas las necesidades individuales de anlisis de cada departamento.

Modelo KimballUn Datawarehouse es una mezcla de todos los Datamarts dentro de una empresa, siendo una copia de los datos transaccionales estructurados de una forma muy especial para el anlisis, el Modelo Dimensional no normalizado incluye las dimensiones de anlisis y sus atributos, su organizacin jerrquica, as como los diferentes hechos de negocio que se quieren analizar. Que por un lado tenemos tablas para las representar las dimensiones y por otro lado tablas para los hechos. Los diferentes Datamarts estn conectados entre s por la llamada Busstructure, que contiene los elementos antes mencionados a travs de las dimensiones conformadas que permiten que los usuarios puedan realizar querys conjuntos sobre los diferentes datamarts, pues este bus contiene los elementos en comn que los comunican. Una dimensin conformada puede ser, por ejemplo, la dimensin cliente, que incluye todos los atributos o elementos de anlisis referentes a los clientes y que puede ser compartida por diferentes datamarts.

Esto tambin se referencia comoBottom-up, pues al final el Datawarehouse Corporativo no es ms que la mezcla de los diferentes datamarts que estn estructurados de una forma comn a travs de la busstructure., esta caracterstica le hace ms flexible y sencillo de implementar, pues podemos construir un Datamart como primer elemento del sistema de anlisis, y luego ir aadiendo otros que comparten las dimensiones ya definidas o incluyen otras nuevas dimensiones.

Diseo ETLLos procesos de Extraccin, Transformacin y Carga constan de mltiples pasos, cuyo objetivo es transferir datos desde las aplicaciones de produccin a los sistemas de Inteligencia de negocio.Extraer: Esta es la primera parte del proceso ETL y consiste en extraer los datos desde los sistemas de origen. La mayora de los proyectos de almacenamiento de datos fusionan datos provenientes de diferentes sistemas de origen.La extraccin convierte los datos a un formato preparado para iniciar el proceso de transformacin.Una parte intrnseca del proceso de extraccin es la de analizar los datos extrados, de lo que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se esperaba. De no ser as los datos son rechazados.Transformar: La fase de transformacin aplica una serie de reglas de negocio o funciones sobre los datos extrados para convertirlos en datos que sern cargados. Algunas fuentes de datos requerirn alguna pequea manipulacin de los datos.Cargar: La fase de carga es el momento en el cual los datos de la fase anterior (transformacin) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organizacin, este proceso puede abarcar una amplia variedad de acciones diferentes. En algunas bases de datos se sobrescribe la informacin antigua con nuevos datos. Los datawarehouse mantienen un historial de los registros de manera que se pueda hacer una auditora de los mismos y disponer de un rastro de toda la historia de un valor a lo largo del tiempo.Qu es SGBD?Se puede definir el Sistema de Gestin de la Base de Datos (SGBD) como un conjunto coordinado de programas, procedimientos, lenguajes, etc. Que suministra a los distintos tipos de usuarios los medios necesarios para describir y manipular los datos almacenados en la base, garantizando su seguridad.Las operaciones tpicas que debe realizar un SGBD pueden resumirse en aquellas que afectan a la totalidad de los datos o a todos los registros de un determinado tipo y las que tienen lugar sobre registros concretos.Las funciones esenciales de un SGBD son las de descripcin, manipulacin y control.Qu BD Relacional?Conjunto de informacin relacionada entre s, referente a un tema o propsito en particular. Los registros de los empleados, las listas de posibles clientes y suministradores constituyen una base de datos.Qu BD Multidimensional?Una base de datos multidimensional, es aquella que almacena sus datos con varias dimensiones, es decir que en vez de un valor, encontramos varios dependiendo de los "ejes" definidos o una base de datos de estructura basada en dimensiones orientada a consultas complejas y alto rendimiento.Las bases de datos multidimensionales se utilizan principalmente para crearaplicacionesOLAP y pueden verse como bases de datos de una solatabla, su peculiaridad es que por cada dimensin tienen un campo (o columna), y otro campo por cada mtrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma: (d1,d2,d3,...,f1,f2,f3,...) Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las mtricas o hechos que se quierealmacenar, estudiar o analizar.Cognos Business IntelligenceIBM Cognos Business Intelligence convierte los datos en vistas del pasado, el presente y el futuro de las operaciones y el rendimiento de su organizacin de modo que los responsables de tomar decisiones puede aprovechar las oportunidades y minimizar los riesgos.Oracle Business IntelligenceOracle Business Intelligence Standard Edition One est diseado para departamentos o empresas con entre 5 y 50 usuarios. Fcil de instalar y configurar, Oracle Business Intelligence Standard Edition One es la solucin ideal hasta para el ms reducido de los presupuestos.Business ObjectsSAP Business Objects es la solucin de Inteligencia de Negocios ideal para las empresas que desean mejorar sus procesos de negocios y obtener una ventaja diferencial frente a la competencia. Incluye herramientas desde la generacin de reportes, consultas ad hoc, anlisis con absoluta flexibilidad, dashboards, integracin con Microsoft Office y Share Point, as como integracin de datos y control de calidad de los mismosMicroStrategyMicroStrategy, lder global en tecnologa Business Intelligence, proporciona software integrado de informes, anlisis y supervisin que permite a las empresas analizar los datos que tienen almacenados para tomar mejores decisiones empresariales. Muchas empresas eligen MicroStrategy debido a su facilidad de uso, sus anlisis sofisticados y una ptima escalabilidad de datos y de usuarios.QlikViewQlikViewes la herramienta de Anlisis de Informacin, que provee a los usuarios de indicadores personalizados que Incrementan la Productividad basados en la Correcta toma de Decisiones. Se ha convertido en producto lder en el mercado en cuanto al anlisis de informacin siendo la plataforma de Inteligencia de Negocio (Business Intelligence) con mayor crecimiento en el mundo.SaS Business IntelligenceProporcionan capacidades de inteligencia de negocios de autoservicio de fcil uso y la implementacin de analtica en tiempo real directamente en dispositivos mviles y aplicaciones de Microsoft. De modo que toda persona que toma decisiones (donde quiera que se encuentren) pueda monitorear mtricas clave y tomar decisiones informadas. Y caractersticas tales como gobernabilidad, metadatos centralizados y escalabilidad que la hacen adecuada tambin para la Tecnologa de Informacin de las empresas.MicrosoftLos clientes pueden construir estas soluciones de BI modernas en las instalaciones que utilizan SQL Server, SharePoint y Excel o simplemente suscribirse al Poder BI para Office 365 y dejar que Microsoft gestionar la infraestructura para ellos, para que puedan centrarse en el desbloqueo de nuevos conocimientos.5 ERPs comercialesMicrosoft Dynamics AXMicrosoft Dynamics AXes la solucin global ERP que aporta a las empresas unabase expresamente diseada bsicamente para cinco sectores, junto confuncionalidades habituales de ERPcompletas y bsicas para la gestin de finanzas, recursos humanos y operaciones.ICGManagerSoftwre ICG MANAGER es una herramienta que incluye todas las funcionalidades para gestionar y controlar toda la informacin de la empresa de una manera ordenada, segura y fiable.SPAREWEBGATESoftware SPAREWEBGATEes la solucin ERP sobre IBM Power System diseada para englobar todos los circuitos de front office y back office.SPAREWEBGATEpara ayudarlas a hacer ms eficientes sus procesos y reducir costes, con la garanta de la robusta arquitectura IBM Power System.Apolo eVOLUTIONSoftware Apolo eVOLUTIONes una solucin modular que funciona independiente de la base de datos para controlar la gestin empresarial.Apolo eVOLUTION es una herramienta flexible y totalmente parametrizable por lo que permite incorporar las funcionalidades concretas que necesita la empresaApolo eVOLUTIONofrece un elevado nivel de parametrizacin, para adaptarse a los procesos empresariales.ALFAWSSoftware ALFAWSes la solucin ERP dirigida a pequeas y medianas empresal diseada para facilitar y agilizar la gestin empresarial.