resumen inteligencia de negocios
-
Upload
insertcoinapps -
Category
Documents
-
view
15 -
download
1
description
Transcript of resumen inteligencia de negocios
Objetivos solucin BIDisponer de una infraestructura que permita a los decisores obtener la informacin que necesitan. Decisores pueden estar en niveles superiores u operativos. Tambin podra darse a externos como valor agregado.
En cuanto a la info, importa su contenido, que sea correcta, la oportunidad (en el momento requerido para tomar la decisin) y el formato y los estilos de exploracin, segn el grado de detalle que se busque.
Que la organizacin haga uso eficaz de la infraestructura.Requisito que el fin sea tomar una decisin para que sea til.
La empresa no tiene una base de datos que integre los datos de la compaa. DW: Un tipo de base de datos ms herramientas (aplicaciones, tableros, anlisis multidimensional, reportes) que trabajan contra el DW.reas de trabajo: Construccin de la solucin Analisis del negocio: Relevamiento, entender el alcance, planificacin y el diseo de la info que se requiere.
Desarrollo del DW: Formalizar fuentes de datos, procesos de extraccin, transformacin y carga.
Desarrollo del entorno de exploracin: construir metadatos y herramientas de usuarios Implementacin de la solucin: implementacin de hw y sw y la dinmica con los usuarios.
Beneficios esperadosPara la organizacin Aumentar el potencial de los datos almacenados
Aumentar la calidad de la toma de decisiones
Unificar conceptos de negocios en toda la institucin
Visualizar la realidad organizacional en forma integrada
Para los usuarios Disminuir el tiempo dedicado a elaborar la info, permitiendo dedicar mayor tiempo al anlisis.
Disponer de una fuente nica y confiable.
Aumentar la autonoma y facilidad para acceder a la informacinPara el rea de Tecnologa de la informacin Mayor capacidad para dar respuesta a las necesidades de informacin
Menor intervencin en el da a da. DecisionesProceso mental deliberado, voluntario, sistemtico, racional. Puede haber racionalidad limitada. Soluciones realistas. Se establecen, analizan y evalan alternativas con el fin de seleccionar solo una.
Decisor (sist. Sujeto) afectado por condicionamientos, informacin y conocimiento decide para modificar el universo (sist. Objeto). Trae consecuencias.
Dato info conocimiento decisin accin
El dato se procesa, el sujeto le da valor en un determinado contexto. El conocimiento es el paso siguiente a la informacin, entiendo qu pasa y cmo accionar contra eso, entiendo que accin debo tomar.
Proceso decisorioInteligencia diseo eleccin revisinDetectar problema, desarrollar alternativas, seleccin de un curso de accin, implementar curso de accin y evaluar la eleccin y sus consecuencias.
Clases de decisiones segn:Programacin Programada: Otorgar descuento a partir de cierto monto Habito, procedimientos operativos estndar, estructura organizativa. Aporte de TI: automatizacin de procedimientos administrativos a travs de sistemas de procesamiento de transacciones.
No programada: Cambiar de rubro comercial Criterio, intuicin y creatividad. Reglas empricas, seleccin y entrenamiento de ejecutivos. Aporte TI: Brindar infraestructura tecnolgica para proveer de la informacin para la toma de decisiones. IA y Tecnicas heursticas para la solucin de problemas.Reversibilidad Reversible: Tercerizar el servicio de limpieza
Irreversible o poco reversible: Trasladarse a otro pas
Plazo de efectos futuros: Corto o largo plazo
Impacto o alcance Bajo o alto
Jerarqua Inferior
Superior
Centralizacin y descentralizacinCentralizacin: La autoridad para la toma de decisiones se concentra en los niveles superiores.Descentralizacin: La autoridad para la toma de decisiones se traslada a niveles inferiores.
Decisiones mientras mas arriba en la pirmide:Poco programables, difciles de revertir, efectos a mediano y largo plazo, impacto mltiple, jerarqua superior.
Info: Ad hoc, resumida, ocasional, externa e interna, integral.
Decisiones abajo en la pirmide: Programables, fciles de revertir, efectos a corto plazo, impacto nico, jerarqua inferior.
Info: especificada con anterioridad, detallada, frecuente, interna, especfica.
Monitoreo - Managers: Info grafica, BI: Tableros Anlisis lnea media: Info agregada. BI anlisis multidimensional, datamining,
Detalle trabajadores operativos: Info detallada. BI: ReportingOLTP OLAP (Online Transactional / Analytical processing)OLAP: Herramienta de anlisis multidimensionalOLTP: Sistemas transaccionales operacionales.
Caractersticas transacciones: Actualizan y/o consultan un conjunto de pocos registros.
Alto nivel de concurrencia de las transacciones que consultas y actualizan. Actualizacin y consultas on-line, que deben tener una respuesta instantnea para no trabar las operaciones de la organizacin.
Reciben muchas transacciones de pocos registros, alto desempeo en el acceso a los registros y su actualizacin. Alta disponibilidad
Normalizadas, para favorecer la actualizacin en lnea y disminuir la probabilidad de inconsistencias que podran generarse.
Indices que favorezcan la actualizacin en lnea (ndices b+)
Incluyen mtodos de recuperacin y protocolos de control de ocncurrencia que aseguren la consistencia de la base de datos ante fallos y actualizaciones concurrentes
Los tres problemas del OLTPInformacin no integrada, inadecuados tiempos de respuesta, consultas ad-hoc no amigables y la inexistencia de herramientas.Los datos que representan la realidad de la organizacin se encuentran muchas veces dispersos. Tienen diseos conceptuales y fsicos independientes entre s. Diferentes visiones de una misma realidad entre los decisores de la org. Imposibilidad de obtener informacin integrada que permita comparar, clasificar y consolidar la informacin de las distintas reas, sectores, procesos para analizar a la organizacin como un todo.
Se puede entorpecer el nivel de respuesta de los sist de nivel operativo, debido al uso intensivo de los recursos que genera el procesamiento de las consultas para la toma de decisiones.Poder acceder a la informacin sin necesitar conocimientos profundos sobre el uso de la tecnologa. Si existen los problemas 1 y 2 (descentralizacin de la bd e inadecuados tiempos de respuesta) el DW es la solucin. Si existe el problema 3, se debe explorar las tecnologas de BI.
Reporte: Formato especfico para impresin. Principalmente nmeros.Analisis multidimensional: Visin flexible y menos estructurada con selectores que combinen distintas vistas del mismo cubo, con la posibilidad de navegar, cambiar filtros, dril down/up.
Dashboard: combinando grilla, grficos e indicadores grficos con filtros pre definidos.
Como trabajar el rea de anlisis del negocio
Necesidades vs datos existesntes. Anlisis de las necesidades de info, alcance, formalizar datos existentes, necesidades de info, diseo del data warehouse.
Generar una relacin con los usuarios (niveles superiores) desde el inicio, pensando en la implementacin. Debe dedicarse mucho tiempo a esta relacin y resistirse a avanzar sin ellos.Desarrollo del entorno de exploracinDefinicin de metadatos Construir las dimensiones: jerarquas y atributos
Construir mtricas e indicadores Realizar pruebas internas de navegacin y calidad de datos.
Diseo de los front-end Esquema y look and feel
Construir los reportes y dems salidas bsicas de acceso
Realizar pruebas internas
Implementacin de la solucinUsuarios Capacitacin y exploracin conjunta, ajustes finales y soporte.
Tecnologa Diseas la infraestructura tecnolgica
Relevar y documentar requerimientos de la arquitectura
Diseo modelo de arquitectura de alto nivel.
Seleccin de productos
Determinar fases para implementar arquitectura
Implantar la infraestructura
Configurar el hardware
Instalacin y configuracin del software
Puesta a punto de la arquitectura y solucin Pasaje a produccin
El DW Integra datos de los distintos sistemas OLTP Incorpora datos externos para analizar variables del entorno
Incorpora datos histricos que no existan en los sistemas OLTP (por ventana operacional y/o update de datos)
El diseo y administracin de la base de datos pensado para un procesamiento OLAP eficiente:
Guardar datos pre calculados
Indices que optimicen este tipo de consultas
Estructuras de datos redundantes Independizar la base de datos de la alta concurrencia del OLTP Posibilita diseos que faciliten su exploracin por parte de los usuarios
Criterios de diseo Construccin iterativa e incremental
Basada en un modelo de datos unificado que sea el roadmap de todo el desarrollo Redundancia Para mejorar la performance Diseo relacional y multidimensional El segundo suele estar apuntado a necesidades de info. Pueden convivir
Granularidad
Alta o baja
RedundanciaPropiedadEfectos
Base OLTPDW
Acelerar consultas con datos precalculadosOO
Mayor tiempo en actualizacin de datosXX
Mayor probabilidad de generar inconsistenciasXX
Mejorar controlesOO
Espacio de almacenamientoXX
Caracteristicas:
Inmon: Orientado a temas, integrados, no voltiles, histricos.
EL ODS: Operational data storeBase de datos complementaria: pretende lograr alta performance de acceso, cuando el DW no puede darlo.Integrada, ambiente separado al operacional, para realizar procesamiento analtico (OLAP).
Datos corrientes, no histricos. Datos pre calculados de la historia del DW.
Puede ser real time con pequeas actualizaciones de poco tiempo.Inmon vs KimballDW vs Data Mart. Foco en la integracin de los datos vs explorar informacin desde las necesidades del negocio.Area de trabajo -> dw objetivo -> dw subjetivo -> data marts
Area de trabajoRestringida solo al equipo de desarrollo de ETL.
Tomar los datos de los OLTP tal cual estn: minimiza el tiempo de acceso, si falla el proceso no es necesario volver a ingresar a los OLTP.DW ObjetivoCopia de datos de los sistemas OLTP, generar una base de datos OLTP integradas, no es el ODS de Inmon. Mismo nivel de desagregacin. Puede omitir algunos atributos. Los cambios al ETL se realizan por cambios en los sistemas OLTP, no por las necesidades de informacin.
Objetivo buscado del dw objetivo Generar reportes operativos Permitira actualizacin en tiempo real No estar focalizado en las necesidades de areas de usuarios en particular.
No es necesario realizar ETL de integracin ante nuevas necesidades de informacin
DW SubjetivoSe organizan los datos en funcin a la exploracin de la informacin. Modelo dimensional: tablas de hechos y dimensiones.Objetivo buscado del dw subjetivo Armar tantas tablas de hechos como necesiten los anlisis de informacin dimensionales Realizar distintas construcciones en base a los mismos datosIntegracin de datos: ETLEs pasaje de datos simplemente? No. Ajusta las multiples fuentes de datos, proporciona medidas sobre la calidad y confianza en los datos. Elimina errores, corrige faltantes de ser posible, estructura los datos para ser usados por herramientas de usuario final, documenta los flujos de datos que alimentan el DW.ETL: ProblemticaLas aplicaciones transaccionales fueron pensadas en sus propios requerimientosEsquemas heterogneos, codificacin divergente, Datos redundantes, distintas tecnologas, calidades de datos heterogneas.Distintas unidades de medida, mismo nombre y diferente contenido, criterios sintcticos o semnticos diversos. Mismo dato con distintas identificaciones en los repositorios, las claves al ser distintas no pueden referenciarse. Identificar cual es el atributo valido.
Tomar los datos de los sist operacionales sin afectar su operatoria. Como extraer los cambios que han sido realizados en los sistemas operacionales desde el ltimo refresh del DW.
Importa el volumen de datos, la secuencia y la periodicidad de procesamiento y actualizacin.ETLE: Identificar las fuentes de datos multiples Entender diversos modelos de datos heterogneos Conectarse y accedr sin interferir Capturar los datos cambiados durante extracciones Disponibilizar los datos extraidos en discoT: Limpieza de datos
Validar la estructura Validar dominio Elegir la fuente mas confiable
Corregir u omitir valores incorrectos
Generar meta data que describa la calidad de datos
Disponibilizar datos limpios en disco y manejo de errores. Integracin y homogeneizado
Mapear las columnas del dw con las columnas de las fuentes, algoritmos Consolidar duplicaciones Unificar claves con equivalencias Homogeneizar niveles de agregacin Moldear datos para su navegacin
Adecuaciones para poder integrar denominaciones de negocios (dimensiones), mtricas e indicadores de performance
L: cargar los datos que sern consumidos por los usuarios. Cargar dimensiones y tablas de hecho Generar dimensiones de tiempo
Cargar y modificar agregaciones
Disponibilizar los datos para ser consumidos
Mapeo lgicoDocumentar la lgica del ETL. Logical data map document. Tiene formato de tabla. Se llenan filas por cada columna que hay que cargar en el destino.
Destino -> origen -> transformacin a realizar.
Analisis multidimensionalHechos -> medidas. Cunto.La dimensin sera el contexto, qu, dnde, cundo.
Las dimensiones tienen jerarquas, de gruesa a fina, las cuales tienen mtricas e indicadores. El indicador es ms elaborado que la mtrica, presenta un estado de situacin.
Concepto de cubo
Tres dimensiones o ms.
Medidas Aditivas: pueden agregarse por cualquiera de las dimensiones. Ej: cantidad comprada
Semi aditivas: pueden agregarse por algunas de las dimensiones, no todas. Ej: stock puede ser aditiva para producto pero no para tiempo
No aditivas: no se pueden agregar por ninguna dimensin. Ej: temperatura.
Las semi y no aditivas pueden ser resumas en mtricas utilizando otas operaciones como MaX, MIN, promedio.MtricasDirectas: funciones sobre una medida o atributo. Ej suma, promedio, contar, max, min.
Mtricas calculadas: funciones sobre clculos entre medidas y atributosAnalisis multidimensional: armado de la info en forma dinmica. Consultas ad-hocEntorno grfico y amigable, el usuario necesita conocer principalmente el lenguaje del negocio. La realidad del negocio se modela en trminos de medidas y dimensiones.
Medidas/Metricas: ventas Q, ventas$, precio promedio, costos
Dimensiones: Tiempo, producto, geografa
Jerarquias: dentro de tiempo: ao, trimestre, mes.
Modelado dimensional conceptualObjetivo: representar las necesidades de informacin sobre una temtica del negocio que debe resolver la solucinSobre l basa: modelo dimensional lgico y herramientas de exploracin.
Desde la perspectiva del negocio se definen mtricas y dimensiones con jerarquas relevantes.
Dimensiones recursivas: No es posible establecer niveles jerrquicos. La jerarqua se construye dinmicamente a partir de las relaciones padre-hijo que existen entre los miembros. Como empleado o rea.Pasos
Trabajar de un area tematica a la vez
Identificar decisores claves para dicha temtica Definir junto a dichos decisores las mtricas sobre las que al negocio le interesa saber para decidir. Identificar las dimensiones sobre las que al negocio le interesa analizar las mtricas. Identificar las jerarquas ms relevantes por dimensin e identificar la granularidad de exploracin.
Graficarlo en el diagrama y reconfirmar y ampliar
Evaluar las mtricas y su relacin con las dimensiones: agregar propiedades en el modelo.