2 - Servicio de Integración de Datos - Parte 3

download 2 - Servicio de Integración de Datos - Parte 3

of 33

Transcript of 2 - Servicio de Integración de Datos - Parte 3

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    1/33

    1

    Servicio de Integracin de Datos

    Definicin

    Integration Services es una plataforma para generar integracin de datos de alto rendimiento y

    soluciones de flujo de trabajo, incluyendo operaciones de extraccin, transformacin y carga (ETL)

    para almacn de datos.

    Integration Services incluye herramientas grficas y asistentes para generar y depurar paquetes,

    tareas para realizar funciones de flujo de datos tales como operaciones de FTP, ejecucin de

    instrucciones SQL y mensajera de correo electrnico, orgenes y destinos de datos para extraer y

    cargar datos, transformaciones para limpiar, agregar, mezclar y copiar datos.

    Fundamentos de PaquetesUn paquete es el objeto que implementa la funcionalidad IntegrationServices para extraer,

    transformar y cargar datos. Un paquete se crea utilizando el Diseador SSIS en BI Development

    Studio. Tambin puede crear un paquete ejecutando el Asistente para importacin y exportacin

    de SQL Server o el Asistente para proyectos de conexiones de IntegrationServices.Un paquete

    bsico incluye los elementos siguientes: Flujos de Control y Flujos de Datos.

    Elementos de flujo de control

    Estos elementos necesarios realizan varias funciones,

    proporcionan estructura y controlan el orden en el que

    se ejecutan los elementos. Los principales elementos de

    flujo de control son las tareas, los contenedores y

    restricciones de precedencia. Es necesario que haya por

    lo menos un elemento de flujo de control en un paquete.

    SQL Server IntegrationServices proporciona tres tipos

    diferentes de elementos de flujo de control:los

    contenedores que proporcionan las estructuras de los

    paquetes, las tareas que proporcionan la funcionalidad y

    las restricciones de precedencia que conectan los

    ejecutables, los contenedores y las tareas en un flujo de control ordenado.

    Contenedores:

    Los contenedores proporcionan estructura en paquetes y servicios a las tareas en el flujo de

    control. IntegrationServices incluye los siguientes tipos de contenedor para agrupar tareas e

    implementar flujos de control repetidos:

    El contenedor de bucles Foreach enumera una coleccin y repite su flujo de control para

    cada miembro de la coleccin.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    2/33

    2

    El contenedor de bucles For repite su flujo de control hasta que una expresin

    especificada presenta el resultado False.

    El contenedor de secuencias le permite definir un subconjunto del flujo de control dentro

    de un contenedor y administrar tareas y contenedores como una unidad.

    Tareas:Las tareas realizan el trabajo en paquetes. IntegrationServices incluye tareas para realizar una

    gama de funciones.

    La tarea Flujo de Datos define y ejecuta flujos de datos que extraen datos, aplican

    transformaciones y cargan datos.

    Las tareas de preparacin de datos copian archivos y directorios, descargan archivos y

    datos, guardan datos devueltos por mtodos Web, o trabajan con documentos XML.

    Las tareas de flujo de trabajo se comunican con otros procesos para ejecutar paquetes o

    programas, enviar y recibir mensajes entre paquetes, enviar mensajes de correo

    electrnico, leer datos de Instrumental de administracin de Windows (WMI), o supervisar

    eventos de WMI.

    Las tareas de SQL Server tienen acceso, copian, insertan, eliminan o modifican objetos y

    datos de SQL Server.

    Las tareas de AnalysisServices crean, modifican, eliminan o procesan objetos de

    AnalysisServices.

    Las tareas de script amplan la funcionalidad de paquete mediante scripts personalizadas.

    Las tareas de mantenimiento realizan funciones administrativas, como realizar copias de

    seguridad de y reducir bases de datos de SQL Server, reconstruir y reorganizar ndices y

    ejecutar trabajos del Agente SQL Server.

    Restricciones de PrecedenciaLas restricciones de precedencia conectan contenedores y tareas de paquetes en un flujo de

    control ordenado. Puede controlar la ejecucin de secuencias para tareas y contenedores, y

    especificar condiciones que determinan si se ejecutan las tareas y contenedores.

    Elementos de flujo de datos

    SQL Server IntegrationServices proporciona tres tipos diferentes de componentes de flujo de

    datos: orgenes, transformaciones y destinos. Los orgenes extraen datos de almacenes de datos

    tales como tablas y vistas en bases de datos relacionales, archivos y bases de datos de

    AnalysisServices. Las transformaciones modifican, resumen y limpian datos. Los destinos cargan

    datos en almacenes de datos o crean conjuntos de datos almacenados en la memoria.

    Adems, IntegrationServices proporciona rutas que conectan la salida de un componente con la

    entrada de otro componente. Las rutas definen la secuencia de los componentes y permiten

    agregar anotaciones en el flujo de datos o ver el origen de la columna.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    3/33

    3

    El siguiente diagrama muestra un flujo de datos que tiene un origen, una transformacin con una

    entrada y una salida, y un destino. El diagrama incluye las entradas, salidas y salidas de error

    adems de las columnas de entrada, salida y externas.

    Orgenes

    En IntegrationServices, un origen es el componente del flujo de datos que pone datos de

    diferentes orgenes de datos externos a disposicin de los dems componentes en el flujo de

    datos.

    El origen de un flujo de datos normalmente tiene una salida normal. La salida normal contiene

    columnas de salida, que son columnas que el origen agrega al flujo de datos.

    La salida normal hace referencia a las columnas externas. Una columna externa es una columna en

    el origen. Por ejemplo, la columna MadeFlag en la tabla Producto de la base de datos

    AdventureWorks es una columna externa que se puede agregar a la salida normal. Los metadatos

    para las columnas externas incluyen informacin tal como el nombre, tipo de datos y longitud de

    la columna de origen.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    4/33

    4

    Una salida de error para un origen contiene las mismas columnas que la salida normal y dos

    columnas adicionales que proporcionan informacin sobre errores. El modelo de objetos de

    IntegrationServices no restringe la cantidad de salidas normales y las salidas de error que pueden

    tener los orgenes. La mayora de los orgenes que incluye IntegrationServices, salvo el

    componente script, tienen una salida normal y muchos de los orgenes tienen una salida de error.

    Los orgenes personalizados se pueden codificar para implementar varias salidas normales y

    salidas de error.

    Todas las columnas de salida estn disponibles como columnas de entrada para el siguiente

    componente de flujo de datos en el flujo de datos.

    Transformaciones:

    Las capacidades de las transformaciones presentan amplias variaciones. Las transformaciones

    pueden realizar tareas tales como actualizar, resumir, limpiar, mezclar y distribuir datos.

    Las entradas y salidas de una transformacin definen las columnas de datos de entrada y salida.Segn la operacin realizada con los datos, algunas transformaciones tienen una sola entrada y

    varias salidas, mientras que otras transformaciones tienen varias entradas y una sola salida. Las

    transformaciones tambin pueden incluir salidas de error, que proporcionan informacin sobre el

    error ocurrido, junto con los datos que han generado errores: por ejemplo, datos de cadena que

    no se pueden convertir en un tipo de datos integer. El modelo de objetos de IntegrationServices

    no restringe la cantidad de entradas, salidas normales y salidas de error que pueden contener las

    transformaciones. Puede crear transformaciones personalizadas que implementan cualquier

    combinacin de varias entradas, salidas normales y salidas de error.

    La entrada de una transformacin se define como una o ms columnas de entrada. Algunas

    transformaciones de IntegrationServices tambin pueden hacer referencia a columnas externas

    como entrada. Por ejemplo, la entrada de la transformacin Comando de OLE DB incluye columnas

    externas. Una columna de salida es una columna que la transformacin agrega al flujo de datos.

    Tanto las salidas normales como las salidas de error contienen columnas de salida. Estas columnas

    de salida a su vez funcionan como columnas de entrada para el siguiente componente en el flujo

    de datos, ya sea otra transformacin o un destino.

    Destinos:

    Un destino es el componente de flujo de datos que escribe los datos desde un flujo de datos en un

    almacn de datos especfico, o crea un conjunto de datos almacenado en la memoria.

    Un destino de IntegrationServices debe tener por lo menos una entrada. La entrada contiene

    columnas de entrada, que proceden de otro componente de flujo de datos. Las columnas de

    entrada se asignan a columnas en el destino.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    5/33

    5

    Muchos destinos tambin tienen una salida de error. La salida de error de un destino contiene

    columnas de salida, que normalmente contienen informacin sobre errores que se producen

    mientras se escriben datos en el almacn de datos de destino. Los errores se producen por

    muchos motivos diferentes. Por ejemplo, una columna puede contener un valor NULL, mientras

    que la columna de destino no puede establecerse como NULL.

    El modelo de objetos de IntegrationServices no limita la cantidad de entradas regulares y salidas

    de error que los destinos pueden tener, y se pueden crear destinos personalizados que

    implementan varias entradas y salidas de error.

    Metadatos Externos:

    Al crear un flujo de datos en un paquete mediante el Diseador SSIS, los metadatos de los

    orgenes y destinos se copian en las columnas externas en orgenes y destinos, actuando como una

    instantnea del esquema. Cuando IntegrationServices valida el paquete, el Diseador SSIS

    compara esta instantnea con el esquema del origen o destino y expone errores y advertencias,

    segn las modificaciones.

    El proyecto de IntegrationServices proporciona un modo sin conexin. Cuando se trabaja sin

    conexin, no se realizan conexiones a los orgenes o destinos que usa el paquete y los metadatos

    de las columnas externas no se actualizan

    Entradas y Salidas:

    Los orgenes tienen salidas, los destinos tienen entradas, y las transformaciones tienen ambos.

    Adems, muchos componentes de flujo de datos se pueden configurar para usar una salida de

    error.

    Entradas

    Los destinos y las transformaciones tienen entradas. Una entrada contiene una o ms

    columnas de entrada, que pueden hacer referencia a las columnas externas si el

    componente de flujo de datos se ha configurado para usarlas. Las entradas se pueden

    configurar para supervisar y controlar el flujo de datos: por ejemplo, puede especificar si el

    componente debe generar un error en respuesta a un error, omitir los errores o redirigir

    las filas de errores a la salida de error. Tambin puede asignar una descripcin a la salida o

    actualizar el nombre de entrada. En el Diseador SSIS, las entradas se configuran mediante

    el cuadro de dilogo Editor avanzado.

    Salidas

    Los orgenes y las transformaciones siempre tienen salidas. Una salida contiene una o ms

    columnas de salida, que pueden hacer referencia a las columnas externas si el

    componente de flujo de datos se ha configurado para usarlas. Las salidas se pueden

    configurar para proporcionar informacin til para el procesamiento en direccin

    descendente de los datos. Por ejemplo, puede indicar si se ordena la salida. Tambin

    puede proporcionar una descripcin para la salida o actualizar el nombre de la salida. En el

    Diseador SSIS, las salidas se configuran mediante el cuadro de dilogo Editor avanzado.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    6/33

    6

    Salidas de error

    Los orgenes, destinos y transformaciones pueden incluir salidas de error. Puede

    especificar de qu manera el componente de flujo de datos responde ante los errores en

    cada entrada o columna mediante el cuadro de dilogo Configurar la salida de errores. Si

    se produce un error o truncamiento de datos en el tiempo de ejecucin y el componente

    de flujo de datos se configura para redirigir filas, las filas de datos con el error se envan a

    la salida de error. Como opcin predeterminada, una salida de error contiene las columnas

    de salida y dos columnas de error: ErrorCode y ErrorColumn. Las columnas de salida

    contienen los datos de la fila que gener el error, ErrorCode proporciona el cdigo de

    error y ErrorColumn identifica la columna que genera el error.

    Columnas

    Las entradas, salidas y salidas de error son colecciones de columnas. Cada columna es

    configurable y, segn el tipo de columna (de entrada, de salida o externa),

    IntegrationServices proporciona diferentes propiedades para la columna.

    IntegrationServices proporciona tres formas diferentes de establecer las propiedades delas columnas: mediante programacin, mediante cuadros de dilogo especficos del

    componente o mediante el cuadro de dilogo Editor avanzado.

    Rutas:

    Las rutas conectan componentes de flujo de datos. En el Diseador SSIS, puede ver y

    modificar las propiedades de ruta, ver los metadatos de salida para el punto de inicio de la

    ruta y anexar visores de datos a una ruta

    Configurar los componentes de flujo de datos:

    Los componentes de flujo de datos se pueden configurar a nivel de componente, en los niveles de

    entrada, salida y salida de error, y en el nivel de columna.

    En el nivel de componente, se configuran propiedades que son comunes para todos los

    componentes y las propiedades personalizadas del componente.

    En los niveles de entrada, salida y salida de error, se configuran las propiedades comunes de

    entradas, salidas y la salida de error. Si el componente admite varias salidas, puede agregar

    salidas.

    En el nivel de columna, se establecen las propiedades que son comunes a todas las columnas,

    adems de cualquier propiedad personalizada que el componente proporcione para las columnas.

    Si el componente admite la adicin de columnas de salida, puede agregar columnas a las salidas.

    Usos TpicosIntegrationServices proporciona un amplio conjunto de tareas, contenedores, transformaciones y

    adaptadores de datos integrados que permiten desarrollar aplicaciones de negocios. Sin escribir

    una sola lnea de cdigo, puede crear soluciones de SSIS para resolver problemas de negocios

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    7/33

    7

    complejos mediante ETL y Business Intelligence, administrar bases de datos de SQL Server y copiar

    objetos de SQL Server entre instancias de SQL Server.

    En los escenarios siguientes se describen usos tpicos de los paquetes de SSIS

    Mezclar datos de ambientes de datos heterogneos

    Los datos suelen almacenarse en muchos sistemas de almacenamiento de datos distintos, por lo

    que extraer datos de todos los orgenes y mezclarlos en un solo conjunto de datos coherente

    constituye un desafo. Esta situacin puede producirse por diversas razones. Por ejemplo:

    Muchas organizaciones archivan informacin que est almacenada en sistemas de

    almacenamiento de datos antiguos. Estos datos pueden no ser importantes para las

    operaciones diarias, pero pueden resultar tiles para el anlisis de tendencias, que

    requiere datos recopilados a lo largo de un perodo prolongado de tiempo.

    Las sucursales de una organizacin pueden usar distintas tecnologas de almacenamiento

    de datos para almacenar los datos operativos. Es posible que el paquete tenga que extraer

    datos de hojas de clculo y de bases de datos relacionales para poder mezclar los datos. Los datos pueden estar almacenados en bases de datos que usan distintos esquemas para

    los mismos datos. Es posible que el paquete tenga que cambiar el tipo de datos de una

    columna o combinar datos de varias columnas en una sola columna para poder mezclar los

    datos.

    IntegrationServices puede conectarse a una gran variedad de orgenes de datos, incluso con varios

    orgenes en un solo paquete. Un paquete puede conectarse a bases de datos relacionales

    mediante proveedores .NET y DB OLE, y a muchas bases de datos antiguas mediante controladores

    ODBC. Tambin puede conectarse con archivos planos, archivos de Excel y proyectos de

    AnalysisServices.

    IntegrationServices incluye componentes de origen que extraen datos de archivos planos, hojas de

    clculo Excel, documentos XML y tablas y vistas de bases de datos relacionales desde el origen de

    datos al que se conecta el paquete.

    A continuacin, los datos se suelen transformar mediante las transformaciones incluidas en

    IntegrationServices. Cuando los datos se han transformado a formatos compatibles, pueden

    mezclarse fsicamente en un conjunto de datos.

    Despus de mezclar correctamente los datos y aplicarles transformaciones, se suelen cargar en

    uno o varios destinos. IntegrationServices incluye un destino para cargar datos en archivos planos,

    archivos sin formato y bases de datos relacionales. Los datos tambin se pueden cargar en un

    conjunto de registros en memoria a los que tienen acceso otros elementos del paquete.

    Llenar almacenamientos de datos y puestos de datos

    Los datos de los almacenamientos de datos y los puestos de datos suelen actualizarse

    frecuentemente y normalmente las cargas de datos son muy grandes.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    8/33

    8

    IntegrationServices incluye una tarea que realiza una carga masiva de datos directamente desde

    un archivo plano a tablas y vistas de SQL Server, y un componente de destino que realiza una carga

    masiva de datos en una base de datos de SQL Server como ltimo paso de un proceso de

    transformacin de datos.

    Se puede configurar un paquete de SSIS como reiniciable. Esto significa que podr volver aejecutar el paquete desde un punto de comprobacin predeterminado (una tarea o un contenedor

    del paquete). La capacidad de reiniciar un paquete permite ahorrar mucho tiempo, especialmente

    si el paquete procesa datos de un gran nmero de orgenes.

    Puede utilizar paquetes de SSIS para cargar las tablas de dimensiones y hechos en la base de

    datos. Si los datos de origen de una tabla de dimensiones estn almacenados en varios orgenes de

    datos, el paquete puede mezclar los datos en un conjunto de datos y cargar la tabla de

    dimensiones en un solo proceso, en lugar de utilizar un proceso independiente para cada origen

    de datos.

    La actualizacin de datos de almacenamientos de datos y puestos de datos puede ser compleja, ya

    que ambos tipos de almacenes de datos suelen incluir dimensiones variables lentas que pueden

    ser difciles de administrar mediante un proceso de transformacin de datos. El Asistente para

    dimensiones variables lentas automatiza la compatibilidad para las dimensiones variables lentas,

    creando dinmicamente las instrucciones SQL que insertan y actualizan registros, actualizan

    registros relacionados y agregan nuevas columnas a las tablas.

    IntegrationServices tambin puede calcular funciones antes de que se carguen los datos en el

    destino. Si los almacenamientos de datos y los puestos de datos almacenan informacin agregada,

    el paquete de SSIS puede calcular funciones como SUM, AVERAGE y COUNT. Una transformacin

    de SSIS tambin puede cambiar datos relacionales y transformarlos a un formato menosnormalizado pero ms compatible con la estructura de las tablas del almacenamiento de datos.

    Limpiar y normalizar datos

    Independientemente de si los datos se van a cargar en una base de datos de procesamiento de

    transacciones en lnea (OLTP) o de procesamiento analtico en lnea (OLAP), una hoja de clculo de

    Excel o un archivo, hay que limpiarlos y normalizarlos antes de cargarlos. Puede ser necesario

    actualizar los datos por las siguientes razones:

    Los datos proceden de varias sucursales de una organizacin y en cada una de las

    sucursales se usan convenciones y estndares distintos. Para poder usar los datos, es

    posible que sea necesario cambiar su formato. Por ejemplo, es posible que tenga quecombinar el nombre y el apellido en una columna.

    Los datos pueden ser alquilados o comprados. Para poder usar los datos es posible que

    sea necesario normalizar y limpiar los datos de forma que satisfagan los estndares de

    negocios. Por ejemplo, una organizacin desea comprobar que todos los registros usan el

    mismo conjunto de abreviaturas de estado o el mismo conjunto de nombres de productos.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    9/33

    9

    Los datos son especficos de la configuracin regional. Por ejemplo, en los datos puede

    haber diversos formatos de fecha/hora o numricos. Si se mezclan datos de

    configuraciones regionales distintas, deben convertirse a una configuracin regional antes

    de cargarse para evitar que los datos resulten daados.

    IntegrationServices incluye transformaciones integradas que se pueden agregar a paquetes paralimpiar y normalizar datos, cambiar las maysculas y minsculas de los datos, convertir datos a un

    tipo o formato distinto, o crear nuevos valores de columna basados en expresiones. Por ejemplo,

    el paquete podra concatenar las columnas de nombre y apellido en una sola columna y despus

    convertir los caracteres a maysculas.

    Un paquete de IntegrationServices tambin puede limpiar datos reemplazando los valores de las

    columnas por valores de una tabla de referencia mediante una bsqueda exacta o aproximada, a

    fin de encontrar los valores en una tabla de referencia. Normalmente, un paquete realiza la

    bsqueda exacta primero y, en caso de que no devuelva resultados, realiza la bsqueda

    aproximada. Por ejemplo, el paquete primero intenta buscar un nombre de producto en la tabla

    de referencia utilizando el valor de la clave principal del producto. Si esta bsqueda no devuelve el

    nombre del producto, el paquete intenta la bsqueda de nuevo, pero esta vez realiza una

    coincidencia aproximada del nombre del producto.

    Otra transformacin limpia los datos agrupando los valores similares de un conjunto de datos.

    Esto es til para identificar registros que pueden ser duplicados y, por tanto, no se deben insertar

    en la base de datos sin realizar ms evaluaciones. Por ejemplo, comparar las direcciones de los

    registros de clientes puede ayudar a identificar varios clientes duplicados.

    Generar Business Intelligence en un proceso de transformacin de datos

    Un proceso de transformacin de datos requiere lgica integrada para responder dinmicamente

    a los datos que procesa y a los que tiene acceso.

    Es posible que sea necesario resumir, convertir y distribuir los datos en funcin de valores de

    datos. Incluso es posible que el proceso tenga que rechazar datos en funcin de una evaluacin de

    valores de columna.

    Para satisfacer este requisito, la lgica del paquete de SSIS puede tener que realizar los siguientes

    tipos de tareas:

    Mezclar datos de varios orgenes de datos.

    Evaluar datos y aplicar conversiones de datos.

    Dividir un conjunto de datos en mltiples conjuntos de datos en funcin de valores de

    datos.

    Aplicar agregaciones diferentes a distintos subconjuntos de un conjunto de datos.

    Cargar subconjuntos de los datos en destinos distintos o en varios destinos.

    IntegrationServices proporciona contenedores, tareas y transformaciones para generar Business

    Intelligence en paquetes deSSIS.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    10/33

    10

    Los contenedores admiten la repeticin de flujos de trabajo recorriendo archivos u objetos, y

    evaluando expresiones. Un paquete puede evaluar datos y repetir flujos de trabajo en funcin de

    los resultados. Por ejemplo, si la fecha pertenece al mes actual, el paquete realiza un conjunto de

    tareas; en caso contrario, realiza un conjunto de tareas alternativas.

    Las tareas que usan parmetros de entrada tambin pueden generar Business Intelligence enpaquetes. Por ejemplo, el valor de un parmetro de entrada puede filtrar los datos recuperados

    por una tarea.

    Las transformaciones pueden evaluar expresiones y despus, en funcin de los resultados, enviar

    filas de un conjunto de datos a diferentes destinos. Una vez divididos los datos, el paquete puede

    aplicar distintas transformaciones a cada subconjunto del conjunto de datos. Por ejemplo, una

    expresin puede evaluar una columna de fecha, agregar los datos de ventas del perodo

    correspondiente y despus almacenar nicamente la informacin de resumen.

    Tambin es posible enviar un conjunto de datos a varios destinos y aplicar a continuacin distintos

    conjuntos de transformaciones a los mismos datos. Por ejemplo, un conjunto de transformaciones

    puede resumir los datos mientras otro conjunto de transformaciones expande los datos buscando

    valores en tablas de referencia y agregando datos de otros orgenes.

    Automatizar las funciones administrativas y la carga de datos

    Normalmente, los administradores desean automatizar las funciones administrativas como la

    copia de seguridad y la restauracin de bases de datos, la copia de bases de datos de SQL Server y

    los objetos que contienen, la copia de objetos de SQL Server y la carga de datos. Los paquetes de

    IntegrationServices pueden realizar estas funciones.

    IntegrationServices incluye tareas diseadas especficamente para copiar objetos de bases dedatos de SQL Server como tablas, vistas y procedimientos almacenados, para copiar objetos de

    SQL Server como bases de datos, inicios de sesin y estadsticas, y para agregar, modificar y

    eliminar objetos y datos de SQL Server mediante instrucciones Transact-SQL.

    La administracin de un entorno de base de datos OLTP u OLAP suele incluir la carga de datos.

    IntegrationServices incluye varias tareas que facilitan la carga masiva de datos. Puede utilizar una

    tarea para cargar datos de archivos de texto directamente en tablas y vistas de SQL Server, o

    puede usar un componente de destino para cargar datos en tablas y vistas de SQL Server despus

    de aplicar transformaciones a los datos de la columna.

    Un paquete de IntegrationServices puede ejecutar otros paquetes. Una solucin de

    transformacin de datos con muchas funciones administrativas puede separarse en varios

    paquetes de forma que resulte ms sencillo administrar y reutilizar los paquetes.

    Si necesita realizar las mismas funciones administrativas en distintos servidores, puede utilizar

    paquetes. Un paquete puede usar un bucle para recorrer los servidores y realizar las mismas

    funciones en varios equipos.

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    11/33

    11

    Ejemplo PrcticoCrear un nuevo Proyectode Inteligencia de Negocios con SQL Server Business

    IntelligenceDevelopment Studio:

    Crear una NuevoOrigen de datos (Conexin Origen de Datos):

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    12/33

    12

    Crear una Nuevo Origen de datos (Conexin Destino de Datos):

    Clic en siguiente y aparece la ventana para seleccionar un origen de datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    13/33

    13

    Clic en nueva conexin, seleccionamos el servidor y la base de datos:

    Clic en siguiente:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    14/33

    14

    Clic en siguiente y ponemos Northwind como nombre de origen de datos:

    Clic en finalizar, y tenemos:

    Ahora, creamos el origen de datos para Northwind_DW,nuevamente:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    15/33

    15

    Aparece la ventana para configurar Orgenes de datos:

    Clic en Nueva y seleccionamos el servidor de datos y la base de datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    16/33

    16

    Clic en aceptar y tenemos:

    Clic en siguiente y escribimos Northwind_DW como nombre de origen de datos y clic en

    finalizar:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    17/33

    17

    Con lo que tenemos:

    Luego en la Pestaa Flujo de Control, ubicamos y enlazamos los siguientes Flujos de datos:

    Y configuramos cada Tarea de control:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    18/33

    18

    Tarea Ejecutar SQL - Ejecutar Limpiar DW:

    Tarea Flujo de DatosETL Clientes:

    Luego configuramos cada Tarea de Flujo de Datos:

    Northwind

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    19/33

    19

    Conversin de Datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    20/33

    20

    Northwind_DW:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    21/33

    21

    Tarea Flujo de DatosETL Empleado:

    Y configuramos cada tarea de flujo de datos:

    Origen de Datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    22/33

    22

    Columna Derivada:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    23/33

    23

    Conversin de Datos:

    Destino de datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    24/33

    24

    Y finalmente Realizamos su mapeo de campos:

    Tarea Flujo de Datos ETL Productos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    25/33

    25

    Tarea de Flujo de Datos ETL Tiempo:

    Configuramos cada una de las tareas de Flujos de Datos:

    Origen OLE DB:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    26/33

    26

    Destino OLE DB:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    27/33

    27

    Tares de Flujo de Datos ETL Transportista:

    Y configuramos cada tarea del flujo de datos:

    NorthwindShipper:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    28/33

    28

    Conversin de Datos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    29/33

    29

    Northwind_dw DimShipper:

    Y mapeamos los campos requeridos:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    30/33

    30

    Tarea de Flujo de Datos ETL Hecho Ventas

    Configuramos cada Flujo de Transformacin, empezamos por Northwind

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    31/33

    31

    Configuramos tambin Northwind_dw

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    32/33

    32

    Luego, ejecutamos el paquete completo:

  • 7/25/2019 2 - Servicio de Integracin de Datos - Parte 3

    33/33