Material Teorico Base de Datos - 2do. Parcial

14
UniversidadTecnológicaNacional-FacultadCórdoba Dptos.IngenieríaIndustrialyMecánica InformáticaI FundamentosdeInformática MaterialrecopiladoyorganizadoporIng.Carrizo Página1de14 UNIDAD5:BASEDEDATOS 1.BasedeDatos:conceptoyrequisitosquedebecumplirunbuenSistemadeBD. 2.EstructuraGeneraldeunaBasedeDatos:Entidad,Atributos,ClaveyRelación. 3.TiposdeBasedeDatos:Jerárquicas,EnRedyRelacionales. 4. BDRelacionales:requisitosquedebecumplirunatabla. 5.SGBD:SistemadeGestióndeBasedeDatosoDBMS(DataBaseManagementSytem). 5.1.AlgunosSGBDmásconocidosenelmercado: a.MicrosoftSQLServer. b.Oracle c.MicrosoftAccess 6.LenguajedeConsultaEstructuradoSQLacualquierBasedeDatos. 6.1.Paraqué utilizamosloscomandosSQL 7. DatawarehouseyDatamining 7.1.DWEmpresarial pdfMachine trial version

description

de Blanca Carrizo UTN FRC argentina

Transcript of Material Teorico Base de Datos - 2do. Parcial

Page 1: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 1 de 14

UNIDAD 5: BASE DE DATOS

1. Base de Datos: concepto y requisitos que debe cumplir un buen Sistema de BD.

2. Estructura General de una Base de Datos: Entidad, Atributos, Clave y Relación.

3. Tipos de Base de Datos: Jerárquicas, En Red y Relacionales.

4. BD Relacionales: requisitos que debe cumplir una tabla.

5. SGBD: Sistema de Gestión de Base de Datos o DBMS (Data Base Management Sytem).5.1.Algunos SGBD más conocidos en el mercado:

a. Microsoft SQL Server.b. Oraclec. Microsoft Access

6. Lenguaje de Consulta Estructurado SQL a cualquier Base de Datos.6.1.Para qué utilizamos los comandos SQL

7. Datawarehouse y Datamining7.1.DW Empresarial

pdfM

achin

e tri

al ve

rsion

Page 2: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 2 de 14

Base de Datos

1. Concepto:· Sistema formado por un conjunto de datos y un paquete de software para la gestión del mismo,de tal modo que controla el almacenamiento de datos redundantes.Los datos resultan independientes de los programas que los usan, se almacenan las relacionesentre los datos junto con éstos y se puede acceder a los datos de diversas formas.Entendemos por Sistema un conjunto de elementos relacionados entre sí y con su ambiente (contexto omedio), cuya suma total es mayor que la suma de las partes tomadas en forma aislada (sinergia o accióncombinada), que tienen un objetivo común.Algunos requisitos que debe cumplir un buen Sistema de Base de Datos (BD) son:· Acceso múltiple: diversos usuarios pueden acceder a la BD, sin que se produzcan conflictos ni visionesincoherentes.

· Utilización múltiple: cada usuario podrá tener una imagen o visión particular de la estructura de la BD.· Flexibilidad: se podrán usar distintos métodos de acceso, con tiempos de respuesta razonablementepequeños.

· Confidencialidad y seguridad: se controlará el acceso a los datos, incluso a nivel campo,impidiéndoselo a los usuarios no autorizados.

· Protección contra fallos: deben existir mecanismos concretos de recuperación en caso e fallo de lacomputadora.

· Independencia física: se puede cambiar el soporte físico de la BS (Ej.: modelo de discos), sin que esorepercuta en la BD ni en los programas que la usan.

· Independencia lógica: capacidad para que se puedan modificar los datos contenidos en la base, lasrelaciones existentes entre ellos o incluir nuevos datos, sin afectar los programas que lo usan.

· Redundancia controlada: los datos se almacenan una sola vez.· Interfaz de alto nivel: existe una forma sencilla y cómoda de utilizar la base, al menos se cuenta conun lenguaje de programación de alto nivel, que facilita la tarea.

· Interrogación directa o Query: existen facilidades para que se pueda tener acceso a los datos deforma conversacional.

2. Estructura general de una Base de DatosEn una BD se almacena información de una serie de objetos o elementos. Estos objetos reciben el nombrede Entidades.Una Entidad es cualquier ente sobre el cual se almacena información. Ej: Base de Datos Académica habráinformación de las siguientes entidades: Alumno, Profesor, Asignatura, Especialidad, Plan de Estudio, Curso,etc.De cada Entidad se almacenan una serie de datos que se denominan Atributos de la Entidad. Ej: LosAtributos de la Entidad Alumno son: DNI, Apellido y Nombres, Sexo, Fecha de Nacimiento, TítuloSecundario, etc.Entidades y Atributos son conceptos abstractos.

pdfM

achin

e tri

al ve

rsion

Page 3: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 3 de 14

En una BD, aunque la tecnología evoluciona constantemente, la información de cada Entidad se almacena enRegistros, y cada Atributo en Campos de dicho registro.Pero cada Entidad necesita Registros con una estructura específica; es decir que en una BD hay diferentestipos de registros, uno por Entidad.Un conjunto de Atributos (DNI, Apellido y Nombres, Sexo, etc.) de una Entidad (Alumno) es unIdentificador de dicha Entidad si el valor de dichos Atributos determina de forma unívoca cada uno de loselementos de dicha Entidad y no existe ningún subconjunto de él que sea Identificador de la Entidad. Ej: enla Entidad Alumno, el Atributo DNI es un identificador de esa Entidad.En general, buscamos una ocurrencia de un Registro en una BD, conociendo el valor de unos o varioscampos y para que esta operación sea rápida, estos campos deben estar definidos en la BD como Clave oLlave de búsqueda de dicho registro.Una Clave es un campo (Ej. DNI) o conjunto de campos (Ej. DNI y Legajo) cuyos valores permiten localizarde forma rápida la Entidad (Ej. Alumno).En una BD se almacenan, además de las Entidades, las relaciones existentes entre ellas.Ej. En la BD Académica antes citada hay relaciones entre las siguientes Entidades: cursos y alumnos,alumnos y profesores, profesores y asignaturas.

pdfM

achin

e tri

al ve

rsion

Page 4: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 4 de 14

3. Tipos de Bases de DatosSe clasifican en tres grupos:· Jerárquicas: es un caso particular de la estructura de red.· En Red: cualquier esquema se cree para una BD jerárquica, se puede utilizar para una en red.· Relacionales: son conceptualmente distintas a las dos anteriores. En las BD relacionales se almacenan ymanipulan las relaciones entre distintas Entidades de forma totalmente diferente.

4. Base de Datos Relacionales:Es una BD formada por Tablas, donde una Tabla (Matriz) es una estructura bidimensional (filas*columnas)formada por una secuencia de registros (filas) del mismo tipo.A las tablas se les imponen ciertas condiciones, razón por la cual se pueden tratar como relacionesmatemáticas; por ello se llaman BD relacionales.Las Tablas deben cumplir las siguientes condiciones:· Todos los registros (filas) de una Tabla son del mismo tipo. Ej. Todos los Alumnos cargados en el Sist.Académico tienen los mismos campos: DNI (Tipo de Campo Numérico de 8 dígitos), Apellido y Nombres(Tipo de Campo Alfabético de 35 dígitos), etc.

· En ninguna Tabla aparecen campos repetidos. Ej. Un Alumno no puede tener dos DNI.· En ninguna Tabla existen registros duplicados. Ej: Un Alumno no debiera tener dos veces el campoespecialidad cargados en la Tabla Alumno, salvo que cursara dos carreras.

· El orden de los Registros (Filas) en la Tabla es indiferente; ya que en cada momento se pueden recuperalos registros en un orden particular.

· En cada Tabla hay una Clave (Llave de acceso a la Tabla), formada por uno (DNI) o varios campos (DNI+ Legajo).Hoy, la mayor parte de las BD disponibles tanto para uso personal como laboral son BD Relacionales.

5. SGBD (Sistema de Gestión de Base de Datos) o DBMS (Data Base Management System).Conjunto de software destinado a la creación, control y manipulación de la información de una BD.Un SGBD permite realizar las siguientes tareas:· Acceso a los datos desde algún lenguaje de alto nivel.· Interrogación o recuperación de información directa en modo conversacional.· Definición del esquema de Base y de los distintos subesquemas.· Organización física de la BD y recuperación tras los fallos del sistema.Un SGBD, al igual que un Sistema Operativo (SO), proporciona servicios tanto a usuarios como a otrosprogramas.

pdfM

achin

e tri

al ve

rsion

Page 5: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 5 de 14

Cuando un usuario piensa que está utilizando el Sistema de Gestión, lo que realmente hace es usar unprograma que le proporciona una interfaz de usuario para trabajar con él.

Algunos generadores de BD muy conocidos comercialmente son:· SQL Server (versión 2000 o 2005),· ORACLE,· SysBase,· INFORMIX,· MySQL,· PARADOX,· ACCESS, etc.En la actualidad las BD pueden definirse como Colección de datos y/o documentos digitales, que pueden serhomogéneos o no, que disponen de SGBD (relacionales o documentales) y un conjunto de aplicaciones quehacen posible su publicación, integración y consulta dentro o fuera de Internet.

5.1. Algunos SGBD más conocidos en el mercado son:a. Microsoft SQL ServerEs un SGBD relacionales basada en el lenguaje Transact-SQL, capaz de poner a disposición de muchosusuarios grandes cantidades de datos de manera simultánea.Entre sus características figuran:· de transacciones.· Escalabilidad, estabilidad y seguridad.· Soporta procedimientos almacenados.· Incluye también un potente entorno gráfico de administración, que permite el uso de comandos DDL yDML gráficamente.

· Permite trabajar en modo Cliente-Servidor donde la información y datos se alojan en el servidor y lasterminales o clientes de la red sólo acceden a la información.

· Además permite administrar información de otros servidores de datosEste sistema incluye una versión reducida, llamada MSDE con el mismo motor de base de datos peroorientado a proyectos más pequeños, que en su versión 2005 pasa a ser el SQL Express Edition.Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases dedatos como son Oracle, Sybase ASE, PostgreSQL o MySQL (es BD basada en Software Libre).Es común desarrollar completos proyectos complementando Microsoft SQL Server y Microsoft Access através de los llamados ADP (Access Data Project).De esta forma, se completa una potente base de datos (Microsoft SQL Server) con un entorno de desarrollocómodo y de alto rendimiento (VBA Access) a través de la implementación de aplicaciones de dos capasmediante el uso de formularios Windows.

pdfM

achin

e tri

al ve

rsion

Page 6: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 6 de 14

Para el desarrollo de aplicaciones más complejas (tres o más capas), Microsoft SQL Server incluye interfacesde acceso para varias plataformas de desarrollo, entre ellas .NET.Microsoft SQL Server, al contrario de su más cercana competencia, no es multiplataforma, ya que sólo estádisponible en Sistemas Operativos de Microsoft.

b. OracleEs un SGBD relacional fabricado por Oracle Corporation.Se considera a Oracle como uno de los sistemas de bases de datos más completos, destacando su:· Soporte de transacciones.· Estabilidad.· Escalabilidad.· Es multiplataforma.Su mayor defecto es su enorme precio, que es de varios miles de euros (según versiones y licencias).Otro aspecto que ha sido criticado por algunos especialistas es la seguridad de la plataforma, y las políticasde suministro de parches de seguridad, modificadas a comienzos de 2005 y que incrementan el nivel deexposición de los usuarios. En los parches de actualización provistos durante el primer semestre de 2005fueron corregidas 22 vulnerabilidades públicamente conocidas, algunas de ellas con una antigüedad de másde 2 años.Aunque su dominio en el mercado de servidores empresariales ha sido casi total hasta hace poco,recientemente sufre la competencia del Microsoft SQL Server de Microsoft y de la oferta de otros RDBMS conlicencia libre como PostgreSQL, MySql o Firebird.Las últimas versiones de Oracle han sido certificadas para poder trabajar bajo Linux.

c. Microsoft AccessEs un SGBD Relacional creado y modificado por Microsoft (DBMS) para uso personal de pequeñasorganizaciones. Es un componente de la suite Microsoft Office aunque no se incluye en el paquete"básico". Una posibilidad adicional es la de crear ficheros con bases de datos que pueden ser consultadospor otros programas.Entre las principales funcionalidades de Access se encuentran:· Crear tablas de datos indexadas.· Modificar tablas de datos.· Relaciones entre tablas (creación de BD relacionales).· Creación de consultas y vistas.· Consultas referencias cruzadas.· Consultas de acción (INSERT, DELETE, UPDATE).· Formularios.· Informes.· Llamadas a la API de Windows.

pdfM

achin

e tri

al ve

rsion

Page 7: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 7 de 14

· Interacción con otras aplicaciones que usen VBA (resto de aplicaciones de Microsoft Office, Autocad,etc.).

· Macros.· Interconexión con entornos de BD de gran nivel (como por ejemplo SQL Server) a través de vinculación.· Soporte de lectura de sistemas de archivos individuales (como FoxBase y similares) a través devinculación e importación de datos.

Además, permite crear frontends o programa que muestra la interfaz de usuario, de BD más potentes yaque es un sistema capaz de acceder a tablas externas a través de ODBC como si fueran tablas Access.Es un software de gran difusión entre pequeñas empresas (PYMES) cuyas BD no requieren de excesivapotencia, ya que se integra perfectamente con el resto de aplicaciones de Microsoft y permite crearpequeñas aplicaciones con unos pocos conocimientos de programación.Tiene un sistema de seguridad de cifrado bastante primitivo y puede ser la respuesta a proyectos deprogramación de pequeño y mediano tamaño.Access es mucho Access y sus limitaciones por ahora están basadas en el tamaño de la BD y en la tarea demultifunción que superando más de 20 usuarios Clientes, la BD puede fallar con bloqueos importantes.Por lo demás, Access puede tener mas de 1.000.000 de registros sin dar ningún tipo de problemas.Con Access se puede hacer todo lo que uno desee, hasta la aplicación mas compleja que podamos imaginar,todo depende de quien programe la BD, de como se estructure y de las consultas que realiza a las tablas.Está claro que utilizar índices ayuda a Access para agilizar la DB, pero es aconsejable no utilizarlos si deseasmanejar muchos Datos, así evitamos Bloqueos y el mal de Access, lo ideal es, que tu base de datos deAccess se mueva, relacione y busque la información con instrucciones SQL no muy complejas, se gana,potencia y rigidez con Access.Para BD de gran calibre (en cuanto a volumen de datos o de usuarios) es recomendable usar otros sistemascomo MySQL o Microsoft SQL Server, y código VBA (Visual Basic para Aplicaciones).Entre sus mayores inconvenientes figuran que no es multiplataforma, pues sólo está disponible parasistemas operativos de Microsoft, y que no permite transacciones.Su uso es inadecuado para grandes proyectos de software que requieren tiempos de respuesta críticos omuchos accesos simultáneos a la BD.

pdfM

achin

e tri

al ve

rsion

Page 8: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 8 de 14

Material de Lectura: Qué se entiende por Arquitectura Cliente-ServidorEsta arquitectura consiste básicamente en que un programa el Cliente informático realiza peticiones a otroprograma, el servidor, que les da respuesta.Aunque esta idea se puede aplicar a programas que se ejecutan sobre una sola computadora es másventajosa en un Sistema Operativo multiusuario distribuido a través de una red de computadoras.En esta arquitectura la capacidad de proceso está repartida entre los Clientes y los Servidores, aunque sonmás importantes las ventajas de tipo organizativo debidas a la centralización de la gestión de la informacióny la separación de responsabilidades, lo que facilita y clarifica el diseño del sistema.La separación entre Cliente y Servidor es una separación de tipo lógico, donde el servidor no se ejecutanecesariamente sobre una sola máquina ni es necesariamente un sólo programa.Una disposición muy común son los sistemas multicapa en los que el servidor se descompone en diferentesprogramas que pueden ser ejecutados por diferentes computadoras aumentando así el grado dedistribución del sistema.La arquitectura Cliente-Servidor sustituye a la arquitectura monolítica en la que no hay distribución,tanto a nivel físico como a nivel lógico.Ventajas de la arquitectura Cliente-Servidor· Centralización del control: los accesos, recursos y la integridad de los datos son controlados por elservidor de forma que un programa cliente defectuoso o no autorizado no pueda dañar el sistema.

· Escalabilidad: se puede aumentar la capacidad de clientes y servidores por separado.El Servidor de cliente es la arquitectura de red que separa al cliente (a menudo un uso que utiliza uninterfaz utilizador gráfico) de un servidor.Cada caso del software del cliente puede enviar peticiones a un servidor.Los tipos específicos de servidores incluyen los servidores web, los servidores del uso, los servidores dearchivo, los servidores terminales, y los servidores del correo. Mientras que sus propósitos varían algo, laarquitectura básica sigue siendo igual.

pdfM

achin

e tri

al ve

rsion

Page 9: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 9 de 14

6. Lenguaje de Consulta Estructurado SQL· Es un lenguaje de consulta comercial que proporciona una interfaz más amigable al usuario.· El Lenguaje de Consulta Estructurado (Structured Query Language) es un lenguaje declarativo deacceso a bases de datos relacionales que permite especificar diversos tipos de operaciones sobre lasmismas. Una de sus características es el manejo del álgebra y el cálculo relacional permitiendolanzar consultas con el fin de recuperar información de interés de una base de datos, de una formasencilla.

· Es un lenguaje de cuarta generación (4GL).

Las partes más importantes del SQL son:· DDL: Lenguaje de definición de datos (que nos permite crear las estructuras )· DML: Lenguaje de manipulación de datos (que nos permite tener acceso a las estructuras para suprimir,

modificar e insertar)· La estructura básica de una expresión en SQL contiene 3 partes: Select, From y Where.

o La cláusula Select se usa para listar los atributos que se desean en el resultado de una consulta.o From, Lista las relaciones que se van a examinar en la evaluación de la expresión.o Where, es la definición de las condiciones a las que puede estar sujeta una consulta.La consulta típica de SQL tiene la siguiente forma:Select A1,A2,A3...An From r1,r2,r3...rm Where Condición(es)Donde:o A1,A2,A3...An: Representan a cada atributo(s) o campos de las tablas de la base de datos

relacional.o r1,r2,r3...rm: Representan a la(s) tabla(s) involucradas en la consulta.o Condición: Es el enunciado que rige el resultado de la consulta.Si se omite la cláusula Where, la condición es considerada como verdadera, la lista de atributos(A1,A2..An) puede sustituirse por un asterisco (*), para seleccionar todos los atributos de todas lastablas que aparecen en la cláusula From.

Los orígenes del SQL están ligados a los de las bases de datos relacionales.En 1970 E. F. Codd propone el modelo relacional y asociado a este un sublenguaje de acceso a los datosbasado en el cálculo de predicados.SQL (Structured Query Language) es un lenguaje de programación diseñado para almacenar, manipular yrecuperar datos almacenados en bases de datos relacionales.La primera encarnación de SQL apareció en 1974, cuando un grupo de IBM desarrolló el primer prototipo deuna base de datos relacional. Relational Software (luego se convirtió en Oracle) lanzó la primera base dedatos relacional comercial.Existen estándares para SQL.

pdfM

achin

e tri

al ve

rsion

Page 10: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 10 de 14

Sin embargo, el SQL que puede utilizarse en cada uno de las principales RDBMS actuales viene en distintasformas.Esto se debe a dos razones:1. El estándar SQL es bastante complejo, y no es práctico implementar el estándar completo, y2. Cada proveedor de BD necesita una forma de diferenciar su producto de otros.

6.1. Para qué utilizamos los comandos SQL?El uso común es la selección de datos desde tablas ubicadas en una base de datos.Inmediatamente, vemos dos palabras claves: necesitamos SELECT la información FROM una tabla, dondela tabla es un contenedor que reside en la BD donde se almacena la información.Las tablas son la estructura básica donde se almacena la información en la base de datos.Dado que en la mayoría de los casos, no hay forma de que el proveedor de base de datos sepa conantelación cuales son sus necesidades de almacenamiento de datos, es probable que necesite crear tablasen la base de datos usted mismo.Muchas herramientas de BD permiten crear tablas sin ingresar SQL, pero debido a que las tablas son loscontenedores de toda la información.La sintaxis Create Table permite crear una tabla contituida por diferentes campos de distintos tipos dedatos. Algunos tipos de datos son: un entero (tal como 1), un número real (tal como 0,55), una línea (talcomo 'sql'), una fecha/expresión de tiempo (tal como '25-ene-2000 03:22:22'), o incluso en formato binario.Cuando especificamos una tabla, necesitamos especificar el tipo de dato asociado con cada columna (esdecir, especificaremos que ‘First_Name’ es de char (50) tipo – lo que significa que es una línea con 50caracteres).La sintaxis SQL para CREATE TABLEesCREATE TABLE "nombre_tabla" ("columna 1" "tipo_de_datos_para_columna_1", "columna 2""tipo_de_datos_para_columna_2", ... )

El SQL trabaja con estructura Cliente/Servidor sobre una red de ordenadores.El ordenador cliente es el que inicia la consulta; el ordenador servidor es que atiende esa consulta.El cliente utiliza toda su capacidad de proceso para trabajar; se limita a solicitar datos al ordenador servidor,sin depender para nada más del exterior. Estas peticiones y las respuestas son transferencias de textos quecada ordenador cliente se encarga de sacar por pantalla, presentar en informes tabulados, imprimir,guardar, etc., dejando el servidor libre.El SQL permite:· Definir una base de datos mediante tablas.· Almacenar información en tablas.· Seleccionar la información que sea necesaria de la base de datos.· Realizar cambios en la información y estructura de los datos.· Combinar y calcular datos para conseguir la información necesaria.

pdfM

achin

e tri

al ve

rsion

Page 11: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 11 de 14

SQL es el lenguaje de comunicación entre el programa cliente y programa servidor, el motor de base dedatos es un programa servidor, en el que está la base de datos propiamente dicha.

El usuario accede con alguno de los programas cliente disponibles para realizar requerimientos al motor.En este manual se explica como emplear SQL para:· Crear y modificar la estructura de una tabla de datos.· Seleccionar información de una tabla.· Añadir datos a una tabla.· Introducir información en una tabla.· Realizar consultas entre tablas con campos comunes.

pdfM

achin

e tri

al ve

rsion

Page 12: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 12 de 14

7. Datawarehouse (DW) y Datamining (DM)Hoy en día las empresas cuentan en su mayoría con la automatización de sus procesos, manejando

gran cantidad de datos en forma centralizada y manteniendo sus sistemas en línea. En esta informacióndescansa el know-how de la empresa, constituyendo un recurso corporativo primario y parte importante desu patrimonio.

El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevas estrategias degestión. En el pasado, las organizaciones fueron típicamente estructuradas en forma piramidal coninformación generada en su base fluyendo hacia lo alto; y era en el estrato de la pirámide más alto donde setomaban decisiones a partir de la información proporcionada por la base, con un bajo aprovechamiento delpotencial de esta información. Estas empresas, han reestructurado y eliminado estratos de estas pirámides yhan autorizado a los usuarios de todos los niveles a tomar mayores decisiones y responsabilidades. Sinembargo, sin información sólida para influenciar y apoyar las decisiones, la autorización no tiene sentido.

Esta necesidad de obtener información para una amplia variedad de individuos es la principal razónde negocios que conduce al concepto de Datawarehouse. El énfasis no está sólo en llevar la informaciónhacia lo alto sino que a través de la organización, para que todos los empleados que la necesiten la tengan asu disposición.

El DW convierte entonces los datos operacionales de una organización en una herramientacompetitiva, por hacerlos disponibles a los empleados que lo necesiten para el análisis y toma de decisiones.

Una herramienta que surge de la mano del DW se denomina Data Mining, asociada a la extracciónde oro de las rocas, extraer información oculta y predecible de grandes bases de datos, información quepuede aportar nuevos enfoques de nuestros propios negocios, hechos que acontecen con nuestros clientesque no los vemos a simple vista, pero se encuentran ocultos en ese cúmulo de datos de transacciones quetan celosamente custodiamos, información que si la aprovechamos pueden generar beneficios adicionalespara la empresa.

El DM es una poderosa tecnología nueva con gran potencial que ayuda a las compañías aconcentrarse en la información más importante de sus Bases de Información (DataWarehouse).

DM es una tecnología de soporte para usuario final cuyo objetivo es extraer conocimiento útil yutilizable a partir de la información contenida en las bases de datos de las empresas

Las dos herramientas presentadas tienen por objetivo manejar eficientemente la información decada área de la empresa, se pueden tomar mejores decisiones y así efectuar acciones apropiadas yfinalmente conseguir un mejor control sobre la producción empresarial.

Un Datawarehouse es una colección de datos en la cual se encuentra integrada lainformación de una Institución y que se usa como soporte para el proceso de toma de decisionesgerenciales.

Aunque diversas organizaciones y personas individuales logran comprender el enfoque de unWarehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.

La importante necesidad de información existente en la empresa, necesita ser satisfecha mediantealgún medio y es lo más deseable que se realice de la forma más eficiente posible.

Pero… ¿Qué limitaciones existen para satisfacer esta necesidad con la base de datos con la queoperan nuestros sistemas de transacciones?

pdfM

achin

e tri

al ve

rsion

Page 13: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 13 de 14

Mediante un sistemas de informes o consultas avanzadas, sobre nuestra base de transacciones (lascuales generalmente aplican modelos relacionales u objeto-relacionales), realizando la unión de las tablasque uno desea y mediante la aplicación de filtros utilizando los operadores clásicos: concatenación,proyección, selección, agrupamiento, (en SQL y extensiones), se puede realizar una aproximación a lasnecesidades habientes.

Pero… ¿Es esto lo que realmente se necesita?Este planteamiento implica trabajar sobre una gran base de datos, con complejas relaciones entre

las tablas, o incluso con datos que se encuentran en distintas bases de datos, que pueden o no estarcorrectamente validados y lo mas importante se debe conocer de antemano las consultas que se puedennecesitar hacer, situación solo se conoce efectivamente en el momento que se realiza el proceso de toma dedecisiones (lo que implicaría un retraso en este proceso hasta que la consulta sea desarrollada u otra opciónde muy improbable aplicación enseñarle a los gerentes a manejar SQL), problemas de inconsistencia,inflexibilidad y carencia de integración a través de la empresa.

Con el objetivo de satisfacer esta necesidad de la manera más eficaz y eficiente, ofreciendo laflexibilidad que se requiere es que surge el concepto de Datawarehousing.

7.1. DW Empresarial· “Almacenamiento, transformación y distribución de datos útiles para los responsables de tomardecisiones”

· Es un proceso que recopila datos de varias aplicaciones, en los sistemas operacionales de unaorganización, integra la información en un modelo lógico, la almacena de modo que resulte accesible alos tomadores de decisiones y se las provee a través de herramientas de consulta y generación deinformes. El objetivo es poner información corporativa comparable y estandarizada en manos deempleados para permitir una visión corporativa amplia de la empresa.

· Es un depósito de datos históricos extraídos de bases de datos operacionales que pueden ser consultadaspara detectar tendencias comerciales o para soporte a la toma de decisiones.

El objetivo principal es satisfacer los requerimientos de información internos de la empresa para unamejor gestión, con eficiencia y facilidad de acceso.El DW puede verse como una bodega donde están almacenados todos los datos necesarios para realizar

las funciones de gestión de la empresa, de manera que puedan utilizarse fácilmente según se necesiten. Elcontenido de los datos, la organización y estructura son dirigidos a satisfacer las necesidades de informaciónde analistas.Los sistemas transaccionales son dinámicos, en el sentido que constantemente se encuentran

actualizando datos.Los almacenes de datos (o Datawarehouse) generan bases de datos tangibles con una perspectiva

histórica, utilizando datos de múltiples fuentes que se fusionan en forma congruente. Estos datos semantienen actualizados, pero no cambian al ritmo de los sistemas transaccionales. Muchos datawarehousesse diseñan para contener un nivel de detalle hasta el nivel de transacción, con la intención de hacerdisponible todo tipo de datos y características, para reportar y analizar.

pdfM

achin

e tri

al ve

rsion

Page 14: Material Teorico Base de Datos - 2do. Parcial

Universidad Tecnológica Nacional - Facultad CórdobaDptos. Ingeniería Industrial y Mecánica

Informática I – Fundamentos de Informática

Material recopilado y organizado por Ing. Carrizo Página 14 de 14

Así, un Datawarehouse resulta ser un recipiente de datos transaccionales para proporcionar consultasoperativas, y la información para poder llevar a cabo análisis multidimensional.Un datawarehouse es una colección de datos orientada al negocio, integrada, variante en el tiempo y no

volátil para el soporte del proceso de toma de decisiones de la empresa

Los objetivos que persigue son:· Permitir el acceso a los datos de la organización en forma inmediata, sobre demanda y con alta

performance.· Manejar datos consistentes· Permitir que los datos puedan ser separados y combinados· El datawarehouse no es solo datos sino un conjunto de herramientas para consultar, analizar y presentar

información.· Ser el lugar donde se publican los datos que se usan en la organización.· La calidad de los datos en el datawarehouse debe ser una meta para la reingeniería del negocio.

pdfM

achin

e tri

al ve

rsion