Cuestionario

6

Click here to load reader

Transcript of Cuestionario

Page 1: Cuestionario

ADMINISTRACIÓN DE BASES DE DATOS BANCO DE PREGUNTAS

1. Diferencias entre DBA, Administrador de datos y administrador de sistemas.

Administrador de BD es aquel que ve por toda la base de datos en general,

entidades, atributos, relaciones en general la gestión de toda la BD y no solo de los

datos. Garantizan la disponibilidad cuando los usuarios lo requieren siempre y cuando

sean autorizados brindando información de calidad a tiempo.

Un administrador de datos es aquel que solo se dedica a ver por la integridad de los

datos contenidos en la BD y a todo lo q corresponde a la gestión de los mismos.

Un administrador de sistemas es la persona que tiene la responsabilidad de ejecutar

y asegurar el correcto funcionamiento de un sistema informático, o algún aspecto de

éste. Cambia de un enfoque de programación a un enfoque de los aspectos más

amplios de la administración de los recursos y a la administración del complejo

software de la base de datos.

2. Cuál es el tamaño por defecto de un bloque de datos en PosgreSQL. ¿Se puede

cambiar el tamaño de bloque?

El tamaño de bloque (por defecto 8KB, el máximo era 32KB, definido en tiempo de

compilación), en el archivo postgresql.conf

3. ¿Qué es un tablespace? Un tablespace es una unidad lógica de almacenamiento dentro de una base de datos que permiten a los administradores de bases de datos definir los lugares en el sistema de archivos donde se almacenan los archivos que representan objetos de la base.

4. ¿Cuáles son las fases de un diseño de base de datos?

ANÁLISIS DE REQUERIMIENTOS:

Captar los requisitos de información de los distintos grupos de usuarios.

Información sobre el uso que se piensa dar a la BD.

Captar requerimientos operativos o Transacciones (críticas y no críticas)

Etapa del diseño conceptual: en esta etapa se obtiene una estructura de la

información de la futura BD independiente de la tecnología que hay que emplear. No se

tiene en cuenta todavía qué tipo de base de datos se utilizará

Etapa del diseño lógico: Proceso de transformar desde el modelo entidad relación al

modelo relacional donde el modelo se lo presenta en tablas eliminando cualquier

redundancia.

Etapa del diseño físico: Creación de la base de datos en un computador utilizando un SGBD Incluye escoger las estructuras de archivos determinadas en las que almacenar las tablas, o relaciones, de la base de datos, y en asegurar que se puede acceder a las relaciones de forma rápida, eficiente y segura.

Page 2: Cuestionario

5. ¿Qué es la desnormalización? ¿Qué ventajas y desventajas tiene la desnormalización? 5. Describa tres formas de desnormalizar.

Es el proceso de procurar optimizar el desempeño de una base de datos por medio de agregar datos redundantes.

VENTAJAS

Se debe desnormalizar para optimizar el esquema relacional.

Para hacer referencia a la combinación de dos relaciones que forman una sola relación.

DESVENTAJAS

Sacrifica a menudo la flexibilidad

Implementación más compleja

FORMAS DE DESNORMALIZAR

Creación de tablas espejo, fragmentación horizontal, fragmentación vertical.

Combinación de relaciones uno a uno

Solo debe considerarse para las relaciones que frecuentemente se haga referencia de manera

conjunta y a las que se haga de forma separada infrecuentemente

Duplicación de atributos no clave en las relaciones uno a muchos para reducir las

combinaciones

Reduce o elimina las combinaciones en las consultas frecuentes o críticas.

Duplicación de los Atributos de clave externa en las relaciones uno a muchos para

reducir las combinaciones

Reduce o elimina las combinaciones en las consultas frecuentes o críticas.

6. ¿Para qué sirve un índice?

Un índice es una ruta alternativa a los datos de una tabla ayuda a mejorar búsqueda de

datos con esto mejora la velocidad de las operaciones, permitiendo un rápido acceso a

los registros de una tabla en una base de datos

7. ¿Por qué no se debe crear índices sobre atributos muy actualizables?

Porque hay que tener en cuenta que ocupan espacio y en determinadas ocasiones incluso más

espacio que los propios datos esto es porque los índices se modifican cada vez que se

actualiza. Provocando una sobrecarga en la BDD.

8. ¿Qué es un índice agrupado?

Es similar a una guía telefónica, los registros con el mismo valor de campo se agrupan juntos.

Un índice agrupado determina la secuencia de almacenamiento de los registros en una tabla.

9. ¿Qué son los niveles de aislamiento? ¿Para qué sirven?

El nivel de aislamiento de una transacción es una característica de vital importancia en

el desarrollo de aplicaciones de base de datos, ya que afecta a los tipos y duración de

bloqueos que se producen en nuestra infraestructura de base de datos, lo cual, tiene

efectos directos en el rendimiento y tiempo de respuesta de nuestras consultas y

transacciones.

Sirven para controlar:

Si se realizan bloqueos cuando se leen los datos y qué tipos de bloqueos se solicitan.

La duración de los bloqueos de lectura.

10. ¿Qué es la granularidad de bloqueos?

Page 3: Cuestionario

La granularidad se refiere a que tan fino se quiere que sea un bloqueo. Por ejemplo

desea bloquear la tabla completa (un bloqueo de granularidad gruesa) o

solo desea bloquear una fila especifica (un bloqueo de granularidad fina).

11. Indique 4 diferencias entre SQL y otros lenguajes de programación.

Access está más enfocado en “uso de escritorio” o personal, pensado para manejarse

desde un solo equipo. Por otro lado, SQL Server permite el acceso a las bases de

datos a miles de usuarios simultáneamente, y no sólo eso, sino que también permite

almacenar grandes volúmenes de datos (TB) que incluyen elementos como fotografías,

videos, textos, números, etc, con millones de registros.

SQL Server es autónomo, mientras que Access no lo es.

SQL Server permite que los clientes puedan manipular los datos desde cualquier

computador conectado a Internet, mientras que Access sólo permite crear aplicaciones

que trabajan en red con los archivos, sin embargo todo el procesamiento se efectúa en

un solo equipo.

SQL Server ofrecer ventajas a la hora de publicar datos en Internet, como por ejemplo

la estabilidad para el servidor web, ya que se libera al servidor web de las actividades

referentes a los datos, es decir no lo sobrecarga, y en conclusión podrá mejorar su

rendimiento y estabilidad. Access, hace todo lo contrario, es decir sobrecarga al

servidor web, aumentando el riesgo de inestabilidad para el servidor web.

12. Señale 3 causas que obligan a cambiar una base de datos en funcionamiento.

Cambio por necesidad de rendimiento

Para almacenar otro tipo de datos

Cambios en las regulaciones

13. Explique 3 aspectos a tomar en cuenta para asegurar cambios exitosos.

PROACTIVIDAD: mientras más temprano los cambios requeridos son identificados e

implementados más bajo es el costo del cambio.

INTELIGENCIA: examinar las implicaciones de cada cambio antes de realizarlo,

planear el cambio buscando la forma más eficiente y menos costosa y realizar plan de

contingencia.

AUTOMATIZACION: eliminan los errores humanos y se realizan los cambios más

rápidamente.

14. Señale 3 casos en los que es necesario mantener varias copias de una misma base

de datos.

Page 4: Cuestionario

Cuando queremos disponer de nuestros datos en caso de pérdida o daños en el equipo

Cuando no queremos tener pérdida de información que puede ser originadas por

infecciones del sistema, fallos de hardware (cortes de corriente y picos de tensión,

excesos de temperatura y daños en los dispositivos), apagados incorrectos del equipo,

accidente o problemas motivados por algún software, entre otros.

Si es que la base de datos no solo es manejada por una persona sino por varias para

evitar posibles acciones incorrectas de parte de las otras personas.

15. ¿Cuál es la instrucción que se utiliza en SQL para modificar el esquema de una base

de datos en producción?

Con la instrucción ALTER 16. Describa 3 ventajas de las herramientas para gestión de cambios.

Tener a mano la solución más adecuada para cualquier modificación

Poseer un plan de contingencia para poder solucionar más rápidamente los

requerimientos

Identificar más rápidamente los cambios a efectuarse

17. Diga el nombre de una herramienta para control de versiones de bases de datos en PostgreSQL.

MVCC: Control de Concurrencia para Múltiples Versiones de PostgreSQL 18. Defina que se entiende por disponibilidad de datos.

La disponibilidad es el recurso en el cual los usuarios pueden tener acceso a los datos en un tiempo considerable

19. Describa dos causas que obligan a las empresas a aumentar la disponibilidad de sus bases de datos.

Los negocios demandan más disponibilidad todo el tiempo de los sistemas y el costo del tiempo fuera de línea aumenta y el tiempo para aumentar el rendimiento disminuye

Mantener un entorno eficaz tanto en el tiempo como en la calidad de datos

Ofrecer al usuario las aplicaciones disponibles ya que si no lo están la empresa puede perder dinero

Tener datos en línea y operando siempre

Para no perder clientes ni prestigio

Ganar a la competencia 20. Diferencias entre disponibilidad y rendimiento.

Rendimiento es la celeridad con la que la DBMS atiende la demanda de los usuarios mientras que la disponibilidad es el recurso en el cual los usuarios tienen acceso a los datos en menor tiempo posible.

El rendimiento optimización del uso de recursos para incrementar la capacidad de procesamiento y disminuir la contención permitiendo que sea procesada la mayor carga del trabajo mientras que disponibilidad se encarga del tiempo como en la calidad de datos presentados.

21. ¿Cómo procedería para la realización de tareas de mantenimiento tales como

respaldos o reorganización de archivos, en bases de datos cuya disponibilidad es de 5 nueves?

22. ¿Cuándo se debe hacer la reorganización de los archivos de una base de datos?

Page 5: Cuestionario

Para reducir la base de datos, la idea es comprimir la información almacenada en la base de datos, que nos produce un ahorro de espacio en disco mejorando el rendimiento del servidor. Por otro lado, el hecho de poder comprimir tipos de datos antes considerados como estáticos, nos permite mitigar malas decisiones de diseño en nuestras bases de datos.

23. ¿Por qué un data warehouse puede causar indisponibilidad de las bases de datos?

La carga de datos en un Data Warehouse es crítica por la indisponibilidad de los datos en caso de retraso en el proceso de carga. Esta indisponibilidad puede retrasar la toma de decisiones directivas, comerciales y de marketing que afectan en gran medida a la planificación, gestión y control de los procesos del negocio.

24. Señale 3 problemas que pueden causar a una empresa la indisponibilidad de sus bases de datos.

Perder clientes por falta de servicio

Perdida de dinero ya que el costo del tiempo fuera de línea aumenta

Daria oportunidad a la competencia para que se adueñe del mercado

25. ¿Cómo se especifica la disponibilidad necesaria en una base de datos? La disponibilidad de los datos en la empresa es muy importante ya que si no están disponibles, las aplicaciones no pueden funcionar y la empresa pierde dinero. Es trabajo del DBA que la base de datos este en línea operando. Los e_business necesitan estar disponibles todo el tiempo.

26. ¿Cómo evitar la indisponibilidad de una base de datos en el caso de un desastre

natural que destruya el centro de datos?

La manera más factible es tener una copia o una réplica de la base de datos en un lugar fuera de la ubicación física de la principal por ejemplo la principal corriendo en Quito y el respaldo Guayaquil.

27. ¿Cómo evitar la indisponibilidad de una base de datos en el caso de que se dañe el disco duro que almacena los datos?

La manera más óptima para prevenir esto es crear una copia íntegra de la base de datos original en otro servidor teniendo un sistema de espejo.

28. ¿Cómo es el procedimiento para cambiar el orden físico de una tabla? Describa los pasos.

29. Explique en qué consiste una base de datos reflejo. Para qué sirve.

Base de Datos Espejo (Database Mirroring) es una configuración donde dos o tres servidores de dase de datos, ejecutándose en equipos independientes, cooperan para mantener copias de la base de datos y archivo de registro de transacciones (log).

Tanto el servidor primario como el servidor espejo mantienen una copia de la base de datos y el registro de transacciones.

Sirve para tener una copia exacta de la base original para poder utilizarla si la principal tiene algún tipo de fallos.

30. Explique qué es la conmutación por error. Para qué sirve.

Es una operación de espera que cambia automáticamente a un sistema en espera si el sistema principal falla. La conmutación por error reorienta automáticamente solicitudes del sistema con errores al sistema en espera. Sirve para evitar que se den fallos y se pierdan datos de la base de datos y las aplicaciones no tengan la disponibilidad de datos.

Page 6: Cuestionario

31. ¿Qué es la clusterización? ¿Para qué sirve?

La clusterización es un conjunto de equipos independientes que funcionan conjuntamente para aumentar la disponibilidad de los servicios y las aplicaciones. Los servidores agrupados (llamados nodos) se conectan mediante cables físicos y software. Sirve para dar alta disponibilidad a un servicio o aplicación.

32. ¿Qué es la replicación sincrónica?

Es la replicación que asegura que todo dato escrito en el CPD principal también se escribe en el centro de respaldo antes de continuar con cualquier otra operación.

33. ¿Qué es la replicación asincrónica?

Es la replicación que no se asegura que todos los datos escritos en el servidor principal se escriban inmediatamente en el centro de respaldo, por lo que puede existir un desfase temporal entre unos y otros.