viernes, 20 de marzo de 2009

DISEÑO DE BASE DE DATOS RELACIONAL.

La concepción de una Base de Datos Relacional es una necesidad de contar con procedimientos ordenados que faciliten el desarrollo de un producto software, ya que esto tiene una incidencia en cuanto a costos y plazos de entrega, además de la calidad y mantenimiento del producto. Una base de datos relacional es un conjunto de una o más tablas estructuradas en registros (líneas) y campos (columnas), que se vinculan entre sí por un campo en común, en ambos casos posee las mismas características como por ejemplo el nombre de campo, tipo y longitud; a este campo generalmente se le denomina ID, identificador o clave. A esta manera de construir bases de datos se le denomina modelo relacional.
No existe una metodología consagrada, sin embargo, ciertas etapas son distinguibles:






Diseño Conceptual: El esquema conceptual se puede utilizar para que el diseñador transmita a la empresa lo que ha entendido sobre la información que ésta maneja. Para ello, ambas partes deben estar familiarizadas con la notación utilizada en el esquema. La más popular es la notación del modelo entidad-relación, que se describirá en el capítulo dedicado al diseño conceptual.

Diseño Lógico: El objetivo del diseño lógico es convertir los esquemas conceptuales locales en un esquema lógico global que se ajuste al modelo de SGBD sobre el que se vaya a implementar el sistema. Mientras que el objetivo fundamental del diseño conceptual es la compleción y expresividad de los esquemas conceptuales locales, el objetivo del diseño lógico es obtener una representación que use, del modo más eficiente posible, los recursos que el modelo de SGBD posee para estructurar los datos y para modelar las restricciones


Diseño Físico: El objetivo de esta etapa es producir una descripción de la implementación de la base de datos en memoria secundaria. Esta descripción incluye las estructuras de almacenamiento y los métodos de acceso que se utilizarán para conseguir un acceso eficiente a los datos.
El diseño físico se divide de cuatro fases, cada una de ellas compuesta por una serie de pasos:
Ø Traducir el esquema lógico global para el SGBD específico.
o Diseñar las relaciones base para el SGBD específico.
o Diseñar las reglas de negocio para el SGBD específico.
Ø Diseñar la representación física.
o Analizar las transacciones.
o Escoger las organizaciones de ficheros.
o Escoger los índices secundarios.
o Considerar la introducción de redundancias controladas.
o Estimar la necesidad de espacio en disco.
Ø Diseñar los mecanismos de seguridad.
o Diseñar las vistas de los usuarios.
o Diseñar las reglas de acceso.
Ø Monitorizar y afinar el sistema.


PELIGROS EN EL DISEÑO DE BASES DE DATOS RELACIONALES.
Existen diversos riesgos en el diseño de las bases de datos relacionales que afecten la funcionalidad de la misma, los riesgos generalmente son la redundancia de información y la inconsistencia de datos.
La normalización es el proceso de simplificar la relación entre los campos de un registro.Por medio de la normalización un conjunto de datos en un registro se reemplaza por varios registros que son más simples y predecibles y, por lo tanto, más manejables. La normalización se lleva a cabo por cuatro razones:
1. Estructurar los datos de forma que se puedan representar las relaciones pertinentes entre los datos.
2.Permitir la recuperación sencilla de los datos en respuesta a las solicitudes de consultas y reportes.
3.Simplificar el mantenimiento de los datos actualizándolos, insertándolos y borrándolos.
4.Reducir la necesidad de reestructurar o reorganizar los datos cuando surjan nuevas aplicaciones.



Pasos de la normalización:

1. Descomponer todos los grupos de datos en registros bidimensionales.
2. Eliminar todas las relaciones en la que los datos no dependan completamente de la llave primaria del registro.
3. Eliminar todas las relaciones que contengan dependencias transitivas.
4. Daremos a cada entidad una llave Primaria o Principal.
5. Observemos que los atributos de cada entidad Tengan Relación uno a uno entre ellos, Imaginemos una entidad cliente en la que tenemos, como atributos:
-identificación
-tipo identificación
-nombre
-dirección
-teléfono
Procedemos a relacionar de la siguiente forma:
Un cliente tiene un número de identificación
Un número de identificación describe un nombre, un teléfono y una dirección
6. Revisaremos nuevamente la clave primaria de cada entidad, generalmente esta siempre va a ser un numero que permite el acceso rápido a la información.
7. Los campos eliminados de la entidada en el paso 2. Que son esenciales en la base de datos pasaran a convertirse en nuevas entidades.
8. A las nuevas entidades les definiremos una clave Principal y de nuevo realizaremos el paso 2, hasta que lleguemos al punto de cumplir con este a cabalidad
9. Observaremos si al normalizar el diseño, cumplimos con los requerimientos de esta base de datos. Probando que esta cumpla con todas las consultas pertinentes.

Formas normales.

Son las técnicas para prevenir las anomalías en las tablas. Dependiendo de su estructura, una tabla puede estar en primera forma normal, segunda forma normal o en cualquier otra. Son las técnicas para prevenir las anomalías en las tablas. Dependiendo de su estructura, una tabla puede estar en primera forma normal, segunda forma normal o en cualquier otra.



Primera forma normal.
En el proceso de normalización de base de datos, una tabla está en primera forma normal si, y sólo si, representa fielmente una relación.Esto se expresa, también, diciendo que la tabla debe ser isomórfica a una relación. Lo que significa que la tabla satisface las siguientes cinco condiciones:
1. Las filas no tienen ningún orden vertical.
2. Las columnas no tienen ningún orden horizontal.
3. No hay filas duplicadas.
4. Toda intersección entre una fila y una columna contiene exactamente un solo valor del dominio aplicable.
5. Todas las columnas son regulares, es decir, ninguna fila tiene componentes ocultos.

Segunda forma normal.

Para definir formalmente la segunda forma normal requerimos saber que es una dependencia funcional: Consiste en edificar que atributos dependen de otro(s) atributo(s).


Definición formal: Una relación R está en 2FN si y solo si está en 1FN y los atributos no primos dependen funcionalmente de la llave primaria.

Una relación se encuentra en segunda forma normal, cuando cumple con las reglas de la primera forma normal y todos sus atributos que no son claves (llaves) dependen por completo de la clave. De acuerdo con está definición, cada tabla que tiene un atributo único como clave, esta en segunda forma normal.

La segunda forma normal se representa por dependencias funcionales como:


Nótese que las llaves primarias están representadas con doble cuadro, las flechas nos indican que de estos atributos se puede referenciar a los otros atributos que dependen funcionalmente de la llave primaria.

TERCERA FORMA NORMAL Y LA FORMA NORMAL DE BOYCE CODD.
Para definir formalmente la 3FN necesitamos definir dependencia transitiva: En una afinidad (tabla bidimensional) que tiene por lo menos 3 atributos (A, B, C) en donde A determina a B, B determina a C pero no determina a A.

Tercera forma normal.Definición formal: Una relación R está en 3FN si y solo si esta en 2FN y todos sus atributos no primos dependen no transitivamente de la llave primaria.
Consiste en eliminar la dependencia transitiva que queda en una segunda forma normal,
Podemos darnos cuenta que se encuentra graficado en segunda forma normal, es decir que todos los atributos llave están indicados en doble cuadro indicando los atributos que dependen de dichas llaves, entonces tenemos:
Forma normal de Boyce Codd.Determinante: Uno o más atributos que, de manera funcional, determinan otro atributo o atributos.

Cuarta forma normal.

Definición formal: Un esquema de relaciones R está en 4FN con respecto a un conjunto D de dependencias funcionales y de valores múltiples sí, para todas las dependencias de valores múltiples en D de la forma X->->Y, donde X<=R y Y<=R, se cumple por lo menos una de estas condiciones: * X->->Y es una dependencia de valores múltiples trivial.* X es una superllave del esquema R.

Suponemos que los estudiantes pueden inscribirse en varias especialidades y en diversos cursos.

En esta tabla o relación no existe dependencia funcional porque los estudiantes pueden tener distintas especialidades, un valor único de clave puede poseer muchos valores de especialidades al igual que de valores de cursos. Por lo tanto existe dependencia de valores múltiples. Este tipo de dependencias produce redundancia de datos, como se puede apreciar en la tabla anterior,

Existe una dependencia de valores múltiples cuando una afinidad tiene por lo menos tres atributos, dos de los cuales poseen valores múltiples y sus valores dependen solo del tercer atributo,

En la tabla anterior Clave determina valores múltiples de especialidad y clave determina valores múltiples de curso, pero especialidad y curso son independientes entre sí.

Las dependencias de valores múltiples se definen de la siguiente manera: Clave ->->Especialidad y Clave->->Curso; Esto se lee "Clave multidetermina a Especialidad, y clave multidetermina a Curso"

QUINTA FORMA NORMAL. Un esquema de relaciones R está en 5FN con respecto a un conjunto D de dependencias funcionales, de valores múltiples y de producto, si para todas las dependencias de productos en D se cumple por lo menos una de estas condiciones:

* (R1, R2, R3,... Rn) es una dependencia de producto trivial.* Toda RI es una superllave de R.

La quinta forma normal se refiere a dependencias que son extrañas.

No hay comentarios:

Publicar un comentario