Modelos de organización de bases de datos. Modelos básicos de construcción de bases de datos.

Cualquier base de datos refleja información sobre un área temática específica. Dependiendo del nivel de abstracción en el que se representa un dominio de problema, existen diferentes niveles de modelos de datos. Un modelo de datos de información es una forma de describir la información contenida en un área temática. A continuación, se considerarán modelos de datos estructurados. Para estos modelos, existen cuatro niveles principales de modelos: infológico (conceptual), datalógico o lógico, físico y nivel de modelos externos.

En el primer nivel, la descripción del área temática se construye de manera que sea lo más general posible, no dependa de las características del DBMS seleccionado posteriormente y la información sea accesible a una amplia categoría de usuarios: desde los clientes hasta el sistema. programadores que diseñarán una base de datos basada en este modelo. Para ello, la información inicial sobre el área temática se analiza y se presenta de alguna forma formalizada. Esta descripción formalizada del área temática debe reflejar sus detalles y usarse en las siguientes etapas del diseño de la estructura de la base de datos en el contexto de las características del DBMS específico seleccionado. Esta descripción formalizada del área temática se denomina modelo infológico o conceptual.

Luego se construye un modelo en términos del DBMS específico seleccionado para el diseño de la base de datos. Este nivel se llama modelo datalógico (lógico). La descripción de la estructura datalógica de una base de datos en el lenguaje del DBMS seleccionado se denomina esquema.

El siguiente nivel es el modelo de datos físicos. En el marco de este modelo, se determinan los métodos para colocar físicamente los datos en un entorno de almacenamiento y se desarrolla el llamado esquema de almacenamiento de datos. Dado que diferentes DBMS tienen diferentes capacidades y características de la organización física de los datos, el modelado físico se lleva a cabo solo después del desarrollo de un modelo datalógico.

Varios DBMS modernos tienen la capacidad de describir la estructura de una base de datos desde el punto de vista de un usuario específico. Esta descripción se llama modelo externo. Para cada tipo de usuario, el modelado externo le permite desarrollar un subesquema de base de datos basado en las necesidades de diferentes categorías de usuarios. Este enfoque es conveniente desde el punto de vista de facilitar el trabajo de los usuarios con la base de datos, ya que el usuario puede, sin conocer toda la estructura de la base de datos, trabajar solo con aquella parte que está directamente relacionada con él. Además, el mecanismo para crear subesquemas sirve como medio adicional para proteger la información almacenada en la base de datos.

Por lo tanto, si el DBMS admite la capacidad de crear subesquemas, entonces la arquitectura de la base de datos pasa a ser de tres niveles: nivel de esquema de almacenamiento, nivel de esquema y nivel de subesquema.

Consideremos ahora los principales tipos de modelos de datos.

El modelo de base de datos jerárquico es uno de los primeros modelos de bases de datos. Esto se debe principalmente al hecho de que es precisamente este modelo el que refleja de forma más natural múltiples conexiones entre objetos del mundo real, cuando un objeto actúa como padre, con el que están asociados un gran número de objetos subordinados.

El principio del modelo de base de datos jerárquico es que todas las conexiones entre datos se describen mediante la construcción de un gráfico ordenado (árbol). Un árbol se ordena según una jerarquía de conjuntos de elementos llamados nodos. Todos los nodos están conectados entre sí mediante ramas. En este caso, para describir el esquema de una base de datos jerárquica, se utiliza el concepto de “árbol” como tipo de datos específico. Este tipo de datos es compuesto y puede incluir subtipos o subárboles. Una base de datos es una colección de árboles, cada uno de los cuales en el lenguaje del modelo jerárquico se denomina base de datos física. Cada árbol consta de un único tipo de raíz (principal, principal) y un conjunto ordenado asociado de tipos subordinados (secundarios). Un tipo raíz es aquel que tiene subtipos y ningún tipo principal. Los tipos de niños que tienen el mismo tipo de padre se llaman gemelos. Cada uno de los tipos subordinados para un tipo raíz determinado puede ser un tipo de “registro” simple o compuesto.

Hay tres tipos de árboles: equilibrados, desequilibrados y binarios. En un árbol equilibrado, cada nodo tiene el mismo número de ramas. Esta organización de datos es físicamente la más simple, pero a menudo la estructura lógica de datos requiere un número variable de ramas en cada nodo, lo que corresponde a un árbol desequilibrado. Los árboles binarios permiten como máximo dos ramas por nodo.

Por tanto, un modelo de base de datos jerárquico puede interpretarse como una colección ordenada de instancias de árbol, cada una de las cuales contiene instancias de registro. El contenido real de la base de datos se almacena en los campos de los registros. Un campo de registro se define como la unidad de datos más pequeña e indivisible.

Al construir un modelo de base de datos jerárquico, siempre debe recordar respaldar la integridad de las relaciones, lo que significa que:

  • - siempre hay al menos un tipo padre, que puede tener un número arbitrario de tipos hijos;
  • - los tipos secundarios no pueden existir sin la presencia de un tipo principal, y para cada tipo subordinado en la base de datos hay un único nivel raíz;
  • - el tipo raíz no tiene necesariamente tipos subordinados.

Cabe señalar que algunas notaciones pueden utilizar terminología diferente. Así, en la notación de la American Database Association DBTG (Data Base Task Group), el término “registro” corresponde al término “segmento”, y un registro es el conjunto completo de registros que pertenecen a una instancia del “árbol”. tipo.

La principal ventaja del modelo de base de datos jerárquico es la velocidad relativamente alta de procesamiento de la información al acceder a los datos. Las desventajas incluyen su complejidad en presencia de conexiones lógicas complejas entre los datos.

El modelo de base de datos en red es, en cierto sentido, una generalización del modelo jerárquico. La principal diferencia entre un modelo de red y uno jerárquico es que en un modelo de red, un tipo subordinado puede tener un número arbitrario de tipos principales. Los conceptos principales del modelo de red son conjunto, agregado, registro y elemento de datos. En este caso, un elemento de datos debería significar lo mismo que en el modelo jerárquico: la unidad mínima de datos. Hay dos tipos de agregados de datos: un agregado vectorial y un agregado de grupo repetido. Un agregado de tipo vector corresponde a un conjunto de elementos de datos. Un agregado de tipo grupo repetido corresponde a una colección de vectores de datos. Un registro es una colección de agregados de datos. Cada registro tiene un tipo específico y consta de una colección de instancias de registros. Un conjunto es un gráfico que conecta dos tipos de registros. Así, el conjunto refleja la relación jerárquica entre los dos tipos de registros. El tipo de registro principal de un conjunto determinado se denomina propietario del conjunto y el tipo de registro secundario se denomina miembro del mismo conjunto. Para dos tipos de registros cualesquiera, se puede especificar cualquier número de conjuntos que los conecten. En este caso, se puede definir un número diferente de conjuntos entre los dos tipos de registros. Sin embargo, el mismo tipo de registro no puede ser al mismo tiempo propietario y miembro de un conjunto.

Una ventaja indudable del modelo de datos de red es la posibilidad de una visualización más flexible de múltiples conexiones entre objetos. Uno de los inconvenientes más importantes es la alta complejidad del esquema de construcción de la base de datos, que se ve agravada por el debilitamiento del control sobre la integridad de las conexiones debido a su gran número.

El modelo de datos relacionales se basa en el concepto de relación, que es una tabla bidimensional que contiene muchas filas (tuplas) y columnas (campos o atributos). La tabla corresponde a un objeto específico del área temática, sus campos describen la propiedad de este objeto y sus filas describen instancias específicas del objeto. Cada relación siempre debe contener un atributo o conjunto de atributos que identifique de forma única la única tupla de esta relación: la clave primaria. Para reflejar la relación entre objetos, las tablas se vinculan de acuerdo con ciertas reglas utilizando las llamadas claves externas, que se analizarán en detalle en las siguientes secciones.

La principal ventaja del modelo relacional es su simplicidad y cierre lógico, pero la desventaja es la complejidad del sistema para describir varias relaciones entre tablas.

El desarrollo del modelo relacional condujo al surgimiento del llamado modelo de datos post-relacional, cuya principal diferencia es la admisibilidad de campos multivalor (campos cuyos valores constan de muchos subvalores). Los campos con varios valores se pueden interpretar como tablas independientes integradas en la tabla de origen. Además, el modelo post-relacional admite múltiples campos asociados que juntos forman una asociación: en cada fila, el primer valor de una columna de asociación corresponde a los primeros valores de todas las demás columnas de asociación.

La principal ventaja del modelo post-relacional es que le permite almacenar datos de manera más eficiente y la cantidad de tablas en este modelo es notablemente menor en comparación con el relacional. La desventaja es que es difícil mantener la coherencia lógica de los datos.

La teoría de los modelos de datos multidimensionales se ha desarrollado activamente recientemente. El concepto de modelo multidimensional significa la multidimensionalidad de la representación lógica de la estructura de la información. Los conceptos principales de un modelo multidimensional son dimensión y celda.

Una dimensión es un conjunto de datos del mismo tipo que forman la cara de un cubo de n dimensiones. Una celda es un campo cuyo valor está determinado por el conjunto completo de medidas. El valor de la celda puede ser una variable o una fórmula.

Para trabajar con modelos de datos multidimensionales, se utilizan DBMS multidimensionales especiales, que se basan en los conceptos de agregabilidad, historicidad y previsibilidad. La agregabilidad de datos se refiere a varios niveles de generalización de la información. La historicidad de los datos significa un alto nivel de estaticidad tanto de los datos en sí como de las conexiones entre ellos, así como la ordenación de los datos en el tiempo durante el proceso de su procesamiento y presentación a los usuarios. Garantizar la previsibilidad se logra mediante el uso de funciones especiales de pronóstico.

Los DBMS multidimensionales utilizan dos esquemas de organización de datos: policúbico e hipercúbico. En el modelo policúbico, los cubos de n dimensiones pueden tener diferentes dimensiones y diferentes dimensiones-caras. En el modelo hipercúbico, todas las dimensiones de los cubos son iguales y las dimensiones de los diferentes cubos son las mismas.

Una porción es un subconjunto determinado de un cubo de n dimensiones, definido fijando un número determinado de dimensiones. Un segmento tiene una dimensión menor que n y se utiliza, en particular, para presentar información a los usuarios en forma de tablas bidimensionales legibles. La rotación también se utiliza a menudo para representar datos en dos dimensiones e implica cambiar el orden de las dimensiones. Las operaciones de agregación y desglose significan una presentación de información más general o más detallada.

Los modelos de datos multidimensionales son especialmente convenientes para trabajar con grandes bases de datos, ya que permiten procesar de manera eficiente grandes cantidades de información, y esta es su indudable ventaja.

La principal diferencia entre el modelo orientado a objetos y los discutidos anteriormente es el uso de métodos de manipulación de datos orientados a objetos: encapsulación, herencia y poliformismo.

Encapsulación significa la capacidad de diferenciar el acceso de varios programas, aplicaciones, métodos y funciones (en un sentido más amplio, el acceso de diferentes categorías de usuarios) a diversas propiedades de los objetos de datos. En el contexto del término "encapsulación", a menudo se utiliza el concepto de visibilidad: el grado de accesibilidad de las propiedades individuales de un objeto. En los sistemas de programación orientados a objetos modernos (como Delphi o C++ Builder) existen los siguientes niveles de encapsulación (visibilidad), que generalmente se denominan secciones:

  • 1. Secciones Públicas, Publicadas y Automatizadas: con pequeñas características distintivas, las propiedades del objeto descrito como perteneciente a estas secciones son totalmente accesibles.
  • 2. Sección privada: esta sección impone las restricciones más severas a la visibilidad de las propiedades de los objetos. Como regla general, dichas propiedades sólo están disponibles para el propietario de este objeto (el módulo de programa en el que se creó este objeto).
  • 3. Sección protegida: a diferencia de la sección Privada, las propiedades de un objeto quedan disponibles para los herederos del propietario del objeto.

A diferencia de la encapsulación, la herencia implica la transferencia completa de todas las propiedades de un objeto principal a los objetos secundarios. Si es necesario, la herencia de propiedades de un objeto se puede extender a objetos que no sean sus hijos.

Polimorfismo significa la capacidad de la misma aplicación para manipular datos de diferentes tipos: las aplicaciones (métodos, procedimientos y funciones) que procesan objetos de diferentes tipos pueden tener el mismo nombre.

La principal ventaja de los modelos orientados a objetos es la capacidad de modelar una variedad de relaciones complejas entre objetos.

El aspecto estructural determina Qué representa lógicamente una base de datos, el aspecto de manipulación determina los métodos transición entre estados bases de datos (es decir, métodos modificaciones datos) y métodos extracción datos de la base de datos, el aspecto de integridad determina los medios de descripción estados correctos bases de datos.

Un modelo de datos es una definición lógica, autónoma y abstracta de objetos, operadores y otros elementos que juntos forman la máquina abstracta de acceso a datos con la que interactúa el usuario. Estos objetos le permiten modelar la estructura de los datos y los operadores, el comportamiento de los datos.

En la literatura, los artículos y el lenguaje cotidiano, el término "modelo de datos" a veces se utiliza en el sentido de "esquema de base de datos" ("modelo de base de datos"). Este uso es incorrecto, como lo señalan muchos expertos autorizados, incluidos K. J. Date, M. R. Kogalovsky, S. D. Kuznetsov. Hay un modelo de datos. teoría, o herramienta de modelado, mientras que el modelo de base de datos (esquema de base de datos) es resultado de la simulación. Según K. Data, la relación entre estos conceptos es similar a la relación entre un lenguaje de programación y un programa específico en este lenguaje.

M. R. Kogalovsky explica la evolución del significado del término de la siguiente manera. Inicialmente el concepto modelos de datos usado como sinónimo estructuras de datos en una base de datos específica. En el proceso de desarrollo de la teoría de los sistemas de bases de datos, el término "modelo de datos" adquirió un nuevo significado. Era necesario un término que denotara una herramienta, y no el resultado de un modelado, y que por tanto abarcara una variedad de bases de datos diferentes de una determinada clase. En la segunda mitad de la década de 1970, muchas publicaciones dedicadas a estos problemas comenzaron a utilizar el mismo término "modelo de datos" para estos fines. Actualmente, en la literatura científica, el término “modelo de datos” se interpreta en la gran mayoría de los casos en un sentido instrumental (como herramienta de modelización).

Sin embargo, durante mucho tiempo el término “modelo de datos” se utilizó sin una definición formal. Uno de los primeros especialistas que definió formalmente este concepto fue E. Codd. En el artículo "Modelos de datos en la gestión de bases de datos", definió un modelo de datos como una combinación de tres componentes:

Ver también

  • Metamodelado
  • Artículo Metamodelado en Wikilibros

Notas

Literatura

  • Fecha K.J. Introducción a los Sistemas de Bases de Datos. - 8ª ed. - M.: “Williams”, 2006. - 1328 p. -ISBN 0-321-19784-4
  • Kogalovsky M. R. Tecnologías avanzadas de sistemas de información. - M.: Prensa DMK; Empresa de TI, 2003. - 288 p. -ISBN 5-279-02276-4
  • Kogalovsky M. R. Enciclopedia de tecnologías de bases de datos. - M.: Finanzas y Estadísticas, 2002. - 800 p. -ISBN 5-279-02276-4
  • Tsikritzis D., Lochowski F. Modelos de datos = D. Tsichritzis, F. Lochovsky. Modelos de datos. Prentice Hall, 1982. - M.: Finanzas y Estadísticas, 1985. - 344 p.

Fundación Wikimedia.

2010.

    Vea qué es un “Modelo de datos” en otros diccionarios: modelo de datos

    - Un conjunto de reglas para generar estructuras de datos en una base de datos, operaciones sobre ellas, así como restricciones de integridad que determinan las conexiones permitidas y los valores de datos, y la secuencia de sus cambios. Nota Para especificar el modelo de datos, utilice... ... modelo de datos - – un método para representar datos del modelo de información en un entorno informático. [GOST 2.053 2006] Título del término: Tecnologías Títulos de enciclopedia: Equipos abrasivos, Abrasivos, Carreteras, Equipos automotrices...

    Vea qué es un “Modelo de datos” en otros diccionarios: Enciclopedia de términos, definiciones y explicaciones de materiales de construcción.

    - 3.1.7 modelo de datos (DM): Representación gráfica y/o léxica de datos que establece sus propiedades, estructuras y relaciones. [ISO/IEC TR 11404 3:1996, definición 3.2.11] Fuente... MODELO DE DATOS - según GOST 2.053–2006 ESKD “Estructura electrónica de un producto”, – un método para presentar datos de modelos de información en un entorno informático...

    Mantenimiento y archivo de registros en términos y definiciones. modelo de datos multidimensional - Un modelo de datos que opera sobre representaciones de datos multidimensionales en forma de cubos de datos. Estos modelos de datos comenzaron a utilizarse ampliamente a mediados de los años 90 debido al desarrollo de las tecnologías OLAP. Capacidades operativas de modelos de datos multidimensionales... ...

    Guía del traductor técnico Modelo de datos de la Organización Mundial de Aduanas - Un modelo de datos que opera sobre representaciones de datos multidimensionales en forma de cubos de datos. Estos modelos de datos comenzaron a utilizarse ampliamente a mediados de los años 90 debido al desarrollo de las tecnologías OLAP. Capacidades operativas de modelos de datos multidimensionales... ...

    - Modelo de datos y conjunto de datos desarrollados en la Organización Mundial de Aduanas con base en el Directorio de elementos de datos comerciales de las Naciones Unidas (UNTDED) [Facilitación del comercio: Glosario de términos inglés-ruso (segunda edición revisada)… …

    - (RMD) modelo lógico de datos, teoría aplicada de la construcción de bases de datos, que es una aplicación a problemas de procesamiento de datos de ramas de las matemáticas como la teoría de conjuntos y la lógica de primer orden. El modelo de datos relacionales se utiliza para construir... ... Wikipedia

    Este término tiene otros significados, ver ER. El modelo entidad-relación (ERM) es un modelo de datos que le permite describir diagramas conceptuales de un área temática. El modelo ER se utiliza cuando... ... Wikipedia

    GOST R ISO/IEC 19778-1-2011: Tecnología de la información. Formación, educación y formación. Tecnología de colaboración. Espacio de trabajo compartido. Parte 1: Modelo de datos del espacio de trabajo compartido- Terminología GOST R ISO/IEC 19778 1 2011: Tecnología de la información. Formación, educación y formación. Tecnología de colaboración. Espacio de trabajo compartido. Parte 1: Documento original del modelo de datos del espacio de trabajo compartido: 5.4.9 AE CE ID... Diccionario-libro de referencia de términos de documentación normativa y técnica.

Libros

  • Modelo de gas electrónico y teoría de cargas generalizadas para describir fuerzas interatómicas y adsorción, A. M. Dolgonosov. Este libro examina cuatro temas clave de la física atómica y molecular, la química física y cuántica: una descripción del gas de electrones atómicos y la siguiente conclusión de los principales...

Base de datos (BD) es un conjunto de interconectados, caracterizado por la posibilidad de uso para una gran cantidad de aplicaciones, la capacidad de obtener y modificar rápidamente la información necesaria, mínima redundancia de información, independencia de los programas de aplicación y un método de búsqueda general controlado

La capacidad de utilizar bases de datos para muchas aplicaciones de usuario simplifica la implementación de consultas complejas, reduce la redundancia de los datos almacenados y aumenta la eficiencia del uso de la tecnología de la información. La principal propiedad de las bases de datos es la independencia de los datos y de los programas que los utilizan. La independencia de los datos significa que cambiar los datos no cambia los programas de aplicación y viceversa.

El núcleo de cualquier base de datos es el modelo de datos. - Un conjunto de reglas para generar estructuras de datos en una base de datos, operaciones sobre ellas, así como restricciones de integridad que determinan las conexiones permitidas y los valores de datos, y la secuencia de sus cambios. Nota Para especificar el modelo de datos, utilice... ... Es un conjunto de estructuras de datos y sus operaciones de procesamiento.

Los modelos de bases de datos se basan en el enfoque moderno del procesamiento de información, que consiste en que las estructuras de datos son relativamente estables. La estructura de la base de información, que muestra el modelo de información del área temática de forma estructurada, permite crear registros lógicos, sus elementos y las relaciones entre ellos. Las relaciones se pueden clasificar en los siguientes tipos principales:

– “uno a uno”, cuando se puede vincular un registro
con una sola entrada;

– “uno a muchos”, cuando un registro está interconectado con muchos otros;

– “muchos a muchos”, cuando un mismo registro puede entrar en relaciones con muchos otros registros de diferentes maneras.

El uso de un tipo u otro de relación ha determinado tres modelos principales de bases de datos: jerárquico, de red y relacional.

Para explicar la estructura lógica de los principales modelos de bases de datos, considere esta sencilla tarea: es necesario desarrollar una estructura lógica de base de datos para almacenar datos sobre tres proveedores: P 1, P 2, P 3, que pueden suministrar los bienes T 1, T 2. , T 3 en las siguientes combinaciones: proveedor P 1 - los tres tipos de bienes, proveedor P 2 - bienes T 1 y T 3, proveedor P 3 - bienes T 2 y T 3.

Modelo jerárquico se presenta en forma de un gráfico de árbol en el que los objetos se distinguen por niveles de subordinación (jerarquía) de los objetos (Fig. 4.1.)

Arroz. 4.1. Modelo de base de datos jerárquico

En el primer nivel superior hay información sobre el objeto "proveedores" (P), en el segundo, sobre proveedores específicos P 1, P 2, P 3, en el tercer nivel inferior, sobre bienes que pueden ser suministrados por proveedores específicos. proveedores. En un modelo jerárquico, se debe observar la siguiente regla: cada nodo hijo no puede tener más de un nodo padre (sólo una flecha entrante); solo puede haber un nodo no generado en la estructura (sin una flecha entrante): la raíz. Los nodos que no tienen flechas de entrada se llaman hojas. El nodo se integra como un registro. Para encontrar el registro requerido, debe pasar de la raíz a las hojas, es decir de arriba a abajo, lo que simplifica enormemente el acceso.

La ventaja de un modelo de datos jerárquico es que permite describir su estructura, tanto a nivel lógico como físico. Las desventajas de este modelo son las relaciones rígidamente fijadas entre los elementos de datos, como resultado de lo cual cualquier cambio en las conexiones requiere cambios en la estructura, así como la estricta dependencia de la organización física y lógica de los datos. La velocidad de acceso en el modelo jerárquico se logra a expensas de la pérdida de flexibilidad de la información (en una pasada por el árbol es imposible obtener información sobre qué proveedores suministran, por ejemplo, el producto Ti).

El modelo jerárquico utiliza un tipo de relación de uno a muchos entre elementos de datos. Si se utiliza una relación de muchos a muchos, entonces se llega a un modelo de datos de red.

modelo de red La base de datos para la tarea se presenta en forma de diagrama de conexión (Fig. 5.2.). El diagrama muestra los tipos de datos independientes (principales) P 1, P 2, P 3, es decir. información sobre proveedores y dependientes: información sobre los bienes T 1, T 2 y T 3. En el modelo de red, se permite cualquier tipo de conexión entre registros y no hay límite en la cantidad de conexiones de retroalimentación. Pero se debe observar una regla: la relación incluye un registro principal y dependiente.

Arroz. 4.2. Modelo de base de datos de red

La ventaja del modelo de base de datos en red es una mayor flexibilidad de la información en comparación con el modelo jerárquico. Sin embargo, ambos modelos siguen teniendo un inconveniente común: una estructura bastante rígida, que dificulta el desarrollo de la base de información del sistema de gestión. Si es necesario reorganizar con frecuencia la base de información (por ejemplo, cuando se utilizan tecnologías de información básicas personalizadas), se utiliza el modelo de base de datos más avanzado: uno relacional, en el que no hay diferencias entre objetos y relaciones.

EN modelo relacional En las bases de datos, las relaciones entre los elementos de datos se representan en tablas bidimensionales llamadas relaciones. Las relaciones tienen las siguientes propiedades: cada elemento de la tabla representa un elemento de datos (no hay grupos repetidos); los elementos de una columna son de la misma naturaleza y las columnas tienen un nombre único; no hay dos filas idénticas en la tabla; Las filas y columnas se pueden ver en cualquier orden, independientemente de su contenido de información.

Las ventajas del modelo de base de datos relacional son la simplicidad del modelo lógico (las tablas son familiares para presentar información); flexibilidad del sistema de seguridad (para cada relación se puede especificar la legalidad del acceso); independencia de datos; la capacidad de construir un lenguaje simple de manipulación de datos utilizando la teoría matemáticamente rigurosa del álgebra relacional (álgebra de relaciones).

Para el problema anterior sobre proveedores y bienes, la estructura lógica de la base de datos relacional contendrá tres tablas (relaciones): R 1, R 2, R 3, que constan respectivamente de registros sobre entregas, sobre bienes y sobre el suministro de bienes por parte de los proveedores. (Figura 4.3.)



Arroz. 4.3. Modelo de base de datos relacional

DBMS y sus funciones.

Un sistema de gestión de bases de datos (DBMS) es un sistema de software diseñado para crear una base de datos general en una computadora que se utiliza para resolver muchos problemas. Dichos sistemas sirven para mantener actualizada la base de datos y proporcionar a los usuarios un acceso efectivo a los datos contenidos en ella dentro de los límites de los derechos otorgados a los usuarios.

El DBMS está diseñado para la gestión centralizada de bases de datos en beneficio de todos los que trabajan en este sistema.

Según el grado de universalidad, se distinguen dos clases de DBMS:

– sistemas de propósito general;

– sistemas especializados.

Los DBMS de propósito general no se centran en ningún área temática en particular ni en las necesidades de información de ningún grupo de usuarios. Cada sistema de este tipo se implementa como un producto de software capaz de funcionar en un determinado modelo de computadora en un sistema operativo específico y se suministra a muchos usuarios como un producto comercial. Estos DBMS tienen los medios para configurarlos para que funcionen con una base de datos específica. El uso de un DBMS de uso general como herramienta para crear sistemas de información automatizados basados ​​​​en tecnología de bases de datos puede reducir significativamente el tiempo de desarrollo y ahorrar recursos laborales. Estos DBMS han desarrollado funcionalidad.

Los DBMS especializados se crean en casos excepcionales cuando es imposible o inapropiado utilizar un DBMS de propósito general.

Los DBMS de propósito general son sistemas de software complejos diseñados para realizar todo el conjunto de funciones asociadas con la creación y operación de una base de datos de un sistema de información.

Los DBMS actualmente en uso tienen características para garantizar la integridad de los datos y una seguridad sólida, lo que permite a los desarrolladores garantizar una mayor seguridad de los datos con menos esfuerzo de programación de bajo nivel. Los productos que funcionan en el entorno WINDOWS se distinguen por su facilidad de uso y sus herramientas de productividad integradas.

Se evalúa el rendimiento del DBMS:

– tiempo de ejecución de la solicitud;

– velocidad de búsqueda de información en campos no indexados;

– tiempo de ejecución de operaciones de importación de bases de datos desde otros formatos;

– la velocidad de creación de índices y de realización de operaciones masivas como actualización, inserción y eliminación de datos;

– el número máximo de accesos paralelos a datos en modo multiusuario;

– momento de generación del informe.

El rendimiento de un DBMS está influenciado por dos factores:

– Los DBMS que monitorean la integridad de los datos conllevan una carga adicional que otros programas no experimentan;

– El rendimiento de los programas de aplicación propietarios depende en gran medida del diseño y la construcción adecuados de la base de datos.


Información relacionada.


hay tres modelos principales bases de datos- Estos son jerárquicos, de red y relacionales. Estos modelos difieren en la forma en que establecen relaciones entre los datos.

8.1. Modelo de base de datos jerárquico

Modelos jerárquicos Las bases de datos fueron históricamente una de las primeras en surgir. Información en una base jerárquica se organiza según el principio de una estructura de árbol, en forma de “ancestros” descendiente". Cada grabación Puede tener como máximo un registro de padres y varios hijos. Las relaciones de registros se implementan como punteros físicos de un registro a otro. Principal desventaja estructura jerárquica de la base de datos- incapacidad para realizar relaciones" muchos a muchos", así como situaciones en las que grabación Tiene varios antepasados.

Bases de datos jerárquicas. Bases de datos jerárquicas se puede representar gráficamente como invertido árbol, que consta de objetos de varios niveles. Nivel superior ( raíz del árbol) toma uno objeto, segundo - objetos del segundo nivel y así sucesivamente.

Hay conexiones entre objetos, cada uno objeto puede incluir varios objetos de nivel inferior. Tales objetos están en relación con el antepasado ( objeto, más cerca de la raíz) al niño ( objeto nivel inferior), mientras objeto-un antepasado puede no tener descendientes o tener varios de ellos, mientras que objeto-descendiente necesariamente tiene un solo antepasado. Los objetos que tienen un ancestro común se llaman gemelos.

Arroz. 6. Base de datos jerárquica

Organizar datos en SGBD El tipo jerárquico se define en términos de: elemento, agregado, grabación (grupo), grupo actitud, base de datos.

Atributo(elemento de datos)

La unidad más pequeña de una estructura de datos.

Normalmente, a cada elemento de la descripción de una base de datos se le asigna un nombre único. Se hace referencia a él con este nombre durante el procesamiento. Un elemento de datos también suele denominarse campo.

Registro Una colección de atributos con nombre. El uso de registros le permite obtener un conjunto de datos conectados lógicamente en un solo acceso a la base de datos. Son los registros los que se modifican, agregan y eliminan. El tipo de registro está determinado por la composición de sus atributos.

Instancia de registro

- - un registro específico con un significado específico de los elementos. Actitud de grupo

relación jerárquica entre registros de dos tipos. El registro principal (el propietario de la relación de grupo) se denomina registro de origen y los registros secundarios (miembros de la relación de grupo) se denominan registros subordinados. Una base de datos jerárquica sólo puede almacenar este tipo de estructuras de árbol.

Ejemplo. Considere el siguiente modelo de datos empresariales (consulte la Figura 7): una empresa consta de departamentos en los que trabajan los empleados. Cada departamento puede tener varios empleados, pero un empleado no puede trabajar en más de un departamento. Por lo tanto, para

sistema de información de gestión

personal, es necesario crear una relación grupal que consta de un registro padre DEPARTAMENTO (NOMBRE DEL DEPARTAMENTO, NÚMERO DE EMPLEADOS) y un registro hijo EMPLEADO (APELLIDO, CARGO, SALARIO). Esta relación se muestra en la Fig.

7(a) (Para simplificar, asumimos que sólo hay dos registros secundarios). Para automatizar la contabilidad de los contratos con los clientes, es necesario crear otra estructura jerárquica: cliente - contratos con él - empleados involucrados en el trabajo en el contrato.:

Este árbol incluirá los registros CLIENTE (NOMBRE_CLIENTE, DIRECCIÓN), CONTRATO (NÚMERO, FECHA, IMPORTE), CONTRATISTA (APELLIDO, CARGO, NOMBRE_DEPARTAMENTO) (Fig. 7b). Arroz. 7. Ejemplo de una base de datos jerárquica Este ejemplo muestra las desventajas de la jerarquía. DB Parcialmente duplicado información entre el EMPLEADO y EJECUTOR

(tales registros se llaman pares), y en modelo de datos jerárquico actitud no proporcionado

apoyo coincidencias entre registros emparejados. puede participar en más de un contrato (es decir, surge conexión tipo M:N). En este caso, debe ingresar otro grupo en la base de datos. actitud, en el que Este ejemplo muestra las desventajas de la jerarquía. será el registro fuente y CONTRACT será el registro secundario (Fig. 7 c). Así, nuevamente nos vemos obligados a duplicar información.

Una estructura jerárquica presupone desigualdad entre los datos: algunos están estrictamente subordinados a otros. Por supuesto, tales estructuras satisfacen claramente los requisitos de muchos, pero no de todos, los problemas de la vida real.

Tipos de modelos de bases de datos

Los DBMS utilizan diferentes modelos de datos. Los sistemas más antiguos se pueden dividir en bases de datos jerárquicas y de red; estos son modelos prerelacionales.

Modelo jerárquico

EN modelo jerárquico Los elementos se organizan en estructuras interconectadas por relaciones jerárquicas o en forma de árbol. Un elemento padre puede tener varios elementos hijos. Pero un elemento hijo sólo puede tener un antepasado.

« Sistema de gestión de información» ( Sistema de gestión de información) de IMB es un ejemplo de un DBMS jerárquico.

El modelo jerárquico organiza los datos en forma de árbol con una jerarquía de segmentos principales y secundarios. Este modelo implica la posibilidad de la existencia de idénticos ( predominantemente subsidiarias) elementos. Los datos aquí se almacenan en una serie de registros con campos de valor adjuntos. El modelo reúne todas las instancias de un registro particular como "tipos de registro"; estos son equivalentes a tablas en el modelo relacional, y los registros individuales son las columnas de una tabla. Para crear relaciones entre tipos de registros, el modelo jerárquico utiliza relaciones como " padre-hijo» tipo 1:N. Esto se logra mediante el uso de una estructura de árbol: se "toma prestada" de las matemáticas, como la teoría de conjuntos utilizada en el modelo relacional.

Sistemas de bases de datos jerárquicos

Tomemos como ejemplo modelo de datos jerárquico una organización que almacena información sobre su empleado: nombre, número de empleado, departamento y salario. La organización también podrá almacenar información sobre sus hijos, sus nombres y fechas de nacimiento.

Los datos sobre el empleado y sus hijos forman una estructura jerárquica, donde la información sobre el empleado es el elemento padre y la información sobre los hijos es el elemento hijo. Si un empleado tiene tres hijos, se asociarán tres hijos al elemento padre. En una base de datos jerárquica la relación " padre-hijo"Es una relación de uno a muchos. Es decir, un elemento hijo no puede tener más de un ancestro.

Las bases de datos jerárquicas han sido populares desde finales de la década de 1960, cuando IBM introdujo su sistema de gestión de información DBMS. El diagrama jerárquico consta de tipos de registros y " padre-hijo»:

  • Un registro es una colección de valores de campo.
  • Los registros del mismo tipo se agrupan en tipos de registros.
  • Una relación padre-hijo es una relación 1:N entre dos tipos de registros.
  • Un esquema de base de datos jerárquico consta de varios esquemas jerárquicos.

modelo de red

En el modelo de datos de red. un elemento padre puede tener varios hijos y un elemento hijo puede tener varios antepasados. Los registros en este modelo están vinculados mediante listas con punteros. IDMS(" Sistema integrado de gestión de datos") de la empresa Computer Associates Internacional Inc.- un ejemplo de un DBMS de red.

El modelo jerárquico estructura los datos en forma de árbol de registros, donde hay un elemento padre y varios hijos. El modelo de red permite que múltiples ancestros y descendientes formen una estructura reticular.

El modelo de red le permite modelar de forma más natural las relaciones entre elementos. Aunque este modelo fue ampliamente utilizado en la práctica, nunca llegó a ser dominante por dos razones principales. En primer lugar, IBM decidió no abandonar el modelo jerárquico en extensiones de sus productos como IMS y DL/I. En segundo lugar, después de algún tiempo fue reemplazado por el modelo relacional, que ofrecía una interfaz declarativa de nivel superior.

La popularidad del modelo de red coincidió con la popularidad del modelo jerárquico. Es mucho más natural modelar algunos datos con múltiples antepasados ​​para un solo niño. El modelo de red hizo posible modelar relaciones de muchos a muchos. Sus estándares se definieron formalmente en 1971 en la Conferencia sobre Lenguajes de Sistemas de Procesamiento de Datos ( CODASILO).

Elemento principal modelo de datos de red- un conjunto que consta de un tipo de registro de propietario, un nombre de conjunto y un tipo de registro de miembro. Un registro subordinado (“registro miembro”) puede desempeñar su función en más de un conjunto. En consecuencia, se apoya el concepto de padres múltiples.

Un registro de nivel superior ("registro de propietario") también puede ser "miembro" o "propietario" en otros conjuntos. El modelo de datos es una red simple, conexiones, tipos de intersección de registros ( en IDMS se denominan registros de unión, es decir, "registros cruzados). Y también conjuntos que puedan combinarlos. Por tanto, la red completa está representada por varios conjuntos por pares.

En cada uno de ellos, un tipo de registro es el "propietario" ( la conexión “flecha” sale de ella), y uno o más tipos de registros son "miembros" ( una flecha los señala). Normalmente hay una proporción de 1:M en un conjunto, pero también se permite una proporción de 1:1. El modelo de datos de la red CODASYL se basa en la teoría matemática de conjuntos.

Bases de datos de red conocidas:

  • TurboIMAGEN;
  • IDMS;
  • RDM incorporado;
  • RDM del servidor.

modelo relacional

En un modelo relacional, a diferencia de un modelo jerárquico o de red, no existen relaciones físicas. Toda la información se almacena en el formulario. tablas (relaciones) formado por filas y columnas. Y los datos de dos tablas están conectados por columnas comunes y no por enlaces físicos o punteros. Existen operadores especiales para manipular series de datos.

A diferencia de los otros dos tipos de DBMS, en modelos de datos relacionales no es necesario seguir todos los punteros, lo que facilita la ejecución de consultas para recuperar información en comparación con los DBMS de red y jerárquicos. Ésta es una de las principales razones por las que el modelo relacional resultó más conveniente. DBMS relacionales comunes: Oracle, Sybase, DB2, Ingres, Informix y MS-SQL Server.

« En el modelo relacional, tanto los objetos como sus relaciones están representados únicamente por tablas y nada más.».

RDBMS es un sistema de gestión de bases de datos relacionales basado en el modelo relacional de E. F. Codd. Le permite definir aspectos estructurales de los datos, procesamiento de relaciones e integridad. En dicha base de datos, el contenido de la información y las relaciones dentro de ella se presentan en forma de tablas: conjuntos de registros con campos comunes.

Las tablas relacionales tienen las siguientes propiedades:

  • Todos los valores son atómicos.
  • Cada fila es única.
  • El orden de las columnas no es importante.
  • El orden de las filas no es importante.
  • Cada columna tiene su propio nombre exclusivo.

Algunos campos se pueden definir como campos clave. Esto significa que la indexación se utilizará para acelerar la búsqueda de valores específicos. Cuando los campos de dos tablas diferentes reciben datos del mismo conjunto, puede utilizar el operador JOIN para seleccionar registros relacionados de las dos tablas haciendo coincidir los valores de los campos.

A menudo los campos tendrán el mismo nombre en ambas tablas. Por ejemplo, la tabla "Pedidos" puede contener pares de "ID de cliente" y "código de producto". Y en la tabla “Producto” puede haber pares de “código de producto” y “precio”. Por lo tanto, para calcular un recibo para un comprador específico, es necesario resumir el precio de todos los bienes comprados por él, usando JOIN en los campos "código de producto" de estas dos tablas. Estas acciones se pueden ampliar para combinar varios campos en varias tablas.

Dado que aquí las relaciones están determinadas únicamente por el tiempo de búsqueda, las bases de datos relacionales se clasifican como sistemas dinámicos.

Comparación de tres modelos.

El primer modelo de datos, jerárquico, tiene una estructura de árbol (“ padre-hijo"), y solo admite relaciones uno a uno o uno a muchos. Este modelo permite una adquisición rápida de datos, pero carece de flexibilidad. A veces el papel del elemento ( padre o hijo) no está claro y no se ajusta al modelo jerárquico.

Segundo, modelo de datos de red, tiene una estructura más flexible que la jerárquica y apoya las relaciones " muchos a muchos" Pero rápidamente se vuelve demasiado complejo e incómodo de gestionar.

El tercer modelo, el relacional, es más flexible que el jerárquico y más fácil de gestionar que el de red. El modelo relacional es el más utilizado en la actualidad.

Un objeto en el modelo relacional se define como una posición de información almacenada en una base de datos. Un objeto puede ser tangible o intangible. Un ejemplo de entidad tangible sería un empleado de una organización y un ejemplo de entidad intangible sería la cuenta de un cliente. Los objetos se definen por atributos: una visualización de información de las propiedades de un objeto. Estos atributos también se conocen como columnas y un grupo de columnas también se conoce como fila. Una serie también se puede definir como una instancia de un objeto.

Los objetos están conectados por relaciones, cuyos tipos principales se pueden definir de la siguiente manera:

"Cara a cara"

En este tipo de relación, un objeto está conectado con otro. Por ejemplo, Gerente -> Departamento.

Cada gerente sólo puede tener un departamento y viceversa.

"Uno a muchos"

En modelos de datos, la relación de un objeto con varios. Por ejemplo, Empleado -> Departamento.

Cada empleado sólo puede estar en un departamento, pero un departamento puede tener más de un empleado.

"Muchos a muchos"

En un momento dado, un objeto puede estar asociado a cualquier otro. Por ejemplo, Empleado -> Proyecto.

Un empleado puede participar en varios proyectos y en cada proyecto pueden participar varios empleados.

En el modelo relacional, los objetos y sus relaciones se representan mediante una matriz o tabla bidimensional.

Cada tabla representa un objeto.

Cada tabla consta de filas y columnas.

Las relaciones entre objetos están representadas por columnas.

Cada columna representa un atributo de un objeto.

Los valores de las columnas se seleccionan de la región o conjunto de todos los valores posibles.

Las columnas que se utilizan para vincular objetos se denominan columnas clave. Hay dos tipos de claves: primaria y externa.

Los primarios se utilizan para definir un objeto sin ambigüedades. Una clave externa es la clave principal de un objeto que existe como atributo en otra tabla.

Ventajas del modelo de datos relacionales:

  1. Facilidad de uso.
  2. Flexibilidad.
  3. Independencia de datos.
  4. Seguridad.
  5. Facilidad de aplicación práctica.
  6. Fusión de datos.
  7. Integridad de los datos.

Defectos:

  1. Redundancia de datos.
  2. Mal desempeño.

Otros modelos de bases de datos (OODBMS)

Recientemente, han aparecido en el mercado DBMS productos con modelos de datos orientados a objetos y objetos, como Gem Stone y Versant DBMS. También se están llevando a cabo investigaciones en el campo de los modelos de datos lógicos y multidimensionales.

Características de los sistemas de gestión de bases de datos orientados a objetos (OODBMS):

  • Al integrar las capacidades de la base de datos con un lenguaje de programación orientado a objetos, el resultado es un DBMS orientado a objetos.
  • Un OODBMS representa datos como objetos en uno o más lenguajes de programación.
  • Un sistema de este tipo debe cumplir dos criterios: debe ser un DBMS y debe estar orientado a objetos. Es decir, debería corresponder, en la medida de lo posible, a los lenguajes de programación modernos orientados a objetos. El primer criterio implica: almacenamiento de datos a largo plazo, gestión de almacenamiento secundario, acceso paralelo a los datos, capacidad de recuperación y soporte para consultas ad hoc. El segundo criterio implica: objetos complejos, identidad del objeto, encapsulación, tipos o clases, mecanismo de herencia, anulación en combinación con enlace dinámico, extensibilidad y completitud computacional.
  • Los OODBMS brindan la capacidad de modelar datos como objetos.

Así como soporte para clases de objetos y herencia de propiedades y métodos de clases por subclases y sus objetos.




Arriba