Diseño de base de datos. Sistemas de gestión de bases de datos. Diseño de base de datos física.

Ministerio de Educación y Ciencia de la Federación de Rusia

Agencia Federal para la Educación

Universidad Técnica Estatal de Daguestán

Facultad de Sistemas de Información

Departamento de Ingeniería Eléctrica e Ingeniería Eléctrica.

Proyecto del curso

"Desarrollo de bases de datos"

Completado: estudiante de 3er año

Gramo. I411 Vagabova P.Kh.

Comprobado: art. maestro

C y f. ISE Muradov M.M.

Majachkalá 2006

1.Introducción

parte teorica

1 “Análisis de dominio”

2 “diseño de base de datos”

3 "Descripción general de los DBMS modernos"

4 “Justificación de la elección de los medios técnicos”

parte del proyecto

1 módulos de programa

2 Descripción de cómo trabajar con el programa.

Conclusión

Literatura

Solicitud

1.Introducción

En la sociedad moderna hay un aumento significativo de las necesidades de información, la introducción de apoyo informativo en todas las esferas de la actividad humana. La estrategia para acelerar el desarrollo de la economía nacional del país, aumentando el ritmo del progreso científico y tecnológico, también determina como condición catalizadora la necesidad de una introducción y uso generalizados de las computadoras en diversos campos de la ciencia, la tecnología y la economía. El desarrollo de la humanidad, como lo ha demostrado la experiencia de países extranjeros, ha llevado a la necesidad de una transición a una sociedad de la información, que se caracteriza por brindar el grado de información requerido, un aumento en el volumen y nivel de los servicios de información y la introducción de la tecnología informática y las redes informáticas de información.

El uso racional y hábil de las amplias capacidades de las computadoras es un problema grave en la etapa actual de desarrollo de la sociedad, cuya relevancia crece a medida que aumenta el parque de computadoras y mejora su equipamiento técnico y de software.

La producción en serie de computadoras de diversas clases, especialmente computadoras personales (PC), conduce a cambios cualitativos en el procesamiento de diversos tipos de información. Por eso se hace necesario introducir el trabajo informático en la práctica cotidiana.

Los problemas con la implementación de las tecnologías de la información surgieron en nuestro país durante un período excepcionalmente difícil para la sociedad. La informatización de la sociedad adquiere especial relevancia en condiciones en las que es necesario brindar información y soporte informático para cuestiones económicas y sociales, satisfacer las necesidades de información de la población, apoyar el proceso de toma de decisiones en varios niveles, etc. La condición para el desarrollo exitoso de las tecnologías de la información en nuestro país es la introducción masiva de la tecnología informática y las redes de comunicación en el ámbito industrial y social, la formación de personal calificado y la introducción de software que proporcione acceso al entorno informático al usuario. no cualificados en tecnología informática.

En este trabajo de curso, la tarea principal es automatizar el trabajo del usuario; esto es necesario para facilitar el trabajo del usuario. Para la comodidad de operaciones en la base de datos como buscar datos, editar, ingresar y eliminar. El uso de tecnología informática en este momento es imposible sin una organización racional de la base de información y garantizar el acceso efectivo de los usuarios a ella. Para ello se utilizan bancos de datos, que han encontrado aplicación en sistemas automatizados de diversos tipos y niveles.

2. Parte teórica

1 Análisis de dominio

En este trabajo de curso, desarrollé una base de datos que registra datos sobre la producción de productos y el consumo de materias primas. Las materias primas y los suministros recibidos diariamente para la producción, así como los datos sobre los productos manufacturados (cuántos productos fueron producidos, por quién y en qué día) deben registrarse en RKO y PKO, que a su vez se ingresan en el Libro Mayor.

Dado que el siglo XXI es el siglo de la tecnología informática, simplemente no tiene sentido mantener registros manualmente, revisar un montón de papeles con la esperanza de encontrar lo que nos interesa; basta con crear una base de datos en C++Builder y; la búsqueda de los datos necesarios será mucho más rápida.

En las empresas que utilizan este tipo de programa, el empleo de los trabajadores aumenta; estos pueden trabajar mucho más en un día, es decir. aumenta la productividad de la jornada laboral.

En mis trabajos de curso, los registros se mantienen en los siguientes campos:

· Nombre completo del maestro,

· Número de coche,

· Número de productos producidos,

· Nombre del producto,

· Material,

· Código de tela,

nombre de la tela

· Fabricante de telas,

· Consumo de tela,

· Precio de la tela,

· Número de artículo del tinte,

· Nombre del tinte,

· Fabricante de tintes,

Consumo de tinte

· Precio del tinte.

En este programa, puede obtener información sobre exactamente quién produjo y cuántos productos en un día en particular.

2 Diseño de base de datos

La base de datos refleja cierta información sobre el área temática.

Un dominio es una parte del mundo real que es de interés para un estudio determinado. Naturalmente, la integridad de su descripción dependerá de los objetivos del sistema de información que se esté creando.

En los sistemas de información automatizados, el reflejo del área temática está representado por modelos de datos de varios niveles. Independientemente de si los niveles del modelo de nivel físico y lógico son compatibles con este formulario, podemos distinguir estos niveles de módulos y, en consecuencia, las etapas de diseño de la base de datos para ellos.

Modelo infológico:

Una descripción del área temática, realizada sin centrarse en el software y hardware que se utilizará en el futuro, se denomina modelo infológico del área temática (ILM).

Antes de comenzar a diseñar una base de datos, debe comprender a fondo cómo funciona el área temática que está creando la base de datos para representar. El área temática debe estar previamente descrita. Para ello se puede utilizar el lenguaje natural, pero su uso tiene muchas desventajas, siendo las principales la engorrosa descripción y la ambigüedad de su interpretación. Por lo tanto, para estos fines se suelen utilizar medios de lenguaje artificial formalizado. En consecuencia, una descripción del área temática, realizada utilizando lenguaje natural, fórmulas matemáticas, tablas, gráficos y otras herramientas que sean comprensibles para todas las personas que trabajan en el diseño de bases de datos, se denomina modelo de datos infológicos (IDM).

El modelo de información debe ser fácilmente percibido por diferentes categorías de usuarios. Es aconsejable que el ILM lo construya un especialista que trabaje en un área temática determinada y no un diseñador de sistemas informáticos de procesamiento de datos. Si por determinadas razones esto no puede garantizarse, es necesario que al menos se pueda comprobar la descripción realizada para asegurarse de que las particularidades del tema se perciban correctamente. El modelo de información también debe ser comprendido fácil e inequívocamente por todos los especialistas que posteriormente participen en el proceso de diseño de bases de datos y software.

El modelo de información es un medio de comunicación para equipos diversos, tanto de usuarios finales como de desarrolladores. Además, es el núcleo del sistema de diseño. El ILM contiene información necesaria y suficiente para el diseño posterior de un sistema automatizado de procesamiento de información.

Para describir el modelo de información se utilizan tanto lenguajes descriptivos como herramientas gráficas. Estos últimos se están volviendo cada vez más populares. La representación gráfica es la más visual y fácil de entender.

Cuando se refleja en un sistema de información, cada objeto está representado por un identificador que distingue una clase de objeto de otro, y cada clase de objetos está representada por su nombre. Cada objeto tiene un conjunto específico de propiedades. Para objetos de la misma clase, el conjunto de estas propiedades es el mismo, pero los valores pueden ser diferentes.

Al describir un área temática, es necesario reflejar las conexiones entre el objeto y la propiedad que lo caracteriza. Las relaciones se muestran como líneas que conectan un objeto y su propiedad. La relación entre un objeto y su propiedad puede ser diferente. Las propiedades son constantes si sus valores no cambian con el tiempo. Estas propiedades se denominan estáticas(S). Y las propiedades del valor que cambian se llaman dinámicas (D).

Requisitos para el modelo de información:

Representación adecuada del área temática: el lenguaje para representar el ILM debe tener capacidades expresivas suficientes para representar los fenómenos que tienen lugar en el área temática.

Coherencia: no se debe permitir la interpretación ambigua del modelo.

Debe reflejar las opiniones y necesidades de todos los usuarios del sistema.

El modelo debe ser fácilmente extensible, es decir asegúrese de que se ingresen nuevos datos sin cambiar los datos previamente definidos. Lo mismo puede decirse sobre la eliminación de datos.

Debe tener propiedades de descomposición y composición (fortalecer la base de datos o dividirla).

Debería implementarse fácilmente en una computadora.

Debe ser independiente del equipo y los idiomas de la organización de la base de datos en una computadora.

Los principales elementos estructurales del modelo de información:

Una entidad es cualquier objeto distinguible cuya información debe almacenarse en una base de datos. Es necesario distinguir entre conceptos como tipo de entidad e instancia de entidad. El concepto de tipo de entidad se refiere a un conjunto de individuos, objetos, eventos e ideas homogéneos que actúan como un todo. Una instancia de entidad se refiere a algo específico en un conjunto.

Un atributo es una característica con nombre de una entidad. Su nombre debe ser único para un tipo de entidad específico, pero puede ser el mismo para diferentes tipos de entidad.

Una clave es un conjunto mínimo de atributos cuyos valores se pueden utilizar para encontrar de forma única la instancia requerida de una entidad.

Relación es la asociación de dos o más entidades. Dado que el propósito de las bases de datos no es solo almacenar datos individuales no relacionados, su estructura no es tan simple como parece a primera vista. Uno de los requisitos de las bases de datos es garantizar la capacidad de encontrar algunas entidades según los valores de otras. Para ello, es necesario establecer ciertas conexiones entre ellos. Pero las bases de datos reales suelen contener hasta miles de entidades, lo que significa que, en teoría, se pueden establecer hasta un millón de conexiones o más entre ellas. La presencia de tal multitud de conexiones determina la complejidad del modelo de información.

Modelo de base de datos datalógica (DLM):

A diferencia del modelo de datos infológico, el modelo datalógico está orientado a la computadora. Este modelo se construye en términos de unidades de información permitidas en el DBMS específico en cuyo entorno estamos diseñando la base de datos. La etapa de creación de un DLM se llama diseño datalógico. Una descripción de la estructura lógica de una base de datos en lenguaje DBMS se llama esquema.

Modelo físico de la base de datos:

Para vincular el modelo de datos al entorno de almacenamiento, se utiliza un modelo de datos de capa física. Este modelo define los dispositivos de almacenamiento utilizados y los métodos para organizar físicamente los datos en el entorno de almacenamiento. El modelo de capa física también se construye teniendo en cuenta las capacidades proporcionadas por el DBMS. La descripción de la estructura física de una base de datos se denomina esquema de almacenamiento. La etapa correspondiente del diseño de una base de datos se llama diseño físico.

Los DBMS tienen diferentes capacidades para la organización física de los datos y, por lo tanto, la complejidad y la intensidad del trabajo del diseño físico y el conjunto de pasos realizados difieren para sistemas específicos. El trabajo realizado en la etapa de diseño físico incluye: elegir el tipo de medio, el método de organización de los datos, los métodos de acceso, determinar el tamaño del bloque físico, gestionar la ubicación de los datos en medios externos, gestionar la memoria libre, determinar la viabilidad de compresión de datos y los métodos de compresión utilizados, evaluando los modelos físicos de datos. El diseño físico también incluye problemas asociados con el almacenamiento en búfer (determinar la cantidad y el tamaño de los búferes utilizados al transferir datos de la memoria externa a la interna, asignar archivos a los búferes).

Actualmente, existe una tendencia a reducir el trabajo en la etapa de diseño físico. A veces estas obras quedan completamente ocultas al diseñador.

programación en lenguaje base dado

2.3 Descripción general del DBMS moderno

La necesidad generalizada de procesamiento automatizado de datos de los medios de comunicación ha planteado la necesidad de lenguajes de procesamiento de datos especializados. Estas funciones suelen estar incluidas en los sistemas de gestión de bases de datos. Los paquetes DBMS permiten administrar datos directamente en modo interactivo y también permiten a los programadores desarrollar software más avanzado para procesarlos: aplicaciones de software.

En la versión más completa, los paquetes DBMS deberían tener los siguientes componentes:

Un entorno de usuario que permite la gestión directa de la base de datos.

Lenguaje algorítmico para la programación de sistemas de procesamiento de datos aplicados.

Un compilador para darle al programa completo una forma comercial lista para usar, en forma de archivo exe.

Los programas son utilidades para la programación rápida de operaciones de rutina, como FORM, MENÚ.

El DBMS es un shell de usuario centrado en la gestión inmediata de las solicitudes de los usuarios. Sin embargo, para el usuario doméstico esto tiene menos importancia debido a la dificultad de dominar la interfaz en inglés. La presencia de un lenguaje de programación en el DBMS le permite crear sistemas de procesamiento de datos complejos para tareas específicas. El grupo de DBMS relacionales está ampliamente representado en el mercado del software. Se trata, por ejemplo, de sistemas como Paradox, Clipper.

La característica principal de un DBMS es la presencia de procedimientos para ingresar y almacenar no solo los datos en sí, sino también descripciones de su estructura. Los archivos provistos de una descripción de los datos almacenados en ellos y controlados por un DBMS comenzaron a denominarse bancos de datos y luego “bases de datos” (DB).

Las bases de datos (BD) son una colección de datos, estructurados de cierta manera sobre un tema específico, utilizados en diversos sectores de la economía, la industria, los negocios y la ciencia. La velocidad de acceso a la información necesaria y la eficiencia de su obtención determinan en última instancia la realización exitosa de los negocios y reducen los costos de las partidas de ingresos relevantes. Se han desarrollado métodos que facilitan el trabajo con grandes cantidades de datos: creación de bases de datos, búsqueda, edición, extracción de diversas muestras, además de realizar análisis de datos y elaboración de cálculos que contienen documentos finales y datos en forma de tablas, gráficos. y gráficos.

Estos métodos se implementan utilizando un conjunto de herramientas de software que permiten trabajar con la base de datos: un sistema de gestión de bases de datos (DBMS).

Existen muchos productos de software que le permiten crear y trabajar con bases de datos, por ejemplo, Access, Clipper, Excel y otros. Entre la amplia variedad de programas, el más popular es el DBMS FoxPro, que por sus características cumple con los más altos requisitos para este tipo de sistemas, tanto en nivel y volumen, como en términos de velocidad de procesamiento de información.

Actualmente, se han desarrollado y se utilizan ampliamente las versiones 3.0 y 5.0 de Visual FoxPro para Windows. Sin embargo, trabajar con estos paquetes para no programadores es una tarea bastante difícil. Por tanto, para crear una base de datos para usuarios con poca experiencia en programación, las versiones 2.5 y 2.6 para Windows y 2.0 para DOS tienen mucho éxito.

Estructura de la base de datos:

Una base de datos es un conjunto de información homogénea y, por regla general, ordenada según algún criterio. La base de datos se puede presentar tanto en papel como en formato informático.

Un ejemplo típico de una base de datos "en papel" es el catálogo de una biblioteca: un conjunto de tarjetas de papel que contienen información sobre libros. La información de esta base de datos es homogénea (contiene información únicamente sobre libros) y ordenada (las fichas están ordenadas alfabéticamente por apellidos de los autores). Otros ejemplos de bases de datos en papel son los directorios telefónicos y los horarios de trenes.

Una base de datos informática es un archivo (o una colección de archivos relacionados) que contiene información, a menudo denominado archivo de datos. El archivo de datos consta de registros, cada uno de los cuales contiene información sobre una instancia. Los registros se componen de campos. Cada campo contiene información sobre una característica de la instancia. Tenga en cuenta que cada registro consta de los mismos campos. Es posible que algunos campos no estén completos, pero aún están presentes en el registro. Sobre el papel conviene representar una base de datos en forma de tabla. La información de las bases de datos informáticas generalmente se muestra en forma de tablas. Por lo tanto, en lugar de la frase "archivo de datos", a menudo se utiliza la frase "tabla de datos" o simplemente "tabla".

Entorno de desarrollo Borland C++ Builder.

Para crear una estación de trabajo autónoma, puede elegir el software de lenguaje C++ Builder, que es uno de los DBMS más conocidos. Existen muchas herramientas para la automatización de la programación en el mercado del software. Pero en términos de potencia y facilidad de uso, sólo Borland Delphi y Microsoft Visual Basic pueden competir con el entorno Builder.

"C++ Builder" es un potente sistema de programación visual orientado a objetos que le permite trabajar tanto con bases de datos remotas locales simples como con bases de datos distribuidas de varios niveles. Él mismo y los productos de software suministrados con él le permiten resolver la siguiente gama de problemas:

Cree rápidamente interfaces de ventana de aspecto profesional para aplicaciones, incluso para programadores novatos.

Cree aplicaciones de cualquier complejidad y propósito, ya sean aplicaciones de oficina, contabilidad, ingeniería o recuperación de información.

Cree una interfaz conveniente para cualquier programa creado previamente.

Cree sus propios componentes DLL, que luego pueden usarse en otros lenguajes de programación.

Cree sistemas para trabajar con bases de datos locales y remotas de cualquier tipo.

Cree bases de datos de varios tipos utilizando el kit de herramientas C++ Builder (DataBaseDesktop).

Formatee e imprima informes complejos desde la aplicación, incluidas tablas, gráficos y una variedad de símbolos.

Conéctese desde su aplicación a productos de Microsoft como Word, Excel, etc.

Cree un sistema de ayuda, tanto para sus aplicaciones como para otras. C++Builder 6 es un programa creado para la gestión de datos: catalogación, soporte, procesamiento de información y mucho más. Aunque puede realizar muchas operaciones de bases de datos a través del sistema de menús y la interfaz, dominar las amplias capacidades de Borland C++Builder 6 requiere cierto conocimiento del lenguaje de programación subyacente.

Las aplicaciones en el entorno Borland C++ Builder 6 se crean en forma de estructuras especiales: proyectos que el usuario ve como una colección de varios archivos. Ningún programa puede existir fuera de la estructura del proyecto. Las actividades de gestión de proyectos se llevan a cabo mediante un paquete de software especial: Project Manager.

4 Justificación de la elección de los medios técnicos

Requisitos mínimos del sistema:

Microsoft Windows 98, Windows Millennium (Me), Windows 2000 y versiones posteriores de los sistemas operativos Microsoft Windows.

3. La cantidad de RAM debe ser de al menos 128 Mb (se recomiendan 256 Mb).

4. 115 Mb de espacio libre en disco duro.

Resolución de monitor VGA o superior.

Ratón, teclado.

Espacio en disco duro necesario para completar la instalación: 675 Mb (edición Enterprise); 580 Mb (Profesional); 480Mb (Personal)

3. Parte de diseño

Tarea: Salida de producto y consumo de materia prima. Estructura del archivo de base de datos:

Nombre completo del maestro, fecha de producción, número de máquina, cantidad de productos producidos, nombre del producto, artículo de tela, nombre de la tela, fabricante de la tela, consumo de tela, precio de la tela, artículo de tinte, nombre del tinte, fabricante de tinte, consumo de tinte, precio de tinte.

Formularios de documentos: información sobre la persona que produce productos para el mes, información sobre las personas que producen productos para el mes.

Con base en datos teóricos, construiremos modelos de datos infológicos (Fig. 3.1) y datalógicos (Tabla 3.1, Tab. 3.2).

Fig. 3.1 modelo infológico del área temática.

Tabla 3.1.

“Diagrama de datos de producción de productos y consumo de materias primas”

Nombre

cita

dimensión

Nombre completo del maestro

fecha de lanzamiento

numero de auto


número de productos


nombre productos

material



Tabla 3.2.

"Material de esquema de datos"

Nombre

cita

dimensión

material


artículo de tela


nombre de la tela

fabricante de telas

consumo de tela

precio de la tela

artículo de tinte


nombre del tinte

fabricante de tintes

consumo de tinte

precio del tinte


Esquema de tabla.

Abra Inicio->Programas->Borland C++ Builder 6->Administrador BDE. Creemos una base de datos: Objeto->Nuevo y llamémosla “CBD”.

Abra Inicio->Programas->Borland C++ Builder 6->Escritorio de base de datos. En él crearemos dos tablas (Nueva->Tabla), a las que llamaremos:

3.1 Módulos del programa

Esta aplicación contiene un formulario principal, Form1. Ejecuta una serie de procedimientos, que son módulos de programa.

Lista de procedimientos:

Table1AfterScroll: garantiza la visualización de los datos de la Tabla1 (“t1.db”) en la ventana de edición al moverse por la tabla. AfterScroll: garantiza la visualización de los datos de la Tabla2 (“t2.db”) en la ventana de edición al moverse por la tabla. garantiza la visualización de los datos de la tabla en la edición de la ventana cuando se mueve a través de la tabla usando el componente de navegación de la base de datos. Haga clic en las Tablas 1 y 2 (“t1.db”, “t2. db”) en el estado de modo de inserción (dsInsert), y también. borra los campos de entrada de datos. Haga clic en: edita el contenido de las Tablas 1 y 2 (“t1.db”, “t2. db”). Haga clic en: guarda los datos ingresados ​​en las ventanas de edición para las Tablas 1 y 2 (“t1.db”. “t2.db”). Haga clic: elimina datos de las Tablas 1 b 2 (“t1.db” y “t2.db”). Haga clic: borra los campos de entrada de datos. Haga clic en: muestra el informe QuickRep1 en la pantalla. el informe QuickRep1 Haga clic - cambia a Form2. Haga clic- sale del programa. Haga clic- filtra la Tabla1 (“t1.db”). Cambia- filtra la Tabla1 (“t1.db”) por el campo N_mash Cambia- filtra la Tabla1 (“t1. db”) por campo Naim_iz Cambiar: busca datos en la Tabla1 (“t1.db”) usando el campo Fio_vas (usando el método Locate Cambiar: busca datos en la Tabla1 (“t1.db”) usando el campo Data_v (). usando el método Locate).

Form2- se utiliza para mostrar ayuda sobre el programa en la pantalla.

Diagrama de interconexión de módulos de software:

2 Descripción de cómo trabajar con el programa.

Este programa realiza las siguientes operaciones: ingresar datos a la base de datos, buscar datos usando palabras clave, mostrar información en pantalla, visualizar datos, imprimir documentos de salida, filtrar por campos y salir correctamente del programa.

La operación de entrada le permite ingresar los siguientes datos en la base de datos: nombre completo del maestro, fecha de producción, número de máquina, cantidad de productos producidos, nombre del producto, material, artículo de tela, nombre de la tela, fabricante de la tela, consumo de tela, precio de la tela. , artículo de tinte, nombre del tinte, tinte del fabricante, consumo de tinte, precio del tinte. Para ingresar nuevos datos, debe hacer clic en el botón Enter -> ingresar los datos requeridos en los campos de entrada -> Guardar.

Al hacer clic en Eliminar, puede eliminar la entrada. Puede editar un registro de la siguiente manera: por ejemplo, en Edit1 ingresamos un nuevo apellido del maestro y hacemos clic en el botón "editar", los cambios deben mostrarse en las tablas.

Ver: le permite ver los cambios realizados. Imprimir: envía el documento terminado a la impresora.

La búsqueda se realiza por el nombre del capitán y la fecha de emisión. Al ingresar el nombre del maestro que necesitamos en el campo de entrada, se mostrarán todos los datos sobre este maestro. El filtrado se realiza por número de máquina y nombre de producto. Por ejemplo, podemos ingresar el nombre de un producto en el campo Edit34, configurar el ícono “nombre del producto” y todos los datos relacionados con este producto se mostrarán en nuestras tablas.

4.Conclusión

Como resultado del trabajo realizado, me familiaricé con el programa C++Builder y creé una base de datos “producción de productos y consumo de materias primas”.

Así, el resultado del trabajo realizado fue un programa para una gestión eficaz de la producción en la empresa. Logré el objetivo planteado al inicio del diseño. Ahora, con la ayuda de este programa, es posible resolver muchos problemas simultáneamente.

Ahora basta con tener en la empresa al menos una computadora personal con este programa, una persona que ingrese los datos de entrada y genere la información necesaria, y el trabajo de todo el complejo industrial no se detendrá, sino que, por el contrario, se detendrá. adquirir nuevo impulso con el tiempo. También será posible controlar la calidad de la producción y se reducirá significativamente la producción de productos defectuosos. De este modo, una sola persona podrá gestionar la organización, sin tener que recurrir a varios cálculos manuales adicionales y buscar los documentos necesarios entre montones de papeles, cuando el programa contiene todo lo que se necesita. Esto permitirá a las personas ahorrar tiempo, que normalmente se dedica a buscar los documentos necesarios, lo que suele provocar tiempos de inactividad en la producción.

5. Literatura

1. Digo S.M. "Uso y diseño de una base de datos".

2. Un curso de conferencias sobre la disciplina “Bases de datos”.

Nikita Kultin “Tutorial C++ Builder” San Petersburgo<<БВХ-Петербург>> 2004

Henner E.K., Mogilev A.V., Pak N.I. "Informática". M.: “Libro de texto para estudiantes de pedagogía. universidades", 1999

B. Babe “Simple y claramente acerca de Borland C++”;

T. Swan “Programación para Windows en Borland C++ Builder”;

D. Hollingworth, B. Swart, M. Cashman, P. Gustafson “Borland C++ Builder”;

M. Flenov “Programación en Borland C++ Builder a través de los ojos de un hacker”;

De vez en cuando miro Toster.ru y, a veces, incluso respondo preguntas allí. Muy a menudo, la gente pregunta dos cosas: cómo convertirse en programador y cómo diseñar correctamente un esquema de base de datos. Personalmente me parece muy extraño que tanta gente haga la última pregunta. Por alguna razón, siempre me pareció que esto es algo tan simple que todos pueden hacer. Pero, como hay tanta gente interesada, aquí intentaré dar una respuesta bastante detallada y al mismo tiempo breve.

Supongo que conoces SQL. Es decir, no es necesario explicar qué son tablas, filas, índices, claves primarias e integridad referencial. Si este no es el caso, me temo que debo remitirlo a la literatura relevante. Afortunadamente, ahora hay mucho.

Dibujar un diagrama

Supongamos que desea diseñar un esquema de base de datos que almacene información sobre artistas musicales, álbumes y canciones. En la etapa inicial, cuando todavía no tenemos nada en absoluto, conviene empezar dibujando un diagrama del esquema futuro. Puede comenzar con un boceto con un bolígrafo en una hoja de papel o utilizar inmediatamente un editor especializado. Hay muchos de ellos ahora, todos están organizados de manera bastante similar. Al preparar esta nota, utilicé DbSchema. Este es un programa pago, pero creo que vale la pena. Además, las empresas normales suelen pagar el coste del software necesario para el trabajo. El período de prueba de DbSchema, en todo caso, es de dos semanas.

Me tomó unos diez minutos dibujar el siguiente diagrama:

Si nunca antes ha trabajado con este tipo de diagramas, no se alarme, todo es sencillo. Los rectángulos son tablas, las filas de los rectángulos son los nombres de las columnas, las flechas indican claves foráneas y las claves indican claves primarias. Si lo desea, incluso puede ver índices, tipos de columnas y si deben completarse (nulo / no nulo), pero para nosotros ahora esto no es tan importante.

Generar SQL y enviarlo al DBMS

Es fácil ver que este diagrama se puede asignar fácilmente al código para crear un esquema de base de datos en SQL. En DbSchema, puede generar SQL diciendo Esquema → Generar esquema y script de datos. Luego, el script resultante se puede enviar al DBMS que esté utilizando:

música de gato.sql |

psql -hlocalhost base_datos_prueba usuario_prueba

Usé PostgreSQL. Encontrará información sobre cómo instalar este DBMS en esta nota.

Entonces, ¿qué me guió a la hora de diseñar el circuito?

Formas normales El proceso de eliminar redundancia e inconsistencia en una base de datos se llama. Existen las llamadas formas normales, de las que en la práctica rara vez alguien recuerda más que las tres primeras.

En términos generales, una tabla está en primera forma normal (1NF) si hay exactamente un valor en la intersección de cualquier fila y cualquier columna de la tabla. En los RDBMS modernos, esta condición siempre se cumple. Incluso si el DBMS admite conjuntos o matrices, se almacena exactamente un valor de conjunto o matriz en la intersección de una fila y una columna. pero en la mesa (usuario varchar(100), número entero de teléfono) no puede haber una línea alex - 1234, 5678. En 1NF solo puede haber dos términos: alex - 1234 y alex - 5678.

Segunda forma normal (2NF) significa que la tabla está en la primera forma normal y todos los atributos no clave irreducible Depende del valor de la clave primaria. Irreductibilidad significa lo siguiente. Si la clave primaria consta de un único atributo, entonces cualquier dependencia funcional de ella es irreducible. Si la clave principal es compuesta, entonces la tabla no puede tener un atributo cuyo valor esté determinado de forma única por el valor de un subconjunto de los atributos de la clave principal.

Una tabla está en tercera forma normal si está en 2NF y ningún atributo que no sea clave tiene una dependencia funcional transitiva de la clave primaria. Por ejemplo, considere la tabla (empleado varchar(100) clave principal, departamento varchar(100), departamento_teléfono entero). Obviamente está en 2NF. Pero el número de teléfono del departamento está en una dependencia funcional transitiva del nombre del empleado, ya que el empleado especifica de forma única el departamento y el departamento especifica de forma única el número de teléfono del departamento. Para convertir una tabla a 3NF, debe dividirla en dos tablas: empleado - departamento y departamento - teléfono.

Es fácil ver que la normalización reduce la redundancia de la base de datos y evita la introducción de errores aleatorios. Por ejemplo, si deja la tabla del último ejemplo en 2NF, puede asignar por error diferentes números de teléfono al mismo departamento. O consideremos una empresa con cinco departamentos y 1.000 empleados. Si el número de teléfono de un departamento ha cambiado, para actualizarlo en la base de datos, en el caso de 2NF, deberá escanear 1000 filas, y en el caso de 3NF, solo cinco.

Tareas básicas de diseño de bases de datos

Tareas principales:

  • Garantizar que toda la información necesaria se almacene en la base de datos.
  • Garantizar la capacidad de obtener datos para todas las solicitudes necesarias.
  • Reduzca la redundancia y duplicación de datos.
  • Garantizar la integridad de los datos (corrección de su contenido): eliminar contradicciones en el contenido de los datos, eliminar su pérdida, etc.

Etapas básicas del diseño de bases de datos.

Diseño conceptual (infológico)- construcción de un modelo semántico del área temática, es decir, un modelo de información del más alto nivel de abstracción. Dicho modelo se crea sin centrarse en ningún DBMS ni modelo de datos específicos. Los términos “modelo semántico”, “modelo conceptual” y “modelo infológico” son sinónimos. Además, en este contexto, las palabras "modelo de base de datos" y "modelo de dominio" se pueden utilizar por igual (por ejemplo, "modelo de base de datos conceptual" y "modelo de dominio conceptual"), ya que dicho modelo es a la vez una imagen de la realidad y una base de datos de diseño de imágenes para esta realidad.

El tipo específico y el contenido del modelo de base de datos conceptual están determinados por el aparato formal elegido para este propósito. Comúnmente se utilizan notaciones gráficas similares a los diagramas ER.

Muy a menudo, el modelo de base de datos conceptual incluye:

  • descripción de objetos de información, o conceptos del área temática y conexiones entre ellos.
  • descripción de las restricciones de integridad, es decir requisitos para valores de datos aceptables y relaciones entre ellos.

Diseño lógico (datalógico)- crear un esquema de base de datos basado en un modelo de datos específico, por ejemplo, un modelo de datos relacional. Para un modelo de datos relacional, un modelo datalógico es un conjunto de diagramas de relaciones, que generalmente especifican claves primarias, así como "vínculos" entre las relaciones, que son claves externas.

La transformación de un modelo conceptual en un modelo lógico suele realizarse según reglas formales. Esta etapa puede automatizarse en gran medida.

En la etapa de diseño lógico, se tienen en cuenta las características específicas de un modelo de datos específico, pero es posible que no se tengan en cuenta las características específicas de un DBMS específico.

Diseño físico

Diseño físico- crear un esquema de base de datos para un DBMS específico. Los detalles de un DBMS en particular pueden incluir restricciones en la denominación de los objetos de la base de datos, restricciones en los tipos de datos admitidos, etc. Además, las características específicas de un DBMS en particular durante el diseño físico incluyen la elección de soluciones relacionadas con el entorno físico de almacenamiento de datos (elección de métodos de administración de memoria de disco, división de la base de datos en archivos y dispositivos, métodos de acceso a datos), creación de índices, etc.

Normalización

Al diseñar bases de datos relacionales, generalmente se realiza algo llamado normalización.

Modelos entidad-relación

Modelo entidad-relación “Modelo Entidad-Relación” ), o el modelo ER, propuesto por P. Chen en 1976, es el representante más famoso de la clase de modelos semánticos (conceptuales, infológicos) del área temática. El modelo ER generalmente se representa en forma gráfica, utilizando la notación original de P. Chen, llamada diagrama ER, o usando otras notaciones gráficas ( pata de gallo, Ingeniería de la información etc.).

Las principales ventajas de los modelos ER:

  • visibilidad;
  • los modelos le permiten diseñar bases de datos con una gran cantidad de objetos y atributos;
  • Los modelos ER se implementan en muchos sistemas de diseño de bases de datos asistidos por computadora (por ejemplo, ERWin).

Elementos básicos de los modelos ER:

  • objetos (entidades);
  • atributos de objeto;
  • conexiones entre objetos.

Una entidad es un objeto de dominio que tiene atributos.

La relación entre entidades se caracteriza por:

  • tipo de conexión (1:1, 1:N, N:M);
  • clase de membresía. Una clase puede ser obligatoria u opcional. Si cada instancia de entidad está involucrada en una relación, entonces la clase de membresía es obligatoria; de lo contrario, es opcional.

Modelos semánticos

El modelo semántico (modelo conceptual, modelo infológico) es un modelo de un área temática diseñado para representar la semántica de un área temática en el más alto nivel de abstracción. Esto significa que se elimina o minimiza la necesidad de utilizar conceptos de bajo nivel asociados con la representación física específica y el almacenamiento de datos.

Fecha K. J. Introducción a los sistemas de bases de datos. - 8ª ed. - M.: “Williams”, 2006:

El modelado semántico ha sido objeto de intensas investigaciones desde finales de los años 1970. La principal motivación para dicha investigación (es decir, el problema que los investigadores intentaban resolver) fue el siguiente hecho. El hecho es que los sistemas de bases de datos suelen tener un conocimiento muy limitado sobre el significado de los datos almacenados en ellos. En la mayoría de los casos, sólo permiten la manipulación de datos de ciertos tipos simples y definen algunas restricciones de integridad simples impuestas a estos datos. Cualquier interpretación más compleja es responsabilidad del usuario. Sin embargo, sería fantástico si los sistemas pudieran tener un poco más de conocimientos y ser un poco más inteligentes a la hora de responder a las consultas de los usuarios, además de admitir interfaces de usuario más complejas (es decir, de mayor nivel).
[…]
Las ideas de modelado semántico pueden resultar útiles como herramienta de diseño de bases de datos incluso si no están respaldadas directamente por el DBMS.

El representante más famoso de la clase de modelos semánticos es el modelo entidad-relación (modelo ER).

Literatura

  • Fecha K.J. Introducción a los Sistemas de Bases de Datos. - 8ª ed. - M.: “Williams”, 2006. - 1328 p. -ISBN 0-321-19784-4
  • Kogalovsky M.R. Tecnologías avanzadas de sistemas de información. - M.: Prensa DMK; Empresa de TI, 2003. - 288 p. -ISBN 5-279-02276-4
  • Kogalovsky M.R. Enciclopedia de tecnologías de bases de datos. - M.: Finanzas y Estadísticas, 2002. - 800 p. -ISBN 5-279-02276-4
  • Kuznetsov S.D. Conceptos básicos de bases de datos. - 2ª ed. - M.: Universidad de Tecnologías de la Información de Internet; BINOMIO. Laboratorio de Conocimiento, 2007. - 484 p. -ISBN 978-5-94774-736-2
  • Connolly T., Begg K. Bases de datos. Diseño, implementación y soporte. Teoría y práctica = Sistemas de bases de datos: un enfoque práctico para el diseño, implementación y gestión. - 3ª edición. - M.: “Williams”, 2003. - 1436 p. -ISBN 0-201-70857-4
  • García-Molina G., Ullman J., Widom J. Sistemas de bases de datos. Curso completo. - M.: “Williams”, 2003. - 1088 p. -ISBN 5-8459-0384-X

Ver también

  • Métodos de diseño

Campo de golf

  • El modelo entidad-relación es un paso hacia una visión unificada de los datos - Citforum
  • Ampliando el modelo relacional para reflejar mejor la semántica - Citforum
  • Una guía para diseñar bases de datos de sitios web "para principiantes"
  • Un método para diseñar la estructura lógica de una base de datos relacional sin normalización de tablas.

Notas


Fundación Wikimedia.

2010.

    Vea qué es "Diseño de base de datos" en otros diccionarios:

    El administrador de una base de datos es una persona responsable de desarrollar los requisitos de una base de datos, su diseño, implementación, uso y mantenimiento efectivos, incluida la administración de cuentas de usuarios de la base de datos y la protección contra personas no autorizadas... ... Wikipedia

    - (Refactorización de bases de datos en inglés) es un simple cambio en el esquema de la base de datos que ayuda a mejorar su diseño manteniendo la semántica funcional e informativa. En otras palabras, la consecuencia de la refactorización de la base de datos no puede ser... ... Wikipedia DISEÑO - una de las formas de reflexión avanzada de la realidad, el proceso de creación de un prototipo (prototipo) de un objeto, fenómeno o proceso propuesto a través de un específico. métodos. P. es una forma específica de manifestación pronóstica. funciones de control,... ...

    La solicitud "DB" se redirige aquí; ver también otros significados. Una base de datos presentada de forma objetiva es una colección de materiales independientes (artículos, cálculos, reglamentos, decisiones judiciales y otros materiales similares), ... ... Wikipedia

Me resulta difícil dar consejos porque no sé exactamente cómo “lo han hecho otros”. Pero si su proyecto tiene como objetivo la autoeducación, creo que primero debería practicar en una base de datos relacional clásica y solo luego pasar a algunas opciones más exóticas. Es necesario pasar de lo simple a lo complejo y sólo cuando lo simple ya no sea suficiente. En general, una base de datos relacional con su estructura rígida y las estrictas restricciones que usted establece son sus amigas, porque están tratando de salvar sus datos de la destrucción.

Respecto a mostrar diferentes tipos de productos en diferentes mesas. Esta decisión tiene lados buenos y malos. Lo principal es que puedes crear completamente cada tabla, teniendo en cuenta todas las características específicas de cada tipo de producto. Pero lo malo es que en este caso habrá que tener cuidado de que cada tabla se procese por separado. Porque si las tablas tienen un diseño diferente, entonces los métodos de procesamiento deberían ser diferentes.

Quizás la solución óptima sería pensar detenidamente qué parámetros de producto necesitará para la búsqueda y convertirlos en columnas indexables separadas de la tabla general de productos. Para algunos tipos de productos, estos campos estarían vacíos. Y otros parámetros que simplemente describen el producto, pero que no están destinados a la búsqueda, se pueden combinar y almacenar en este formulario en una columna. Y descomprimirlos según sea necesario, cuando sea necesario entregárselos al usuario. Podrías poner todo tipo de cosas allí, sin preocuparte en absoluto de que estas cosas puedan cambiar para un producto en particular. Lo principal es almacenarlo en forma de pares de valores para saber qué es qué (quería agregar a la descripción del producto que los cocodrilos son de color marrón grisáceo y no morados, como todos los demás), eso es lo que escribir - Cocodrilos => marrón grisáceo.

Por otro lado, no siempre sabes qué categoría de producto deseas agregar a continuación. Pero distorsionar, inflar y “descargar” la tabla general de bienes no es una muy buena idea. Desde este punto de vista de generalidad, tu idea de diferentes tablas para diferentes productos puede ser muy buena. Después de todo, después de haber desarrollado la base misma: haber elaborado varios procesamientos para varias tablas de productos, al agregar un nuevo tipo de producto, solo necesita crear una tabla y darle un controlador que sea adecuado para ella. No tienes que preocuparte por cómo funcionan otras tablas.

Bueno, por ejemplo, seleccionamos la categoría de producto de computadoras portátiles y buscamos según parámetros que son típicos solo de las computadoras portátiles.

La esencia del diseño de una base de datos, como cualquier otro proceso de diseño, es crear una descripción de un nuevo sistema que no ha existido previamente en esta forma, que, una vez implementado, sea capaz de funcionar en condiciones apropiadas. De esto se deduce que las etapas del diseño de la base de datos deben reflejar de manera consistente y lógica la esencia de este proceso.

Contenidos del diseño y puesta en fase de la base de datos.

La intención del diseño se basa en alguna necesidad social formulada. Esta necesidad tiene un entorno para su aparición y un público objetivo de consumidores que utilizarán el resultado del diseño. En consecuencia, el proceso de diseño de una base de datos comienza con el estudio de una necesidad determinada desde el punto de vista de los consumidores y el entorno funcional de su ubicación prevista. Es decir, la primera etapa consiste en recopilar información y definir un modelo del área temática del sistema, así como examinarlo desde el punto de vista del público objetivo. En general, para determinar los requisitos del sistema, se determina el alcance de las actividades así como los límites de las aplicaciones de bases de datos.

A continuación, el diseñador, que ya tiene ciertas ideas sobre lo que necesita crear, aclara las tareas supuestamente resueltas por la aplicación, crea una lista de ellas (especialmente si el desarrollo del proyecto es una base de datos grande y compleja), aclara la secuencia de resolución. problemas y realiza análisis de datos. Este proceso también es un trabajo de diseño por etapas, pero generalmente en la estructura del diseño estos pasos son absorbidos por la etapa de diseño conceptual: la etapa de identificación de objetos, atributos y conexiones.

La creación de un conceptual (modelo de información) implica la formación preliminar de requisitos conceptuales del usuario, incluidos los requisitos para aplicaciones que pueden no implementarse de inmediato, pero teniendo en cuenta cuáles mejorarán la funcionalidad del sistema en el futuro. Al tratar con representaciones de conjuntos de objetos abstractos (sin especificar métodos de almacenamiento físico) y sus relaciones, el modelo conceptual corresponde esencialmente al modelo de dominio. Por eso, en la literatura, la primera etapa del diseño de una base de datos se denomina diseño infológico.

A continuación, sigue una etapa separada (o una adición a la anterior) a la etapa de formación de requisitos para el entorno operativo, donde se evalúan los requisitos de los recursos informáticos capaces de garantizar el funcionamiento del sistema. En consecuencia, cuanto mayor sea el volumen de la base de datos diseñada, mayor será la actividad del usuario y la intensidad de las solicitudes, mayores serán los requisitos de recursos: para la configuración de la computadora, para el tipo y versión del sistema operativo. Por ejemplo, la operación multiusuario de una futura base de datos requiere una conexión de red utilizando un sistema operativo adecuado para realizar múltiples tareas.

El siguiente paso es que el diseñador seleccione un sistema de gestión de bases de datos (DBMS), así como herramientas de software. Posteriormente, el modelo conceptual debe ser transferido a un modelo de datos compatible con el sistema de gestión seleccionado. Pero esto a menudo implica realizar modificaciones y cambios en el modelo conceptual, ya que las interconexiones entre los objetos reflejados en el modelo conceptual no siempre se pueden implementar utilizando los medios de un DBMS determinado.

Esta circunstancia determina el surgimiento de la siguiente etapa: el surgimiento de un modelo conceptual provisto de los medios de un DBMS específico. Este paso corresponde a la etapa de diseño lógico (creación de un modelo lógico).

Finalmente, la etapa final del diseño de una base de datos es el diseño físico: la etapa de vincular la estructura lógica y el entorno de almacenamiento físico.

Así, las principales etapas del diseño de forma detallada se presentan en las siguientes etapas:

  • diseño de información,
  • formación de requisitos para el entorno operativo
  • selección del sistema de control y software de base de datos,
  • diseño lógico,
  • diseño físico

Los principales se analizarán con más detalle a continuación.

Diseño infológico

La identificación de entidades forma la base semántica del diseño infológico. Una entidad aquí es un objeto (abstracto o concreto), cuya información se acumulará en el sistema. En el modelo infológico del área temática, la estructura y las propiedades dinámicas del área temática se describen en términos fáciles de usar que no dependen de la implementación específica de la base de datos. Pero los términos se toman en una escala estándar. Es decir, la descripción no se expresa a través de objetos individuales del área temática y sus relaciones, sino a través de:

  • descripción de tipos de objetos,
  • restricciones de integridad asociadas con el tipo descrito,
  • procesos que conducen a la evolución de un área temática: su transición a otro estado.

Se puede crear un modelo de información utilizando varios métodos y enfoques:

  1. El enfoque funcional se basa en las tareas asignadas. Se denomina funcional porque se utiliza si se conocen las funciones y tareas de las personas que atenderán sus necesidades de información con ayuda de la base de datos diseñada.
  2. El enfoque temático se centra en la información sobre la información que estará contenida en la base de datos, a pesar de que es posible que la estructura de la consulta no esté definida. En este caso, la investigación sobre un área temática se centra en su visualización más adecuada en la base de datos en el contexto de toda la gama de solicitudes de información esperadas.
  3. Un enfoque integrado que utiliza el método “entidad-relación” combina las ventajas de los dos anteriores. El método se reduce a dividir toda el área temática en partes locales, que se modelan por separado y luego se recombinan en un área completa.

Dado que el uso del método “entidad-relación” es un método de diseño combinado en esta etapa, a menudo se convierte en una prioridad.

Cuando se dividen metódicamente, las representaciones locales deben, si es posible, incluir información que sea suficiente para resolver un problema separado o para satisfacer las necesidades de un determinado grupo de usuarios potenciales. Cada una de estas áreas contiene entre 6 y 7 entidades y corresponde a una aplicación externa independiente.

La dependencia de las entidades se refleja en su división en fuertes (base, padre) y débiles (hijo). Una entidad fuerte (por ejemplo, un lector en una biblioteca) puede existir en la base de datos por sí sola, pero una entidad débil (por ejemplo, la suscripción de este lector) está "adjunta" a una fuerte y no existe por separado.

Es necesario separar los conceptos de "instancia de entidad" (un objeto caracterizado por valores de propiedad específicos) y el concepto de "tipo de entidad", un objeto caracterizado por un nombre común y una lista de propiedades.

Para cada entidad individual se seleccionan atributos (un conjunto de propiedades) que, según el criterio, pueden ser:

  • identificativo (con un valor único para entidades de ese tipo, convirtiéndolas en claves potenciales) o descriptivo;
  • de un solo valor o de varios valores (con el número apropiado de valores para una instancia de entidad);
  • básico (independiente de otros atributos) o derivado (calculado en base a los valores de otros atributos);
  • simple (un componente indivisible) o compuesto (combinado de varios componentes).

Después de esto, se especifica el atributo, las conexiones se especifican en la vista local (divididas en opcionales y obligatorias) y las vistas locales se fusionan. Si el número de áreas locales es de hasta 4 o 5, se pueden combinar en un solo paso. . Si el número aumenta, la fusión binaria de áreas se produce en varias etapas.

Durante esta y otras etapas intermedias, se refleja el carácter iterativo del diseño, que se expresa aquí en el hecho de que para eliminar contradicciones es necesario volver a la etapa de modelar representaciones locales para su aclaración y cambio (por ejemplo, para cambiar los mismos nombres de objetos semánticamente diferentes o para coordinar atributos de integridad en los mismos atributos en diferentes aplicaciones).

Selección de un sistema de control y software de base de datos.

La implementación práctica del sistema de información depende de la elección del sistema de gestión de la base de datos. Los criterios más importantes en el proceso de selección son los siguientes parámetros:

  • tipo de modelo de datos y su conformidad con las necesidades del área temática,
  • reserva de posibilidades en caso de ampliación del sistema de información,
  • características de rendimiento del sistema seleccionado,
  • confiabilidad operativa y conveniencia del DBMS,
  • herramientas dirigidas al personal de administración de datos,
  • el costo del DBMS en sí y el software adicional.

Es casi seguro que los errores al elegir un DBMS provocarán posteriormente la necesidad de ajustar los modelos conceptuales y lógicos.

Diseño de base de datos lógica

La estructura lógica de la base de datos debe corresponder al modelo lógico del área temática y tener en cuenta la conexión del modelo de datos con el DBMS compatible. Por tanto, la etapa comienza con la elección de un modelo de datos, donde es importante tener en cuenta su sencillez y claridad.

Es preferible que la estructura de datos natural coincida con el modelo que la representa. Entonces, por ejemplo, si los datos se presentan en forma de estructura jerárquica, entonces es mejor elegir un modelo jerárquico. Sin embargo, en la práctica, esta elección suele estar determinada por el sistema de gestión de la base de datos y no por el modelo de datos. Por lo tanto, el modelo conceptual se traduce realmente en un modelo de datos que es compatible con el sistema de gestión de bases de datos seleccionado.

Esto también refleja la naturaleza del diseño, que permite la posibilidad (o necesidad) de volver al modelo conceptual para cambiarlo si las relaciones entre objetos (o atributos de objetos) allí reflejadas no pueden implementarse utilizando el DBMS elegido.

Al finalizar la etapa se deben generar esquemas de bases de datos de ambos niveles de arquitectura (conceptual y externo), creados en el lenguaje de definición de datos soportado por el SGBD seleccionado.

Los esquemas de bases de datos se forman utilizando uno de dos enfoques diferentes:

  • o utilizando un enfoque ascendente, cuando el trabajo proviene de los niveles inferiores de atributos definitorios, agrupados en relaciones que representan objetos, a partir de las relaciones existentes entre atributos;
  • o utilizar un enfoque inverso, de arriba hacia abajo, que se utiliza cuando el número de atributos aumenta significativamente (hasta cientos y miles).

El segundo enfoque implica identificar una serie de entidades de alto nivel y sus relaciones con el posterior detalle hasta el nivel requerido, lo que se refleja, por ejemplo, en un modelo creado basado en el método "entidad-relación". Pero en la práctica ambos enfoques suelen combinarse.

Diseño de base de datos física.

En la siguiente etapa del diseño físico de la base de datos, la estructura lógica se muestra en forma de estructura de almacenamiento de la base de datos, es decir, está vinculada al entorno de almacenamiento físico donde se colocarán los datos de la manera más eficiente posible. Aquí se describe detalladamente el esquema de datos, indicando todos los tipos, campos, tamaños y restricciones. Además de desarrollar índices y tablas, se definen consultas básicas.

La construcción de un modelo físico implica resolver problemas en gran medida contradictorios:

  1. tareas de minimizar el espacio de almacenamiento de datos,
  2. retos para lograr integridad, seguridad y máximo rendimiento.

La segunda tarea entra en conflicto con la primera porque, por ejemplo:

  • Para que las transacciones funcionen eficazmente, es necesario reservar espacio en disco para objetos temporales.
  • para aumentar la velocidad de búsqueda, debe crear índices, cuyo número está determinado por el número de todas las combinaciones posibles de campos involucrados en la búsqueda,
  • Para restaurar los datos, se crearán copias de seguridad de la base de datos y se mantendrá un registro de todos los cambios.

Todo esto aumenta el tamaño de la base de datos, por lo que el diseñador busca un equilibrio razonable en el que los problemas se resuelvan de manera óptima colocando los datos de manera inteligente en el espacio de la memoria, pero no a expensas de la seguridad de la base de datos, que incluye tanto la protección contra el acceso no autorizado como la protección. de fracasos.

Para completar la creación de un modelo físico se evalúan sus características operativas (velocidad de búsqueda, eficiencia de ejecución de consultas y consumo de recursos, corrección de las operaciones). A veces, esta etapa, al igual que las etapas de implementación, prueba y optimización de la base de datos, así como el mantenimiento y la operación, se lleva fuera del diseño inmediato de la base de datos.




Arriba