Niveles y estructura de la información económica. Niveles sintácticos, semánticos y pragmáticos de la información económica. Medidas semánticas y pragmáticas de información.

Medida sintáctica de información.

Arroz. 1.1. Medidas de información

La medida sintáctica opera sobre el volumen de datos y la cantidad de información I a expresada a través de la entropía (el concepto de incertidumbre del estado del sistema).

La medida semántica opera sobre la cantidad de información expresada a través de su volumen y grado de contenido.

Una medida pragmática está determinada por su utilidad, expresada a través de los correspondientes efectos económicos.

Medida sintáctica de información.

Esta medida de la cantidad de información opera con información impersonal que no expresa una relación semántica con el objeto.

Hoy en día, los métodos más conocidos para medir información cuantitativa son el volumétrico, el de entropía y el algorítmico.

La volumétrica es la forma más sencilla y tosca de medir información. La correspondiente evaluación cuantitativa de la información puede, naturalmente, denominarse volumen de información.

La cantidad de información es la cantidad de caracteres del mensaje. Dado que el mismo número se puede escribir de muchas maneras diferentes, es decir, utilizando diferentes alfabetos, por ejemplo veintiuno - 21 - XXI - 11001, este método es sensible a la forma de presentación (grabación) del mensaje. En informática, toda la información procesada y almacenada, independientemente de su naturaleza (número, texto, visualización), se presenta en forma binaria (utilizando un alfabeto que consta de sólo dos caracteres "0" y "1").

En el sistema numérico binario, la unidad de medida es un bit (bit – dígito binario – dígito binario).

En teoría de la información, un bit es la cantidad de información necesaria para distinguir entre dos mensajes igualmente probables; y en informática, un bit es la "porción" más pequeña de memoria necesaria para almacenar uno de los dos caracteres "0" y "1" utilizados para la representación interna de datos y comandos de la máquina. Esta es una unidad de medida demasiado pequeña; en la práctica, se utiliza más a menudo una unidad más grande, un byte, igual a los 8 bits necesarios para codificar cualquiera de los 256 caracteres del alfabeto del teclado de computadora (256 = 2 8).

También se utilizan ampliamente unidades de información derivadas aún más grandes:

1 kilobyte (kbyte) = 1024 bytes = 2 10 bytes;

1 megabyte (MB) = 1024 KB = 2 20 bytes;

1 Gigabyte (GB) = 1024 MB = 2 30 bytes.

Recientemente, debido al aumento en el volumen de información procesada, se han comenzado a utilizar las siguientes unidades derivadas:

1 Terabyte (TB) = 1024 GB = 2 40 bytes;

1 petabyte (PB) = 1024 TB = 250 bytes.

En el sistema numérico decimal, la unidad de medida es dit (lugar decimal).

Un mensaje en sistema binario en forma de código binario de ocho bits 1011 1011 tiene un volumen de datos V D = 8 bits.

Un mensaje en el sistema decimal en forma de un número de seis dígitos 275 903 tiene un volumen de datos V D = 6 bits.

En la teoría de la información y la codificación, se adopta un enfoque de entropía para medir la información. La obtención de información sobre un sistema siempre va asociada a un cambio en el grado de desconocimiento del destinatario sobre el estado de este sistema. Este método de medición proviene del siguiente modelo.

Deje que el consumidor tenga alguna información preliminar (a priori) sobre el sistema α antes de recibir información. Después de recibir el mensaje b, el destinatario adquirió información adicional I(b), lo que redujo su ignorancia. Esta información generalmente no es confiable y se expresa en las probabilidades con las que se espera tal o cual evento. La medida general de incertidumbre (entropía) se caracteriza por cierta dependencia matemática de la totalidad de estas probabilidades. La cantidad de información en un mensaje está determinada por cuánto disminuye esta medida después de recibir el mensaje.

Así, el ingeniero estadounidense R. Hartley (1928) considera el proceso de obtención de información como la selección de un mensaje de un conjunto finito predeterminado de N mensajes igualmente probables, y la cantidad de información i contenida en el mensaje seleccionado se define como el binario logaritmo de N (fórmula de Hartley):

Digamos que necesitas adivinar un número de un conjunto de números del uno al cien. Usando la fórmula de Hartley, puede calcular cuánta información se requiere para esto: , es decir, un mensaje sobre un número adivinado correctamente contiene una cantidad de información aproximadamente igual a 6,644 unidades de información.

Otros ejemplos de mensajes igualmente probables:

1) al lanzar una moneda, “salió cara”, “salió cara”;

2) en la página del libro “el número de letras es par”, “el número de letras es impar”.

Es imposible responder inequívocamente a la pregunta de si los mensajes “la mujer será la primera en salir de las puertas del edificio” y “el hombre será el primero en salir de las puertas del edificio” son igualmente probables. Todo depende de qué tipo de edificio estemos hablando. Si se trata, por ejemplo, de una estación de metro, entonces la probabilidad de salir primero por la puerta es la misma para un hombre y una mujer, y si se trata de un cuartel militar, entonces para un hombre esta probabilidad es mucho mayor que para una mujer. .

Para problemas de este tipo, el científico estadounidense Claude Shannon propuso en 1948 otra fórmula para determinar la cantidad de información, teniendo en cuenta la posible probabilidad desigual de mensajes en un conjunto (fórmula de Shannon):

donde es la probabilidad de que se seleccione el i-ésimo mensaje en un conjunto de N mensajes.

Es fácil notar que si las probabilidades... son iguales, entonces cada una de ellas es igual y la fórmula de Shannon se convierte en la fórmula de Hartley.

Además de los dos enfoques considerados para determinar la cantidad de información, existen otros. Es importante recordar que cualquier resultado teórico es aplicable sólo a una cierta gama de casos, delineados por los supuestos iniciales.

La teoría algorítmica de la información (una sección de la teoría de los algoritmos) propone un método algorítmico para evaluar la información de un mensaje. A cualquier mensaje se le puede asignar una característica cuantitativa que refleje la complejidad (tamaño) del programa que permite producirlo.

El coeficiente (grado) de contenido de información (brevedad) de un mensaje está determinado por la relación entre la cantidad de información y el volumen total de datos recibidos:

y 0< Y < 1.

A medida que Y aumenta, la cantidad de trabajo para transformar la información (datos) en el sistema disminuye. Por lo tanto, es necesario esforzarse por aumentar el contenido de la información, para lo cual se están desarrollando métodos especiales para una codificación óptima de la información.

1.4.2.2 Medida semántica de información

La semántica es la ciencia del significado, el contenido de la información.

Para medir el contenido semántico de la información, es decir, su cantidad a nivel semántico, la medida del tesauro, que conecta las propiedades semánticas de la información con la capacidad del usuario para aceptar el mensaje entrante, ha recibido el mayor reconocimiento. Un mismo mensaje informativo (artículo de periódico, anuncio, carta, telegrama, certificado, cuento, dibujo, emisión de radio, etc.) puede contener diferentes cantidades de información para diferentes personas dependiendo de su conocimiento previo, nivel de comprensión de este mensaje e interés en a él.

Para medir la cantidad de información semántica se utiliza el concepto de “tesauro de usuario”, es decir, la totalidad de la información disponible para el usuario o el sistema.

Dependiendo de la relación entre el contenido semántico de la información S y el tesauro del usuario S p, cambia la cantidad de información semántica I c percibida por el usuario y posteriormente incluida por él en su tesauro. La naturaleza de esta dependencia se muestra en la Figura 1.2.

Arroz. 1. 2. Dependencia de la cantidad de información semántica percibida por el consumidor de su tesauro I C = f(S p)

Consideremos dos casos límite cuando la cantidad de información semántica I C es igual a 0:

En el usuario no percibe ni comprende la información entrante;

En el usuario lo sabe todo y no necesita la información entrante.

El consumidor adquiere la máxima cantidad de información semántica al coordinar su contenido semántico S con su tesauro ( ), cuando la información entrante es comprensible para el usuario y le proporciona información previamente desconocida (no en su tesauro).

Por tanto, la cantidad de información semántica y nuevos conocimientos en un mensaje recibido por el usuario es un valor relativo.

Una medida relativa de la cantidad de información semántica puede ser el coeficiente de contenido C, definido como la relación entre la cantidad de información semántica y su volumen.

que ocurre en promedio por estado se llama entropía de una fuente discreta de información

mación.

H p i log p i

yo 1 norte

Si volvemos a centrarnos en medir la incertidumbre en unidades binarias, entonces la base del logaritmo debe tomarse igual a dos.

Hp ilog 2 p i

yo 1 norte

En elecciones equiprobables, todos

bloquear

y la fórmula (5) se transforma en la fórmula (2) de R. Hartley:

1 registro2

Nlog2

La medida propuesta se llamó entropía no por casualidad. El caso es que la estructura formal de la expresión (4) coincide con la entropía del sistema físico, previamente definida por Boltzmann. Según la segunda ley de la termodinámica, la entropía de un espacio cerrado está determinada por

pi 1

crecer entonces

se puede escribir como

pilón

yo 1 norte

Esta fórmula coincide completamente con (4)

En ambos casos, el valor caracteriza el grado de diversidad del sistema.

Utilizando las fórmulas (3) y (5), es posible determinar la redundancia del alfabeto fuente del mensaje.

Lo que muestra cuán racionalmente se utilizan los símbolos de un alfabeto determinado:

) es la entropía máxima posible, determinada por la fórmula (3);

() - entropía

fuente, determinada por la fórmula (5).

La esencia de esta medida es que, con una elección igualmente probable, se puede garantizar la misma carga de información en un signo utilizando un alfabeto más pequeño que en el caso de una elección desigual.

Medidas de información a nivel semántico.

Para medir el contenido semántico de la información, es decir Por su cantidad a nivel semántico, la más extendida es la medida del tesauro, que conecta las propiedades semánticas de la información con la capacidad del usuario para aceptar el mensaje entrante. De hecho, para comprender y utilizar la información recibida, el destinatario debe tener ciertos conocimientos. El completo desconocimiento del tema no nos permite extraer información útil del mensaje recibido sobre este tema. A medida que crece el conocimiento sobre un tema, también crece la cantidad de información útil extraída del mensaje.

Si llamamos "tesauro" al conocimiento del destinatario sobre un tema determinado (es decir, un determinado conjunto de palabras, conceptos, nombres de objetos conectados por conexiones semánticas), entonces la cantidad de información contenida en un determinado mensaje se puede evaluar en el grado de cambio en el tesauro individual bajo la influencia de este mensaje.

Un tesauro es una colección de información disponible para un usuario o sistema.

En otras palabras, la cantidad de información semántica extraída por el destinatario de los mensajes entrantes depende del grado de preparación de su tesauro para percibir dicha información.

Dependiendo de la relación entre el contenido semántico de la información y el tesauro del usuario, cambia la cantidad de información semántica percibida por el usuario y posteriormente incluida en su tesauro. La naturaleza de esta dependencia se muestra en la Figura 3. Consideremos dos casos límite cuando la cantidad de información semántica es igual a

Figura 3 - Dependencia de la cantidad de información semántica percibida por el consumidor de su tesauro ()

El consumidor adquiere la máxima cantidad de información semántica al aceptar

combinando su contenido semántico con su tesauro (), cuando la información entrante es comprensible para el usuario y le trae información previamente desconocida (no en su tesauro).

En consecuencia, la cantidad de información semántica en un mensaje, la cantidad de nuevos conocimientos recibidos por el usuario, es un valor relativo. El mismo mensaje puede tener un contenido significativo para un usuario competente y carecer de significado para un usuario incompetente.

Al evaluar el aspecto semántico (contenido) de la información, es necesario esforzarse por armonizar los valores y.

Una medida relativa de la cantidad de información semántica puede ser el coeficiente de contenido, que se define como la relación entre la cantidad de información semántica y su volumen:

Otro enfoque para las evaluaciones semánticas de la información, desarrollado en el marco de la investigación científica, es que el número de enlaces a ella en otros documentos se toma como el principal indicador del valor semántico de la información contenida en el documento analizado (mensaje, publicación). . Los indicadores específicos se forman a partir del procesamiento estadístico del número de enlaces en varias muestras.

Medidas de información a nivel pragmático

Esta medida determina la utilidad de la información (valor) para que el usuario logre su objetivo. También es un valor relativo, determinado por las peculiaridades del uso de esta información en un sistema particular.

Uno de los primeros científicos nacionales que abordó este problema fue A. A. Kharkevich, quien propuso tomar como medida del valor de la información la cantidad de información necesaria para lograr el objetivo, es decir, Calcular el incremento en la probabilidad de lograr el objetivo. Entonces, si

Así, el valor de la información se mide en unidades de información, en este caso en bits.

La expresión (7) puede considerarse como el resultado de normalizar el número de resultados. A modo de explicación, en la Figura 4 se muestran tres diagramas en los que se toman los mismos valores para el número de resultados: 2 y 6 para los puntos 0 y 1, respectivamente. La posición inicial es el punto 0. Según la información recibida, se realiza una transición al punto 1. El objetivo está marcado con una cruz. Los resultados favorables se representan mediante líneas que conducen a la meta. Determinemos el valor de la información recibida en los tres casos:

a) el número de resultados favorables es tres:

y por lo tanto

b) hay un resultado favorable:

c) el número de resultados favorables es cuatro:

En el ejemplo b) se obtuvo un valor negativo de información (información negativa). Esta información, que aumenta la incertidumbre inicial y reduce la probabilidad de lograr un objetivo, se denomina información errónea. Así, en el ejemplo b) recibimos información errónea de 1,58 unidades binarias.

Medida sintáctica de información.

Esta medida de la cantidad de información opera con información impersonal que no expresa una relación semántica con el objeto. Volumen de datos Vd en este caso, el mensaje se mide por el número de caracteres (bits) del mensaje. En diferentes sistemas numéricos, un dígito tiene un peso diferente y la unidad de medida de los datos cambia en consecuencia.

Por ejemplo, en el sistema numérico binario la unidad de medida es el bit. (dígito bit-binario - dígito binario). Un bit es la respuesta a una única pregunta binaria ("sí" o "no"; "0" o "1"), transmitida a través de canales de comunicación mediante una señal. Así, la cantidad de información contenida en un mensaje en bits está determinada por el número de palabras binarias del lenguaje natural, el número de caracteres de cada palabra y el número de señales binarias necesarias para expresar cada carácter.

En las computadoras modernas, junto con la unidad mínima de medida de datos "bit", se usa ampliamente la unidad de medida ampliada "byte", igual a 8 bits. En el sistema numérico decimal, la unidad de medida es el “bit” (lugar decimal).

cantidad de información que a nivel sintáctico es imposible determinarlo sin considerar el concepto de incertidumbre del estado del sistema (entropía del sistema). De hecho, la obtención de información sobre un sistema siempre va asociada a un cambio en el grado de desconocimiento del receptor sobre el estado de este sistema, es decir la cantidad de información se mide por un cambio (reducción) en la incertidumbre del estado del sistema.

Coeficiente (grado) de contenido de información.(concisión) de un mensaje está determinada por la relación entre la cantidad de información y la cantidad de datos, es decir

Y= I/Vd, con 0

Con aumento Y Se reduce la cantidad de trabajo para transformar la información (datos) en el sistema. Por lo tanto, se esfuerzan por aumentar el contenido de la información, para lo cual se están desarrollando métodos especiales para una codificación óptima de la información.

Medida semántica de información.

Para medir el contenido semántico de la información, es decir su cantidad a nivel semántico, la más reconocida es la medida del tesauro, que conecta las propiedades semánticas de la información con la capacidad del usuario para aceptar el mensaje entrante. Para ello se utiliza el concepto diccionario de sinónimos del usuario.

Tesauro es una colección de información disponible para un usuario o sistema.

Dependiendo de la relación entre el contenido semántico de la información. S y el tesauro del usuario sp la cantidad de información semántica cambia Yo, percibido por el usuario y posteriormente incluido por él en su tesauro.

La naturaleza de esta dependencia se muestra en la Fig. 1. Considere dos casos límite cuando la cantidad de información semántica yo es igual a 0:

en sp= 0 el usuario no percibe ni comprende la información entrante;

En sp el usuario lo sabe todo y no necesita la información entrante.

Método de evaluación cuantitativa de la información: estadística, semántica, pragmática y estructural.

Para evaluar y medir la cantidad de información de acuerdo con los aspectos anteriores, se utilizan varios enfoques. Entre ellos se encuentran los estadísticos, semánticos, pragmáticos y estructurales. Históricamente, el enfoque estadístico ha recibido el mayor desarrollo.

De acuerdo a enfoque estadístico Se introdujo el concepto de “cantidad de información” como una medida de la incertidumbre del estado del sistema, eliminada al recibir información. La incertidumbre de un estado expresada cuantitativamente se llama "entropía". Al obtener información, la incertidumbre disminuye, es decir. entropía, sistemas. Obviamente, cuanta más información recibe el observador, más incertidumbre se elimina y la entropía del sistema disminuye, es decir, La entropía de un sistema puede considerarse como una medida de la información faltante. Cuando la entropía es cero, hay información completa sobre el sistema y al observador le parece estar completamente ordenado. Así, la obtención de información va asociada a un cambio en el grado de desconocimiento del destinatario sobre el estado de este sistema.

Cabe señalar que el método estadístico para determinar la cantidad de información prácticamente no tiene en cuenta los aspectos semánticos y pragmáticos de la información.

Enfoque semántico determinar la cantidad de información es la más difícil de formalizar y aún no ha sido determinada definitivamente.

La medida del tesauro ha recibido el mayor reconocimiento por medir el contenido semántico de la información. Para comprender y utilizar la información, el destinatario debe tener cierto conocimiento.

Si el tesauro individual del consumidor (S n) refleja su conocimiento sobre un tema determinado, entonces la cantidad de información semántica (I c) contenida en un determinado mensaje puede evaluarse por el grado de cambio en este tesauro que se produjo bajo la influencia de este. mensaje. Obviamente, la cantidad de información (I s) depende de forma no lineal del estado del tesauro individual del usuario, y aunque el contenido semántico del mensaje es constante, los usuarios con diferentes tesauros recibirán una cantidad desigual de información. Por ejemplo, si el tesauro individual del destinatario de la información es cercano a cero (S n = 0), entonces, en este caso, la cantidad de información recibida es cero (I c = 0). Por ejemplo, al escuchar un mensaje en un idioma extranjero desconocido, es imposible extraer información del mismo sin conocer el idioma.

La cantidad de información semántica (I s) en un mensaje también será igual a cero si el usuario de la información sabe absolutamente todo sobre el tema, es decir su diccionario de sinónimos (S n) y su mensaje no le aportan nada nuevo.

Enfoque pragmático determina la cantidad de información como medida que contribuye al logro del objetivo. Este enfoque considera la cantidad de información como un incremento en la probabilidad de lograr un objetivo.

Al evaluar la cantidad de información en aspectos semánticos y pragmáticos, es necesario tener en cuenta la dependencia temporal de la información (ya que la información, especialmente en los sistemas de gestión de objetos económicos, tiende a envejecer, es decir, su valor disminuye con el tiempo).

Enfoque estructural Se asocia con problemas de almacenamiento, reorganización y recuperación de información y, a medida que aumenta el volumen de información acumulada, adquiere cada vez más importancia.

El enfoque estructural hace abstracción de la subjetividad y el valor relativo de la información y considera las estructuras lógicas y físicas de la organización de la información.

Estructura de la información sociolaboral: indicadores, detalles y documentos

160 del Convenio de la Organización Internacional del Trabajo (OIT) “Sobre Estadísticas Laborales” y 170 Recomendación de la OIT “Sobre Estadísticas Laborales” /1985/ definen las principales direcciones para recopilar y analizar información social y laboral a nivel macroeconómico:

Población económicamente activa, empleo, desempleo y subempleo;

Salarios y jornada laboral;

Índices de precios de bienes de consumo;

Costo laboral;

Gastos e ingresos del hogar;

Lesiones laborales y enfermedades profesionales;

Conflictos laborales;

Productividad laboral

Indicador- una característica generalizadora de un objeto o proceso sagrado. El indicador actúa como una herramienta metodológica que permite probar proposiciones teóricas utilizando datos empíricos.

1) cualidades registrar la presencia o ausencia de una definición. santos
2) cantidad. Fijación del grado de expresión, desarrollo, determinadas propiedades.

Indicadores laborales que se utilizan para calcular la cantidad de trabajo gastado y se expresan por unidad de tiempo. Con su ayuda se calcula lo siguiente: PT, salario, etc.

Social indicadores calidad o características cuantitativas de propiedades individuales y estados de objetos y procesos sociales, refleja características en estadística y dinámica.

Billete número 2

Billete número 3

Modelos de información: descriptivos y formales

Modelos de información descriptiva- Se trata de modelos creados en lenguaje natural (es decir, en cualquier idioma de comunicación entre personas: inglés, ruso, chino, maltés, etc.) en forma oral o escrita.

Modelos de información formales- se trata de modelos creados en un lenguaje formal (es decir, científico, profesional o especializado). Ejemplos de modelos formales: todo tipo de fórmulas, tablas, gráficos, mapas, diagramas, etc.

Modelos cromáticos (de información)- estos son modelos creados en el lenguaje natural de la semántica de los conceptos de color y sus predicados ontológicos (es decir, en el lenguaje de los significados y significados de los cánones de color, reproducidos representativamente en la cultura mundial). Ejemplos de modelos cromáticos: modelo “atómico” de inteligencia (AMI), inmanencia interconfesional de las religiones (MIR), modelo de semántica axiológico-social (MASS), etc., creados a partir de la teoría y metodología del cromatismo.

Tipos de modelos de información

Tabular– los objetos y sus propiedades se presentan en forma de lista y sus valores se colocan en celdas rectangulares. La lista de objetos del mismo tipo se coloca en la primera columna (o fila) y los valores de sus propiedades se colocan en las siguientes columnas (o filas).

Jerárquico– los objetos se distribuyen en los niveles. Cada elemento de alto nivel se compone de elementos de nivel inferior, y un elemento de nivel inferior sólo puede ser parte de un elemento de nivel superior.

Red– utilizado para reflejar sistemas en los que las conexiones entre elementos tienen una estructura compleja.

Ticket número 4. Tareas y funciones de los sistemas de información. Tipología de sistemas de información según su escala, alcance, naturaleza de las tareas a resolver, conjunto de funciones realizadas, grado de automatización, tipo de información, etc.

Sistema de información Es un conjunto interconectado de medios, métodos y personal que se utiliza para almacenar, procesar y emitir información para lograr los objetivos de gestión.

ü Propósito de la operación– satisfacer necesidades de información específicas dentro de un área temática específica

ü El resultado del funcionamiento.– productos de información: documentos, conjuntos de información, bases de datos y servicios de información

Billete número 5

Soporte tecnológico de sistemas de control automatizados: (soporte a subsistemas de tecnología de la información) informativo, lingüístico, técnico, software, matemático, organizativo y ergonómico. Soporte jurídico.

Soporte tecnológico- EDP ​​​​(Procesamiento electrónico de datos) es un conjunto de métodos y medios para recopilar, almacenar, transmitir, procesar y proteger información basados ​​​​en tecnología informática y de comunicaciones.

Boleto número 6

Propósito y tipos de estaciones de trabajo.

El uso de un lugar de trabajo automatizado en una oficina moderna facilita al máximo el trabajo de un especialista, liberando tiempo y esfuerzo que antes se dedicaban a operaciones rutinarias de recopilación de datos y cálculos complejos para actividades creativas y con base científica para resolver problemas profesionales. El propósito de la implementación es mejorar los siguientes indicadores:

Automatización laboral, uso de tecnologías que ahorran mano de obra (por ejemplo, el uso de computadoras); aumentar la seguridad de la producción (cuando se utiliza en la industria); adopción más rápida de decisiones de gestión; movilidad de trabajadores; aumentar la productividad laboral

Para caracterizar el lugar de trabajo automatizado, podemos distinguir componentes principales de la tecnología de la información, implementándolo. Estos incluyen:1. soporte técnico y de hardware (computadoras, impresoras, escáneres, cajas registradoras y otros equipos adicionales);2. software de aplicación y sistemas operativos (OS);3. soporte de información (estándares de documentos y formularios unificados, estándares para la presentación de indicadores, clasificadores e información de referencia);4. dispositivos de red y comunicación (redes locales y corporativas, correo electrónico).

Las características de estos componentes determinan el nivel de automatización del lugar de trabajo, su finalidad y sus características. Los puestos de trabajo están diseñados para proporcionar las condiciones para el trabajo cómodo, eficiente y de alta calidad de un especialista y deben satisfacer los siguientes requisitos:

La interfaz de usuario debe ser sencilla, cómoda y accesible incluso para un usuario no capacitado. Debe contener un sistema de sugerencias, preferiblemente en forma de demostración (vídeo, sonido, animación);

Es necesario garantizar la seguridad del especialista y el cumplimiento de todos los requisitos ergonómicos (comodidad, color y gama de sonidos correspondientes a la mejor percepción, ubicación conveniente de la información y accesibilidad de todas las herramientas necesarias para el trabajo, un estilo unificado de realización de operaciones, etc.);

El usuario de la estación de trabajo debe realizar todas las acciones sin salir del sistema, por lo que se requiere estar equipado con todas las operaciones necesarias;

Garantizar el funcionamiento ininterrumpido del lugar de trabajo automatizado debería garantizar al usuario la finalización oportuna de las tareas de acuerdo con el horario de trabajo. Las interrupciones en la producción son inaceptables;

La organización racional del trabajo de un especialista crea condiciones de trabajo cómodas y aumenta la productividad del especialista;

El software de las estaciones de trabajo debe ser compatible con otros sistemas y tecnologías de la información, por lo que las más valiosas son las tecnologías que combinan varias estaciones de trabajo.

Billete número 7

Boleto número 8

Boleto número 9

CL3Desarrollo

El 13 de enero de 1988 se celebró una rueda de prensa en Nueva York para anunciar el sindicato. Ashton-Tate y Microsoft para desarrollar un nuevo producto llamado Ashton-Tate/Microsoft SQL Server. El mismo día, se emitió un comunicado de prensa conjunto anunciando un nuevo producto basado en los desarrollos de Sybase. En cuanto al papel de las empresas en el desarrollo y promoción del producto, según el comunicado de prensa Ashton Tate iba a ser responsable de supervisar los desarrollos en el campo de las bases de datos (y también proporcionar sus propios desarrollos en esta área), y microsoft Se asignó un papel similar en el campo de las tecnologías para trabajar en redes locales. Una vez que se lanzara SQL Server, Ashton-Tate obtendría la licencia del producto de Microsoft y se encargaría de las ventas minoristas en todo el mundo, mientras que Microsoft suministraría el producto a los fabricantes de equipos originales (OEM) de hardware.

Salida

29 de abril de 1989 Comenzó la venta oficial de Ashton-Tate/Microsoft SQL Server 1.0. Los miembros del equipo de SQL Server portaron camisetas con el lema "Ashton-Tate SQL Server: hecho a tiempo y orgulloso de ello"(Inglés) Ashton-Tate SQL Server: puntual y orgulloso de ello) .

La prensa especializada habló muy positivamente del nuevo producto, sin embargo, las ventas fueron muy bajas.

En 1990 la situación no había mejorado. Los planes para promover conjuntamente el producto, como resultado de lo cual se suponía que SQL Server ganaría una posición en la gran comunidad de desarrolladores de dBASE, fracasaron. Como resultado, Ashton-Tate, que dos años antes había ocupado una posición de liderazgo en el mercado de bases de datos domésticas, ahora se vio obligada a luchar por su supervivencia, lo que a su vez la obligó a volver a su producto principal dBASE. Mientras tanto, Microsoft lanzó OS/2 LAN Manager bajo su propia marca. Todo esto llevó a la decisión de suspender la promoción conjunta de SQL Server, tras lo cual este producto fue ligeramente modificado y presentado como Microsoft SQL Server.

Servidor SQL 1.11 (1991)

En 1991, Microsoft lanzó una versión intermedia: SQL Server 1.11. Este lanzamiento se debió al hecho de que la lista de usuarios ya se había ampliado significativamente en ese momento. A pesar de que la arquitectura cliente-servidor aún no estaba muy extendida, los clientes fueron cambiando gradualmente a ella. Pero, a pesar de las críticas positivas de la prensa especializada, las ventas de SQL Server todavía dejaban mucho que desear (Diagrama en la diapositiva).

DC5 Historial de publicaciones en diapositiva.

Billete número 10

Funcionalidad

Microsoft SQL Server utiliza una versión de SQL como lenguaje de consulta llamada Transact-SQL (T-SQL para abreviar), que es una implementación de SQL-92 (el estándar ISO para SQL) con múltiples extensiones. T-SQL permite una sintaxis adicional para procedimientos almacenados y brinda soporte para transacciones (interacción entre la base de datos y la aplicación host). Microsoft SQL Server y Sybase ASE utilizan un protocolo de capa de aplicación llamado Tabular Data Stream (TDS) para comunicarse con la red. El protocolo TDS también se implementó en el proyecto FreeTDS para permitir que varias aplicaciones interactúen con las bases de datos de Microsoft SQL Server y Sybase.

Microsoft SQL Server también admite Open Database Connectivity (ODBC), una interfaz para que las aplicaciones interactúen con el DBMS. SQL Server 2005 brinda la capacidad de conectar usuarios a través de servicios web que utilizan el protocolo SOAP. Esto permite que los programas cliente que no sean de Windows se conecten multiplataforma a SQL Server. Microsoft también ha lanzado un controlador JDBC certificado que permite que las aplicaciones basadas en Java (como BEA e IBM WebSphere) se conecten a Microsoft SQL Server 2000 y 2005.

SQL Server admite la creación de reflejos y agrupaciones de bases de datos. Un clúster de SQL Server es una colección de servidores configurados de forma idéntica; Este esquema ayuda a distribuir la carga de trabajo entre varios servidores. Todos los servidores tienen un nombre virtual y los datos se distribuyen entre las direcciones IP de las máquinas del clúster durante el ciclo de trabajo. Además, en caso de falla o falla en uno de los servidores del clúster, está disponible la transferencia automática de carga a otro servidor.

SQL Server admite la redundancia de datos en tres escenarios:

Instantánea: el servidor toma una instantánea de la base de datos y la envía a los destinatarios.

Historial de cambios: todos los cambios de la base de datos se transmiten continuamente a los usuarios.

Sincronización con otros servidores: las bases de datos de varios servidores se sincronizan entre sí. Los cambios en todas las bases de datos se producen de forma independiente en cada servidor y, durante la sincronización, los datos se concilian. Este tipo de duplicación brinda la posibilidad de resolver contradicciones entre bases de datos.

Ediciones de MS SQL Server 2000

Había dos tipos de SQLServer disponibles en diferentes ediciones:

· 2000 - SQL Server 2000 de 32 bits, nombre clave Shiloh (versión 8.0);

· 2003: SQL Server 2000 de 64 bits, con nombre en código Liberty.

SQLServer 2000 está disponible en una variedad de ediciones para satisfacer una variedad de requisitos de costo, tiempo de ejecución y rendimiento de los clientes (organizacionales e individuales).

Edición empresarial. Esta edición es la versión completa de SQLServer que se ofrece con mayor frecuencia a las organizaciones. EnterpriseEdition ofrece las capacidades de escalabilidad y confiabilidad necesarias para abordar aplicaciones de Internet y negocios en línea de misión crítica, incluidas vistas particionadas distribuidas, portabilidad de registros y capacidades avanzadas de agrupación en clústeres. Esta edición también aprovecha al máximo el hardware más avanzado, admitiendo hasta 32 procesadores y 64 GB de RAM. Además, SQLServer 2000 EnterpriseEdition incluye funciones de análisis adicionales.

Edición estándar. Esta opción es asequible para organizaciones medianas y pequeñas que no requieren las complejas capacidades de escalabilidad y disponibilidad y el conjunto completo de funciones de análisis que se encuentran en SQLServer 2000 EnterpriseEdition. StandardEdition se utiliza en sistemas multiprocesador simétricos con hasta 4 procesadores y hasta 2 GB de RAM.

Edición personal. Esta edición incluye el conjunto completo de herramientas de administración y la mayor parte de la funcionalidad de StandardEdition, pero está optimizada para uso personal. PersonalEdition se ejecuta no sólo en los sistemas operativos de servidor de Microsoft, sino también en sus ediciones personales, que incluyen Windows 2000 Professional, WindowsNTWorkstation 4.0 y Windows 98. Se admiten sistemas de doble procesador. Si bien esta edición admite bases de datos de cualquier tamaño, su rendimiento está optimizado para usuarios individuales y grupos de trabajo pequeños, lo que reduce la carga de trabajo que conlleva tener más de cinco usuarios simultáneos.

Edición de desarrollador. Esta variante de SQLServer permite a los desarrolladores crear cualquier tipo de aplicación que se ejecute junto con SQLServer. Esta edición incluye todas las funciones de EnterpriseEdition, pero con un acuerdo de licencia de usuario final (EULA) especial que permite el desarrollo y las pruebas, pero prohíbe la implementación con fines de producción.

Motor de escritorio (MSDE). Esta edición incluye la funcionalidad principal del motor de base de datos SQLServer 2000, pero no incluye la interfaz de usuario, herramientas de administración, funciones de análisis, soporte de replicación acumulativa, licencias de acceso de cliente, bibliotecas para desarrolladores ni documentación en línea. El tamaño de la base de datos y el nivel de carga de trabajo al trabajar con usuarios también están limitados aquí. La edición DesktopEngine requiere la menor cantidad de recursos en comparación con otras ediciones de SQLServer 2000, lo que la hace ideal para implementar un almacén de datos autónomo.

Edición WindowsCEE. Esta edición es la versión de SQLServer 2000 para dispositivos que ejecutan WindowsCE. Es un software compatible con otras ediciones de SQLServer 2000, lo que permite a los desarrolladores aprovechar sus habilidades y aplicaciones existentes para ampliar la funcionalidad del almacén de datos relacional con soluciones que se ejecutan en nuevas clases de dispositivos.

Características de SQL Server 2000

MicrosoftSQL Server 2000 incluye una serie de características que facilitan su instalación, implementación y operación, además de admitir escalabilidad, almacenamiento de datos e integración del sistema con otro software de servidor.

Incluye muchas herramientas y funciones que facilitan la instalación, implementación, administración y uso de bases de datos. SQL Server 2000 proporciona a los administradores de bases de datos un conjunto completo de herramientas necesarias para ajustar SQL Server 2000 dentro de los sistemas industriales en línea. SQL Server 2000 también se ejecuta eficientemente en pequeños sistemas de un solo usuario con una mínima sobrecarga de administración.

La instalación o actualización está controlada por una aplicación de interfaz gráfica de usuario (GUI) que guía al usuario mientras ingresa la información requerida por el instalador. El programa de instalación detecta automáticamente si tiene una versión anterior de SQL Server. Una vez completada la instalación de SQL Server 2000, le pregunta al usuario si desea ejecutar el asistente de actualización de SQL Server 2000, que lo guiará rápidamente a través del proceso de actualización. De esta forma, todo el proceso de instalación o actualización se completa rápidamente, debiendo el usuario introducir un mínimo de información.

SQL Server 2000 cambia automática y dinámicamente su configuración mientras se ejecuta. A medida que crece el número de usuarios conectados a SQL Server 2000, puede asignar dinámicamente los recursos necesarios, como la memoria. Cuando la carga disminuye, SQL Server 2000 libera recursos y los devuelve al sistema. Si se ejecutan otras aplicaciones en el servidor al mismo tiempo, SQL Server 2000 detectará que se les está asignando memoria virtual adicional y reducirá la cantidad de memoria virtual que utiliza para reducir la sobrecarga de paginación. SQL Server 2000 también puede aumentar o reducir automáticamente el tamaño de la base de datos a medida que se agrega o elimina información.

SQL Server 2000 funciona con otros productos de software para proporcionar un almacén de información estable y seguro para Internet e intranets:

· SQL Server 2000 trabaja con los mecanismos de seguridad y cifrado de Windows 2000 Server y Windows NT Server, implementando almacenamiento seguro de información;

· SQL Server 2000 es un servicio de almacenamiento de alto rendimiento para aplicaciones web que ejecutan Microsoft Internet Information Services;

· SQL Server 2000 se puede utilizar junto con Site Server para servir sitios web de comercio electrónico grandes y complejos;

· La compatibilidad con sockets TCP/IP le permite integrar SQL Server 2000 con Microsoft Proxy Server para implementar comunicaciones seguras a través de Internet e intranets.

SQL Server 2000 puede diseñarse para funcionar al nivel necesario para ejecutar sitios de Internet de gran tamaño. Además, el motor de base de datos SQL Server 2000 tiene soporte integrado para XML y el Asistente web le ayuda a generar páginas HTML (lenguaje de marcado de hipertexto) a partir de datos de SQL Server 2000 y publicar esos datos en HTTP (Protocolo de transporte de hipertexto) y FTP. (Protocolo de transferencia de archivos).

SQL Server admite la autenticación de Windows, lo que le permite utilizar cuentas de usuario y dominio de Windows NT y Windows 2000 como cuentas de SQL Server 2000.

Windows 2000 autentica a los usuarios cuando se conectan a la red. Al conectarse a SQL Server, el software cliente solicita una conexión confiable, que sólo se puede otorgar si los usuarios están autenticados por Windows NT o Windows 2000. Por lo tanto, SQL Server en sí no autentica. usuarios, pero los usuarios no necesitan inicios de sesión y contraseñas separados para conectarse a cada sistema SQL Server. SQL Server 2000 puede enviar y recibir correo electrónico y mensajes de paginación desde Microsoft Exchange u otros servidores de correo compatibles con MAPI (Interfaz de programación de aplicaciones de mensajes). Esta característica permite enviar correo utilizando lotes de SQL Server 2000, procedimientos almacenados y activadores de eventos y notificaciones de SQL Server 2000 que se pueden configurar de modo que, si ocurre un problema grave, o incluso existe el riesgo de que ocurra, se notifique automáticamente al administrador del servidor. por correo electrónico o buscapersonas.

Herramientas de SQL Server 2000

Gerente Empresarial

SQL Server Enterprise Manager es la principal herramienta de administración de SQL Server 2000, admite una interfaz de usuario compatible con MMC (Microsoft Management Console) y le permite resolver una serie de tareas administrativas:

· definir grupos de servidores que ejecutan SQL Server;

· registrar servidores individuales en un grupo;

· configurar cualquier configuración de SQL Server para todos los servidores registrados;

· crear y administrar bases de datos, objetos, ID de usuario, inicios de sesión y derechos de acceso a SQL Server en cada uno de los servidores registrados;

· Definir y realizar todas las tareas administrativas de SQL Server en cada servidor registrado;

· construir y probar interactivamente sentencias, paquetes y scripts SQL llamando al Analizador de consultas SQL;

· llamar a varios asistentes de SQL Server.

MMC admite una interfaz común para administrar varias aplicaciones de servidor en una red de Microsoft Windows. Las aplicaciones de servidor incluyen un componente llamado complemento que proporciona una interfaz para que los usuarios de MMC administren la aplicación de servidor. SQL Server Enterprise Manager es un complemento MMC para Microsoft SQL Server 2000.

Agente SQL Server

El Agente SQL Server se ejecuta en un servidor que ejecuta una instancia de SQL Server 2000 o versiones anteriores de SQL Server. El Agente SQL Server es responsable de resolver las siguientes tareas:

· ejecutar trabajos de SQL Server programados para ejecutarse en un momento específico o después de un período de tiempo específico;

· definir condiciones especiales que requieren que se realice una acción especificada por el administrador, como alertar a alguien enviando un buscapersonas o un correo electrónico, o ejecutando una tarea que cumpla con estas condiciones;

· iniciar tareas definidas por los administradores que realizan la replicación.

Perfilador SQL

SQL Profiler es una herramienta para registrar eventos de SQL Server 2000. Los eventos se almacenan en un archivo de seguimiento, que luego puede analizarse o usarse para repetir alguna secuencia de acciones para diagnosticar el problema. El Perfilador SQL se utiliza para:

· ejecución paso a paso de consultas problemáticas y determinación del origen del problema;

· buscar y diagnosticar consultas lentas;

· registrar secuencias de declaraciones SQL que conducen a problemas;

· monitorear el rendimiento de SQL Server y regular su carga.

SQL Profiler también admite la auditoría de acciones realizadas en instancias de SQL Server. La información sobre las actividades relacionadas con la seguridad se almacena para su posterior revisión por parte del administrador de seguridad.

Gerente de Servicio

SQLServerServiceManager está diseñado para iniciar, detener y pausar los componentes del servidor SQLServer 2000. Estos componentes se ejecutan como servicios en Microsoft Windows NT o Windows 2000 y como programas ejecutables independientes en Windows 95 y Windows 98.

Servidor SQL. Implementa el motor de base de datos SQL Server. Hay un servicio de SQL Server para cada instancia de SQL Server que se ejecuta en una computadora.

Agente SQL Server. Implementa un agente que ejecuta tareas administrativas programadas de SQL Server. Hay un servicio del Agente SQL Server para cada instancia de SQL Server que se ejecuta en una computadora.

Búsqueda de Microsoft (sólo Windows NT y Windows 2000). Implementa un mecanismo de búsqueda de texto completo. Hay una única copia, independientemente de la cantidad de instancias de SQL Server en la computadora.

MSDTC (sólo Windows NT y Windows 2000). Gestiona transacciones distribuidas. Hay una única copia, independientemente de la cantidad de instancias de SQL Server en la computadora.

MSSQLServerOLAPService (sólo Windows NT y Windows 2000). Implementa servicios de análisis. Hay una única copia, independientemente de la cantidad de instancias de SQL Server en la computadora.

La ventana del Administrador de servicios se puede ocultar y representar mediante un icono en la bandeja del sistema. Para mostrar un menú que enumera las tareas que admite Service Manager, haga clic derecho en el icono en la barra de tareas.

Analizador de consultas SQL

SQL Query Analyzer es una herramienta GUI diseñada para resolver muchos problemas diferentes:

· crear consultas y scripts SQL, así como ejecutarlos con bases de datos SQL Server;

· crear objetos de base de datos de uso frecuente en scripts estándar;

· copiar objetos de bases de datos existentes;

· ejecución de procedimientos almacenados sin especificar sus parámetros;

· Depuración de procedimientos almacenados;

· consultas de depuración que tienen problemas de rendimiento;

· buscar objetos en bases de datos, así como ver y trabajar con objetos;

· agregar, actualizar y eliminar filas en la tabla;

· definir atajos de teclado para ejecutar consultas utilizadas con frecuencia; agregar comandos utilizados con frecuencia al menú Herramientas.

SQL Query Analyzer se inicia directamente desde el menú Inicio o SQL Server Enterprise Manager. También se puede iniciar ingresando isqlw en el símbolo del sistema.

Boleto número 11

Objetos grandes

DB2/2 y DB2/6000 Proporcionar al usuario nuevos tipos de datos, como objetos binarios grandes (BLOBS) y objetos de texto grandes (CLOBS).

GOTAS le permite almacenar cualquier tipo de datos de hasta dos gigabytes de tamaño.

Opción 1: la función tiene acceso directo a la base de datos, lo que permite un rendimiento máximo, pero representa una amenaza potencial para el rendimiento del servidor y la integridad de los datos.

Opción 2: la función se ejecuta como un proceso separado del servidor de la base de datos, lo que protege los datos y el DBMS, pero reduce el rendimiento

Ventajas

Hay una buena versión gratuita.

Buen soporte técnico gratuito.

Es posible recibir soporte pago del fabricante, lo que le permite utilizarlo en el sector empresarial Enterprise.

Con configuraciones

Buen desempeño

Maneja mejor situaciones como "no hay suficiente memoria para el servidor 1C"

No hay límite de 256 tablas, lo que amplía las posibilidades al trabajar con RLS

Contras

Pocos especialistas

Baja prevalencia

El tamaño de la base de datos es mayor que en otras subbases de datos.

Hay autoajuste del sistema, pero es incompleto.

Es posible que la plataforma no procese correctamente algunos mensajes.

Billete número 12

Boleto número 14

Billete número 15.

La Arquitectura de Servicios Abiertos de Windows (WOSA) es un conjunto de estándares abiertos para la interacción de sistemas de aplicaciones.

Windows admite una familia de estándares que facilitan la escritura y apertura vertical de las aplicaciones. El nombre general de estos estándares es WOSA (Windows Open Services Architecture).

(WOSA) proporciona un conjunto de estándares abiertos para la interacción de los componentes del sistema de aplicaciones en el lado del servidor y del cliente.

La familia se divide en tres categorías:

normas de propósito general;

estándares de comunicación;

estándares para aplicaciones y servicios financieros.

El grupo de normas de propósito general incluye:

— Conectividad abierta de bases de datos (ODBC): acceso a bases de datos

— Interfaz de programación de aplicaciones de mensajería (MAPI): reenvío de mensajes

— Interfaz de programación de aplicaciones de telefonía (TAPI): acceso a través de línea telefónica

Al grupo de comunicación
Las normas incluyen los siguientes elementos:

API de comunicaciones de host Windows SNA

Interfaz de comunicación Windows Sockets basada en el protocolo TCP/IP

Llamada a procedimiento remoto de Microsoft (RPC): interfaz de llamada a procedimiento remoto

El grupo de normas para aplicaciones y servicios financieros incluye dos elementos.

Extensión WOSA para datos de mercado en vivo (WOSA/XRT)

Extensión WOSA para servicios financieros (WOSA/XFS)

Cada miembro de la familia de estándares WOSA describe una arquitectura que incluye los siguientes componentes principales:

Interfaz de programación de aplicaciones (API)

Interfaz de servidor (SPI)

Administrador de grupo de aplicaciones/servicios

Base de datos para registro de aplicaciones/servicios.

Boleto número 16

Arroz. 1. Movimiento de información de la base de datos a la aplicación.

La figura muestra que al desarrollar una aplicación DBMS, el programador trabaja con conjuntos de componentes diseñados para intercambiar información con bases de datos y mostrarla. Dependiendo del mecanismo de acceso a la base de datos seleccionado, es posible que no se utilicen algunos conjuntos de componentes, pero todos ellos, independientemente de las características de la base de datos utilizada y el mecanismo para acceder a ella, tienen propiedades y métodos similares.

ODBC (Open Database Connectivity - acceso abierto a bases de datos): desarrollado por Microsoft, un universal interfaz de programación de aplicaciones para acceder a bases de datos.

El objetivo principal del desarrollo del protocolo ODBC es estandarizar los mecanismos de interacción con varios DBMS. El principal problema asociado con el desarrollo de aplicaciones que interactúan con bases de datos basadas en API SQL especiales era que cada DBMS tenía su propia interfaz de programación, cada uno de ellos tenía sus propias características y no funcionaba exactamente como los demás. En este sentido, el desarrollo de la aplicación dependió en gran medida del DBMS utilizado. Microsoft ha dado un paso importante para solucionar este problema. La idea principal era desarrollar una interfaz universal al nivel de la familia de sistemas operativos Windows, que pudiera ser compatible con diferentes DBMS.

Veamos brevemente la estructura del software ODBC:

· Interfaz de llamada de función ODBC: Esta es la llamada capa superior de ODBC, que contiene la API, que las aplicaciones utilizan directamente. Esta API se implementa como una biblioteca de vínculos dinámicos DLL y forma parte del sistema operativo Windows;

· controladores ODBC: Este es el llamado nivel inferior de ODBC y contiene un conjunto de controladores para el DBMS que admiten el protocolo ODBC. Como parte de la tecnología, se puede desarrollar un controlador ODBC correspondiente para cada DBMS, que actuará como un enlace intermedio entre el programa de aplicación y el DBMS, traduciendo las llamadas a funciones DBMS en llamadas a funciones DBMS internas especializadas. Esto resuelve el problema de la estandarización. Para muchos DBMS modernos, existen controladores ODBC especializados que se instalan por separado en el sistema operativo;

· Administrador de controladores ODBC: Este mecanismo de software representa la capa intermedia de ODBC, gestionando el proceso de carga de los controladores necesarios.

El diagrama de ejecución del programa utilizando el protocolo ODBC para el acceso a datos se muestra en la Fig. 2.

Arroz. 2. Diagrama de ejecución del programa utilizando el protocolo ODBC para acceder a los datos.

El sistema operativo Windows incluye varios mecanismos para acceder a las bases de datos: ODBC,OLE-DB Y ALHARACA.

tecnología ODBC(del ingles Conectividad de base de datos abierta– mecanismo abierto para acceder a bases de datos 1 ) es un componente del sistema operativo ventanas, diseñado para unificar el acceso a la información almacenada en bases de datos varios tipos. ODBC Consiste en un conjunto de conductores que realizan operaciones de cambio con ciertos bases de datos y un administrador de controladores que transfiere solicitudes de la aplicación al conductor y transfiere información del conductor a la aplicación (Fig. 3).

Arroz. 3. Movimiento de información entre la aplicación y la base de datos mediante ODBC

El lenguaje de consulta se utiliza para obtener y cambiar datos. SQL, independientemente de si es compatible con la base de datos a la que accede la aplicación. Si la base de datos no soporta el idioma SQL, entonces el acceso a él no es diferente del acceso a DB, apoyando SQL. Así es la unificación del acceso a las bases de datos por parte del sistema. ODBC– la aplicación especifica el nombre del controlador que se debe utilizar para conectarse a la base de datos y envía una solicitud que describe la composición de la información requerida. Mecanismo adicional ODBC realiza todas las operaciones necesarias para obtener información, ocultando a la aplicación los detalles de trabajar con una base de datos específica. Acceso a la aplicación ODBC llevado a cabo a través de API-funciones implementadas en bibliotecas dinámicas.

Para medir la información se introducen dos parámetros: la cantidad de información I y la cantidad de datos V d.

Estos parámetros tienen diferentes expresiones e interpretaciones según la forma de adecuación que se considere.

Adecuación sintáctica. Muestra las características formales y estructurales de la información y no afecta su contenido semántico. A nivel sintáctico se tienen en cuenta el tipo de medio y método de presentación de la información, la velocidad de transmisión y procesamiento, el tamaño de los códigos para presentar información, la confiabilidad y precisión de la conversión de estos códigos, etc.

La información considerada únicamente desde una posición sintáctica se suele denominar datos, ya que el lado semántico no importa.

Adecuación semántica (nocional). Esta forma determina el grado de correspondencia entre la imagen del objeto y el objeto mismo. El aspecto semántico implica tener en cuenta el contenido semántico de la información. En este nivel se analiza la información que refleja la información y se consideran las conexiones semánticas. En informática, se establecen conexiones semánticas entre códigos para representar información. Esta forma sirve para formar conceptos e ideas, identificar el significado, contenido de la información y su generalización.

Adecuación pragmática (del consumidor). Refleja la relación entre la información y su consumidor, la correspondencia de la información con el objetivo de gestión, que se implementa sobre su base. Las propiedades pragmáticas de la información aparecen sólo si existe unidad de información (objeto), usuario y objetivo de gestión.

Aspecto pragmático La consideración está asociada con el valor, la utilidad de utilizar la información cuando el consumidor desarrolla una solución para lograr su objetivo. Desde este punto de vista, se analizan las propiedades de consumo de la información. Esta forma de adecuación está directamente relacionada con el uso práctico de la información, con su cumplimiento de la función objetivo del sistema.

Cada forma de adecuación corresponde a su propia medida de la cantidad de información y volumen de datos (Fig. 2.1).

Arroz. 2.1.

Medidas de información

2.2.1. Medida sintáctica de información. Medida sintáctica

cantidad de información opera con información impersonal que no expresa una relación semántica con el objeto.

  • El volumen de datos V d en un mensaje se mide por el número de caracteres (bits) de este mensaje. En diferentes sistemas numéricos, un dígito tiene un peso diferente y la unidad de medida de los datos cambia en consecuencia: en el sistema numérico binario la unidad de medida es el bit ( poco
  • - dígito binario - dígito binario);

En el sistema numérico decimal, la unidad de medida es dit (lugar decimal).

Ejemplo. Un mensaje en sistema binario en forma de código binario de ocho bits 10111011 tiene un volumen de datos V d = 8 bits.

Un mensaje en el sistema decimal en forma de número de seis dígitos 275903 tiene un volumen de datos de V d = 6 dit.

La cantidad de información está determinada por la fórmula:

donde H (α) es entropía, es decir la cantidad de información se mide por un cambio (reducción) en la incertidumbre del estado del sistema.

La entropía de un sistema H (α), que tiene N estados posibles, según la fórmula de Shannon, es igual a:

donde p i es la probabilidad de que el sistema esté en el i-ésimo estado.

Para el caso en que todos los estados del sistema sean igualmente probables, su entropía está determinada por la relación

m - base del sistema numérico (variedad de símbolos utilizados en el alfabeto);

n es el número de bits (caracteres) del mensaje.

2.2.2. Medida semántica de información.

Para medir el contenido semántico de la información, es decir su cantidad a nivel semántico, la más reconocida es la medida del tesauro, que conecta las propiedades semánticas de la información con la capacidad del usuario para aceptar el mensaje entrante. Para ello se utiliza el concepto diccionario de sinónimos de usuario.

Un tesauro es una colección de información disponible para un usuario o sistema.

Dependiendo de la relación entre el contenido semántico de la información S y el tesauro del usuario S p, cambia la cantidad de información semántica I c percibida por el usuario y posteriormente incluida por él en su tesauro. La naturaleza de esta dependencia se muestra en la Fig. 2.2:

  • cuando S p = 0 el usuario no percibe ni comprende la información entrante;
  • cuando S p → ∞ el usuario lo sabe todo, no necesita la información entrante.

Arroz. 2.2.

Dependencia de la cantidad de información semántica percibida por el consumidor de su tesauro I с = f (S p)

Al evaluar el aspecto semántico (contenido) de la información, es necesario esforzarse por armonizar los valores de S y S p.

Una medida relativa de la cantidad de información semántica puede ser el coeficiente de contenido C, que se define como la relación entre la cantidad de información semántica y su volumen:

2.2.3. Medida pragmática de información.

Esta medida determina la utilidad de la información (valor) para que el usuario logre su objetivo. Esta medida es también un valor relativo, determinado por las peculiaridades del uso de la información en un sistema particular. Es recomendable medir el valor de la información en las mismas unidades (o cerca de ellas) en las que se mide la función objetivo.

A modo de comparación, presentamos las medidas de información ingresadas en la tabla. 2.1. Tabla 2.1.

Unidades de información y ejemplos. Medida de información Unidades de medida
Ejemplos (para el campo de la informática)

Sintáctico:

Enfoque de Shannon

enfoque informático Grado de reducción de la incertidumbre
probabilidad de evento Unidades de presentación de información.
Bit, byte, KB, etc. Tesauro Semántico
Paquete de software de aplicación, computadora personal, redes informáticas, etc. Indicadores económicos
Rentabilidad, productividad, tasa de depreciación, etc. Pragmático Valor en uso
Valor monetario Capacidad de memoria, rendimiento de la computadora, velocidad de transferencia de datos, etc.



Arriba