Transición de señales continuas y transformaciones a discretas. Procesamiento Fourier de imágenes digitales.

En el capítulo anterior estudiamos sistemas lineales espacialmente invariantes en un dominio bidimensional continuo. En la práctica, estamos ante imágenes que tienen dimensiones limitadas y al mismo tiempo se miden en un conjunto discreto de puntos. Por lo tanto, los métodos desarrollados hasta ahora deben adaptarse, ampliarse y modificarse para que puedan aplicarse en dicho ámbito. También surgen varios puntos nuevos que requieren una cuidadosa consideración.

El teorema de muestreo nos dice bajo qué condiciones se puede reconstruir con precisión una imagen continua a partir de un conjunto discreto de valores. También aprenderemos qué sucede cuando no se cumplen sus condiciones de aplicabilidad. Todo esto tiene una relación directa con el desarrollo de los sistemas visuales.

Los métodos que requieren pasar al dominio de la frecuencia se han vuelto populares en parte debido a los algoritmos para el cálculo rápido de la transformada discreta de Fourier. Sin embargo, se debe tener cuidado porque estos métodos suponen la presencia de una señal periódica. Discutiremos cómo se puede cumplir este requisito y cuáles son las consecuencias de violarlo.

7.1. Límite de tamaño de imagen

En la práctica, las imágenes siempre tienen dimensiones finitas. Considere una imagen rectangular con ancho y alto H. Ahora no es necesario tomar integrales en la transformada de Fourier sobre límites infinitos:

Es interesante que no necesitamos conocer todas las frecuencias para restaurar la función. Saber eso representa una restricción difícil. En otras palabras, una función que es distinta de cero sólo en una región limitada del plano de la imagen contiene mucha menos información que una función que no tiene esta propiedad.

Para ver esto, imagine que el plano de la pantalla está cubierto con copias de una imagen determinada. En otras palabras, ampliamos nuestra imagen a una función que es periódica en ambas direcciones.

Aquí está el número entero más grande que no excede x. La transformada de Fourier de dicha imagen multiplicada tiene la forma

Usando factores de convergencia seleccionados apropiadamente en el Ej. 7.1 se demuestra que

Por eso,

de donde vemos que es igual a cero en todas partes excepto en un conjunto discreto de frecuencias. Por lo tanto, para encontrarlo, nos basta con saberlo en estos puntos. Sin embargo, la función se obtiene simplemente cortando la sección para la cual . Por lo tanto, para restaurarlo, nos basta con saber que solo para todos se trata de un conjunto contable de números.

Tenga en cuenta que la transformación de una función periódica resulta ser discreta. La transformación inversa se puede representar como una serie, ya que

Las imágenes que constan de elementos discretos, cada uno de los cuales sólo puede tomar un número finito de valores distinguibles que cambian en un tiempo finito, se denominan discretas. Cabe destacar que los elementos de una imagen discreta, en general, pueden tener un área desigual y cada uno de ellos puede tener un número desigual de gradaciones distinguibles.

Como se mostró en el primer capítulo, la retina transmite imágenes discretas a las partes superiores del analizador visual.

Su aparente continuidad es sólo una de las ilusiones de la visión. Esta “cuantización” de imágenes inicialmente continuas no está determinada por las limitaciones asociadas con la resolución del sistema óptico del ojo, ni siquiera por los elementos estructurales morfológicos del sistema visual, sino por la organización funcional de las redes nerviosas.

La imagen se divide en elementos discretos mediante campos receptivos que unen uno u otro número de fotorreceptores. Los campos receptivos producen la selección primaria de la señal luminosa útil mediante suma espacial y temporal.

La parte central de la retina (fóvea) está ocupada únicamente por conos; en la periferia fuera de la fóvea hay conos y bastones. En condiciones de visión nocturna, los campos de conos en la parte central de la retina tienen aproximadamente el mismo tamaño (alrededor de 5" en medida angular). El número de tales campos en la fóvea, cuyas dimensiones angulares son de aproximadamente 90", es de aproximadamente 200. El papel principal en las condiciones de visión nocturna lo desempeñan los campos de bastones, que ocupan toda la superficie restante de la retina. Tienen un tamaño angular de aproximadamente 1° en toda la superficie de la retina. El número de estos campos en la retina es de aproximadamente 3 mil. No sólo la detección, sino también la visualización de objetos con poca luz en estas condiciones se lleva a cabo mediante las áreas periféricas de la retina.

A medida que aumenta la iluminación, otro sistema de células de almacenamiento (los campos receptores de conos) comienza a desempeñar un papel importante. En la fóvea, un aumento de la iluminación provoca una disminución gradual de la intensidad efectiva del campo hasta que, con un brillo de aproximadamente 100 asb, se reduce a un cono. En la periferia, a medida que aumenta la iluminación, los campos de bastones se apagan gradualmente (se desaceleran) y los campos de conos entran en acción. Los campos de los conos en la periferia, al igual que los campos foveales, tienen la capacidad de disminuir dependiendo de la energía luminosa que incide sobre ellos. El mayor número de conos que pueden tener los campos receptores de conos al aumentar la iluminación aumenta desde el centro hacia los bordes de la retina y alcanza aproximadamente 90 a una distancia angular de 50-60° desde el centro.

Se puede calcular que en condiciones de buena luz natural, el número de campos receptivos alcanza unos 800 mil. Este valor corresponde aproximadamente al número de fibras del nervio óptico humano. La discriminación (resolución) de objetos en la visión diurna se lleva a cabo principalmente mediante la fóvea, donde el campo receptivo se puede reducir a un cono y los propios conos están ubicados más densamente.

Si el número de células de almacenamiento de la retina se puede determinar con una aproximación satisfactoria, entonces todavía no hay datos suficientes para determinar el número de posibles estados de los campos receptivos. Sólo se pueden hacer algunas estimaciones basadas en el estudio de umbrales diferenciales de campos receptivos. El contraste umbral en los campos receptivos foveales en un determinado rango operativo de iluminación es del orden de 1. En este caso, el número de gradaciones distinguibles es pequeño. A lo largo de todo el rango de reestructuración del campo receptivo del cono foveal, se diferencian entre 8 y 9 gradaciones.

El período de acumulación en el campo receptivo, la llamada duración crítica, está determinado en promedio por un valor del orden de 0,1 segundos, pero con altos niveles de iluminación aparentemente puede disminuir significativamente.

En realidad, el modelo que describe la estructura discreta de las imágenes transmitidas debería ser aún más complejo. Habría que tener en cuenta la relación entre los tamaños del campo receptivo, los umbrales y la duración crítica, así como la naturaleza estadística de los umbrales visuales. Pero por ahora no es necesario. Basta imaginar como modelo de imagen un conjunto de elementos de igual área, cuyas dimensiones angulares son menores que las dimensiones angulares del detalle más pequeño resuelto por el ojo, cuyo número de estados distinguibles es mayor que el número máximo. de gradaciones distinguibles de brillo, y cuyo tiempo de cambio discreto es menor que el período de parpadeo en la frecuencia crítica de fusión de parpadeo.

Si se reemplazan imágenes de objetos reales continuos del mundo exterior por imágenes discretas, el ojo no notará la sustitución.* En consecuencia, las imágenes discretas de este tipo contienen al menos no menos información de la que percibe el sistema visual. **

* Las imágenes en color y volumen también se pueden reemplazar con un modelo discreto.
** El problema de sustituir imágenes continuas por imágenes discretas es importante para la tecnología cinematográfica y televisiva. La cuantización del tiempo es la base de esta técnica. En los sistemas de televisión de código de impulsos, la imagen también se divide en elementos discretos y se cuantifica según el brillo.

Muestreo de imágenes.

Considere una imagen continua: una función de dos variables espaciales incógnita 1 y incógnita 2 F(incógnita 1 , incógnita 2) en un área rectangular limitada (Figura 3.1).

Figura 3.1 – Transición de imagen continua a discreta

Introduzcamos el concepto de paso de muestreo Δ 1 con respecto a la variable espacial. incógnita 1 y Δ 2 por variable incógnita 2. Por ejemplo, se puede imaginar que en puntos distantes entre sí por una distancia Δ 1 a lo largo del eje incógnita 1 hay sensores de video puntuales. Si dichos sensores de vídeo se instalan en toda el área rectangular, la imagen se definirá en una red bidimensional.

Para acortar la notación, denotamos

Función F(norte 1 , norte 2) es una función de dos variables discretas y se llama secuencia bidimensional. Es decir, muestrear una imagen por variables espaciales la traduce en una tabla de valores de muestra. La dimensión de la tabla (número de filas y columnas) está determinada por las dimensiones geométricas del área rectangular original y la elección del paso de muestreo según la fórmula.

Donde los corchetes [...] indican la parte entera del número.

Si el dominio de definición de una imagen continua es un cuadrado l 1 = l 2 = L, y el paso de muestreo se elige para que sea el mismo a lo largo de los ejes incógnita 1 y incógnita 2 (Δ 1 = Δ 2 = Δ), entonces

y la dimensión de la mesa es norte 2 .

Un elemento de la tabla obtenido al muestrear una imagen se llama " píxel" o " cuenta atrás". Considere un píxel F(norte 1 , norte 2). Este número toma valores continuos. La memoria de la computadora solo puede almacenar números discretos. Por lo tanto, para registrar en memoria un valor continuo F debe someterse a una conversión de analógico a digital con el paso D F(ver Figura 3.2).

Figura 3.2 – Cuantización de cantidades continuas

La operación de conversión de analógico a digital (muestreo de un valor continuo por nivel) a menudo se denomina cuantificación. El número de niveles de cuantificación, siempre que los valores de la función de brillo se encuentren en el intervalo _____ _ ____ ___, es igual a

En problemas prácticos de procesamiento de imágenes, la cantidad q varía ampliamente de q= 2 (imágenes “binarias” o “blanco y negro”) hasta q= 210 o más (valores de brillo casi continuos). Seleccionado con mayor frecuencia q= 28, en el que un píxel de la imagen está codificado con un byte de datos digitales. De todo lo anterior concluimos que los píxeles almacenados en la memoria de la computadora son el resultado de muestrear la imagen continua original por argumentos (¿coordenadas?) y por niveles. (Dónde y cuántos, y todo es discreto) Está claro que los pasos de muestreo Δ 1 , Δ 2 debe elegirse lo suficientemente pequeño para que el error de muestreo sea insignificante y la representación digital conserve la información esencial de la imagen.

Debe recordarse que cuanto menor sea el paso de muestreo y cuantificación, mayor será la cantidad de datos de imagen que deben registrarse en la memoria de la computadora. Como ilustración de esta afirmación, consideremos una imagen en una diapositiva de 50x50 mm, que se ingresa en la memoria mediante un densímetro óptico digital (microdensitómetro). Si, al ingresar, la resolución lineal del microdensitómetro (paso de muestreo para variables espaciales) es de 100 micrones, entonces una matriz bidimensional de píxeles de dimensión norte 2 = 500×500 = 25∙10 4. Si el paso se reduce a 25 micrones, entonces las dimensiones de la matriz aumentarán 16 veces y ascenderán a norte 2 = 2000×2000 = 4∙10 6. Utilizando la cuantificación en 256 niveles, es decir, codificando el píxel encontrado por byte, encontramos que en el primer caso se requieren 0,25 megabytes de memoria para la grabación, y en el segundo caso, 4 megabytes.

Provisión analógica y discreta de información gráfica. Una persona es capaz de percibir y almacenar información en forma de imágenes (visual, sonora, táctil, gustativa y olfativa). Las imágenes visuales se pueden guardar en forma de imágenes (dibujos, fotografías, etc.) y las imágenes sonoras se pueden grabar en discos, cintas magnéticas, discos láser, etc.

La información, incluidos gráficos y audio, se puede presentar en forma analógica o discreta. En la representación analógica, una cantidad física adopta un número infinito de valores y sus valores cambian continuamente. Con una representación discreta, una cantidad física adopta un conjunto finito de valores y su valor cambia abruptamente.

Pongamos un ejemplo de representación analógica y discreta de información. La posición de un cuerpo en un plano inclinado y en una escalera está especificada por los valores de las coordenadas X e Y. Cuando un cuerpo se mueve a lo largo de un plano inclinado, sus coordenadas pueden adoptar un número infinito de valores que cambian continuamente. desde un cierto rango, y al moverse por una escalera, solo un cierto conjunto de valores, que cambian abruptamente


Un ejemplo de representación analógica de información gráfica es, por ejemplo, una pintura cuyo color cambia continuamente, y una representación discreta es una imagen impresa con una impresora de inyección de tinta y que consta de puntos individuales de diferentes colores. Un ejemplo de almacenamiento analógico de información sonora es un disco de vinilo (la banda sonora cambia de forma continuamente) y uno discreto es un CD de audio (cuya banda sonora contiene áreas con diferente reflectividad).

La conversión de información gráfica y sonora de forma analógica a discreta se lleva a cabo mediante muestreo, es decir, dividiendo una imagen gráfica continua y una señal de sonido continua (analógica) en elementos separados. El proceso de muestreo implica codificar, es decir, asignar a cada elemento un valor específico en forma de código.

El muestreo es la conversión de imágenes y sonido continuos en un conjunto de valores discretos en forma de códigos.

Sonido en la memoria de la computadora

Conceptos básicos: adaptador de audio, frecuencia de muestreo, profundidad de bits de registro, archivo de sonido.

La naturaleza física del sonido son vibraciones en un determinado rango de frecuencia transmitidas por una onda sonora a través del aire (u otro medio elástico). El proceso de convertir ondas sonoras en código binario en la memoria de la computadora: onda de sonido -> micrófono -> corriente eléctrica alterna -> adaptador de audio -> código binario -> memoria de la computadora .

El proceso de reproducir información de audio almacenada en la memoria de la computadora:
memoria de la computadora -> código binario -> adaptador de audio -> corriente eléctrica alterna -> altavoz -> onda de sonido.

adaptador de audio(tarjeta de sonido) es un dispositivo especial conectado a una computadora, diseñado para convertir las vibraciones eléctricas de la frecuencia de audio en un código binario numérico al ingresar sonido y para la conversión inversa (de un código numérico a vibraciones eléctricas) al reproducir sonido.

Mientras graba audio un adaptador de audio con un cierto período mide la amplitud de la corriente eléctrica y la ingresa en el registro código binario de página del valor resultante. Luego, el código resultante del registro se reescribe en la RAM de la computadora. La calidad del sonido de la computadora está determinada por las características del adaptador de audio: frecuencia de muestreo y profundidad de bits.

Frecuencia de muestreo– es el número de mediciones de la señal de entrada en 1 segundo. La frecuencia se mide en Hertz (Hz). Una medición por segundo corresponde a una frecuencia de 1 Hz. 1000 mediciones en un segundo -1 kilohercio (kHz). Frecuencias de muestreo típicas de adaptadores de audio: 11 kHz, 22 kHz, 44,1 kHz, etc.

Ancho de registro– número de bits en el registro del adaptador de audio. La profundidad de bits determina la precisión de la medición de la señal de entrada. Cuanto mayor sea la profundidad de bits, menor será el error de cada conversión individual de la magnitud de la señal eléctrica en un número y viceversa. Si la profundidad de bits es 8(16), al medir la señal de entrada, se pueden obtener 2 8 =256 (2 16 =65536) valores diferentes. Obviamente de 16 bits El adaptador de audio codifica y reproduce sonido con mayor precisión que los 8 bits.

archivo de sonido– un archivo que almacena información de audio en forma binaria numérica. Normalmente, la información de los archivos de audio está comprimida.

Ejemplos de problemas resueltos.

Ejemplo No. 1.
Determine el tamaño (en bytes) de un archivo de audio digital cuyo tiempo de reproducción es de 10 segundos a una frecuencia de muestreo de 22,05 kHz y una resolución de 8 bits. El archivo no está comprimido.

Solución.
La fórmula para calcular el tamaño (en bytes) de un archivo de audio digital (audio monoaural): (frecuencia de muestreo en Hz)*(tiempo de grabación en segundos)*(resolución en bits)/8.

Así, el archivo se calcula de la siguiente manera: 22050*10*8/8 = 220500 bytes.

Tareas para el trabajo independiente.

No 1. Determine la cantidad de memoria para almacenar un archivo de audio digital cuyo tiempo de reproducción sea de dos minutos a una frecuencia de muestreo de 44,1 kHz y una resolución de 16 bits.

No. 2. El usuario tiene una capacidad de memoria de 2,6 MB. Es necesario grabar un archivo de audio digital con una duración de sonido de 1 minuto. ¿Cuál debería ser la frecuencia de muestreo y la profundidad de bits?

No 3. La cantidad de memoria libre en el disco es 5,25 MB, la profundidad de bits de sonido de la placa es 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 22,05 kHz?

No 4. Un minuto de un archivo de audio digital ocupa 1,3 MB de espacio en disco y la profundidad de bits de la tarjeta de sonido es 8. ¿A qué frecuencia de muestreo se graba el sonido?

No 5. Dos minutos de grabación de un archivo de audio digital ocupan 5,1 MB de espacio en disco. Frecuencia de muestreo – 22050 Hz. ¿Cuál es la profundidad de bits del adaptador de audio? No 6. La cantidad de memoria libre en el disco es 0,01 GB, la profundidad de bits de la tarjeta de sonido es 16. ¿Cuál es la duración del sonido de un archivo de audio digital grabado con una frecuencia de muestreo de 44100 Hz?

Presentación de información gráfica.

Representación ráster.

Conceptos básicos: gráficos por computadora, píxeles, trama, resolución de pantalla, información de video, memoria de video, archivo de gráficos, profundidad de bits, página de memoria de video, código de color de píxeles, gráficos primitivos, sistema de coordenadas gráficas.

gráficos por computadora– una rama de la informática, cuyo tema es el trabajo en una computadora con imágenes gráficas (dibujos, dibujos, fotografías, fotogramas de vídeo, etc.).

Píxel– el elemento de imagen más pequeño en la pantalla (punto en la pantalla).

Ráster– una cuadrícula rectangular de píxeles en la pantalla.

Resolución de pantalla– el tamaño de la cuadrícula ráster, especificado como producto M*N, donde M es el número de puntos horizontales, N es el número de puntos verticales (número de líneas).

Información del vídeo– información sobre la imagen mostrada en la pantalla de una computadora, almacenada en la memoria de la computadora.

Memoria de vídeo– memoria de acceso aleatorio que almacena información del vídeo durante su reproducción en una imagen en la pantalla.

Archivo gráfico– un archivo que almacena información sobre una imagen gráfica.

El número de colores reproducidos en la pantalla (K) y el número de bits asignados en la memoria de vídeo para cada píxel (N) están relacionados mediante la fórmula: K=2 N

La cantidad N se llama profundidad de bits.

Página– una sección de memoria de video que contiene información sobre una imagen de pantalla (una “imagen” en la pantalla). La memoria de video puede acomodar varias páginas al mismo tiempo.

Toda la variedad de colores de la pantalla se obtiene mezclando tres colores básicos: rojo, azul y verde. Cada píxel de la pantalla consta de tres elementos poco espaciados que brillan en estos colores. Las pantallas en color que utilizan este principio se denominan monitores RGB (rojo-verde-azul).

Código colores de píxeles Contiene información sobre la proporción de cada color base.
Si los tres componentes tienen la misma intensidad (brillo), entonces de sus combinaciones se pueden obtener 8 colores diferentes (2 3). La siguiente tabla muestra la codificación de una paleta de 8 colores utilizando código binario de tres bits. En él, la presencia del color base se indica con uno y la ausencia con cero.

código binario


A z CON Color
0 0
0
Negro
0 0
1
Azul
0 1 0 Verde
0 1 1 Azul
1 0
0
Rojo
1 0
1
Rosa
1 1
0
Marrón
1 1
1
Blanco

Se obtiene una paleta de dieciséis colores utilizando una codificación de píxeles de 4 bits: a los tres bits de colores base se añade un bit de intensidad. Este bit controla el brillo de los tres colores simultáneamente. Por ejemplo, si en una paleta de 8 colores el código 100 significa rojo, entonces en una paleta de 16 colores: 0100 – rojo, 1100 – rojo brillante; 0110 – marrón, 1110 – marrón brillante (amarillo).

Se obtiene una gran cantidad de colores controlando por separado la intensidad de los colores base. Además, la intensidad puede tener más de dos niveles si se asigna más de un bit para codificar cada uno de los colores básicos.

Cuando se utiliza una profundidad de bits de 8 bits/píxel, el número de colores es: 2 8 =256. Los bits de dicho código se distribuyen de la siguiente manera: KKKZZSS.

Esto significa que se asignan 3 bits para los componentes rojo y verde, y 2 bits para los componentes azules. En consecuencia, los componentes rojo y verde tienen cada uno 2 3 = 8 niveles de brillo, y el componente azul tiene 4 niveles.

Representación vectorial.

Con el enfoque vectorial, la imagen se considera como un conjunto de elementos simples: líneas rectas, arcos, círculos, elipses, rectángulos, sombras, etc., que se denominan primitivas graficas. La información gráfica son datos que identifican de forma única todas las primitivas gráficas que componen el dibujo.

La posición y forma de las primitivas gráficas se especifican en sistema de coordenadas gráfico relacionado con la pantalla. Normalmente el origen se encuentra en la esquina superior izquierda de la pantalla. La cuadrícula de píxeles coincide con la cuadrícula de coordenadas. El eje X horizontal se dirige de izquierda a derecha; el eje Y vertical es de arriba a abajo.

Un segmento de recta se determina unívocamente indicando las coordenadas de sus extremos; círculo – coordenadas del centro y radio; poliedro - por las coordenadas de sus esquinas, el área sombreada - por la línea límite y el color de sombreado, etc.

Equipo

Acción

Línea a X1,Y1

Dibuja una línea desde la posición actual hasta la posición (X1, Y1).

Línea X1, Y1, X2, Y2

Dibuja una línea con las coordenadas iniciales X1, Y1 y las coordenadas finales X2, Y2. La posición actual no está establecida.

Círculo X, Y, R

Dibuja un círculo: X, Y – coordenadas del centro, R – longitud del radio en pasos de cuadrícula rasterizada.

Elipse X1, Y1, X2, Y2

Dibuja una elipse delimitada por un rectángulo; (X1, Y1) son las coordenadas de la esquina superior izquierda y (X2, Y2) son las coordenadas de la esquina inferior derecha de este rectángulo.

Rectángulo X1, Y1, X2, Y2

Dibuja un rectángulo; (X1, Y1) son las coordenadas de la esquina superior izquierda y (X2, Y2) son las coordenadas de la esquina inferior derecha de este rectángulo.

Color de dibujo COLOR

Establece el color de dibujo actual.

Color de relleno COLOR

Establece el color de relleno actual.

Rellenar X, Y, COLOR DEL BORDE

Pintar una figura cerrada arbitraria; X, Y – coordenadas de cualquier punto dentro de una figura cerrada, COLOR DEL FRONTERA – color de la línea límite.

Ejemplos de problemas resueltos.

Ejemplo No. 1.
Para formar el color se utilizan 256 tonos de rojo, 256 tonos de verde y 256 tonos de azul. ¿Cuántos colores se pueden mostrar en la pantalla en este caso?

Solución:
256*256*256=16777216.

Ejemplo No. 2.
En una pantalla con una resolución de 640*200, solo se muestran imágenes de dos colores. ¿Cuál es la cantidad mínima de memoria de video necesaria para almacenar una imagen?

Solución.
Dado que la profundidad de bits de una imagen de dos colores es 1 y la memoria de video debe acomodar al menos una página de la imagen, la cantidad de memoria de video es: 640 * 200 * 1 = 128000 bits = 16000 bytes.

Ejemplo No. 3.
¿Cuánta memoria de video se necesita para almacenar cuatro páginas de imágenes si la profundidad de bits es 24 y la resolución de pantalla es 800*600 píxeles?

Solución.
Para almacenar una página necesitas

800*600*24 = 11.520.000 bits = 1.440.000 bytes. Para 4, respectivamente, 1.440.000 * 4 = 5.760.000 bytes.

Ejemplo No. 4.
La profundidad de bits es 24. ¿Cuántos tonos diferentes de grises se pueden mostrar en la pantalla?
Nota: Se obtiene un tono de gris cuando los niveles de brillo de los tres componentes son iguales. Si los tres componentes tienen un nivel de brillo máximo, entonces se obtiene el color blanco; la ausencia de los tres componentes representa el color negro.

Solución.
Como los componentes RGB son los mismos para obtener tonos grises, la profundidad es 24/3=8. Obtenemos el número de colores 2 8 =256.

Ejemplo No. 5.
Se proporciona una cuadrícula rasterizada de 10*10. Describe la letra "K" con una secuencia de comandos vectoriales.

Solución:
En representación vectorial, la letra "K" son tres líneas. Cada línea se describe indicando las coordenadas de sus extremos en la forma: LÍNEA (X1,Y1,X2,Y2). La imagen de la letra "K" se describirá de la siguiente manera:

LÍNEA (4,2,4,8)
LÍNEA (5,5,8,2)
LÍNEA (5,5,8,8)

Tareas para el trabajo independiente.

No 1. ¿Cuánta memoria de video se necesita para almacenar dos páginas de imágenes, siempre que la resolución de la pantalla sea de 640 x 350 píxeles y el número de colores utilizados sea 16?

No. 2. La capacidad de la memoria de vídeo es de 1 MB. Resolución de pantalla – 800*600. ¿Cuál es la cantidad máxima de colores que se pueden usar si la memoria de video se divide en dos páginas?

No 3. La profundidad de bits es 24. Describe varias representaciones binarias de gris claro y gris oscuro.

No 4. En la pantalla de una computadora necesitas obtener 1024 tonos de gris. ¿Cuál debería ser la profundidad de bits?

No 5. Para representar dígitos decimales en el código postal estándar (tal como están escritos en los sobres), obtenga una representación vectorial y rasterizada. Elija usted mismo el tamaño de la cuadrícula ráster.

No 6. Reproducir dibujos en papel mediante comandos vectoriales. Resolución 64*48.

A)
Color de dibujo Rojo
Color de relleno Amarillo
Círculo 16, 10, 2
Tono 16, 10, Rojo
Conjunto 16, 12
Línea al 16, 23
Línea al 19, 29
Línea al 21, 29
Línea 16, 23, 13, 29
Línea 13, 29, 11, 29
Línea 16, 16, 11, 12
Línea 16, 16, 21, 12

B)
Color de dibujo Rojo
Color de relleno rojo
Círculo 20, 10, 5
Círculo 20, 10, 10
Tono 25, 15, Rojo
Círculo 20, 30, 5
Círculo 20, 30, 10
Tono 28, 32, Rojo

Como regla general, las señales ingresan al sistema de procesamiento de información de forma continua. Para el procesamiento informático de señales continuas, es necesario, en primer lugar, convertirlas en digitales. Para ello se realizan operaciones de muestreo y cuantificación.

Muestreo de imágenes

Muestreo– se trata de la transformación de una señal continua en una secuencia de números (muestras), es decir, la representación de esta señal según alguna base de dimensión finita. Esta representación consiste en proyectar una señal sobre una base determinada.

La forma más conveniente y natural de muestreo desde el punto de vista de organizar el procesamiento es representar señales en forma de una muestra de sus valores (muestras) en puntos separados, regularmente espaciados. Este método se llama rasterización, y la secuencia de nodos en los que se toman las muestras es trama. El intervalo a través del cual se toman los valores de una señal continua se llama paso de muestreo. El recíproco del paso se llama tasa de muestreo,

Una pregunta esencial que surge durante el muestreo: ¿a qué frecuencia debemos tomar muestras de la señal para poder reconstruirla a partir de estas muestras? Obviamente, si las muestras se toman muy raramente, no contendrán información sobre una señal que cambia rápidamente. La tasa de cambio de una señal se caracteriza por la frecuencia superior de su espectro. Por tanto, el ancho mínimo permitido del intervalo de muestreo está relacionado con la frecuencia más alta del espectro de la señal (inversamente proporcional a ella).

Para el caso de muestreo uniforme, se cumple lo siguiente: Teorema de Kotelnikov, publicado en 1933 en la obra “Sobre la capacidad del aire y el cable en las telecomunicaciones”. Dice: si una señal continua tiene un espectro limitado por la frecuencia, entonces puede reconstruirse completa e inequívocamente a partir de sus muestras discretas tomadas con un período, es decir, con frecuencia.

La restauración de la señal se realiza mediante la función. .

.

Kotelnikov demostró que una señal continua que satisface los criterios anteriores se puede representar como una serie: Este teorema también se llama teorema de muestreo. La función también se llama función de muestreo o Kotelnikov

, aunque Whitaker estudió una serie de interpolación de este tipo en 1915. La función de muestreo tiene una extensión infinita en el tiempo y alcanza su mayor valor, igual a la unidad, en el punto respecto del cual es simétrica. Cada una de estas funciones puede considerarse como una respuesta de un ideal filtro de paso bajo

(filtro de paso bajo) al pulso delta que llega en el momento . Por lo tanto, para restaurar una señal continua a partir de sus muestras discretas, se deben pasar a través de un filtro de paso bajo apropiado. Cabe señalar que dicho filtro no es causal y es físicamente irrealizable. La relación anterior significa la posibilidad de reconstruir con precisión señales con un espectro limitado a partir de la secuencia de sus muestras. Señales de espectro limitado – se trata de señales cuyo espectro de Fourier difiere de cero sólo dentro de una porción limitada del área de definición. Las señales ópticas se pueden clasificar como una de ellas, porque El espectro de Fourier de las imágenes obtenidas en sistemas ópticos es limitado debido al tamaño limitado de sus elementos. La frecuencia se llama. Ésta es la frecuencia límite por encima de la cual no debería haber componentes espectrales en la señal de entrada.

Cuantización de imágenes

En el procesamiento de imágenes digitales, el rango dinámico continuo de valores de brillo se divide en varios niveles discretos. Este procedimiento se llama cuantificación. Su esencia radica en la transformación de una variable continua en una variable discreta que toma un conjunto finito de valores. Estos valores se llaman niveles de cuantificación. En general, la transformación se expresa mediante una función escalonada (Fig. 1). Si la intensidad de la muestra de imagen pertenece al intervalo (es decir, cuando ), luego la muestra original se reemplaza por el nivel de cuantificación, donde umbrales de cuantificación. Se supone que el rango dinámico de los valores de brillo es limitado e igual a .

Arroz. 1. Función que describe la cuantificación.

La tarea principal en este caso es determinar los valores de umbrales y niveles de cuantificación. La forma más sencilla de resolver este problema es dividir el rango dinámico en intervalos iguales. Sin embargo, esta solución no es la mejor. Si los valores de intensidad de la mayoría de los recuentos de imágenes se agrupan, por ejemplo, en la región "oscura" y el número de niveles es limitado, entonces es aconsejable cuantificar de forma desigual. En la región "oscura" es necesario cuantificar con más frecuencia y en la región "clara" con menos frecuencia. Esto reducirá el error de cuantificación.

En los sistemas de procesamiento de imágenes digitales, se esfuerzan por reducir el número de niveles y umbrales de cuantificación, ya que la cantidad de información necesaria para codificar una imagen depende de su número. Sin embargo, con un número relativamente pequeño de niveles en la imagen cuantificada, pueden aparecer contornos falsos. Surgen como resultado de un cambio brusco en el brillo de la imagen cuantificada y son especialmente notables en áreas planas de su cambio. Los contornos falsos degradan significativamente la calidad visual de la imagen, ya que la visión humana es especialmente sensible a los contornos. Para cuantificar uniformemente imágenes típicas, se requieren al menos 64 niveles.




Arriba