Métodos de procesamiento de imágenes digitales. Procesamiento de imágenes: técnicas básicas

Procesamiento de imágenes digitales

Procesamiento de imágenes- cualquier forma de procesamiento de información en la que los datos de entrada estén representados por una imagen, por ejemplo, fotografías o fotogramas de vídeo. El procesamiento de imágenes se puede realizar tanto para obtener una imagen de salida (por ejemplo, preparación para la reproducción impresa, para transmisión de televisión, etc.) como para obtener otra información (por ejemplo, reconocimiento de texto, conteo del número y tipo de células en el microscopio). campo, etcétera). Además de las imágenes estáticas en 2D, también es necesario procesar imágenes que cambian con el tiempo, como el vídeo.

Historia

Técnicas básicas de procesamiento de señales

Si el procesamiento se aplica a datos representados en forma digital (en particular, si la señal se convierte a formato digital antes del procesamiento), dicho procesamiento se denomina digital.

Procesamiento de imágenes para reproducción

Tareas típicas

  • Transformaciones geométricas como rotación y escala.
  • Corrección de color: cambio de brillo y contraste, cuantificación de color, conversión a otro espacio de color.
  • Comparación de dos o más imágenes. Como caso especial: encontrar correlaciones entre una imagen y una muestra, por ejemplo en un detector de billetes.
  • Combinando imágenes de varias maneras.
  • Dividiendo la imagen en áreas.
  • Edición y retoque.
  • Amplíe el rango dinámico combinando imágenes con diferentes exposiciones.
  • Compensar la pérdida de nitidez, por ejemplo, mediante una máscara de reducción de nitidez.

Procesamiento de imágenes con fines aplicados y científicos.

Tareas típicas

  • Reconocimiento de texto
  • Procesamiento de imágenes de satélite
  • Visión artificial
  • Procesamiento de datos para extraer diversas características.
  • Procesamiento de imágenes médicas
  • Identificación personal (por rostro, iris, datos dactilares)
  • Control automático del coche.

Ver también

Fundación Wikimedia.

2010.

    Vea qué es "Procesamiento de imágenes digitales" en otros diccionarios:

    Imagen monocromática en blanco y negro. El procesamiento de imágenes es cualquier forma de procesamiento de información cuyo dato de entrada es una imagen, como fotografías o fotogramas de vídeo. El procesamiento de imágenes se puede realizar ... Wikipedia

    Este término tiene otros significados, consulte Señal (significados). El procesamiento de señales es un campo de la ingeniería de radio en el que se llevan a cabo la restauración, separación de flujos de información, supresión de ruido, compresión de datos, filtrado, amplificación... ... Wikipedia

    - (CFS) es un conjunto de software y hardware especiales diseñados para el procesamiento fotogramétrico de datos de fotografías aéreas y espaciales. El procesamiento de imágenes rasterizadas digitales generalmente se realiza en estereoscópico... ... Wikipedia

    - (mapa digital del terreno) un modelo digital del terreno creado mediante la digitalización de fuentes cartográficas, procesamiento fotogramétrico de datos de teledetección y registro digital. GOST 28441 99 da la siguiente definición: “Digital... ... Wikipedia

    Wikipedia no tiene... Wikipedia

    Compresión de imágenes La aplicación de algoritmos de compresión de datos a imágenes almacenadas digitalmente. Como resultado de la compresión, el tamaño de la imagen se reduce, lo que reduce el tiempo necesario para transferir imágenes a través de la red y ahorra espacio para... ... Wikipedia

    Procesamiento de señales digitales (DSP), conversión DSP de señales presentadas en forma digital. Cualquier señal continua (analógica) s(t) puede someterse a muestreo de tiempo y cuantificación de nivel... ... Wikipedia

    El dithering, el dithering (dither en inglés del inglés antiguo didderen para temblar) cuando se procesan señales digitales es la mezcla de ruido pseudoaleatorio con un espectro especialmente seleccionado en la señal primaria. Utilizado para... ... Wikipedia

Resolución: generalmente medida en ppp (puntos por pulgada). Por ejemplo, en la pantalla de un monitor la resolución suele ser de 72 ppp, cuando se muestra en papel, 600 ppp, cuando se graba en una matriz CCD con un tamaño de elemento único de 9 micrones, la resolución será de casi 3000 ppp. Durante el procesamiento, la resolución se puede cambiar: esto no afectará la imagen en sí, pero sí cambiará su visualización en el dispositivo de visualización.

Número de colores (profundidad de color): más precisamente, el número de bits asignados para almacenar color está determinado por la simplificación de los circuitos electrónicos y es un múltiplo de una potencia de 2. Una imagen que requiere 1 bit para almacenar información de color se llama binaria. . Para almacenar imágenes de medios tonos (escala de grises, nivel de grises), se suelen utilizar 8 bits. Las imágenes en color normalmente se almacenan utilizando 24 bits, 8 para cada uno de los tres canales de color.

Tamaño: este parámetro puede ser cualquiera, pero a menudo se selecciona en función de las características de registro de la imagen (por ejemplo, estándares de vídeo PAL (625, 4:3), SECAM (625, 4:3), NTSC (525, 4:3). )), las características del procesamiento posterior (los algoritmos de transformada rápida de Fourier tienen requisitos especiales), etc. Aunque los captadores de fotogramas han interpolado recientemente imágenes a cualquier tamaño, las bibliotecas FFT pueden manejar imágenes de cualquier tamaño.

Características principales de la imagen

Normalmente, la señal física que surge en un punto es una función que depende de muchos parámetros (- profundidad, - longitud de onda, - tiempo). Sin embargo, consideraremos imágenes estáticas y, más a menudo, monocromáticas.

Para ser procesada en una computadora, la imagen debe ser muestreada y cuantificada. Una imagen muestreada y cuantificada se llama digital. Una imagen digital se presenta en un espacio bidimensional discreto, donde es el número de fila y es el número de columna. El elemento ubicado en la intersección de la enésima fila y la enésima columna se llama píxel (píxel – elemento de imagen). La intensidad de los píxeles se puede describir como un número real o un número entero. La intensidad relativa en números reales suele oscilar entre 0 y 1, y en números enteros, entre 0 y 255.

Cabe señalar que estaremos manipulando imágenes bidimensionales. Por imagen nos referimos a una función de dos variables reales, donde es la intensidad (brillo) en un punto con coordenadas. A veces no se procesará toda la imagen, sino una parte de ella, lo que en la literatura inglesa se suele llamar región de. interés, ROI (el área que representa el interés, OPI).

Definición de imagen digital

Tareas

Objetivos

El procesamiento de imágenes se puede realizar para varios propósitos:

  • Cambiar (distorsionar) una imagen para lograr algún efecto (mejora artística). Estas conversiones no se cubrirán en este curso;
  • Procesamiento de imágenes – mejora visual (perceptible a la vista) de la calidad de la imagen (corrección de brillo y contraste, corrección de color, etc.); mejora objetiva de la calidad de la imagen (eliminación de distorsiones como distorsión, desenfoque, desenfoque, etc.);
  • Análisis de imagen – realizar mediciones sobre la imagen (análisis de interferogramas, Hartmanogramas, PSF, etc.);
  • Comprensión de la imagen – Reconocimiento de imágenes (reconocimiento de caracteres, huellas dactilares, rostros, dispositivos señaladores, etc.)

Para lograr nuestros objetivos, consideraremos resolver los siguientes problemas:

  1. Muestreo, cuantificación y codificación de imágenes.
  2. Transformaciones geométricas de imágenes.
  3. Operaciones lógicas y aritméticas sobre imágenes.
  4. Filtrado de imágenes.
  5. Preparación de imágenes.

Las características de las imágenes digitales incluyen:

Los algoritmos de procesamiento de imágenes se basan principalmente en transformaciones integrales: convolución, transformada de Fourier, etc. También se utilizan métodos estadísticos.

Métodos de frecuencia- se basan en la modificación de la señal, “trabajan” directamente con la función de brilloagujas.

    métodos de procesamiento de imágenes elemento por elemento -

gradacional, (por ejemplo, negativa), logarítmica, transformaciones de potencia, lineal por partes, histograma, etc.: el resultado del procesamiento en cualquier punto depende únicamente del valor del valor original en el mismo punto;

    métodos de procesamiento de ventanas correderas –

filtrado, contorno, etc. – el resultado depende del área circundante.

    transformadas de Fourier, Hadamard, etc.

Métodos espaciales– enfoques basados ​​en la manipulación directa de los píxeles de la imagen y sus características (rotación, estiramiento (compresión), reflexión, traducción, las llamadas transformaciones afines).

Procesamiento de imágenes elemento por elemento.

La esencia del procesamiento de imágenes elemento por elemento se reduce a lo siguiente. Dejar
– valores de brillo de la imagen original y el obtenido después del procesamiento de la imagen, respectivamente, en un punto del cuadro que tiene coordenadas cartesianas (número de fila) y (número de columna). El procesamiento elemento por elemento significa que existe una relación funcional uno a uno entre estos brillos.

, (1.1)

permitiendo que el valor de la señal de salida se determine a partir del valor de la señal fuente. En general, como se tiene en cuenta en esta expresión, el tipo o parámetros de la función
, que describe el procesamiento, depende de las coordenadas actuales. En este caso, el procesamiento es heterogéneo. Sin embargo, la mayoría de los procedimientos utilizados en la práctica utilizan homogéneo procesamiento elemento por elemento. En este caso, los índices y j en la expresión (1.1) puede estar ausente. En este caso, la relación entre el brillo de las imágenes originales y procesadas se describe mediante la función:

(1.2)

Lo mismo para todos los puntos del marco.

Contraste de imagen lineal. Si se asigna 1 byte (8 bits) de almacenamiento para la representación digital de cada muestra de imagen, entonces las señales de entrada o salida pueden tomar uno de 256 valores. Normalmente, el rango de trabajo es 0...255; en este caso, el valor 0 corresponde al nivel de negro durante la visualización y el valor 255 corresponde al nivel de blanco. Supongamos que el brillo mínimo y máximo de la imagen original son iguales. incógnita mín. Y incógnita máximo respectivamente. Si estos parámetros o uno de ellos difieren significativamente de los valores límite del rango de brillo, entonces la imagen visualizada parece insaturada, incómoda y agotadora de observar. Un ejemplo de una representación tan fallida se muestra en la Fig. 1.1a, donde el rango de brillo tiene límites incógnita mín. = 180,incógnita máximo = 240.

Para el contraste lineal, se utiliza una transformación lineal de la forma por elementos.

, (1.3)

cuyos parámetros están determinados por los valores deseados del mínimo y mín. y máximo y y máximo brillo de salida. Habiendo resuelto el sistema de ecuaciones.

con respecto a los parámetros de transformación y , es fácil reducir (1.3) a la forma:

.

El resultado del contraste lineal de la imagen original que se muestra en la Fig. 1.1a, mostrado en la Fig. 1.1b en y mín.= 0 y y máximo= 255. La comparación de las dos imágenes indica una calidad visual significativamente mejor de la imagen procesada. La mejora se debe al uso de todo el rango dinámico de la pantalla después del contraste, que falta en la imagen original.

Conversión de histograma, ecualización. Todas las transformaciones de imágenes elemento por elemento pueden considerarse desde el punto de vista de los cambios en la densidad de probabilidad de la distribución de brillo de las imágenes originales y resultantes. Evidentemente, con ninguno de ellos la densidad de probabilidad del producto de salida coincidirá con la densidad de probabilidad de la imagen original (a excepción de la transformación
).

Determinar las características probabilísticas de imágenes que han sido sometidas a procesamiento no lineal es directo tarea de análisis. Al resolver problemas prácticos de procesamiento de imágenes, se pueden plantear problema inverso: Por famoso forma de densidad de probabilidad
Y deseado mente
definir requerido transformación
, al que debe estar sometida la imagen original. En la práctica del procesamiento de imágenes digitales, transformar una imagen a una distribución equiprobable a menudo produce resultados útiles. En este caso

(1.4)

Dónde y mín. Y y máximo– valores de brillo mínimo y máximo de la imagen convertida.

Determinemos las características del convertidor que soluciona este problema. Dejar incógnita Y y están relacionados por la función (1.2), y
Y
leyes integrales de distribución cantidades de entrada y salida. Teniendo en cuenta (1.4), encontramos:

Sustituyendo esta expresión en la condición de equivalencia probabilística

=
,

después de transformaciones simples obtenemos la relación

que representa la característica (1.2) del problema que se resuelve. Según (1.5), la imagen original sufre una transformación no lineal, cuya característica es
está determinada por la ley de distribución integral de la propia imagen original. Después de esto, el resultado se lleva al rango dinámico especificado mediante una operación de contraste lineal.

Por tanto, la transformación de densidad de probabilidad supone el conocimiento de la distribución acumulativa de la imagen original. Como regla general, no hay información confiable al respecto. El uso de aproximaciones analíticas para los fines considerados también es de poca utilidad, porque sus pequeñas desviaciones de las distribuciones reales pueden conducir a diferencias significativas en los resultados de los requeridos. Por tanto, en la práctica del procesamiento de imágenes, la transformación de distribuciones se realiza en dos etapas.

En la primera etapa se mide histograma imagen original. Para una imagen digital cuya escala de grises, por ejemplo, pertenece al rango de números enteros 0...255, el histograma es una tabla de 256 números. Cada uno de ellos muestra el número de puntos del cuadro que tienen un brillo determinado. Dividiendo todos los números en esta tabla por el tamaño total de la muestra igual al número de puntos de imagen utilizados, obtenemos evaluación Distribuciones de probabilidad del brillo de la imagen. Denotemos esta estimación
0  j 255. Entonces la estimación de la distribución integral se obtiene mediante la fórmula:

.

En la segunda etapa, se realiza la propia transformación no lineal (1.2), proporcionando las propiedades necesarias de la imagen de salida. Es más, en lugar de desconocido Para la verdadera distribución acumulativa, se utiliza su estimación basada en el histograma. Teniendo esto en cuenta, todos los métodos de transformación de imágenes elemento por elemento, cuyo objetivo es modificar las leyes de distribución, se denominan métodos de histograma. En particular, una transformación en la que la imagen de salida tiene una distribución uniforme se llama ecualización (nivelación) de histogramas.

Tenga en cuenta que los procedimientos de conversión de histograma se pueden aplicar tanto a la imagen en su conjunto como a sus fragmentos individuales. Esto último puede ser útil al procesar no estacionario imágenes, cuyo contenido varía significativamente en sus características en diferentes áreas. En este caso, se puede lograr un mejor efecto aplicando procesamiento de histograma a áreas individuales.

El uso de las relaciones (1.4), (1.5), válidas para imágenes con una distribución de brillo continua, no es del todo correcta para imágenes digitales. Hay que tener en cuenta que como resultado del procesamiento no es posible obtener una distribución de probabilidad ideal de la imagen de salida, por lo que es útil controlar su histograma.

En la figura. 1.2 muestra un ejemplo de ecualización realizada de acuerdo con la metodología descrita. Un rasgo característico de muchas imágenes obtenidas en sistemas de imágenes reales es una proporción significativa de áreas oscuras y un número relativamente pequeño de áreas con alto brillo.

La ecualización está diseñada para corregir la imagen nivelando las áreas integrales de áreas con diferentes brillos. Una comparación de las imágenes originales (Fig. 1.2a) y procesadas (Fig. 1.2b) muestra que la redistribución del brillo que ocurre durante el procesamiento conduce a una mejora en la percepción visual.

Analizar imágenes digitales y eliminar diversos defectos técnicos que surgieron durante la toma, por ejemplo, debido a configuraciones incorrectas del dispositivo de captura o defectos (arañazos, partículas de polvo, etc.) en la lente de una cámara de video o fotografía, procesamiento de imágenes. A menudo es necesario aumentar el contenido de la información y la calidad de las imágenes resultantes.

Operaciones como eliminación/supresión de ruido, ajuste de brillo, contraste, nitidez de la fotografía, corrección de color, suavizado, compensación de distorsión y muchas otras le permiten editar una imagen y prepararla para imprimirla o publicarla. También existen operaciones especiales para trabajar con imágenes: obtener un negativo, binarización (convertir una imagen a blanco y negro), convertir a gris, etc.

El procesamiento de imágenes digitales también incluye la creación de imágenes obtenidas combinando varios fotogramas.

Programa de procesamiento de imágenes

Capturar imágenes digitales desde un dispositivo de captura (video, web o cámara fija) en una computadora y luego editarlas requiere algún tipo de sistema de procesamiento de imágenes. Idealmente, un sistema de este tipo también debería controlar los parámetros de disparo, como la velocidad de obturación y la exposición, configuraciones de imagen como brillo, contraste, gamma, saturación, etc.

El programa está diseñado específicamente para controlar dispositivos (o), así como para analizar y procesar tramas recibidas. Esta es una aplicación multiplataforma que puede funcionar con varios modelos en los sistemas operativos más populares (por ejemplo, Canon PowerShot y Canon EOS en Windows, sistema operativo basado en kernel Linux y Mac OS). Para procesar los fotogramas recibidos, el programa cuenta con muchos filtros y operaciones que trabajan tanto con la forma como con el color de la imagen. Todas las acciones realizadas en esta aplicación sobre una imagen estática también se pueden realizar en tiempo real.

Métodos de procesamiento de imágenes.

Para editar imágenes digitales, existen varios algoritmos de procesamiento de imágenes implementados en programas modernos. Su uso permite obtener una alta calidad de imagen, así como eliminar la mayoría de los defectos que surgen en las fotografías durante el disparo.

El programa Altami Studio ha desarrollado métodos de procesamiento de imágenes tales como: geométrico (por ejemplo, rotación, escala, recorte), morfológico (dilatación, erosión), transformaciones de imágenes en color (negativo, gamma, suavizado), imágenes en escala de grises (transformada de Laplace, umbral , búsqueda de límites), así como operaciones para trabajar con medidas (búsqueda de contornos) y con el fondo (ecualización de luz, restauración, eliminación de fondo). Además, el software de procesamiento de imágenes Altami Studio tiene una función como la búsqueda automática de objetos en la imagen. Todas las operaciones se pueden aplicar secuencialmente a una imagen, lo que le permite ajustar la imagen.

Procesamiento de imágenes de rayos X

Para analizar una imagen de rayos X, a menudo es necesario editarla primero. Básicamente, para ello se ajusta el brillo y el contraste de la foto, se utiliza la operación de corrección gamma, así como algoritmos de procesamiento de imágenes de medios tonos y mucho más.

Estos métodos de procesamiento de imágenes se pueden aplicar en el programa Altami Studio. Además, las transformaciones de fondo del sistema pueden eliminar artefactos de una imagen de rayos X y el filtro de búsqueda automática de objetos le permite encontrar y resaltar áreas de interés en la imagen. Además de lo anterior, el programa Altami Studio implementa una transformación como Pseudocolors, ideal para trabajar con imágenes de rayos X. Al usarlo, puede "colorear" una imagen asignando ciertos colores a los píxeles como resultado de cuantizarlos por niveles de brillo. De esta manera se pueden distinguir zonas con valores de brillo similares.




Arriba