Exploración del uso de la morfología matemática en el ...

IEL2-2002-II-26

EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR

CAMILO VEJARANO ÁLVAREZ

UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIERÍA

DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA

BOGOTÁ, D.C.

2002

IEL2-2002-II-26

EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR

CAMILO VEJARANO ÁLVAREZ

Proyecto de Grado para optar al título de

Ingeniero Electrónico

Asesor

ALFREDO RESTREPO PALACIOS, Ph.D.

UNIVERSIDAD DE LOS ANDES

FACULTAD DE INGENIERÍA

DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA

BOGOTÁ, D.C.

2002

IEL2-2002-II-26

2

CONTENIDO

Página

Lista de abreviaturas más usadas 6

Resumen 7

Introducción 8

1. Morfología sobre representación vectorial de la imagen 13

1.1. Representación vectorial de la imagen 13

1.2. Propuesta de ordenamiento condicional de Louverdis et al. 13

1.3. Ventajas y problemas 14

1.4. Mejoras propuestas 16

1.4.1. Operaciones sobre la coordenada de saturación 16

1.4.2. Gradiente morfológico con coordenada h circular 17

1.5. Conclusiones parciales 20

2. Morfología sobre representación escalar de la imagen 24

2.1. Motivación e idea general 24

2.2. Representación escalar de la imagen 25

2.3. Imagen: longitud finita, longitud infinita 26

2.4. Operaciones morfológicas 28

IEL2-2002-II-26

3

2.4.1. Erosión 28

2.4.2. Dilatación 31

2.4.3. Apertura 32

2.4.4. Otras operaciones 33

2.5. Comentarios sobre los sistemas de color 33

2.6. Ejemplo de aplicación 34

2.7. Sobre la eficiencia de los algoritmos 35


3. Morfología sobre división de la imagen por procesos oponentes de color 40

3.1. Introducción 40

3.2. División de la imagen por procesos oponentes de color 40

3.3. Tratamiento de las zonas de color 42

3.4. Reincorporación de la información en la imagen 42

3.5. Ejemplo de aplicación 44


4. Resumen de Conclusiones 49

Apéndice 1: Morfología matemática binaria y de escala de grises 50

Apéndice 2: Sistemas de color 56

Referencias bibliográficas 59

IEL2-2002-II-26

4

LISTA DE FIGURAS

Página

Figura 1: Supresión de ruido con MM con ordenamiento marginal 12

Figura 2: Dilatación y erosión con ordenamiento marginal 12

Figura 3: Representación vectorial de una imagen a color 21

Figura 4: Dilatación vectorial en HSV con coordenada s y s’ 21

Figura 5: Problema de los rojos: explicación 21

Figura 6: Problema de los rojos: ejemplo 22

Figura 7: Gradiente morfológico con coordenada h circular 23

Figura 8: Representación escalar de una imagen a color 37

Figura 9: Erosión escalar en RGB 37

Figura 10: Interpretación de la erosión escalar en RGB 37

Figura 11: Interpretación de la apertura escalar en RGB 38

Figura 12: Apertura escalar en RGB 38

Figura 13: Ejemplo de aplicación de la MM escalar 39

Figura 14: Zonas de color de una imagen 46

Figura 15: Dilatación de la zona azulada de una imagen 47

Figura 16: Erosión de la zona amarilleja de una imagen 47

Figura 17: Ejemplo de aplicación de la MM sobre procesos oponentes 48

Figura A1.1: Dilatación binaria 54

Figura A1.2: Erosión binaria 54

IEL2-2002-II-26

5

Figura A1.3: Apertura binaria 54

Figura A1.4: Cierre binario 55

Figura A1.5: MM en escala de grises 55

Figura A1.6: Gradiente morfológico binario interno 55

Figura A2.1: Sólido de color RGB 58

Figura A2.2: Sistema de color de Hering 58

Figura A2.3: Sólido de color HSV 58

IEL2-2002-II-26

6

LISTA DE ABREVIATURAS MÁS USADAS

MM: Morfología matemática

EE: Elemento de estructura

h: Hue, Matiz

s: Saturation, Saturación

v: Value, Valor

ASF: Alternating Sequential Filter

IEL2-2002-II-26

7

RESUMEN

Aunque existen definiciones ampliamente aceptadas de morfología matemática

(MM) para imágenes binarias y de escala de grises, representadas como

conjuntos y funciones esclares respectivamente (ver, por ejemplo [3,4]), no sucede

lo mismo para las imágenes a color; la extensión de los operadores morfológicos a

éstas no es inmediata. En este trabajo se explora el uso de la MM en imágenes a

color y se muestran tres posibles aproximaciones diferentes al tema.

La primera de ellas, descrita en el capítulo 1 consiste en analizar la propuesta

de Louverdis et al. [5] de morfología sobre una representación vectorial de la

imagen en el espacio de color HSV (para una descripción de este espacio, véase

el apéndice 2). En ésta, las imágenes son funciones de Z2!Z3 y tienen un grafo

que �vive� en Z5. Se propone un cambio del tratamiento de la coordenada s para

hacerlo mas coherente con el ordenamiento propuesto y se mejora el problema de

detección falsa de bordes con el gradiente morfológico en zonas rojizas de la

imagen. Para esto último se combina el ordenamiento condicional con la idea de

Hanbury y Serra [6] del tratamiento circular de la coordenada h.

En el capítulo 2 se enfoca el problema desde un punto de vista distinto y no

tradicional: tratar la imagen a color como una función escalar incorporando el color

en una coordenada adicional del dominio de la imagen, sobre esta representación

se trabaja una versión de la morfología de grises extendida a funciones con

dominio de 3 dimensiones. En este caso las imágenes son funciones con grafo en

Z4 y aunque la visualización no es fácil, la propuesta admite algunas

interpretaciones intuitivas y tiene la ventaja de ser una morfología de escala de

grises que hereda todas las propiedades de los operadores y aporta nuevas

capacidades en el tratamiento del color, especialmente en segmentación por

características de forma y color.

IEL2-2002-II-26

8

Finalmente se presenta una aproximación distinta, que guarda cierta relación

con los métodos de ordenamiento marginal (tratar los componentes de color de la

imagen separadamente), consiste en dividir la imagen en zonas de acuerdo a

procesos oponentes de color en el espacio de color de Hering (apéndice 2),

realizar operaciones morfológicas en zonas de la imagen y reconstruirla. Este

método se describe en el capítulo 3.

En todos los casos se busca preservar los aportes de la morfología binaria y de

escala de grises en cuanto a tratamiento de forma e intensidad y añadir una forma

de tener en cuenta el color como portador importante de información en la imagen.

Para este proyecto, el trabajo incluyó el análisis y desarrollo teórico de las

diferentes propuestas así como la implantación de los algoritmos en Matlab y la

realización de pruebas (cualitativas) sobre diversas imágenes, las más relevantes

se incluyen como ejemplos en este documento.

En el apéndice 1 se resumen brevemente las definiciones de representación

de imágenes binarias y de escala de grises y de los operadores morfológicos en

cada una siguiendo la notación de [3]. Para una mejor introducción a la MM pude

consultarse [3,4]. En el apéndice 2 se tratan los sistemas de color mencionados en

el documento.

IEL2-2002-II-26

9

INTRODUCCIÓN

La morfología matemática nació a finales de los años 70 con los trabajos de

Matheron [1] y Serra [2] y se ha consolidado como una poderosa técnica útil en la

solución de muchos problemas de tratamiento de imágenes. Se basa en un

enfoque geométrico que la hace especialmente buena para tratar explícitamente

las formas. Las operaciones morfológicas se han definido para imágenes binarias

y de escala de grises incluso con dominios de dimensión mayor que 2 (sólidos en

un espacio tridimensional, por ejemplo).

Las técnicas de MM para el tratamiento y análisis de imágenes binarias y de

escala de grises como detectores de bordes con gradientes morfológicos,

segmentación con la transformación Watershed, filtrado, granulometrías,

reconocimiento de patrones, etc., se vienen usando con éxito en distintas

aplicaciones en el ámbito del tratamiento digital de imágenes [7 -13].

En general las definiciones de MM son abstractas y aplican sobre cualquier

cosa que tenga la estructura de retícula completa [1,9] (complete lattice), es decir

un conjunto con una relación de orden parcial en el que todo subconjunto no vacío

tiene supremo e ínfimo. Para el caso de las imágenes a color se presenta el

problema básico de establecer cierta representación de la imagen y sobre ésta, la

relación de orden para poder definir el supremo e ínfimo de un conjunto y derivar

las operaciones básicas: erosión y dilatación, sobre las que se construyen las

demás.

Típicamente la representación es la de una función vectorial en la que los

distintos componentes (normalmente 3) corresponden a los canales de color de la

imagen en cierto espacio de color. Para esta representación hay tres formas

IEL2-2002-II-26

10

tradicionales de ordenamiento: orden marginal, orden reducido y orden

condicional, cada una de las cuales genera un tipo distinto de morfología.

El ordenamiento marginal, que es el más difundido, es sencillamente procesar

cada componente de color separadamente con morfología de escala de grises;

puede verse que es equivalente a definir el �máximo� (�mínimo�) de un conjunto de

vectores como el vector que resulta de tomar los máximos (mínimos) de cada

componente. Estos �máximos� y �mínimos� no necesariamente pertenecen al

conjunto (no son máximos ni mínimos estrictamente hablando) por lo que la

morfología derivada de esta forma puede alterar el balance de color de la imagen;

además, al tratar cada componente separadamente, no se tiene en cuenta la

relación entre los distintos componentes de color en el elemento de estructura

(EE) al hacer operaciones invariantes bajo desplazamientos del mismo (aperturas,

cierres). Por otra parte es una forma fácil de aplicar la morfología en imágenes a

color y puede servir por ejemplo para la remoción de ruido con filtros morfológicos

o ASFs (Alternating Sequential Filter [9]) como se muestra en la figura 1. El

conocido programa de edición digital de imágenes Paint Shop Pro, utiliza

morfología por ordenamiento marginal en el espacio RGB con elementos de

estructura elementales para lograr los efectos visuales de erosión y dilatación

(dilate, erode en el programa), con los que agranda las zonas oscuras y claras de

la imagen respectivamente; un ejemplo se puede apreciar en la figura 2.

El ordenamiento reducido consiste en calcular, para cada píxel de la imagen

(que es un vector), un valor escalar y ordenar de acuerdo a dicho valor;

dependiendo de qué valor se calcule (por ejemplo la norma del vector) puede

resultar una morfología con interpretaciones mas o menos razonables; el problema

fundamental de esta propuesta es la posible aparición de múltiples máximos o

mínimos en un conjunto. En la práctica son raras las aplicaciones de este tipo de

ordenamiento.

El problema de múltiples máximos y mínimos lleva a la idea del ordenamiento

marginal, que es ordenar los vectores de acuerdo al valor de cierta componente,

IEL2-2002-II-26

11

aquellos que tengan el mismo valor (si los hay) se ordenan de acuerdo a otra

componente y así sucesivamente. Este tipo de ordenamiento sirvió para definir la

morfología para imágenes a color en [5], que se describe con mayor detalle en el

capítulo 1; por ahora basta mencionar que el sistema de coordenadas de color que

se escoja y el orden de importancia que se les dé en el ordenamiento, es

fundamental en las propiedades de la morfología que resulta.

Además de estos ordenamientos para la representación vectorial de las

imágenes a color, también se puede tratar únicamente ciertas componentes de

ella con la MM de escala de grises, el caso evidente es convertir la imagen a color

a una de grises (sólo componente de intensidad), pero podría tratarse sólo la

componente correspondiente al color de interés según la aplicación. Esta idea está

relacionada con el método presentado en el capítulo 3.

Estas son las formas más conocidas en que se ha trabajado la MM para

imágenes a color, cada una con bondades y problemas; sin embargo aún no se

llega a una definición universalmente aceptada como las existentes para imágenes

binarias y de grises (esto, debido en parte a que no hay una única representación

para una imagen a color), con lo que el tratamiento de imágenes a color sigue

siendo un campo de desarrollo activo dentro de la MM en el que seguramente

jugará un papel importante el uso de distintos sistemas de coordenadas de color.

Adicionalmente, aunque la morfología se define igualmente para funciones con

dominio y rango tanto continuo como discreto, en adelante se tratarán únicamente

imágenes digitales.

IEL2-2002-II-26

12

(a)

(b)

Figura 1: Supresión de ruido con morfología con ordenamiento marginal. (a) Imagen original.

(b) Resultado de apertura y cierre con EE de 2x2.

(a)

(b)

(c)

Figura 2. Dilatación y erosión con ordenamiento marginal. (a) Imagen original. (b),(c) Dilatación y erosión con ordenamiento marginal en RGB.

IEL2-2002-II-26

13

MORFOLOGÍA SOBRE REPRESENTACIÓN VECTORIAL DE LA IMAGEN

1.1 REPRESENTACIÓN VECTORIAL DE LA IMAGEN

Como ya se mencionó, la forma más común de representar una imagen a color

es como una función vectorial. En este capítulo se considerará como el dominio de

la función, un subconjunto de Z2, finito y rectangular y el rango será R3 (o un

subconjunto de Z3 en el caso de una máquina digital; la diferencia no es relevante

aquí). El conjunto de valores válidos en el rango depende del sistema de color que

se utilice:

23 ,: :IImagen ZDRDI ⊂→

Así, a cada punto del dominio de la imagen (píxel) le corresponde un vector de

longitud 3 con los valores de las coordenadas de color en el sistema de color que

se esté usando (ver figura. 3).

1.2 PROPUESTA DE ORDENAMIENTO CONDICIONAL DE LOUVERDIS ET AL.

Louverdis, Vardavoulia, Andreadis y Tsalides, investigadores de la Democritus

University of Thrace, proponen en [5] un ordenamiento condicional en el espacio

de color HSV (hue, saturation, value, o matiz, saturación y valor, ver apéndice 2)

con el cual definen operaciones morfológicas para imágenes a color y muestran

posibles aplicaciones, en particular la detección de bordes con un gradiente

morfológico interno. Esta morfología vectorial incluso se ha implementado en

Hardware [14].

IEL2-2002-II-26

14

Para los detalles formales se remite al lector a la fuente [5], básicamente la

propuesta consiste en ordenar los vectores ascendentemente de acuerdo al valor

de su coordenada v, los empates se resuelven ordenando descendentemente por

su coordenada s y luego ascendentemente por el valor de h. Así, los píxeles mas

claros se consideran siempre mayores (resultado de que la coordenada v domine

el ordenamiento), para aquellos con igual intensidad se consideran mayores los

mas acromáticos (menor saturación).

Además del ordenamiento se definen en el artículo las operaciones de suma y

resta de vectores (componente a componente), la traslación espacial y la reflexión

de una imagen. Con esto se define la erosión y dilatación vectoriales de forma

similar a las existentes para escala de grises (estas definiciones están en el

apéndice 1), reemplazando el supremo e ínfimo por las versiones vectoriales

resultantes del ordenamiento ya descrito.

1.3 VENTAJAS Y PROBLEMAS

Es importante mencionar algunas de las propiedades y características de esta

morfología por la relación que tienen con las mejoras propuestas en este capítulo:

una ventaja que tiene es que preserva los vectores de la imagen porque el mínimo

o máximo de un conjunto pertenecen a él, esto hace que no se introduzcan

colores que no estén presentes en la imagen original y permite implementar filtros

morfológicos que eliminen ruido en las tres componentes sin alterar el balance de

color de la imagen (esta aplicación también se ilustra en la referencia [5]).

También, al basar el ordenamiento fundamentalmente en la coordenada v, se

trabaja principalmente con la intensidad de la imagen por lo que las dilataciones y

erosiones tienen el efecto visual de agrandar las zonas claras y oscuras,

respectivamente, de la imagen.

De otro lado, el orden condicional también hace que las propiedades de los

operadores morfológicos relativas al orden de las imágenes (crecientes,

IEL2-2002-II-26

15

decrecientes, extensivas, etc., ver apéndice 1) se cumplan, por la misma

definición, respecto al ordenamiento usado, pero no necesariamente respecto a

las componentes de color; por ejemplo una erosión con un elemento de estructura

que contenga el origen es antiextensiva, es decir todos los píxeles del resultado

son �menores� que los de la imagen original de acuerdo al orden que se propuso,

pero respecto a las distintas componentes de color esto sólo se puede garantizar

para la coordenada v (que es la que domina el ordenamiento), las coordenadas s y

h del resultado pueden tener valores mayores que los de la imagen original; esto

tiene incidencia por ejemplo en el cálculo del gradiente morfológico (ver definición

en el apéndice 1) de una imagen.

Al igual que cuando se usa un ordenamiento marginal, con esta propuesta los

valores relativos de las coordenadas de color del elemento de estructura son

irrelevantes al hacer operaciones invariantes a desplazamientos del EE, así, es

igual hacer una apertura con un EE de cualquier color, brillante o no (esto es

porque los valores que se restan en la erosión se vuelven a sumar en la dilatación

y como en toda la vecindad se resta y suma lo mismo, ello no influye en la

decisión del máximo o mínimo).

El ordenamiento propuesto para las coordenadas v y s puede justificarse

intuitivamente, ya que hace que los colores más brillantes y más blancos se

consideren mayores, similar a la MM para imágenes de grises, pero por otra parte

el matiz sólo importa para diferenciar píxeles con la misma intensidad y saturación

y esto relega el color (representado en la coordenada h) al último plano del orden

y le da poco peso en la toma de decisiones al comparar vectores, y en cierta forma

esto es tratar las imágenes a color de tal forma que el color importe lo menos

posible, tal vez no se está aprovechando la información que éste acarrea. Pero

además, la coordenada h, que es naturalmente circular (ver figura 5b), se trata de

forma lineal, lo que implicó utilizar un origen y un ordenamiento arbitrario de los

colores, un problema que ocasiona esto se trata en la sección 1.3.2.

IEL2-2002-II-26

16

1.4 MEJORAS PROPUESTAS

1.4.1 Operaciones sobre la coordenada de saturación

Como ya se mencionó, el ordenamiento condicional propuesto en [5] trata la

coordenada de saturación descendentemente con la idea de hacer �mayores� los

píxeles de la imagen con menor saturación, esto es, mas grisáceos o blancos (o

acromáticos). Siendo coherentes con esto, se esperaría que una operación que

�agrande� la imagen, como es el caso de las que suman el elemento de estructura,

la volviera mas acromática ya que esto indicaría un desplazamiento hacia valores

mayores (según el ordenamiento); por ejemplo, una dilatación con un elemento de

estructura con valores positivos debería llevar la imagen hacia los tonos grisáceos.

Similarmente, las operaciones que restan a la imagen deberían volverla más

colorida ya que se considera que esto indica valores menores.

Pero aunque la coordenada de saturación se interpreta inversamente en la

relación de orden, para las operaciones de suma y resta se trata de forma normal,

entonces si el elemento de estructura tiene valores positivos, al sumarlo se

incrementa la saturación de la imagen lo que hace que el resultado �decrezca�,

contrariamente a lo que sería de esperar según el ordenamiento que se propuso.

Una forma de tratar coherentemente la coordenada de saturación en el

ordenamiento y en las operaciones es definir una nueva coordenada s’ que se

ordena crecientemente y que se suma y resta normalmente.

ss −=1'

Si s toma valores válidos, es decir en el intervalo [0,1], s’ también está en el

intervalo [0,1] y el ordenar s’ ascendentemente es equivalente a ordenar

descendentemente s, por lo que no hay cambios en el ordenamiento. Pero en este

caso, valores pequeños de s’ sí corresponden a valores pequeños en el

ordenamiento, y viceversa, y al sumar (restar) directamente los valores de s’ si se

incrementa (decrementa) el valor del píxel de acuerdo al orden usado. Entonces el

IEL2-2002-II-26

17

uso de la nueva coordenada s’ sí es coherente con la idea del ordenamiento

condicional. Desde luego, para obtener la imagen resultante después de una

operación morfológica en valores HSV válidos se usa:

'1 ss −=

Se implementaron los dos tipos de morfología vectorial, esto es, según la

definición original y con la coordenada s’. En la figura 4 se puede observar el

efecto de las operaciones sobre la coordenada s como se propuso originalmente

en [5] y usando la coordenada s’, y cómo el uso de esta última es más

consecuente con el ordenamiento cuando el elemento de estructura tiene valores

no nulos de saturación: se dilata la imagen (4a) por un elemento de estructura con

valor de saturación 0.1, con la propuesta original (4b) la imagen se torna más

cromática aunque esto contradice el ordenamiento; usando la coordenada s’ el

resultado es el que cabría esperar (4c). En la siguiente sección, que trata de

aplicaciones de la morfología vectorial, se usará la implementación con

coordenada s’ por ser más coherente.

1.4.2 Gradiente morfológico con coordenada h circular

Otro problema de la propuesta de morfología vectorial que se está

considerando, lo ocasiona el tratamiento de la coordenada h. Este tratamiento

parece bastante arbitrario y como ya se mencionó, el color se está teniendo en

cuenta muy poco; pero el problema particular que atañe a esta sección es el

resultado de tratarla linealmente en un gradiente morfológico para la detección de

bordes en imágenes a color.

El gradiente morfológico interno se obtiene de la diferencia entre la imagen

original y la erosión de ésta por el elemento de estructura elemental, en este caso

un cuadrado de 3x3 píxeles con valores nulos de matiz, saturación y valor; para

IEL2-2002-II-26

18

cada vecindad se toman los máximos de estas diferencias como indicador de la

magnitud de la pendiente de la superficie en ese punto.

Para el caso de una imagen a color con la morfología que se está

considerando, el resultado es una función vectorial con las diferencias en cada

componente del espacio HSV, pero como ya se mencionó pueden producirse

resultados no válidos (negativos) en las componentes s y h, y en todo caso el color

de la imagen resultante no será representativo de los colores de la imagen original

sino solamente de las variaciones de color en esta (una especie de falso color).

Por esto, una vez calculado el gradiente morfológico, se toma la norma de los

vectores resultantes y la imagen de escala de grises que se obtiene tiene

intensidades que indican la �intensidad� del borde en la imagen original.

Para las coordenadas v y s, que son por naturaleza lineales, aplicar esta

definición directamente produce buenos resultados, pero el tratar la coordenada h

de forma lineal resulta en el �problema de los rojos� [6]: matices de rojos muy

similares aparecen como muy distintos y generan bordes falsos en el gradiente;

esto se debe a que hay tonos de rojos con valores cercanos a 0 y cercanos a 1, y

al tomar las diferencias linealmente, es decir restando directamente los valores de

matiz (h), resulta un valor grande cuando los colores en realidad son parecidos y

se marca un borde que visualmente no se percibe. Este problema sucede con los

rojos y no con otros matices porque el origen de la coordenada h está por

convención en un tono rojizo; si la coordenada de matiz de una imagen se rota

para desplazar los colores en ella, el problema puede desaparecer o aparecer en

otras zonas (ver figura 6). En la figura 5 se muestra la causa del problema de los

rojos sobre una ilustración de la coordenada h: cuando se la trata linealmente, los

dos puntos, que corresponden a matices perceptivamente parecidos aparecen a

una distancia grande, lo que indicaría un borde debido a un cambio (falso) de

color.

Este problema fue reconocido por Hanbury y Serra [6] al usar el gradiente

morfológico sobre la coordenada h de imágenes a color (pero sólo la coordenada

IEL2-2002-II-26

19

h) y lo resolvieron reconociendo que el gradiente utiliza únicamente diferencias de

valores, por lo que se puede considerara la coordenada h de forma circular fijando

un origen (que en todo caso no será relevante) y utilizando como diferencia de

valores de matiz el menor ángulo que forman en la circunferencia (figura 5b). La

definición que dan para la diferencia de dos valores h1 y h2 es la siguente:

>−−−≤−−

=πππ

2121

212121 ,2

,),(

hhsihhhhsihh

hhD

Donde h1 y h2 pertenecen a la circunferencia unitaria S1; para traducirlo a

valores en el intervalo [0,1) que son los utilizados normalmente en las

representaciones en computador, 2π equivaldría a 1 y π a 0.5.

La idea del gradiente morfológico vectorial se puede combinar con la del

tratamiento circular de la coordenada h, usando diferencias lineales para los

valores de v y s, y ángulos agudos para h, y así resulta un detector de bordes para

imágenes a color que puede distinguir cambios tanto en intensidad como en color

y que no presenta el problema de los rojos. El algoritmo completo se implantó en

en Matlab: se realizó la erosión vectorial y se tomaron las diferencias entre la

imagen original y este resultado, linealmente para las coordenadas v y s, y

circularmente (ángulo agudo) para la coordenada h. Algunos resultados se

muestran en las figura 6 y 7. En la figura 6 puede notarse el problema de los rojos

en el fondo que rodea a la virgen y cómo éste desaparece al rotar la coordenada h

para llevar la imagen hacia el azul. En la figura 7 se ve la detección falsa de

bordes al utilizar la coordenada de matiz de forma lineal (7b) y cómo se corrige el

problema al tratarla circularmente (7c), asimismo, cómo se pueden perder bordes

en partes de la imagen que tienen cambios apreciables de color pero no de

intensidad, si se utiliza un gradiente morfológico tradicional sobre una versión de

escala de grises de la imagen (7d).

IEL2-2002-II-26

20

1.5 CONCLUSIONES PARCIALES

Con la introducción de la coordenada s’, se mejora un problema de coherencia

de la morfología vectorial propuesta en [5], un problema que no es fácil de detectar

ya que sólo se presenta al usar elementos de estructura con valores no nulos de

saturación.

El gradiente morfológico con coordenada h circular es una alternativa a los

detectores de bordes existentes para imágenes a color; permite tener en cuenta

los cambios de color tanto como los de intensidad y corrige el problema de los

rojos que tiene la versión original en [5] tratando la coordenada de matiz

linealmente.

IEL2-2002-II-26

21

Figura 3: Representación vectorial de una imagen en el espacio RGB

(a)

(b)

(c)

Figura 4: Dilatación en HSV con coordenada s y s’ (a) Imagen original. (b) Dilatación usando la

suma directamente sobre la coordenada s (método original). (c) Dilatación usando la suma sobre la coordenada s’ (mejora propuesta). En ambas se usó un EE con s = 0.1

(a)

(b)

Figura 5: Problema de los rojos: explicación. (a) Coordenada h tratada linealmente.

(b) Coordenada h tratada circularmente.

IEL2-2002-II-26

22

(a)

(b)

(c)

(d)

Figura 6: Problema de los rojos: ejemplo. (a) Imagen original. (b) Imagen con coordenada de matiz

rotada. (c),(d) Gradiente morfológico vectorial con coordenada h lineal de las anteriores.

IEL2-2002-II-26

23

(a)

(b)

(c)

(d)

Figura 7: Gradiente morfológico con coordenada h circular (a) Imagen original. (b) Gradiente morfológico con coordenada h lineal. (c) Gradiente morfológico con coordenada h circular.

(d)Gradiente morfológico tradicional sobre versión en escala de grises de la imagen.

IEL2-2002-II-26

24

MORFOLOGÍA SOBRE REPRESENTACIÓN ESCALAR DE LA IMAGEN

2.1 MOTIVACIÓN E IDEA GENERAL

En la introducción a este documento se mencionó el hecho de que la

morfología para imágenes a color utilizando ordenamiento marginal (tratar cada

componente de color separadamente) no tenía en cuenta los valores relativos de

las componentes de color del elemento de estructura al hacer operaciones que

son invariantes al desplazamiento, esto porque cada componente de la imagen se

trata separadamente, cada componente no �sabe� que está pasando con los

demás; entonces sería deseable de alguna forma procesarlos todos a la vez, de

tal forma que la relación entre los componentes de color de la imagen y el EE sea

tenida en cuenta explícitamente. Esta fue la idea que motivó el desarrollo que se

expone en este capítulo.

En programas como Matlab, una imagen de escala de grises se almacena y

trabaja como una matriz de MxN, y es práctica común interpretarla como una

función escalar, una superficie definida en un subconjunto de Z2; se asume que el

tamaño de la matriz determina el dominio de la imagen y los valores en ella, el

rango. Una imagen a color se almacena y trabaja como una matriz de MxNx3, y

siguiendo el mismo razonamiento, podría interpretarse como una función escalar,

una hipersuperficie definida en un subconjunto de Z3. El grafo de una imagen en

esta representación �viviría� en un espacio de dimensión 4 difícil de visualizar,

pero lo importante es que como función sigue siendo escalar. Si se aplica la

morfología de escala de grises sobre esta representación ¿cuál es el resultado?

IEL2-2002-II-26

25

2.2 REPRESENTACIÓN ESCALAR DE LA IMAGEN

La propuesta es entonces, incorporar el color en el dominio de la imagen con

una coordenada adicional; una imagen a color tendría dos coordenadas

espaciales (filas y columnas) y una coordenada de color en que la longitud sería

únicamente 3, es decir toma valores en {0,1,2}, por ejemplo.

3 ,:Imagen ZDRDI ⊂→

El significado de los valores de la dimensión de color depende del sistema de

color que se esté usando, por ejemplo en el espacio de color RGB se podría

asignar en esa dimensión el valor 0 para el rojo, el 1 para el verde y el 2 para el

azul, con lo que una imagen de 1x1 píxel amarillo se representaría así:

I(0,0,0) = 1 (coordenada espacial 0,0, valor de la componente de color rojo)

I(0,0,1) = 1 (coordenada espacial 0,0, valor de la componente de color verde)

I(0,0,2) = 0 (coordenada espacial 0,0, valor de la componente de color azul)

Mientras que usando la representación vectorial se tendría:

I(0,0) = (1,1,0) (píxel 0,0 de color amarillo)

Un ejemplo de representación escalar de una imagen se puede ver en la figura

8, la interpretación es que las componentes de color se �apilan� en una dimensión

adicional, en este caso hacia adentro de la página; debe notarse que para una

imagen de un solo píxel de ancho se requiere una gráfica tridimensional, para

imágenes prácticas de MxN no es posible dibujar la representación escalar por ser

una función en Z4.

Para las coordenadas espaciales el origen del espacio se fija normalmente en

la esquena superior izquierda y además rara vez se repara en él, básicamente es

irrelevante; para la coordenada de color hay que fijar arbitrariamente el origen y el

IEL2-2002-II-26

26

orden de las componentes, esto puede prestarse a distintas interpretaciones como

se mostrará en la siguiente sección.

Dado que la imagen se representa como una función escalar (sólo que con

dominio de dimensión 3), es posible modificar los algoritmos de MM de escala de

grises para que funcionen sobre esta representación, extendiéndolos para que

tengan en cuenta la dimensión adicional; no hay que introducir una nueva relación

de orden.

2.3 IMAGEN: LONGITUD FINITA, LONGITUD INFINITA

Cuando se trabaja la MM a nivel teórico, las imágenes se consideran con

dominio Z2, es decir como señales bidimensionales de longitud infinita, aunque

normalmente de duración finita, es decir que tienen valores no nulos únicamente

en un subconjunto finito del dominio. En este caso, operaciones como la erosión

contraen el soporte de la imagen y otras como la dilatación lo agrandan (esto se

puede apreciar en los ejemplos de erosiones y dilataciones binarias en el apéndice

1).

Al tratar con imágenes digitales en la práctica, se tienen señales de longitud

finita, es decir sólo definidas dentro de un rectángulo de NxM en Z2, o en uno de

MxNx3 en Z3 para el caso de la representación escalar de imágenes a color. Esto

puede presentar dificultades al aplicar operaciones que cambian el dominio de la

imagen, en particular se considerará la erosión y la dilatación.

El efecto de reducción del soporte de la imagen que causa la erosión puede

interpretarse desde el punto de vista de un operador de vecindad; como para

calcular la erosión en un punto se necesitan los valores de una vecindad del punto

dada por el tamaño del EE, en las fronteras de la imagen hacen falta valores

(porque los píxeles de frontera no tienen suficientes vecinos definidos).

Normalmente esto se soluciona de dos formas: o se genera una imagen de salida

IEL2-2002-II-26

27

mas pequeña dejando sólo los píxeles para los que se tiene la vecindad

mencionada, o se suponen valores de píxeles adicionales por fuera del dominio

original de la imagen para calcular las vecindades en los puntos cercanos a la

frontera (ceros, o un reflejo de la imagen, o una extensión periódica de esta). En lo

que atañe a las coordenadas espaciales de la imagen, la diferencia no es grande,

en todo caso los elementos de estructura normalmente son pequeños (3x3) y la

información mas importante en una imagen no suele encontrarse en las fronteras.

La coordenada de color de la representación escalar presenta un problema

mayor, y es que la longitud en esa dimensión es 3 y la del EE también, por lo que

si se toma la opción de reducir el dominio, una erosión de una imagen de MxNx3

por un elemento de estructura de PxQx3 produciría un resultado de (M-P+1) x (N-

Q+1) x 1 que no sería una imagen a color según la representación escalar. Por

otra parte, si se considera la imagen como de longitud infinita y se suponen

valores por fuera de la frontera en la coordenada de color, el resultado sería una

imagen con longitud 3 en la dimensión de color pero con una sola componente no

nula, y cuál de ellas dependería del origen (arbitrario) que se escoja en la

coordenada de color para el EE.

Con la dilatación sucede lo contrario, el soporte de la imagen se agranda, con

lo cual hay nuevamente dos opciones: o se recorta la imagen de salida para que

tenga el mismo tamaño que la de entrada, que equivale a considerarla de longitud

infinita de la cual sólo es importante una parte, o se obtiene una imagen de salida

mas grande que la de entrada. Y nuevamente las coordenadas espaciales no

presentan mayor problema.

La interpretación de lo que sucede con la coordenada de color si es

problemática: si se agranda la imagen en la coordenada de color, el resultado de

una dilatación de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño

(M+P-1) x (N+Q-1) x 5, que definitivamente no es una imagen a color válida

porque tiene longitud 5 en la coordenada de color. Si por el contrario se recorta la

imagen resultante en la coordenada de color, es equivalente a tomar sólo 3 de las

IEL2-2002-II-26

28

5 componentes de color que se obtuvieron con la dilatación, y cuales 3 se tomen

depende del origen (de nuevo arbitrario) que se fije en la dimensión de color y el

orden que se les asigne a las coordenadas de color en ella.

Estos problemas se tratarán en las secciones siguientes con miras a lograr una

interpretación más intuitiva, además cabe notar que sólo se presentan si el

elemento de estructura es una imagen a color, es decir si tiene longitud 3 en la

dimensión de color. De acuerdo a la definición, el elemento de estructura podría

tener cualquier longitud en dicha dimensión, por lo que en particular podría ser una

imagen de escala de grises (longitud 1 en color) y se evitarían los problemas

mencionados. Sin embargo, esta opción es equivalente a la morfología con

ordenamiento marginal mencionada en la introducción y por esto no es de interés

en este capítulo, lo que es interesante es ver qué pueden aportar las operaciones

morfológicas sobre la representación escalar.

2.4 OPERACIONES MORFOLÓGICAS BÁSICAS

A continuación se describen las implementaciones que se hicieron de las

operaciones morfológicas básicas, en particular la elección de la forma de tratar la

coordenada de color para la dilatación y erosión, los motivos intuitivos que

justificaron esa elección y las interpretaciones y propiedades de las operaciones

que resultaron. Como se está utilizando una representación escalar para las

imágenes, todas estas operaciones se implementaron con una variación de los

algoritmos de MM de escala de grises para tener en cuenta la dimensión adicional.

2.4.1 EROSIÓN

La particularidad de la erosión en la representación escalar es que reduce la

longitud de la imagen en la dimensión de color, y el resultado puede verse bien

IEL2-2002-II-26

29

como una imagen de escala de grises (longitud 1 en dicha dimensión) o como una

imagen a color con soporte en sólo una de las componentes de color.

En las coordenadas espaciales normalmente se cambia el tamaño de la

imagen resultante para hacer que sea igual al de la de entrada; en el caso de la

dimensión de color, esto tiene el atractivo de que las operaciones sobre imágenes

a color generan también imágenes a color; elegir esta opción resuelve un

problema práctico, sin embargo los problemas de interpretación son mayores.

La imagen a color que resulta sólo tiene soporte en una de las dimensiones de

color, pero qué coordenada sea depende de qué origen se escoja para la imagen

y el EE en la dimensión de color. Por ejemplo, si se utiliza el sistema de color RGB

y se define el origen de la dimensión de color en el rojo aumentando hacia el azul,

el resultado de una erosión será una imagen a color roja únicamente; si el origen

se fija en el verde, el resultado será una imagen verde. Pero en ambos casos las

superficies resultantes serán iguales, sólo que desplazadas en el color (el

desplazar el origen sólo desplaza el resultado, no lo altera de otra forma).

Entonces se estaría fijando un origen de forma arbitraria, con el fin de obtener una

imagen a color que realmente no lo es, pues sólo contiene la información que tiene

una imagen de escala de grises: la de intensidades en una superficie.

Por esto se escogió la otra opción, cambiar el tamaño de la imagen de salida

en la dimensión de color para obtener un resultado de MxNx1, que se interpreta

como una imagen de escala de grises. Aunque pueda parecer extraño que la

erosión de una imagen a color por un EE a color produzca un resultado de grises,

existe, además de los problemas mencionados anteriormente, otra justificación

intuitiva para esta escogencia: en MM binaria y de escala de grises, una de las

interpretaciones que se le da a la erosión es que va barriendo la imagen probando

y marcando aquellos puntos donde �cabe� el EE dentro de la imagen. Entonces la

erosión a color en la representación escalar indica donde �cabe� el EE, que es

información esencialmente espacial, por lo que el resultado es una imagen de

intensidad; pero el aporte importante en el tema de color es que para determinar si

IEL2-2002-II-26

30

el EE �cabe� o no, se tienen en cuenta todas las componentes de color a la vez, lo

que hace de esta erosión una herramienta capaz de discriminar objetos en una

imagen con base en sus características de color.

Para mostrar esto, considere una imagen como la de la figura 9a representada

de forma escalar en el espacio de color RGB, si se hace una erosión con un

elemento de estructura cuadrado amarillo de 5x5, en la imagen resultante (figura

9b) se marcan las posiciones e intensidades de los objetos amarillos y blancos de

tamaño mayor o igual que 5x5, además todos los objetos que sobreviven se

encogen por el tamaño del EE (que es el aporte de la MM binaria). Si se hace la

misma erosión con un EE blanco, sólo se seleccionan los objetos que tienen

blanco o tonos grisáceos (figura 9c). La explicación de este comportamiento se

ilustra en la figura 10, en términos de dónde �cabe� el EE y hasta qué �altura�

cabe, en el sistema RGB el amarillo es la suma de rojo y verde, entonces el EE

amarillo �cabe� en los objetos que tengan rojo y verde, es decir los amarillos y los

blancos y grisáceos ya que estos últimos tienen rojo, verde y azul; por esta misma

razón, un EE blanco sólo selecciona los blancos y grises (en el sistema RGB).

Se puede notar que la erosión efectivamente puede discriminar patrones de

forma, intensidad y color, es decir preserva los aportes de la MM binaria y de

escala de grises y añade nuevas capacidades para tener en cuenta el color.

También es claro que el comportamiento de la erosión con determinado EE

depende fundamentalmente del sistema de color que se utilice, este punto se

tratará con mayor detalle en la sección 2.5.

Se presenta además otro detalle y es que los elementos de estructura con

distintas características de color no son, en general, �planos�, y entonces en

algunas de las componentes de color tienen valores no nulos, lo cual puede hacer

que el resultado de la erosión (y de las demás operaciones morfológicas) tenga

valores por fuera del rango válido. En MM de escala de grises este problema se

evita usando EE planos, pero como ya se dijo, al introducir el color en un EE esto

puede no ser posible. Es importante entonces, tener esta situación en cuenta para

IEL2-2002-II-26

31

escoger adecuadamente el elemento de estructura y posiblemente sea necesario

truncar los valores no válidos en el resultado.

Por otra parte, cabe notar que un EE de estructura a color siempre tiene

longitud 3 en la dimensión de color, por lo que (a diferencia de la MM binaria y de

grises), un EE de 1x1 píxel sí hace diferencia en las operaciones dependiendo de

su color, o mejor, de los valores de sus componentes de color y del sistema de

coordenadas que se esté utilizando.

2.4.2 DILATACIÓN

La dilatación presenta el mismo problema de la erosión al cambiar el soporte

de la imagen, desafortunadamente no parece admitir una interpretación intuitiva

como el caso de la erosión; ninguna de las dos posibles salidas al problema

produce resultados satisfactorios.

Claramente, si se escoge tratar la imagen como de longitud finita y agrandar el

dominio al hacer una dilatación, como ya se mencionó, el resultado de la apertura

de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño (M+P-1)x(N+Q-

1)x5, lo que no puede interpretarse como una imagen a color (mucho menos como

de escala de grises). Si de esas 5 componentes de color se toman sólo 3 (que

equivale a fijar un origen arbitrario en la coordenada de color), el resultado es una

imagen a color en la representación escalar, pero no tiene ninguna interpretación

intuitiva.

Sin embargo, la dilatación de una imagen de grises por un EE de color si

puede verse como �poner� el EE de color en aquellas partes �marcadas� por la

imagen de grises, esta propiedad se explota en la apertura.

IEL2-2002-II-26

32

2.4.3 APERTURA

La apertura en la representación escalar tiene una interpretación bastante

intuitiva en términos de la erosión y la dilatación que la originan: la erosión localiza

(en una imagen de escala de grises) los puntos en donde cabe el EE y hasta qué

�altura� cabe, y la dilatación pone el EE en esos puntos y alturas (ver figura 11). En

este caso funciona porque se está haciendo la dilatación de una imagen de grises

por un EE a color. Además, la imagen resultante es una imagen a color que tiene

en todos sus puntos la misma relación entre los valores de las distintas

coordenadas de color que el EE.

En cierta forma, la apertura selecciona la parte de la imagen que es similar al

elemento de estructura o, haciendo el símil con un espacio vectorial, �proyecta� la

imagen sobre el EE y obtiene la �componente� en la �dirección� del EE.

La apertura de una imagen a color por un EE a color produce siempre una

imagen a color, y como en el caso de MM de escala de grises, no cambia con

desplazamientos del EE, por lo tanto no es necesario preocuparse por la posición

del origen en la dimensión de color y además no importa el orden de las

coordenadas de color en dicha dimensión. También es idempotente y conserva las

propiedades de MM binaria y de grises al seleccionar objetos con determinada

forma, pero añade la capacidad de discriminar con base en el color; en la figura 12

se ve el ejemplo de una apertura en el sistema RGB de una flor con un EE morado

de 1x1 píxel; puede notarse cómo la apertura extrae algo así como la �parte

morada� de la imagen, desde luego determinada totalmente por las características

de la primera erosión y estas a su vez por el espacio de color que se está usando;

en el sistema RGB, el morado sólo está contenido en las partes moradas y

blancas de la flor, pero muy poco en el fondo y las hojas que son las partes que

entonces se atenúan fuertemente. Además, al igual que la erosión, la apertura

preserva la capacidad de tratar formas heredada de la MM binaria y de grises, con

lo cual, si se usa un EE mayor, pueden suavizarse los detalles, por ejemplo.

IEL2-2002-II-26

33

2.4.4 OTRAS OPERACIONES

Siguiendo las definiciones, se pueden implementar sobre la representación

escalar otras de las operaciones morfológicas, pero algunas de ellas tal vez no

tengan interpretaciones intuitivas y otras probablemente no resulten útiles (esto

por supuesto depende de la aplicación) así como parece suceder con la dilatación.

Además, el hecho de que las operaciones cambien el dominio de la imagen en la

coordenada de color limita la viabilidad de algunas aplicaciones como las

erosiones y dilataciones iterativas que se usan en algoritmos de esqueletización o

las diferencias entre dilataciones y erosiones en gradientes morfológicos.

Por otra parte, en este trabajo sólo se han explorado las posibles aplicaciones

de las operaciones básicas; en la solución de un problema real podría presentarse

la oportunidad de utilizar con provecho algunas más complejas.

2.5 COMENTARIOS SOBRE LOS SISTEMAS DE COLOR

La característica principal de la morfología propuesta sobre la representación

escalar de las imágenes es que tiene en cuenta las distintas propiedades de color

de los objetos, representadas como los valores que toman las coordenadas en el

espacio de color que se esté usando.

En el espacio RGB el tono de un color está dado más por la relación entre los

distintos componentes que por sus valores absolutos, por lo cual una erosión no

puede segmentar, por ejemplo, basándose en intensidades. En el ejemplo de la

figura 12 se aprovechó la propiedad de que todos los colores están contenidos en

el blanco para seleccionar tanto las partes blancas como las moradas de la flor. El

sistema de Hering sí hace explícitos la intensidad y el color en coordenadas

distintas, por lo cual se pueden seleccionar patrones con cierto color en

intensidad. Sin embargo asigna una dirección privilegiada positiva al rojo y al

IEL2-2002-II-26

34

amarillo, y la MM no es simétrica ante estas orientaciones (como si lo son los

filtros lineales, por ejemplo) por lo que se tratan de forma distinta los colores

oponentes. El sistema CMY, por ejemplo puede utilizarse en imágenes con fondo

blanco ya que éste es el origen del sistema de coordenadas.

Lo que es claro es que distintos sistemas de color hacen explícita diferente

información, determinan los resultados de las operaciones morfológicas y la

elección adecuada del EE y se prestan mejor a determinadas aplicaciones; incluso

es posible que sea necesario utilizar variaciones de los sistemas de color

tradicionales (un ejemplo de esto en la siguiente sección) o sistemas totalmente

nuevos.

2.6 EJEMPLO DE APLICACIÓN

A continuación se ilustra una posible aplicación de las técnicas expuestas en

este capítulo aplicadas a la segmentación de fríjoles en una imagen. También se

utilizan operaciones morfológicas tradicionales de escala de grises y binarias y se

la utilidad del sistema de color de Hering para hacer explícitas ciertas

características de color.

La idea es segmentar los fríjoles de las arvejas en la imagen de la figura 13a.

Para esto se utiliza el hecho de que los fríjoles son más rojos y más oscuros que

el resto de los objetos en la imagen, y se utiliza una versión modificada del

sistema de color de Hering invirtiendo la coordenada BW para que crezca hacia lo

más oscuro. Se realiza una erosión escalar con un EE rojo oscuro y el resultado

se muestra en la figura 13b, esta es la parte mas importante de la segmentación y

la que utiliza la MM escalar a color, es de notar que como el fondo es blanco, el

sistema RGB no es hubiera sido de mucha utilidad para segmentar.

En la figura 13c se hace un cierre de escala de grises para �rellenar� los

huecos en los fríjoles, y en la 13d se realiza un umbral que posteriormente se usa

IEL2-2002-II-26

35

como máscara en la figura 13e. Como se ve, el resultado es bastante bueno.

(Para una aplicación de análisis como granulometría podría ser suficiente con

lograr la imagen binaria 13d)

2.7 SOBRE LA EFICIENCIA DE LOS ALGORITMOS

En general los algoritmos que implementan la erosión y la dilatación tienen

orden de complejidad proporcional al tamaño de la imagen y del elemento de

estructura. Si se considera que normalmente el EE es pequeño y su tamaño para

una aplicación dada es fijo, entonces las operaciones tienen orden de complejidad

MxN (filas x columnas de la imagen).

Para este trabajo las distintas rutinas se implantaron como funciones de

Matlab, y se compilaron como librerías de encadenamiento directo (dll) de

Windows usando el compilador Borland 5.5 con lo que se consiguieron tiempos de

ejecución de unos pocos segundos sobre imágenes del orden de 256x256 píxeles

(192 kB) en un computador personal. Aunque razonables, estos tiempos todavía

están lejos de servir para aplicaciones de procesamiento en tiempo real, y para las

operaciones compuestas de usos sucesivos de erosiones y dilataciones, como

aperturas, cierres el tiempo aumenta, y para filtros más complejos (como ASFs) en

imágenes grandes, puede llegar a ser considerable, del orden de algunos pocos

minutos.

En todo caso, los algoritmos son esencialmente los mismos de la MM en

escala de grises y por tanto pueden optimizarse por ejemplo haciendo erosiones y

dilataciones rápidas cuando el EE puede descomponerse apropiadamente [3].

IEL2-2002-II-26

36


Las operaciones propuestas alteran sustancialmente las características de

color de las imágenes, algunas de las operaciones ni siquiera producen imágenes

a color como resultado. En general no parecerían adecuadas para el mejoramiento

o tratamiento de imágenes para observación humana, en cambio han mostrado

aportar en la discriminación de patrones de color preservando las capacidades de

tratar formas de las MM binaria y de grises, y pueden ser útiles en aplicaciones de

análisis combinadas con otras técnicas de tratamiento de imágenes.

Los distintos sistemas de color mostraron ser determinantes en los resultados

obtenidos y en las aplicaciones para las que son útiles.

La morfología sobre la representación escalar de la imagen es una propuesta

novedosa que aún puede ser desarrollada mas, por ejemplo explorando el uso de

otros sistemas de color y buscando aplicaciones prácticas.

IEL2-2002-II-26

37

(a)

(b)

Figura 8: Representación escalar de una imagen a color (a) Imagen original de 1x10 píxeles y sus

componentes RGB. (b) Representación escalar �apilando� los componentes de color en una dimensión adicional.

(a)

(b)

(c)

Figura 9: Erosión escalar en RGB (a) Imagen original. (b) Erosión escalar con cuadrado

amarillo de 5x5. (c) Erosión escalar con cuadrado blanco de 5x5.

(a)

(b)

(c)

Figura 10: Interpretación de la erosión escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la erosión, hasta donde

�cabe� el EE en la imagen.

IEL2-2002-II-26

38

(a)

(b)

(c)

Figura 11: Interpretación de la apertura escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la apertura, poner el EE

hasta donde �cabe� en la imagen.

(a)

(c)

Figura 12: Apertura escalar en RGB (a) Imagen original. (b) Apertura escalar en RGB con un EE

morado de 1x1 pixel

IEL2-2002-II-26

39

(a)

(b)

(c)

(d)

(e)

Figura 13: Ejemplo de aplicación de la MM escalar. (a) Imagen original. (b) Erosión escalar en

sistema de Hering modificado. (c) Cierre en escala de grises. (d) Umbralización. (e) Máscara sobre la imagen original.

IEL2-2002-II-26

40

MORFOLOGÍA SOBRE DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR

3.1 INTRODUCCIÓN

En este capítulo se propone aplicar las operaciones morfológicas de forma

similar al ordenamiento marginal sobre el espacio de Hering, excepto que no se

procesan las componentes de color como tales separadamente sino que se define

el concepto de zonas de color de la imagen, una división de acuerdo al color que

corresponda hasta donde sea posible con una apreciación subjetiva de las zonas

con cierto color dominante en la imagen. Se trata la zona deseada

independientemente con MM de escala de grises y luego se reincorpora la

información de la zona de color en la imagen original de tal forma que el resto de

la imagen no se afecte.

3.2 DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR

Intuitivamente es sencillo determinar en una imagen que hay zonas de un color

predominante; para el procesamiento propuesto se divide la imagen en 4 zonas

disyuntas: rojiza, verdosa, azulada y amarilleja, de acuerdo a los colores básicos

en el espacio de Hering.

La idea es que un píxel de la imagen pertenece a una determinada zona de

color si su valor para ese color en coordenadas de Hering es mayor que para

todos los demás. Para poder hacer la comparación se consideran los valores

negativos de la coordenada Y-B como positivos de azul y los negativos de la

coordenada R-G como positivos de verde.

Entonces, un píxel pertenece a la zona rojiza si su valor de R-G es mayor que

la parte positiva de su valor �(R-G) (verde), que la parte positiva de su valor Y-B

IEL2-2002-II-26

41

(amarillo) si la hay y que la parte negativa de su valor �(Y-B) (azul) si la hay.

Puede verse que esto es equivalente a comparar el valor R-G con el valor

absoluto de Y-B, puesto que este último es una cantidad no negativa que contiene

los valores de amarillo y azul, y para que R-G sea mayor que |Y-B| tiene que ser

mayor que cero, con lo cual el valor de rojo tiene que ser mayor que el de verde.

La zona amarilleja se obtiene de la misma manera, y para las zonas verdosa y

azulada se utiliza el negativo de las coordenadas R-G y Y-B respectivamente.

Así, si se considera la imagen como función de un subconjunto de Z2 al

espacio de Hering, o equivalentemente una tripla de funciones escalares con los

valores de R-G, Y-B y BW, las zonas de color serían un conjunto de puntos (x,y)

en el dominio de la imagen, junto con el valor de color asociado en ese punto

(función escalar definida en esos puntos). Si se denota por (R-G)(x,y), (Y-B)(x,y)

los valores de R-G y Y-B respectivamente, en el punto (x,y):

Zona rojiza: { }),)((),(|,),)((|),)((:)),(,,( yxGRyxRyxBYyxGRyxRyx −=−>−

Zona verdosa: { }),)((),(|,),)((|),)((:)),(,,( yxGRyxGyxBYyxGRyxGyx −−=−>−−

Zona amarilleja: { }),)((),(|,),)((|),)((|)),(,,( yxBYyxYyxGRyxBYyxYyx −=−>−

Zona azulada: { }),)((),(|,),)((|),)((|)),(,,( yxBYyxByxBYyxGRyxByx −−=−>−

Debe notarse que esta división garantiza que las zonas son disyuntas, ningún

punto (x,y) pertenece a más de una, pero puede dejar píxeles sin asignar a

ninguna zona si tienen igual valor (en valor absoluto) en las dos coordenadas de

color, es decir que la división que se hace no es una partición de la imagen.

En la figura 14 se muestran las distintas zonas de color de una imagen como

imágenes de escala de grises, los puntos en negro no pertenecen a la zona.

Puede verse cómo el resultado está bastante de acuerdo con lo que

subjetivamente se hubiera esperado.

IEL2-2002-II-26

42

3.3 TRATAMIENTO DE LAS ZONAS DE COLOR

Con la definición anterior, cada zona de color es una función de intensidades

que puede tratarse con todas las operaciones de la morfología de escala de grises

para seleccionar o remover características, mejorar conectividad, suavizar, etc.

Para hacer este tratamiento hay que tener en cuenta que las zonas no son

exactamente imágenes de escala de grises normales, ya que en general no están

definidas en todo el dominio de la imagen original, debe recordarse que según la

definición en la sección anterior la zona es un conjunto de puntos junto con una

función definida únicamente en ellos (en la figura 14 las partes negras no tienen

valor 0 sino que no pertenecen a la zona). Esto en teoría no afecta la aplicación de

las operaciones morfológicas, pero en la práctica hay que asignar valores no

definidos (o grandes negativos) en los puntos que no pertenecen a la zona para

lograr el efecto deseado.

Por otra parte, las operaciones morfológicas básicas cambian el dominio de la

función, por ejemplo las aperturas y erosiones lo contraen y los cierres y

dilataciones lo agrandan, esto es importante si se desea reincorporar la

información de la zona en la imagen original después de tratarla.

3.4 REINCORPORACIÓN DE LA INFORMACIÓN EN LA IMAGEN

La extracción de las zonas de color y el procesamiento de estas puede servir

por si solo en algunas aplicaciones, pero también sería deseable poder cambiar

las zonas de color sobre la imagen original, o lo que es equivalente, reincorporar la

información en la imagen después del procesamiento. Esto presenta un

inconveniente si las operaciones cambian el dominio de la imagen, que es lo que

sucede con cualquiera que utilice un EE mayor de 1x1 píxel. En este caso el

dominio de la zona de color cambia y hay al menos dos opciones: reemplazar la

IEL2-2002-II-26

43

información de la imagen con la de la zona de color en los píxeles pertenecientes

a la zona de color original o en los pertenecientes a la nueva zona de color

(después de procesamiento). En general puede escogerse cualquiera de las dos

(incluso otras opciones) dependiendo de la aplicación y del resultado deseado,

aquí se tratarán dos casos particulares.

El primero corresponde a los procesamientos morfológicos que agrandan el

dominio de la zona de color, como dilataciones o cierres, que además resaltan los

píxeles pertenecientes a la zona y mejoran la conectividad de esta. En este caso

se escogió reemplazar en la imagen original la información de la zona de color

después del procesamiento, así se intensifica el color que se dilató y se �rellenan�

los �huecos� del color oponente dentro de la zona escogida. Un ejemplo se

muestra en la figura 15, la figura 15b corresponde a la zona azulada de la imagen

de la figura 15a, en 15c se muestra la zona azulosa dilatada por un EE de 3x3 y

altura 0.1, al reincorporar la información de la nueva zona azulada en la imagen

original se obtiene el resultado mostrado en la figura 15d. Si se hubiera

reemplazado la información sólo en la zona azulada original no se habría obtenido

el efecto espacial de agrandar la parte azul de la imagen.

El segundo son los procesos que encogen el dominio de la zona de color como

aperturas y erosiones, que pueden servir para eliminar objetos pequeños y

desacentuar el color en toda la zona. En este caso se escogió reemplazar en la

imagen original la información de la zona de color original, así se reduce tanto la

intensidad del color como su distribución espacial en la imagen. Un ejemplo se

ilustra en la figura 16: se erosionó la zona amarilleja de la imagen con un EE de

3x3 y altura 0.1, puede verse como la zona amarilleja original (16b) se contrae y

atenúa (16c); el resultado final, que se muestra en la figura 16d, tiene la zona

amarilleja atenuada pero el resto de la imagen no sufrió modificaciones. Además,

si se hubiera reincorporado a la imagen sólo la zona amarilleja después de

procesar (que es mas pequeña), en los bordes de ésta hubieran quedado zonas

con amarillo fuerte que corresponden a la zona amarilleja original.

IEL2-2002-II-26

44

En general se consiguen buenos efectos visuales reemplazando en la imagen

original: la zona de color después de procesar cuando la operación agranda el

dominio de ésta, y la zona de color antes de procesar cuando la operación lo

contrae.

3.5 EJEMPLO DE APLICACIÓN

A continuación se ilustra con un ejemplo una posible aplicación de las técnicas

descritas para mejorar la visibilidad de unas manchas rojas en una foto de tejido.

En el procesamiento de la zona de color se emplean distintas operaciones

morfológicas de escala de grises para obtener el resultado.

En la figura 17a se muestra la imagen original, que tiene unas manchas rojizas

muy tenues y por tanto difíciles de ver; se extrae la zona rojiza que se muestra en

la figura 17b, para mejorar la conectividad se hace un cierre con un EE plano

circular de radio 10 (figura 17c), con una apertura con EE de 5x5 se eliminan las

zonas pequeñas (figura 17d), y con una dilatación se intensifican y agrandan un

poco las manchas (figura 17e). El resultado se muestra en la figura 17f, puede

observarse que se acentuaron adecuadamente las manchas que eran muy

difíciles de ver en la imagen original (pero que se ven si se observa con cuidado).


La división de la imagen por procesos oponentes de color está generalmente

de acuerdo con la percepción (subjetiva) de zonas con colores dominantes.

Las operaciones morfológicas propuestas reincorporando la información de la

zona tratada en la imagen original tienen interpretaciones intuitivas en términos de

agrandar, reducir, intensificar, atenuar detalles de acuerdo al color.

IEL2-2002-II-26

45

Con estas técnicas sólo se tratan las partes de interés de la imagen, las demás

no sufren modificaciones, y aún las zonas tratadas no se alteran tanto como para

que pierdan sus características esenciales, por esto la morfología sobre esta

división resulta útil para mejoramiento de imágenes y resaltado de características.

IEL2-2002-II-26

46

(a)

(b)

(c)

(d)

(e)

Figura 14: Zonas de color de una imagen. (a) Imagen original. (b) Zona rojiza. (c) Zona verdosa.

(d) Zona amarilleja. (e) Zona azulada

IEL2-2002-II-26

47

(b)

(c)

(d)

(e)

Figura 15: Dilatación de la zona azulada de una imagen. (a) Imagen original. (b) Zona azulada. (c) Zona azulada dilatada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes

b y c se muestran con colores invertidos para ilustrar mejor los detalles).

(b)

(c)

(d)

(e)

Figura 16: Erosión de la zona amarilleja de una imagen. (a) Imagen original. (b) Zona amarilleja.

(c) Zona amarilleja erosionada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes b y c se muestran con colores invertidos para ilustrar mejor los detalles).

IEL2-2002-II-26

48

(a)

(b)

(c)

(d)

(e)

(f)

Figura 17: Ejemplo de aplicación de MM por procesos oponentes. (a) Imagen original. (b) Zona rojiza (c) Cierre con EE circular radio 10. (d) Apertura EE 5x5. (e) Dilatación EE 3x3 altura 0.1.

(f) Imagen resultante

IEL2-2002-II-26

49

RESUMEN DE CONCLUSIONES

Se presentan tres distintas alternativas del uso de MM en el tratamiento de

imágenes a color.

En la primera, se mejoró una propuesta de MM vectorial [5] y se obtuvo un

detector de bordes en imágenes a color: el gradiente morfológico en el espacio

HSV que permite tener en cuenta los cambios de color tanto como los de

intensidad y al tratar la coordenada h circularmente (idea propuesta en [6]),

corrige el problema de los rojos que tiene la versión con coordenada h lineal.

La segunda es una propuesta original para MM en imágenes a color: una

versión de la MM de escala de grises extendida a funciones con dominio de

dimensión 3 sobre una representación escalar de las imágenes. Algunas de las

operaciones no son fáciles de interpretar o alteran mucho la imagen, sin embargo

se encontró que la erosión y apertura son útiles para discriminar patrones de

forma y color, lo que representa un aporte adicional sobre la MM binaria y de

escala de grises. Por otra parte se vio que los distintos sistemas de color juegan

un papel fundamental y abren una gama de posibilidades para escoger el más

adecuado de acuerdo a la aplicación.

Finalmente se presentó una MM que trabaja sobre una división de la imagen

por procesos oponentes de color, las operaciones sólo alteran partes de la imagen

y tienen interpretaciones muy intuitivas en términos de cómo alteran las zonas de

color de la imagen. En principio se encontró que puede servir en aplicaciones

como resaltar o atenuar características de color. Por otra parte, las zonas de color

se tratan con MM de escala de grises, por lo que se tiene a disposición toda una

serie de herramientas muy bien estudiadas y desarrolladas.

IEL2-2002-II-26

50

APÉNDICE 1 – MORFOLOGÍA MATEMÁTICA BINARIA Y DE ESCALA DE GRISES

A continuación se resumen las definiciones más básicas de la MM binaria y de

escala de grises, para un tratamiento más completo véanse las referencias [2-4].

DEFINICIONES PREVIAS

Un operador σ es creciente si preserva el orden de las imágenes (en imágenes

binarias la relación de orden ≤ es la inclusión ⊂ ): )()( BABA σσ ≤→≤

Es extensivo si contiene al resultado: )(AA σ≤

Antiextensivo si está contenido en el resultado: AA ≤)(σ

E idempotente si aplicarlo más de una vez no produce cambios adicionales en

el resultado: ))(()( AA σσσ =

MORFOLOGÍA BINARIA

Una imagen binaria está determinada por el conjunto de píxeles con valor 1 en

ella, entonces se representa como el subconjunto del espacio Zn formado por

dichos píxeles:

nZA ⊂ :A binariaImagen

La traslación de A esta dada por:

}algún para |{ AaxacZcA nx ∈+=∈=

IEL2-2002-II-26

51

La reflexión de A es:

}algún para |{A AaacZc n ∈−=∈=∨

La dilatación de A por el elemento de estructura B equivale a barrer el origen

del EE por cada punto de la imagen A (ver figura A1.1) y allí poner el EE:

B(A)δBAAa

aB U∈

==⊕

La dilatación conmuta con la unión, es creciente y además extensiva si el

EE contiene el origen.

La erosión de A por el EE B equivale a marcar con el origen del elemento de

estructura los puntos donde éste �cabe� dentro de la imagen (ver figura A1.2):

A}|BE{x(A)εBAΘ xN

B ⊆∈==

La erosión conmuta con la intersección, es creciente y además antiextensiva si

el EE contiene el origen.

La apertura de A por el EE B, que es creciente, antiextensiva e idempotente, se

define como:

BBA(A)BA B ⊕Θ== ) (γo

La apertura selecciona aquellas partes de la imagen donde es posible encajar

el EE (figura A1.3).

El cierre, que es creciente, extensivo e idempotente, está dado por:

BBA(A)BA B )( Θ⊕==• ϕ

El cierre tiende a fusionar regiones suficientemente cercanas en la imagen

(figura A1.4) mejorando así la conectividad de los objetos.

IEL2-2002-II-26

52

La erosión y la dilatación, así como a la apertura y el cierre están relacionados

por las relaciones de dualidad:

BABA cc∨

Θ=⊕ )( y BABA cc∨

•=)( o

La idea es que lo que un operador le hace a la imagen, su dual (reflejado) lo

hace al fondo (el complemento).

MORFOLOGÍA DE ESCALA DE GRISES

Una imagen de escala de grises se representa como una función (superficie)

que a cada punto del dominio de asigna un valor de intensidad:

RZf n →: :f grises deImagen

Si F y H son los subconjuntos de Zn donde están definidas f y h

respectivamente, la dilatación de la imagen f por el elemento de estructura h es:

{ } FzxHzzhzxf(f)δhf h ∈−∈+−==⊕ ,|)()(max

Y la erosión de la imagen f por h es:

{ })()(min)( zhzxffhfHz

h −+==Θ∈

ε

La dilatación (dependiendo del elemento de estructura que se use) agranda las

zonas claras de la imagen y la erosión las oscuras (ver figura A1.5). Si el EE que

se usa es plano (todos sus valores son 0), la dilatación equivale a un filtro máximo

móvil y la erosión a un mínimo, ambos con ventana dada por la forma del EE.

La apertura y el cierre se definen igual que para imágenes binarias como

composiciones de erosiones y dilataciones.

IEL2-2002-II-26

53

GRADIENTES MORFOLÓGICOS

Los gradientes morfológicos se consiguen con diferencias entre la imagen y

operadores extensivos y antiextensivos sobre ésta. Los tres tipos de gradientes

morfológicos más usados se definen así [7]:

Gradiente de Beucher: ) ()()( BIBIIg Θ−⊕=

Gradiente interno: ) ()( BIIIg Θ−=−

Gradiente externo: IBIIg −⊕= )()(

Donde B es el elemento de estructura elemental de la grilla considerada.

IEL2-2002-II-26

54

(a)

(b) (c)

Figura A1.1: Dilatación binaria. (a) Imagen original. (b) Elemento de estructura.

(c) Resultado de la dilatación.

(a)

(b)

Figura A1.2: Erosión binaria. (a) Imagen original. (b) Erosión binaria con un EE cuadrado de 5x5,

nótese cómo sólo se marcaron los objetos de 5x5 o más.

(a)

(b)

Figura A1.3: Apertura binaria. (a) Imagen original. (b) Apertura binaria con EE circular de radio 5.

IEL2-2002-II-26

55

(a)

(b)

Figura A1.4: Cierre binario. (a) Imagen original. (b) Cierre binario con EE circular de radio 5.

(a) (b)

(c)

Figura A1.5: MM en escala de grises. (a) Imagen original. (b) Erosión con cuadrado de 3x3.

(c) Dilatación con cuadrado de 3x3.

Figura A1.6: Gradiente morfológico binario interno. (a) Imagen original. (b) Gradiente morfológico interno.

IEL2-2002-II-26

56

APÉNDICE 2 – SISTEMAS DE COLOR

Este apéndice comprende un breve resumen de los sistemas de color a los que

se hace referencia en el documento, mas información se puede encontrar por

ejemplo en [15].

SISTEMA RGB

El sistema de color RGB (Red, Green, Blue o rojo, verde, azul) representa en

tres coordenadas las cantidades de rojo, verde y azul que combinadas

aditivamente producen un color dado. Es la representación más directa para usar

con monitores y televisores, que funcionan con combinaciones aditivas de luz roja,

verde y azul (ver figura A2.1).

SISTEMA CMY

El sistema de color CMY (Cyan, Magenta, Yellow o aguamarina, morado,

amarillo) representa en tres coordenadas las cantidades de aguamarina, morado y

amarillo que combinadas sustractivamente (como al usar pigmentos) producen un

color dado. La idea de la combinación sustractiva de pigmentos es la base de los

sistemas de impresión a color, por ejemplo. Los valores de CMY se pueden

obtener de los de RGB con la transformación:

−=

BGR

YMC

1

IEL2-2002-II-26

57

SISTEMA DE HERING

El sistema de color de Hering (o NCS: Natural Color System) representa un

punto en el espacio de color mediante una coordenada de intensidad y dos

coordenadas de procesos oponentes de color: Rojo-Verde y Amarillo-Azul (BW,

R-G, Y-B). Está basado en la observación (que está justificada fisiológicamente

por los procesos oponentes a nivel de células ganglionares en el sistema visual

humano) de que no hay un color intermedio entre el rojo y el verde ni entre el

amarillo y el azul, en otras palabras, que no existe por ejemplo un �rojo-verdoso�

(ver figura A2.2).

La representación en el espacio de Hering de un color se puede obtener de los

valores RGB con la transformación lineal:

−

−=

−−

BGR

BWBYGR

3/13/13/112/12/1

011

El espacio de Hering hace explícitos los colores básicos, incluyendo el amarillo

(que por ejemplo no es explícito en el sistema RGB).

SISTEMA HSV

En el sistema HSV (hue, saturation, value, o matiz, saturación, valor), la

coordenada circular h codifica el color con origen arbitrario en un tono rojizo. La

saturación es la medida de la �pureza� del color (o que tan �diluido� con blanco

está), valores de s cercanos a 0 indican baja cromaticidad, cercanos a 1 un color

puro. El valor es una coordenada de intensidad (ver figura a2.3).

IEL2-2002-II-26

58

Figura A2.1: Sólido de color RGB

Figura A2.2. Sistema de color de Hering

Figura A2.3. Sólido de color HSV.

IEL2-2002-II-26

59

REFERENCIAS BIBLIOGRÁFICAS

[1] MATHERON G, Random Sets and Integral Geometry, Wiley, New York, 1975.

[2] SERRA Jean, Image Analysis and Mathematical Morphology, Academic

Press, London, 1982.

[3] HARALICK R.M. and SHAPIRO L. Computer and Robot Vision. Addison-

Wesley, 1993.

[4] GONZÁLEZ R.C. and WOODS R.E. Digital Image Processing. Addison-

Wesley, 1992.

[5] LOUVERDIS G. VARDAVOULIA M.I. ANDREADIS I. TSALIDES Ph. A new

approach to morphological color image processing. Pattern Recognition,

vol.35, no.8, Aug. 2002. pp. 1733-41.

[6] HANBURY Allan G., SERRA Jean. Morphological operators on the unit circle.

IEEE Transactions on Image Processing, vol. 10, no.12, December 2001. pp.

1842-1850

[7] RIVEST Jean F., SOILLE Pierre, BEUCHER Serge. Morphological gradients. Proc. SPIE "Image Science and Technology", San Jose, California, Feb.

1992.

[8] BEUCHER Serge. The Watershed transformation applied to image

segmentation. 1Oth Pfefferkorn Conf. on Signal and Image Processing in

Microscopy and Microanalysis, 16-19 sept. 1991

IEL2-2002-II-26

60

[9] SERRA Jean, VINCENT Luc. An overview of morphological filtering. IEEE

Trans. on Circuits, Systems and Signal Processing, Vol. 11, N°1, 1992, pp.

47-108.

[10] VINCENT Luc. Granulometries and opening trees. Fundamenta Informaticae,

Vol. 41, No. 1-2, IOS Press, January 2000, pp. 57-90.

[11] BLOOMBERG Dan S. VINCENT Luc. Pattern matching using the blurr hit-

miss transform. Journal of Electronic Imaging, April 2000

[12] DI RUBERTO, DEMPSTER, KHAN, JARRA. Analysis of infected blood cell

images using morphological operators. Image and Vision Computing, vol. 20,

2002, pp. 133-146

[13] LANGE, VINCENT. Advanced Gray-Scale Morphological Filters for the

Detection of Sea Mines in Side-Scan Sonar Imagery. Proc SPIE Vol. 4038,

"Detection and Remediation Technologies for Mines and Minelike Targets",

August 2000, pp. 362-372.

[14] VARDAVOULIA, ANDREADIS, TSALIDES. Hardware implementation of soft

color morphological operations. Opt-Eng, vol. 41, no. 7, july 2002, pp. 1536-

1545.

[15] Color Models & Color Wheels, en:

http://www.handprint.com/HP/WCL/color6.html (consultada en 10-ene-2003)

Exploración del uso de la morfología matemática en el ...

Documents

Transcript of Exploración del uso de la morfología matemática en el ...