Exploración del uso de la morfología matemática en el ...
Transcript of Exploración del uso de la morfología matemática en el ...
IEL2-2002-II-26
EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR
CAMILO VEJARANO ÁLVAREZ
UNIVERSIDAD DE LOS ANDES
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
BOGOTÁ, D.C.
2002
IEL2-2002-II-26
EXPLORACIÓN DEL USO DE LA MORFOLOGÍA MATEMÁTICA EN EL TRATAMIENTO DE IMÁGENES A COLOR
CAMILO VEJARANO ÁLVAREZ
Proyecto de Grado para optar al título de
Ingeniero Electrónico
Asesor
ALFREDO RESTREPO PALACIOS, Ph.D.
UNIVERSIDAD DE LOS ANDES
FACULTAD DE INGENIERÍA
DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA
BOGOTÁ, D.C.
2002
IEL2-2002-II-26
2
CONTENIDO
Página
Lista de abreviaturas más usadas 6
Resumen 7
Introducción 8
1. Morfología sobre representación vectorial de la imagen 13
1.1. Representación vectorial de la imagen 13
1.2. Propuesta de ordenamiento condicional de Louverdis et al. 13
1.3. Ventajas y problemas 14
1.4. Mejoras propuestas 16
1.4.1. Operaciones sobre la coordenada de saturación 16
1.4.2. Gradiente morfológico con coordenada h circular 17
1.5. Conclusiones parciales 20
2. Morfología sobre representación escalar de la imagen 24
2.1. Motivación e idea general 24
2.2. Representación escalar de la imagen 25
2.3. Imagen: longitud finita, longitud infinita 26
2.4. Operaciones morfológicas 28
IEL2-2002-II-26
3
2.4.1. Erosión 28
2.4.2. Dilatación 31
2.4.3. Apertura 32
2.4.4. Otras operaciones 33
2.5. Comentarios sobre los sistemas de color 33
2.6. Ejemplo de aplicación 34
2.7. Sobre la eficiencia de los algoritmos 35
2.8. Conclusiones parciales 36
3. Morfología sobre división de la imagen por procesos oponentes de color 40
3.1. Introducción 40
3.2. División de la imagen por procesos oponentes de color 40
3.3. Tratamiento de las zonas de color 42
3.4. Reincorporación de la información en la imagen 42
3.5. Ejemplo de aplicación 44
3.6. Conclusiones parciales 44
4. Resumen de Conclusiones 49
Apéndice 1: Morfología matemática binaria y de escala de grises 50
Apéndice 2: Sistemas de color 56
Referencias bibliográficas 59
IEL2-2002-II-26
4
LISTA DE FIGURAS
Página
Figura 1: Supresión de ruido con MM con ordenamiento marginal 12
Figura 2: Dilatación y erosión con ordenamiento marginal 12
Figura 3: Representación vectorial de una imagen a color 21
Figura 4: Dilatación vectorial en HSV con coordenada s y s’ 21
Figura 5: Problema de los rojos: explicación 21
Figura 6: Problema de los rojos: ejemplo 22
Figura 7: Gradiente morfológico con coordenada h circular 23
Figura 8: Representación escalar de una imagen a color 37
Figura 9: Erosión escalar en RGB 37
Figura 10: Interpretación de la erosión escalar en RGB 37
Figura 11: Interpretación de la apertura escalar en RGB 38
Figura 12: Apertura escalar en RGB 38
Figura 13: Ejemplo de aplicación de la MM escalar 39
Figura 14: Zonas de color de una imagen 46
Figura 15: Dilatación de la zona azulada de una imagen 47
Figura 16: Erosión de la zona amarilleja de una imagen 47
Figura 17: Ejemplo de aplicación de la MM sobre procesos oponentes 48
Figura A1.1: Dilatación binaria 54
Figura A1.2: Erosión binaria 54
IEL2-2002-II-26
5
Figura A1.3: Apertura binaria 54
Figura A1.4: Cierre binario 55
Figura A1.5: MM en escala de grises 55
Figura A1.6: Gradiente morfológico binario interno 55
Figura A2.1: Sólido de color RGB 58
Figura A2.2: Sistema de color de Hering 58
Figura A2.3: Sólido de color HSV 58
IEL2-2002-II-26
6
LISTA DE ABREVIATURAS MÁS USADAS
MM: Morfología matemática
EE: Elemento de estructura
h: Hue, Matiz
s: Saturation, Saturación
v: Value, Valor
ASF: Alternating Sequential Filter
IEL2-2002-II-26
7
RESUMEN
Aunque existen definiciones ampliamente aceptadas de morfología matemática
(MM) para imágenes binarias y de escala de grises, representadas como
conjuntos y funciones esclares respectivamente (ver, por ejemplo [3,4]), no sucede
lo mismo para las imágenes a color; la extensión de los operadores morfológicos a
éstas no es inmediata. En este trabajo se explora el uso de la MM en imágenes a
color y se muestran tres posibles aproximaciones diferentes al tema.
La primera de ellas, descrita en el capítulo 1 consiste en analizar la propuesta
de Louverdis et al. [5] de morfología sobre una representación vectorial de la
imagen en el espacio de color HSV (para una descripción de este espacio, véase
el apéndice 2). En ésta, las imágenes son funciones de Z2!Z3 y tienen un grafo
que �vive� en Z5. Se propone un cambio del tratamiento de la coordenada s para
hacerlo mas coherente con el ordenamiento propuesto y se mejora el problema de
detección falsa de bordes con el gradiente morfológico en zonas rojizas de la
imagen. Para esto último se combina el ordenamiento condicional con la idea de
Hanbury y Serra [6] del tratamiento circular de la coordenada h.
En el capítulo 2 se enfoca el problema desde un punto de vista distinto y no
tradicional: tratar la imagen a color como una función escalar incorporando el color
en una coordenada adicional del dominio de la imagen, sobre esta representación
se trabaja una versión de la morfología de grises extendida a funciones con
dominio de 3 dimensiones. En este caso las imágenes son funciones con grafo en
Z4 y aunque la visualización no es fácil, la propuesta admite algunas
interpretaciones intuitivas y tiene la ventaja de ser una morfología de escala de
grises que hereda todas las propiedades de los operadores y aporta nuevas
capacidades en el tratamiento del color, especialmente en segmentación por
características de forma y color.
IEL2-2002-II-26
8
Finalmente se presenta una aproximación distinta, que guarda cierta relación
con los métodos de ordenamiento marginal (tratar los componentes de color de la
imagen separadamente), consiste en dividir la imagen en zonas de acuerdo a
procesos oponentes de color en el espacio de color de Hering (apéndice 2),
realizar operaciones morfológicas en zonas de la imagen y reconstruirla. Este
método se describe en el capítulo 3.
En todos los casos se busca preservar los aportes de la morfología binaria y de
escala de grises en cuanto a tratamiento de forma e intensidad y añadir una forma
de tener en cuenta el color como portador importante de información en la imagen.
Para este proyecto, el trabajo incluyó el análisis y desarrollo teórico de las
diferentes propuestas así como la implantación de los algoritmos en Matlab y la
realización de pruebas (cualitativas) sobre diversas imágenes, las más relevantes
se incluyen como ejemplos en este documento.
En el apéndice 1 se resumen brevemente las definiciones de representación
de imágenes binarias y de escala de grises y de los operadores morfológicos en
cada una siguiendo la notación de [3]. Para una mejor introducción a la MM pude
consultarse [3,4]. En el apéndice 2 se tratan los sistemas de color mencionados en
el documento.
IEL2-2002-II-26
9
INTRODUCCIÓN
La morfología matemática nació a finales de los años 70 con los trabajos de
Matheron [1] y Serra [2] y se ha consolidado como una poderosa técnica útil en la
solución de muchos problemas de tratamiento de imágenes. Se basa en un
enfoque geométrico que la hace especialmente buena para tratar explícitamente
las formas. Las operaciones morfológicas se han definido para imágenes binarias
y de escala de grises incluso con dominios de dimensión mayor que 2 (sólidos en
un espacio tridimensional, por ejemplo).
Las técnicas de MM para el tratamiento y análisis de imágenes binarias y de
escala de grises como detectores de bordes con gradientes morfológicos,
segmentación con la transformación Watershed, filtrado, granulometrías,
reconocimiento de patrones, etc., se vienen usando con éxito en distintas
aplicaciones en el ámbito del tratamiento digital de imágenes [7 -13].
En general las definiciones de MM son abstractas y aplican sobre cualquier
cosa que tenga la estructura de retícula completa [1,9] (complete lattice), es decir
un conjunto con una relación de orden parcial en el que todo subconjunto no vacío
tiene supremo e ínfimo. Para el caso de las imágenes a color se presenta el
problema básico de establecer cierta representación de la imagen y sobre ésta, la
relación de orden para poder definir el supremo e ínfimo de un conjunto y derivar
las operaciones básicas: erosión y dilatación, sobre las que se construyen las
demás.
Típicamente la representación es la de una función vectorial en la que los
distintos componentes (normalmente 3) corresponden a los canales de color de la
imagen en cierto espacio de color. Para esta representación hay tres formas
IEL2-2002-II-26
10
tradicionales de ordenamiento: orden marginal, orden reducido y orden
condicional, cada una de las cuales genera un tipo distinto de morfología.
El ordenamiento marginal, que es el más difundido, es sencillamente procesar
cada componente de color separadamente con morfología de escala de grises;
puede verse que es equivalente a definir el �máximo� (�mínimo�) de un conjunto de
vectores como el vector que resulta de tomar los máximos (mínimos) de cada
componente. Estos �máximos� y �mínimos� no necesariamente pertenecen al
conjunto (no son máximos ni mínimos estrictamente hablando) por lo que la
morfología derivada de esta forma puede alterar el balance de color de la imagen;
además, al tratar cada componente separadamente, no se tiene en cuenta la
relación entre los distintos componentes de color en el elemento de estructura
(EE) al hacer operaciones invariantes bajo desplazamientos del mismo (aperturas,
cierres). Por otra parte es una forma fácil de aplicar la morfología en imágenes a
color y puede servir por ejemplo para la remoción de ruido con filtros morfológicos
o ASFs (Alternating Sequential Filter [9]) como se muestra en la figura 1. El
conocido programa de edición digital de imágenes Paint Shop Pro, utiliza
morfología por ordenamiento marginal en el espacio RGB con elementos de
estructura elementales para lograr los efectos visuales de erosión y dilatación
(dilate, erode en el programa), con los que agranda las zonas oscuras y claras de
la imagen respectivamente; un ejemplo se puede apreciar en la figura 2.
El ordenamiento reducido consiste en calcular, para cada píxel de la imagen
(que es un vector), un valor escalar y ordenar de acuerdo a dicho valor;
dependiendo de qué valor se calcule (por ejemplo la norma del vector) puede
resultar una morfología con interpretaciones mas o menos razonables; el problema
fundamental de esta propuesta es la posible aparición de múltiples máximos o
mínimos en un conjunto. En la práctica son raras las aplicaciones de este tipo de
ordenamiento.
El problema de múltiples máximos y mínimos lleva a la idea del ordenamiento
marginal, que es ordenar los vectores de acuerdo al valor de cierta componente,
IEL2-2002-II-26
11
aquellos que tengan el mismo valor (si los hay) se ordenan de acuerdo a otra
componente y así sucesivamente. Este tipo de ordenamiento sirvió para definir la
morfología para imágenes a color en [5], que se describe con mayor detalle en el
capítulo 1; por ahora basta mencionar que el sistema de coordenadas de color que
se escoja y el orden de importancia que se les dé en el ordenamiento, es
fundamental en las propiedades de la morfología que resulta.
Además de estos ordenamientos para la representación vectorial de las
imágenes a color, también se puede tratar únicamente ciertas componentes de
ella con la MM de escala de grises, el caso evidente es convertir la imagen a color
a una de grises (sólo componente de intensidad), pero podría tratarse sólo la
componente correspondiente al color de interés según la aplicación. Esta idea está
relacionada con el método presentado en el capítulo 3.
Estas son las formas más conocidas en que se ha trabajado la MM para
imágenes a color, cada una con bondades y problemas; sin embargo aún no se
llega a una definición universalmente aceptada como las existentes para imágenes
binarias y de grises (esto, debido en parte a que no hay una única representación
para una imagen a color), con lo que el tratamiento de imágenes a color sigue
siendo un campo de desarrollo activo dentro de la MM en el que seguramente
jugará un papel importante el uso de distintos sistemas de coordenadas de color.
Adicionalmente, aunque la morfología se define igualmente para funciones con
dominio y rango tanto continuo como discreto, en adelante se tratarán únicamente
imágenes digitales.
IEL2-2002-II-26
12
(a)
(b)
Figura 1: Supresión de ruido con morfología con ordenamiento marginal. (a) Imagen original.
(b) Resultado de apertura y cierre con EE de 2x2.
(a)
(b)
(c)
Figura 2. Dilatación y erosión con ordenamiento marginal. (a) Imagen original. (b),(c) Dilatación y erosión con ordenamiento marginal en RGB.
IEL2-2002-II-26
13
MORFOLOGÍA SOBRE REPRESENTACIÓN VECTORIAL DE LA IMAGEN
1.1 REPRESENTACIÓN VECTORIAL DE LA IMAGEN
Como ya se mencionó, la forma más común de representar una imagen a color
es como una función vectorial. En este capítulo se considerará como el dominio de
la función, un subconjunto de Z2, finito y rectangular y el rango será R3 (o un
subconjunto de Z3 en el caso de una máquina digital; la diferencia no es relevante
aquí). El conjunto de valores válidos en el rango depende del sistema de color que
se utilice:
23 ,: :IImagen ZDRDI ⊂→
Así, a cada punto del dominio de la imagen (píxel) le corresponde un vector de
longitud 3 con los valores de las coordenadas de color en el sistema de color que
se esté usando (ver figura. 3).
1.2 PROPUESTA DE ORDENAMIENTO CONDICIONAL DE LOUVERDIS ET AL.
Louverdis, Vardavoulia, Andreadis y Tsalides, investigadores de la Democritus
University of Thrace, proponen en [5] un ordenamiento condicional en el espacio
de color HSV (hue, saturation, value, o matiz, saturación y valor, ver apéndice 2)
con el cual definen operaciones morfológicas para imágenes a color y muestran
posibles aplicaciones, en particular la detección de bordes con un gradiente
morfológico interno. Esta morfología vectorial incluso se ha implementado en
Hardware [14].
IEL2-2002-II-26
14
Para los detalles formales se remite al lector a la fuente [5], básicamente la
propuesta consiste en ordenar los vectores ascendentemente de acuerdo al valor
de su coordenada v, los empates se resuelven ordenando descendentemente por
su coordenada s y luego ascendentemente por el valor de h. Así, los píxeles mas
claros se consideran siempre mayores (resultado de que la coordenada v domine
el ordenamiento), para aquellos con igual intensidad se consideran mayores los
mas acromáticos (menor saturación).
Además del ordenamiento se definen en el artículo las operaciones de suma y
resta de vectores (componente a componente), la traslación espacial y la reflexión
de una imagen. Con esto se define la erosión y dilatación vectoriales de forma
similar a las existentes para escala de grises (estas definiciones están en el
apéndice 1), reemplazando el supremo e ínfimo por las versiones vectoriales
resultantes del ordenamiento ya descrito.
1.3 VENTAJAS Y PROBLEMAS
Es importante mencionar algunas de las propiedades y características de esta
morfología por la relación que tienen con las mejoras propuestas en este capítulo:
una ventaja que tiene es que preserva los vectores de la imagen porque el mínimo
o máximo de un conjunto pertenecen a él, esto hace que no se introduzcan
colores que no estén presentes en la imagen original y permite implementar filtros
morfológicos que eliminen ruido en las tres componentes sin alterar el balance de
color de la imagen (esta aplicación también se ilustra en la referencia [5]).
También, al basar el ordenamiento fundamentalmente en la coordenada v, se
trabaja principalmente con la intensidad de la imagen por lo que las dilataciones y
erosiones tienen el efecto visual de agrandar las zonas claras y oscuras,
respectivamente, de la imagen.
De otro lado, el orden condicional también hace que las propiedades de los
operadores morfológicos relativas al orden de las imágenes (crecientes,
IEL2-2002-II-26
15
decrecientes, extensivas, etc., ver apéndice 1) se cumplan, por la misma
definición, respecto al ordenamiento usado, pero no necesariamente respecto a
las componentes de color; por ejemplo una erosión con un elemento de estructura
que contenga el origen es antiextensiva, es decir todos los píxeles del resultado
son �menores� que los de la imagen original de acuerdo al orden que se propuso,
pero respecto a las distintas componentes de color esto sólo se puede garantizar
para la coordenada v (que es la que domina el ordenamiento), las coordenadas s y
h del resultado pueden tener valores mayores que los de la imagen original; esto
tiene incidencia por ejemplo en el cálculo del gradiente morfológico (ver definición
en el apéndice 1) de una imagen.
Al igual que cuando se usa un ordenamiento marginal, con esta propuesta los
valores relativos de las coordenadas de color del elemento de estructura son
irrelevantes al hacer operaciones invariantes a desplazamientos del EE, así, es
igual hacer una apertura con un EE de cualquier color, brillante o no (esto es
porque los valores que se restan en la erosión se vuelven a sumar en la dilatación
y como en toda la vecindad se resta y suma lo mismo, ello no influye en la
decisión del máximo o mínimo).
El ordenamiento propuesto para las coordenadas v y s puede justificarse
intuitivamente, ya que hace que los colores más brillantes y más blancos se
consideren mayores, similar a la MM para imágenes de grises, pero por otra parte
el matiz sólo importa para diferenciar píxeles con la misma intensidad y saturación
y esto relega el color (representado en la coordenada h) al último plano del orden
y le da poco peso en la toma de decisiones al comparar vectores, y en cierta forma
esto es tratar las imágenes a color de tal forma que el color importe lo menos
posible, tal vez no se está aprovechando la información que éste acarrea. Pero
además, la coordenada h, que es naturalmente circular (ver figura 5b), se trata de
forma lineal, lo que implicó utilizar un origen y un ordenamiento arbitrario de los
colores, un problema que ocasiona esto se trata en la sección 1.3.2.
IEL2-2002-II-26
16
1.4 MEJORAS PROPUESTAS
1.4.1 Operaciones sobre la coordenada de saturación
Como ya se mencionó, el ordenamiento condicional propuesto en [5] trata la
coordenada de saturación descendentemente con la idea de hacer �mayores� los
píxeles de la imagen con menor saturación, esto es, mas grisáceos o blancos (o
acromáticos). Siendo coherentes con esto, se esperaría que una operación que
�agrande� la imagen, como es el caso de las que suman el elemento de estructura,
la volviera mas acromática ya que esto indicaría un desplazamiento hacia valores
mayores (según el ordenamiento); por ejemplo, una dilatación con un elemento de
estructura con valores positivos debería llevar la imagen hacia los tonos grisáceos.
Similarmente, las operaciones que restan a la imagen deberían volverla más
colorida ya que se considera que esto indica valores menores.
Pero aunque la coordenada de saturación se interpreta inversamente en la
relación de orden, para las operaciones de suma y resta se trata de forma normal,
entonces si el elemento de estructura tiene valores positivos, al sumarlo se
incrementa la saturación de la imagen lo que hace que el resultado �decrezca�,
contrariamente a lo que sería de esperar según el ordenamiento que se propuso.
Una forma de tratar coherentemente la coordenada de saturación en el
ordenamiento y en las operaciones es definir una nueva coordenada s’ que se
ordena crecientemente y que se suma y resta normalmente.
ss −=1'
Si s toma valores válidos, es decir en el intervalo [0,1], s’ también está en el
intervalo [0,1] y el ordenar s’ ascendentemente es equivalente a ordenar
descendentemente s, por lo que no hay cambios en el ordenamiento. Pero en este
caso, valores pequeños de s’ sí corresponden a valores pequeños en el
ordenamiento, y viceversa, y al sumar (restar) directamente los valores de s’ si se
incrementa (decrementa) el valor del píxel de acuerdo al orden usado. Entonces el
IEL2-2002-II-26
17
uso de la nueva coordenada s’ sí es coherente con la idea del ordenamiento
condicional. Desde luego, para obtener la imagen resultante después de una
operación morfológica en valores HSV válidos se usa:
'1 ss −=
Se implementaron los dos tipos de morfología vectorial, esto es, según la
definición original y con la coordenada s’. En la figura 4 se puede observar el
efecto de las operaciones sobre la coordenada s como se propuso originalmente
en [5] y usando la coordenada s’, y cómo el uso de esta última es más
consecuente con el ordenamiento cuando el elemento de estructura tiene valores
no nulos de saturación: se dilata la imagen (4a) por un elemento de estructura con
valor de saturación 0.1, con la propuesta original (4b) la imagen se torna más
cromática aunque esto contradice el ordenamiento; usando la coordenada s’ el
resultado es el que cabría esperar (4c). En la siguiente sección, que trata de
aplicaciones de la morfología vectorial, se usará la implementación con
coordenada s’ por ser más coherente.
1.4.2 Gradiente morfológico con coordenada h circular
Otro problema de la propuesta de morfología vectorial que se está
considerando, lo ocasiona el tratamiento de la coordenada h. Este tratamiento
parece bastante arbitrario y como ya se mencionó, el color se está teniendo en
cuenta muy poco; pero el problema particular que atañe a esta sección es el
resultado de tratarla linealmente en un gradiente morfológico para la detección de
bordes en imágenes a color.
El gradiente morfológico interno se obtiene de la diferencia entre la imagen
original y la erosión de ésta por el elemento de estructura elemental, en este caso
un cuadrado de 3x3 píxeles con valores nulos de matiz, saturación y valor; para
IEL2-2002-II-26
18
cada vecindad se toman los máximos de estas diferencias como indicador de la
magnitud de la pendiente de la superficie en ese punto.
Para el caso de una imagen a color con la morfología que se está
considerando, el resultado es una función vectorial con las diferencias en cada
componente del espacio HSV, pero como ya se mencionó pueden producirse
resultados no válidos (negativos) en las componentes s y h, y en todo caso el color
de la imagen resultante no será representativo de los colores de la imagen original
sino solamente de las variaciones de color en esta (una especie de falso color).
Por esto, una vez calculado el gradiente morfológico, se toma la norma de los
vectores resultantes y la imagen de escala de grises que se obtiene tiene
intensidades que indican la �intensidad� del borde en la imagen original.
Para las coordenadas v y s, que son por naturaleza lineales, aplicar esta
definición directamente produce buenos resultados, pero el tratar la coordenada h
de forma lineal resulta en el �problema de los rojos� [6]: matices de rojos muy
similares aparecen como muy distintos y generan bordes falsos en el gradiente;
esto se debe a que hay tonos de rojos con valores cercanos a 0 y cercanos a 1, y
al tomar las diferencias linealmente, es decir restando directamente los valores de
matiz (h), resulta un valor grande cuando los colores en realidad son parecidos y
se marca un borde que visualmente no se percibe. Este problema sucede con los
rojos y no con otros matices porque el origen de la coordenada h está por
convención en un tono rojizo; si la coordenada de matiz de una imagen se rota
para desplazar los colores en ella, el problema puede desaparecer o aparecer en
otras zonas (ver figura 6). En la figura 5 se muestra la causa del problema de los
rojos sobre una ilustración de la coordenada h: cuando se la trata linealmente, los
dos puntos, que corresponden a matices perceptivamente parecidos aparecen a
una distancia grande, lo que indicaría un borde debido a un cambio (falso) de
color.
Este problema fue reconocido por Hanbury y Serra [6] al usar el gradiente
morfológico sobre la coordenada h de imágenes a color (pero sólo la coordenada
IEL2-2002-II-26
19
h) y lo resolvieron reconociendo que el gradiente utiliza únicamente diferencias de
valores, por lo que se puede considerara la coordenada h de forma circular fijando
un origen (que en todo caso no será relevante) y utilizando como diferencia de
valores de matiz el menor ángulo que forman en la circunferencia (figura 5b). La
definición que dan para la diferencia de dos valores h1 y h2 es la siguente:
>−−−≤−−
=πππ
2121
212121 ,2
,),(
hhsihhhhsihh
hhD
Donde h1 y h2 pertenecen a la circunferencia unitaria S1; para traducirlo a
valores en el intervalo [0,1) que son los utilizados normalmente en las
representaciones en computador, 2π equivaldría a 1 y π a 0.5.
La idea del gradiente morfológico vectorial se puede combinar con la del
tratamiento circular de la coordenada h, usando diferencias lineales para los
valores de v y s, y ángulos agudos para h, y así resulta un detector de bordes para
imágenes a color que puede distinguir cambios tanto en intensidad como en color
y que no presenta el problema de los rojos. El algoritmo completo se implantó en
en Matlab: se realizó la erosión vectorial y se tomaron las diferencias entre la
imagen original y este resultado, linealmente para las coordenadas v y s, y
circularmente (ángulo agudo) para la coordenada h. Algunos resultados se
muestran en las figura 6 y 7. En la figura 6 puede notarse el problema de los rojos
en el fondo que rodea a la virgen y cómo éste desaparece al rotar la coordenada h
para llevar la imagen hacia el azul. En la figura 7 se ve la detección falsa de
bordes al utilizar la coordenada de matiz de forma lineal (7b) y cómo se corrige el
problema al tratarla circularmente (7c), asimismo, cómo se pueden perder bordes
en partes de la imagen que tienen cambios apreciables de color pero no de
intensidad, si se utiliza un gradiente morfológico tradicional sobre una versión de
escala de grises de la imagen (7d).
IEL2-2002-II-26
20
1.5 CONCLUSIONES PARCIALES
Con la introducción de la coordenada s’, se mejora un problema de coherencia
de la morfología vectorial propuesta en [5], un problema que no es fácil de detectar
ya que sólo se presenta al usar elementos de estructura con valores no nulos de
saturación.
El gradiente morfológico con coordenada h circular es una alternativa a los
detectores de bordes existentes para imágenes a color; permite tener en cuenta
los cambios de color tanto como los de intensidad y corrige el problema de los
rojos que tiene la versión original en [5] tratando la coordenada de matiz
linealmente.
IEL2-2002-II-26
21
Figura 3: Representación vectorial de una imagen en el espacio RGB
(a)
(b)
(c)
Figura 4: Dilatación en HSV con coordenada s y s’ (a) Imagen original. (b) Dilatación usando la
suma directamente sobre la coordenada s (método original). (c) Dilatación usando la suma sobre la coordenada s’ (mejora propuesta). En ambas se usó un EE con s = 0.1
(a)
(b)
Figura 5: Problema de los rojos: explicación. (a) Coordenada h tratada linealmente.
(b) Coordenada h tratada circularmente.
IEL2-2002-II-26
22
(a)
(b)
(c)
(d)
Figura 6: Problema de los rojos: ejemplo. (a) Imagen original. (b) Imagen con coordenada de matiz
rotada. (c),(d) Gradiente morfológico vectorial con coordenada h lineal de las anteriores.
IEL2-2002-II-26
23
(a)
(b)
(c)
(d)
Figura 7: Gradiente morfológico con coordenada h circular (a) Imagen original. (b) Gradiente morfológico con coordenada h lineal. (c) Gradiente morfológico con coordenada h circular.
(d)Gradiente morfológico tradicional sobre versión en escala de grises de la imagen.
IEL2-2002-II-26
24
MORFOLOGÍA SOBRE REPRESENTACIÓN ESCALAR DE LA IMAGEN
2.1 MOTIVACIÓN E IDEA GENERAL
En la introducción a este documento se mencionó el hecho de que la
morfología para imágenes a color utilizando ordenamiento marginal (tratar cada
componente de color separadamente) no tenía en cuenta los valores relativos de
las componentes de color del elemento de estructura al hacer operaciones que
son invariantes al desplazamiento, esto porque cada componente de la imagen se
trata separadamente, cada componente no �sabe� que está pasando con los
demás; entonces sería deseable de alguna forma procesarlos todos a la vez, de
tal forma que la relación entre los componentes de color de la imagen y el EE sea
tenida en cuenta explícitamente. Esta fue la idea que motivó el desarrollo que se
expone en este capítulo.
En programas como Matlab, una imagen de escala de grises se almacena y
trabaja como una matriz de MxN, y es práctica común interpretarla como una
función escalar, una superficie definida en un subconjunto de Z2; se asume que el
tamaño de la matriz determina el dominio de la imagen y los valores en ella, el
rango. Una imagen a color se almacena y trabaja como una matriz de MxNx3, y
siguiendo el mismo razonamiento, podría interpretarse como una función escalar,
una hipersuperficie definida en un subconjunto de Z3. El grafo de una imagen en
esta representación �viviría� en un espacio de dimensión 4 difícil de visualizar,
pero lo importante es que como función sigue siendo escalar. Si se aplica la
morfología de escala de grises sobre esta representación ¿cuál es el resultado?
IEL2-2002-II-26
25
2.2 REPRESENTACIÓN ESCALAR DE LA IMAGEN
La propuesta es entonces, incorporar el color en el dominio de la imagen con
una coordenada adicional; una imagen a color tendría dos coordenadas
espaciales (filas y columnas) y una coordenada de color en que la longitud sería
únicamente 3, es decir toma valores en {0,1,2}, por ejemplo.
3 ,:Imagen ZDRDI ⊂→
El significado de los valores de la dimensión de color depende del sistema de
color que se esté usando, por ejemplo en el espacio de color RGB se podría
asignar en esa dimensión el valor 0 para el rojo, el 1 para el verde y el 2 para el
azul, con lo que una imagen de 1x1 píxel amarillo se representaría así:
I(0,0,0) = 1 (coordenada espacial 0,0, valor de la componente de color rojo)
I(0,0,1) = 1 (coordenada espacial 0,0, valor de la componente de color verde)
I(0,0,2) = 0 (coordenada espacial 0,0, valor de la componente de color azul)
Mientras que usando la representación vectorial se tendría:
I(0,0) = (1,1,0) (píxel 0,0 de color amarillo)
Un ejemplo de representación escalar de una imagen se puede ver en la figura
8, la interpretación es que las componentes de color se �apilan� en una dimensión
adicional, en este caso hacia adentro de la página; debe notarse que para una
imagen de un solo píxel de ancho se requiere una gráfica tridimensional, para
imágenes prácticas de MxN no es posible dibujar la representación escalar por ser
una función en Z4.
Para las coordenadas espaciales el origen del espacio se fija normalmente en
la esquena superior izquierda y además rara vez se repara en él, básicamente es
irrelevante; para la coordenada de color hay que fijar arbitrariamente el origen y el
IEL2-2002-II-26
26
orden de las componentes, esto puede prestarse a distintas interpretaciones como
se mostrará en la siguiente sección.
Dado que la imagen se representa como una función escalar (sólo que con
dominio de dimensión 3), es posible modificar los algoritmos de MM de escala de
grises para que funcionen sobre esta representación, extendiéndolos para que
tengan en cuenta la dimensión adicional; no hay que introducir una nueva relación
de orden.
2.3 IMAGEN: LONGITUD FINITA, LONGITUD INFINITA
Cuando se trabaja la MM a nivel teórico, las imágenes se consideran con
dominio Z2, es decir como señales bidimensionales de longitud infinita, aunque
normalmente de duración finita, es decir que tienen valores no nulos únicamente
en un subconjunto finito del dominio. En este caso, operaciones como la erosión
contraen el soporte de la imagen y otras como la dilatación lo agrandan (esto se
puede apreciar en los ejemplos de erosiones y dilataciones binarias en el apéndice
1).
Al tratar con imágenes digitales en la práctica, se tienen señales de longitud
finita, es decir sólo definidas dentro de un rectángulo de NxM en Z2, o en uno de
MxNx3 en Z3 para el caso de la representación escalar de imágenes a color. Esto
puede presentar dificultades al aplicar operaciones que cambian el dominio de la
imagen, en particular se considerará la erosión y la dilatación.
El efecto de reducción del soporte de la imagen que causa la erosión puede
interpretarse desde el punto de vista de un operador de vecindad; como para
calcular la erosión en un punto se necesitan los valores de una vecindad del punto
dada por el tamaño del EE, en las fronteras de la imagen hacen falta valores
(porque los píxeles de frontera no tienen suficientes vecinos definidos).
Normalmente esto se soluciona de dos formas: o se genera una imagen de salida
IEL2-2002-II-26
27
mas pequeña dejando sólo los píxeles para los que se tiene la vecindad
mencionada, o se suponen valores de píxeles adicionales por fuera del dominio
original de la imagen para calcular las vecindades en los puntos cercanos a la
frontera (ceros, o un reflejo de la imagen, o una extensión periódica de esta). En lo
que atañe a las coordenadas espaciales de la imagen, la diferencia no es grande,
en todo caso los elementos de estructura normalmente son pequeños (3x3) y la
información mas importante en una imagen no suele encontrarse en las fronteras.
La coordenada de color de la representación escalar presenta un problema
mayor, y es que la longitud en esa dimensión es 3 y la del EE también, por lo que
si se toma la opción de reducir el dominio, una erosión de una imagen de MxNx3
por un elemento de estructura de PxQx3 produciría un resultado de (M-P+1) x (N-
Q+1) x 1 que no sería una imagen a color según la representación escalar. Por
otra parte, si se considera la imagen como de longitud infinita y se suponen
valores por fuera de la frontera en la coordenada de color, el resultado sería una
imagen con longitud 3 en la dimensión de color pero con una sola componente no
nula, y cuál de ellas dependería del origen (arbitrario) que se escoja en la
coordenada de color para el EE.
Con la dilatación sucede lo contrario, el soporte de la imagen se agranda, con
lo cual hay nuevamente dos opciones: o se recorta la imagen de salida para que
tenga el mismo tamaño que la de entrada, que equivale a considerarla de longitud
infinita de la cual sólo es importante una parte, o se obtiene una imagen de salida
mas grande que la de entrada. Y nuevamente las coordenadas espaciales no
presentan mayor problema.
La interpretación de lo que sucede con la coordenada de color si es
problemática: si se agranda la imagen en la coordenada de color, el resultado de
una dilatación de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño
(M+P-1) x (N+Q-1) x 5, que definitivamente no es una imagen a color válida
porque tiene longitud 5 en la coordenada de color. Si por el contrario se recorta la
imagen resultante en la coordenada de color, es equivalente a tomar sólo 3 de las
IEL2-2002-II-26
28
5 componentes de color que se obtuvieron con la dilatación, y cuales 3 se tomen
depende del origen (de nuevo arbitrario) que se fije en la dimensión de color y el
orden que se les asigne a las coordenadas de color en ella.
Estos problemas se tratarán en las secciones siguientes con miras a lograr una
interpretación más intuitiva, además cabe notar que sólo se presentan si el
elemento de estructura es una imagen a color, es decir si tiene longitud 3 en la
dimensión de color. De acuerdo a la definición, el elemento de estructura podría
tener cualquier longitud en dicha dimensión, por lo que en particular podría ser una
imagen de escala de grises (longitud 1 en color) y se evitarían los problemas
mencionados. Sin embargo, esta opción es equivalente a la morfología con
ordenamiento marginal mencionada en la introducción y por esto no es de interés
en este capítulo, lo que es interesante es ver qué pueden aportar las operaciones
morfológicas sobre la representación escalar.
2.4 OPERACIONES MORFOLÓGICAS BÁSICAS
A continuación se describen las implementaciones que se hicieron de las
operaciones morfológicas básicas, en particular la elección de la forma de tratar la
coordenada de color para la dilatación y erosión, los motivos intuitivos que
justificaron esa elección y las interpretaciones y propiedades de las operaciones
que resultaron. Como se está utilizando una representación escalar para las
imágenes, todas estas operaciones se implementaron con una variación de los
algoritmos de MM de escala de grises para tener en cuenta la dimensión adicional.
2.4.1 EROSIÓN
La particularidad de la erosión en la representación escalar es que reduce la
longitud de la imagen en la dimensión de color, y el resultado puede verse bien
IEL2-2002-II-26
29
como una imagen de escala de grises (longitud 1 en dicha dimensión) o como una
imagen a color con soporte en sólo una de las componentes de color.
En las coordenadas espaciales normalmente se cambia el tamaño de la
imagen resultante para hacer que sea igual al de la de entrada; en el caso de la
dimensión de color, esto tiene el atractivo de que las operaciones sobre imágenes
a color generan también imágenes a color; elegir esta opción resuelve un
problema práctico, sin embargo los problemas de interpretación son mayores.
La imagen a color que resulta sólo tiene soporte en una de las dimensiones de
color, pero qué coordenada sea depende de qué origen se escoja para la imagen
y el EE en la dimensión de color. Por ejemplo, si se utiliza el sistema de color RGB
y se define el origen de la dimensión de color en el rojo aumentando hacia el azul,
el resultado de una erosión será una imagen a color roja únicamente; si el origen
se fija en el verde, el resultado será una imagen verde. Pero en ambos casos las
superficies resultantes serán iguales, sólo que desplazadas en el color (el
desplazar el origen sólo desplaza el resultado, no lo altera de otra forma).
Entonces se estaría fijando un origen de forma arbitraria, con el fin de obtener una
imagen a color que realmente no lo es, pues sólo contiene la información que tiene
una imagen de escala de grises: la de intensidades en una superficie.
Por esto se escogió la otra opción, cambiar el tamaño de la imagen de salida
en la dimensión de color para obtener un resultado de MxNx1, que se interpreta
como una imagen de escala de grises. Aunque pueda parecer extraño que la
erosión de una imagen a color por un EE a color produzca un resultado de grises,
existe, además de los problemas mencionados anteriormente, otra justificación
intuitiva para esta escogencia: en MM binaria y de escala de grises, una de las
interpretaciones que se le da a la erosión es que va barriendo la imagen probando
y marcando aquellos puntos donde �cabe� el EE dentro de la imagen. Entonces la
erosión a color en la representación escalar indica donde �cabe� el EE, que es
información esencialmente espacial, por lo que el resultado es una imagen de
intensidad; pero el aporte importante en el tema de color es que para determinar si
IEL2-2002-II-26
30
el EE �cabe� o no, se tienen en cuenta todas las componentes de color a la vez, lo
que hace de esta erosión una herramienta capaz de discriminar objetos en una
imagen con base en sus características de color.
Para mostrar esto, considere una imagen como la de la figura 9a representada
de forma escalar en el espacio de color RGB, si se hace una erosión con un
elemento de estructura cuadrado amarillo de 5x5, en la imagen resultante (figura
9b) se marcan las posiciones e intensidades de los objetos amarillos y blancos de
tamaño mayor o igual que 5x5, además todos los objetos que sobreviven se
encogen por el tamaño del EE (que es el aporte de la MM binaria). Si se hace la
misma erosión con un EE blanco, sólo se seleccionan los objetos que tienen
blanco o tonos grisáceos (figura 9c). La explicación de este comportamiento se
ilustra en la figura 10, en términos de dónde �cabe� el EE y hasta qué �altura�
cabe, en el sistema RGB el amarillo es la suma de rojo y verde, entonces el EE
amarillo �cabe� en los objetos que tengan rojo y verde, es decir los amarillos y los
blancos y grisáceos ya que estos últimos tienen rojo, verde y azul; por esta misma
razón, un EE blanco sólo selecciona los blancos y grises (en el sistema RGB).
Se puede notar que la erosión efectivamente puede discriminar patrones de
forma, intensidad y color, es decir preserva los aportes de la MM binaria y de
escala de grises y añade nuevas capacidades para tener en cuenta el color.
También es claro que el comportamiento de la erosión con determinado EE
depende fundamentalmente del sistema de color que se utilice, este punto se
tratará con mayor detalle en la sección 2.5.
Se presenta además otro detalle y es que los elementos de estructura con
distintas características de color no son, en general, �planos�, y entonces en
algunas de las componentes de color tienen valores no nulos, lo cual puede hacer
que el resultado de la erosión (y de las demás operaciones morfológicas) tenga
valores por fuera del rango válido. En MM de escala de grises este problema se
evita usando EE planos, pero como ya se dijo, al introducir el color en un EE esto
puede no ser posible. Es importante entonces, tener esta situación en cuenta para
IEL2-2002-II-26
31
escoger adecuadamente el elemento de estructura y posiblemente sea necesario
truncar los valores no válidos en el resultado.
Por otra parte, cabe notar que un EE de estructura a color siempre tiene
longitud 3 en la dimensión de color, por lo que (a diferencia de la MM binaria y de
grises), un EE de 1x1 píxel sí hace diferencia en las operaciones dependiendo de
su color, o mejor, de los valores de sus componentes de color y del sistema de
coordenadas que se esté utilizando.
2.4.2 DILATACIÓN
La dilatación presenta el mismo problema de la erosión al cambiar el soporte
de la imagen, desafortunadamente no parece admitir una interpretación intuitiva
como el caso de la erosión; ninguna de las dos posibles salidas al problema
produce resultados satisfactorios.
Claramente, si se escoge tratar la imagen como de longitud finita y agrandar el
dominio al hacer una dilatación, como ya se mencionó, el resultado de la apertura
de una imagen de MxNx3 por un EE de PxQx3 tendría tamaño (M+P-1)x(N+Q-
1)x5, lo que no puede interpretarse como una imagen a color (mucho menos como
de escala de grises). Si de esas 5 componentes de color se toman sólo 3 (que
equivale a fijar un origen arbitrario en la coordenada de color), el resultado es una
imagen a color en la representación escalar, pero no tiene ninguna interpretación
intuitiva.
Sin embargo, la dilatación de una imagen de grises por un EE de color si
puede verse como �poner� el EE de color en aquellas partes �marcadas� por la
imagen de grises, esta propiedad se explota en la apertura.
IEL2-2002-II-26
32
2.4.3 APERTURA
La apertura en la representación escalar tiene una interpretación bastante
intuitiva en términos de la erosión y la dilatación que la originan: la erosión localiza
(en una imagen de escala de grises) los puntos en donde cabe el EE y hasta qué
�altura� cabe, y la dilatación pone el EE en esos puntos y alturas (ver figura 11). En
este caso funciona porque se está haciendo la dilatación de una imagen de grises
por un EE a color. Además, la imagen resultante es una imagen a color que tiene
en todos sus puntos la misma relación entre los valores de las distintas
coordenadas de color que el EE.
En cierta forma, la apertura selecciona la parte de la imagen que es similar al
elemento de estructura o, haciendo el símil con un espacio vectorial, �proyecta� la
imagen sobre el EE y obtiene la �componente� en la �dirección� del EE.
La apertura de una imagen a color por un EE a color produce siempre una
imagen a color, y como en el caso de MM de escala de grises, no cambia con
desplazamientos del EE, por lo tanto no es necesario preocuparse por la posición
del origen en la dimensión de color y además no importa el orden de las
coordenadas de color en dicha dimensión. También es idempotente y conserva las
propiedades de MM binaria y de grises al seleccionar objetos con determinada
forma, pero añade la capacidad de discriminar con base en el color; en la figura 12
se ve el ejemplo de una apertura en el sistema RGB de una flor con un EE morado
de 1x1 píxel; puede notarse cómo la apertura extrae algo así como la �parte
morada� de la imagen, desde luego determinada totalmente por las características
de la primera erosión y estas a su vez por el espacio de color que se está usando;
en el sistema RGB, el morado sólo está contenido en las partes moradas y
blancas de la flor, pero muy poco en el fondo y las hojas que son las partes que
entonces se atenúan fuertemente. Además, al igual que la erosión, la apertura
preserva la capacidad de tratar formas heredada de la MM binaria y de grises, con
lo cual, si se usa un EE mayor, pueden suavizarse los detalles, por ejemplo.
IEL2-2002-II-26
33
2.4.4 OTRAS OPERACIONES
Siguiendo las definiciones, se pueden implementar sobre la representación
escalar otras de las operaciones morfológicas, pero algunas de ellas tal vez no
tengan interpretaciones intuitivas y otras probablemente no resulten útiles (esto
por supuesto depende de la aplicación) así como parece suceder con la dilatación.
Además, el hecho de que las operaciones cambien el dominio de la imagen en la
coordenada de color limita la viabilidad de algunas aplicaciones como las
erosiones y dilataciones iterativas que se usan en algoritmos de esqueletización o
las diferencias entre dilataciones y erosiones en gradientes morfológicos.
Por otra parte, en este trabajo sólo se han explorado las posibles aplicaciones
de las operaciones básicas; en la solución de un problema real podría presentarse
la oportunidad de utilizar con provecho algunas más complejas.
2.5 COMENTARIOS SOBRE LOS SISTEMAS DE COLOR
La característica principal de la morfología propuesta sobre la representación
escalar de las imágenes es que tiene en cuenta las distintas propiedades de color
de los objetos, representadas como los valores que toman las coordenadas en el
espacio de color que se esté usando.
En el espacio RGB el tono de un color está dado más por la relación entre los
distintos componentes que por sus valores absolutos, por lo cual una erosión no
puede segmentar, por ejemplo, basándose en intensidades. En el ejemplo de la
figura 12 se aprovechó la propiedad de que todos los colores están contenidos en
el blanco para seleccionar tanto las partes blancas como las moradas de la flor. El
sistema de Hering sí hace explícitos la intensidad y el color en coordenadas
distintas, por lo cual se pueden seleccionar patrones con cierto color en
intensidad. Sin embargo asigna una dirección privilegiada positiva al rojo y al
IEL2-2002-II-26
34
amarillo, y la MM no es simétrica ante estas orientaciones (como si lo son los
filtros lineales, por ejemplo) por lo que se tratan de forma distinta los colores
oponentes. El sistema CMY, por ejemplo puede utilizarse en imágenes con fondo
blanco ya que éste es el origen del sistema de coordenadas.
Lo que es claro es que distintos sistemas de color hacen explícita diferente
información, determinan los resultados de las operaciones morfológicas y la
elección adecuada del EE y se prestan mejor a determinadas aplicaciones; incluso
es posible que sea necesario utilizar variaciones de los sistemas de color
tradicionales (un ejemplo de esto en la siguiente sección) o sistemas totalmente
nuevos.
2.6 EJEMPLO DE APLICACIÓN
A continuación se ilustra una posible aplicación de las técnicas expuestas en
este capítulo aplicadas a la segmentación de fríjoles en una imagen. También se
utilizan operaciones morfológicas tradicionales de escala de grises y binarias y se
la utilidad del sistema de color de Hering para hacer explícitas ciertas
características de color.
La idea es segmentar los fríjoles de las arvejas en la imagen de la figura 13a.
Para esto se utiliza el hecho de que los fríjoles son más rojos y más oscuros que
el resto de los objetos en la imagen, y se utiliza una versión modificada del
sistema de color de Hering invirtiendo la coordenada BW para que crezca hacia lo
más oscuro. Se realiza una erosión escalar con un EE rojo oscuro y el resultado
se muestra en la figura 13b, esta es la parte mas importante de la segmentación y
la que utiliza la MM escalar a color, es de notar que como el fondo es blanco, el
sistema RGB no es hubiera sido de mucha utilidad para segmentar.
En la figura 13c se hace un cierre de escala de grises para �rellenar� los
huecos en los fríjoles, y en la 13d se realiza un umbral que posteriormente se usa
IEL2-2002-II-26
35
como máscara en la figura 13e. Como se ve, el resultado es bastante bueno.
(Para una aplicación de análisis como granulometría podría ser suficiente con
lograr la imagen binaria 13d)
2.7 SOBRE LA EFICIENCIA DE LOS ALGORITMOS
En general los algoritmos que implementan la erosión y la dilatación tienen
orden de complejidad proporcional al tamaño de la imagen y del elemento de
estructura. Si se considera que normalmente el EE es pequeño y su tamaño para
una aplicación dada es fijo, entonces las operaciones tienen orden de complejidad
MxN (filas x columnas de la imagen).
Para este trabajo las distintas rutinas se implantaron como funciones de
Matlab, y se compilaron como librerías de encadenamiento directo (dll) de
Windows usando el compilador Borland 5.5 con lo que se consiguieron tiempos de
ejecución de unos pocos segundos sobre imágenes del orden de 256x256 píxeles
(192 kB) en un computador personal. Aunque razonables, estos tiempos todavía
están lejos de servir para aplicaciones de procesamiento en tiempo real, y para las
operaciones compuestas de usos sucesivos de erosiones y dilataciones, como
aperturas, cierres el tiempo aumenta, y para filtros más complejos (como ASFs) en
imágenes grandes, puede llegar a ser considerable, del orden de algunos pocos
minutos.
En todo caso, los algoritmos son esencialmente los mismos de la MM en
escala de grises y por tanto pueden optimizarse por ejemplo haciendo erosiones y
dilataciones rápidas cuando el EE puede descomponerse apropiadamente [3].
IEL2-2002-II-26
36
2.8 CONCLUSIONES PARCIALES
Las operaciones propuestas alteran sustancialmente las características de
color de las imágenes, algunas de las operaciones ni siquiera producen imágenes
a color como resultado. En general no parecerían adecuadas para el mejoramiento
o tratamiento de imágenes para observación humana, en cambio han mostrado
aportar en la discriminación de patrones de color preservando las capacidades de
tratar formas de las MM binaria y de grises, y pueden ser útiles en aplicaciones de
análisis combinadas con otras técnicas de tratamiento de imágenes.
Los distintos sistemas de color mostraron ser determinantes en los resultados
obtenidos y en las aplicaciones para las que son útiles.
La morfología sobre la representación escalar de la imagen es una propuesta
novedosa que aún puede ser desarrollada mas, por ejemplo explorando el uso de
otros sistemas de color y buscando aplicaciones prácticas.
IEL2-2002-II-26
37
(a)
(b)
Figura 8: Representación escalar de una imagen a color (a) Imagen original de 1x10 píxeles y sus
componentes RGB. (b) Representación escalar �apilando� los componentes de color en una dimensión adicional.
(a)
(b)
(c)
Figura 9: Erosión escalar en RGB (a) Imagen original. (b) Erosión escalar con cuadrado
amarillo de 5x5. (c) Erosión escalar con cuadrado blanco de 5x5.
(a)
(b)
(c)
Figura 10: Interpretación de la erosión escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la erosión, hasta donde
�cabe� el EE en la imagen.
IEL2-2002-II-26
38
(a)
(b)
(c)
Figura 11: Interpretación de la apertura escalar en RGB (a) Imagen original: un píxel blanco, uno morado y uno amarillo. (b) EE amarillo: rojo + verde. (c) Resultado de la apertura, poner el EE
hasta donde �cabe� en la imagen.
(a)
(c)
Figura 12: Apertura escalar en RGB (a) Imagen original. (b) Apertura escalar en RGB con un EE
morado de 1x1 pixel
IEL2-2002-II-26
39
(a)
(b)
(c)
(d)
(e)
Figura 13: Ejemplo de aplicación de la MM escalar. (a) Imagen original. (b) Erosión escalar en
sistema de Hering modificado. (c) Cierre en escala de grises. (d) Umbralización. (e) Máscara sobre la imagen original.
IEL2-2002-II-26
40
MORFOLOGÍA SOBRE DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR
3.1 INTRODUCCIÓN
En este capítulo se propone aplicar las operaciones morfológicas de forma
similar al ordenamiento marginal sobre el espacio de Hering, excepto que no se
procesan las componentes de color como tales separadamente sino que se define
el concepto de zonas de color de la imagen, una división de acuerdo al color que
corresponda hasta donde sea posible con una apreciación subjetiva de las zonas
con cierto color dominante en la imagen. Se trata la zona deseada
independientemente con MM de escala de grises y luego se reincorpora la
información de la zona de color en la imagen original de tal forma que el resto de
la imagen no se afecte.
3.2 DIVISIÓN DE LA IMAGEN POR PROCESOS OPONENTES DE COLOR
Intuitivamente es sencillo determinar en una imagen que hay zonas de un color
predominante; para el procesamiento propuesto se divide la imagen en 4 zonas
disyuntas: rojiza, verdosa, azulada y amarilleja, de acuerdo a los colores básicos
en el espacio de Hering.
La idea es que un píxel de la imagen pertenece a una determinada zona de
color si su valor para ese color en coordenadas de Hering es mayor que para
todos los demás. Para poder hacer la comparación se consideran los valores
negativos de la coordenada Y-B como positivos de azul y los negativos de la
coordenada R-G como positivos de verde.
Entonces, un píxel pertenece a la zona rojiza si su valor de R-G es mayor que
la parte positiva de su valor �(R-G) (verde), que la parte positiva de su valor Y-B
IEL2-2002-II-26
41
(amarillo) si la hay y que la parte negativa de su valor �(Y-B) (azul) si la hay.
Puede verse que esto es equivalente a comparar el valor R-G con el valor
absoluto de Y-B, puesto que este último es una cantidad no negativa que contiene
los valores de amarillo y azul, y para que R-G sea mayor que |Y-B| tiene que ser
mayor que cero, con lo cual el valor de rojo tiene que ser mayor que el de verde.
La zona amarilleja se obtiene de la misma manera, y para las zonas verdosa y
azulada se utiliza el negativo de las coordenadas R-G y Y-B respectivamente.
Así, si se considera la imagen como función de un subconjunto de Z2 al
espacio de Hering, o equivalentemente una tripla de funciones escalares con los
valores de R-G, Y-B y BW, las zonas de color serían un conjunto de puntos (x,y)
en el dominio de la imagen, junto con el valor de color asociado en ese punto
(función escalar definida en esos puntos). Si se denota por (R-G)(x,y), (Y-B)(x,y)
los valores de R-G y Y-B respectivamente, en el punto (x,y):
Zona rojiza: { }),)((),(|,),)((|),)((:)),(,,( yxGRyxRyxBYyxGRyxRyx −=−>−
Zona verdosa: { }),)((),(|,),)((|),)((:)),(,,( yxGRyxGyxBYyxGRyxGyx −−=−>−−
Zona amarilleja: { }),)((),(|,),)((|),)((|)),(,,( yxBYyxYyxGRyxBYyxYyx −=−>−
Zona azulada: { }),)((),(|,),)((|),)((|)),(,,( yxBYyxByxBYyxGRyxByx −−=−>−
Debe notarse que esta división garantiza que las zonas son disyuntas, ningún
punto (x,y) pertenece a más de una, pero puede dejar píxeles sin asignar a
ninguna zona si tienen igual valor (en valor absoluto) en las dos coordenadas de
color, es decir que la división que se hace no es una partición de la imagen.
En la figura 14 se muestran las distintas zonas de color de una imagen como
imágenes de escala de grises, los puntos en negro no pertenecen a la zona.
Puede verse cómo el resultado está bastante de acuerdo con lo que
subjetivamente se hubiera esperado.
IEL2-2002-II-26
42
3.3 TRATAMIENTO DE LAS ZONAS DE COLOR
Con la definición anterior, cada zona de color es una función de intensidades
que puede tratarse con todas las operaciones de la morfología de escala de grises
para seleccionar o remover características, mejorar conectividad, suavizar, etc.
Para hacer este tratamiento hay que tener en cuenta que las zonas no son
exactamente imágenes de escala de grises normales, ya que en general no están
definidas en todo el dominio de la imagen original, debe recordarse que según la
definición en la sección anterior la zona es un conjunto de puntos junto con una
función definida únicamente en ellos (en la figura 14 las partes negras no tienen
valor 0 sino que no pertenecen a la zona). Esto en teoría no afecta la aplicación de
las operaciones morfológicas, pero en la práctica hay que asignar valores no
definidos (o grandes negativos) en los puntos que no pertenecen a la zona para
lograr el efecto deseado.
Por otra parte, las operaciones morfológicas básicas cambian el dominio de la
función, por ejemplo las aperturas y erosiones lo contraen y los cierres y
dilataciones lo agrandan, esto es importante si se desea reincorporar la
información de la zona en la imagen original después de tratarla.
3.4 REINCORPORACIÓN DE LA INFORMACIÓN EN LA IMAGEN
La extracción de las zonas de color y el procesamiento de estas puede servir
por si solo en algunas aplicaciones, pero también sería deseable poder cambiar
las zonas de color sobre la imagen original, o lo que es equivalente, reincorporar la
información en la imagen después del procesamiento. Esto presenta un
inconveniente si las operaciones cambian el dominio de la imagen, que es lo que
sucede con cualquiera que utilice un EE mayor de 1x1 píxel. En este caso el
dominio de la zona de color cambia y hay al menos dos opciones: reemplazar la
IEL2-2002-II-26
43
información de la imagen con la de la zona de color en los píxeles pertenecientes
a la zona de color original o en los pertenecientes a la nueva zona de color
(después de procesamiento). En general puede escogerse cualquiera de las dos
(incluso otras opciones) dependiendo de la aplicación y del resultado deseado,
aquí se tratarán dos casos particulares.
El primero corresponde a los procesamientos morfológicos que agrandan el
dominio de la zona de color, como dilataciones o cierres, que además resaltan los
píxeles pertenecientes a la zona y mejoran la conectividad de esta. En este caso
se escogió reemplazar en la imagen original la información de la zona de color
después del procesamiento, así se intensifica el color que se dilató y se �rellenan�
los �huecos� del color oponente dentro de la zona escogida. Un ejemplo se
muestra en la figura 15, la figura 15b corresponde a la zona azulada de la imagen
de la figura 15a, en 15c se muestra la zona azulosa dilatada por un EE de 3x3 y
altura 0.1, al reincorporar la información de la nueva zona azulada en la imagen
original se obtiene el resultado mostrado en la figura 15d. Si se hubiera
reemplazado la información sólo en la zona azulada original no se habría obtenido
el efecto espacial de agrandar la parte azul de la imagen.
El segundo son los procesos que encogen el dominio de la zona de color como
aperturas y erosiones, que pueden servir para eliminar objetos pequeños y
desacentuar el color en toda la zona. En este caso se escogió reemplazar en la
imagen original la información de la zona de color original, así se reduce tanto la
intensidad del color como su distribución espacial en la imagen. Un ejemplo se
ilustra en la figura 16: se erosionó la zona amarilleja de la imagen con un EE de
3x3 y altura 0.1, puede verse como la zona amarilleja original (16b) se contrae y
atenúa (16c); el resultado final, que se muestra en la figura 16d, tiene la zona
amarilleja atenuada pero el resto de la imagen no sufrió modificaciones. Además,
si se hubiera reincorporado a la imagen sólo la zona amarilleja después de
procesar (que es mas pequeña), en los bordes de ésta hubieran quedado zonas
con amarillo fuerte que corresponden a la zona amarilleja original.
IEL2-2002-II-26
44
En general se consiguen buenos efectos visuales reemplazando en la imagen
original: la zona de color después de procesar cuando la operación agranda el
dominio de ésta, y la zona de color antes de procesar cuando la operación lo
contrae.
3.5 EJEMPLO DE APLICACIÓN
A continuación se ilustra con un ejemplo una posible aplicación de las técnicas
descritas para mejorar la visibilidad de unas manchas rojas en una foto de tejido.
En el procesamiento de la zona de color se emplean distintas operaciones
morfológicas de escala de grises para obtener el resultado.
En la figura 17a se muestra la imagen original, que tiene unas manchas rojizas
muy tenues y por tanto difíciles de ver; se extrae la zona rojiza que se muestra en
la figura 17b, para mejorar la conectividad se hace un cierre con un EE plano
circular de radio 10 (figura 17c), con una apertura con EE de 5x5 se eliminan las
zonas pequeñas (figura 17d), y con una dilatación se intensifican y agrandan un
poco las manchas (figura 17e). El resultado se muestra en la figura 17f, puede
observarse que se acentuaron adecuadamente las manchas que eran muy
difíciles de ver en la imagen original (pero que se ven si se observa con cuidado).
3.6 CONCLUSIONES PARCIALES
La división de la imagen por procesos oponentes de color está generalmente
de acuerdo con la percepción (subjetiva) de zonas con colores dominantes.
Las operaciones morfológicas propuestas reincorporando la información de la
zona tratada en la imagen original tienen interpretaciones intuitivas en términos de
agrandar, reducir, intensificar, atenuar detalles de acuerdo al color.
IEL2-2002-II-26
45
Con estas técnicas sólo se tratan las partes de interés de la imagen, las demás
no sufren modificaciones, y aún las zonas tratadas no se alteran tanto como para
que pierdan sus características esenciales, por esto la morfología sobre esta
división resulta útil para mejoramiento de imágenes y resaltado de características.
IEL2-2002-II-26
46
(a)
(b)
(c)
(d)
(e)
Figura 14: Zonas de color de una imagen. (a) Imagen original. (b) Zona rojiza. (c) Zona verdosa.
(d) Zona amarilleja. (e) Zona azulada
IEL2-2002-II-26
47
(b)
(c)
(d)
(e)
Figura 15: Dilatación de la zona azulada de una imagen. (a) Imagen original. (b) Zona azulada. (c) Zona azulada dilatada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes
b y c se muestran con colores invertidos para ilustrar mejor los detalles).
(b)
(c)
(d)
(e)
Figura 16: Erosión de la zona amarilleja de una imagen. (a) Imagen original. (b) Zona amarilleja.
(c) Zona amarilleja erosionada por un EE de 3x3 y altura 0.1. (d) Imagen resultante. (las imágenes b y c se muestran con colores invertidos para ilustrar mejor los detalles).
IEL2-2002-II-26
48
(a)
(b)
(c)
(d)
(e)
(f)
Figura 17: Ejemplo de aplicación de MM por procesos oponentes. (a) Imagen original. (b) Zona rojiza (c) Cierre con EE circular radio 10. (d) Apertura EE 5x5. (e) Dilatación EE 3x3 altura 0.1.
(f) Imagen resultante
IEL2-2002-II-26
49
RESUMEN DE CONCLUSIONES
Se presentan tres distintas alternativas del uso de MM en el tratamiento de
imágenes a color.
En la primera, se mejoró una propuesta de MM vectorial [5] y se obtuvo un
detector de bordes en imágenes a color: el gradiente morfológico en el espacio
HSV que permite tener en cuenta los cambios de color tanto como los de
intensidad y al tratar la coordenada h circularmente (idea propuesta en [6]),
corrige el problema de los rojos que tiene la versión con coordenada h lineal.
La segunda es una propuesta original para MM en imágenes a color: una
versión de la MM de escala de grises extendida a funciones con dominio de
dimensión 3 sobre una representación escalar de las imágenes. Algunas de las
operaciones no son fáciles de interpretar o alteran mucho la imagen, sin embargo
se encontró que la erosión y apertura son útiles para discriminar patrones de
forma y color, lo que representa un aporte adicional sobre la MM binaria y de
escala de grises. Por otra parte se vio que los distintos sistemas de color juegan
un papel fundamental y abren una gama de posibilidades para escoger el más
adecuado de acuerdo a la aplicación.
Finalmente se presentó una MM que trabaja sobre una división de la imagen
por procesos oponentes de color, las operaciones sólo alteran partes de la imagen
y tienen interpretaciones muy intuitivas en términos de cómo alteran las zonas de
color de la imagen. En principio se encontró que puede servir en aplicaciones
como resaltar o atenuar características de color. Por otra parte, las zonas de color
se tratan con MM de escala de grises, por lo que se tiene a disposición toda una
serie de herramientas muy bien estudiadas y desarrolladas.
IEL2-2002-II-26
50
APÉNDICE 1 – MORFOLOGÍA MATEMÁTICA BINARIA Y DE ESCALA DE GRISES
A continuación se resumen las definiciones más básicas de la MM binaria y de
escala de grises, para un tratamiento más completo véanse las referencias [2-4].
DEFINICIONES PREVIAS
Un operador σ es creciente si preserva el orden de las imágenes (en imágenes
binarias la relación de orden ≤ es la inclusión ⊂ ): )()( BABA σσ ≤→≤
Es extensivo si contiene al resultado: )(AA σ≤
Antiextensivo si está contenido en el resultado: AA ≤)(σ
E idempotente si aplicarlo más de una vez no produce cambios adicionales en
el resultado: ))(()( AA σσσ =
MORFOLOGÍA BINARIA
Una imagen binaria está determinada por el conjunto de píxeles con valor 1 en
ella, entonces se representa como el subconjunto del espacio Zn formado por
dichos píxeles:
nZA ⊂ :A binariaImagen
La traslación de A esta dada por:
}algún para |{ AaxacZcA nx ∈+=∈=
IEL2-2002-II-26
51
La reflexión de A es:
}algún para |{A AaacZc n ∈−=∈=∨
La dilatación de A por el elemento de estructura B equivale a barrer el origen
del EE por cada punto de la imagen A (ver figura A1.1) y allí poner el EE:
B(A)δBAAa
aB U∈
==⊕
La dilatación conmuta con la unión, es creciente y además extensiva si el
EE contiene el origen.
La erosión de A por el EE B equivale a marcar con el origen del elemento de
estructura los puntos donde éste �cabe� dentro de la imagen (ver figura A1.2):
A}|BE{x(A)εBAΘ xN
B ⊆∈==
La erosión conmuta con la intersección, es creciente y además antiextensiva si
el EE contiene el origen.
La apertura de A por el EE B, que es creciente, antiextensiva e idempotente, se
define como:
BBA(A)BA B ⊕Θ== ) (γo
La apertura selecciona aquellas partes de la imagen donde es posible encajar
el EE (figura A1.3).
El cierre, que es creciente, extensivo e idempotente, está dado por:
BBA(A)BA B )( Θ⊕==• ϕ
El cierre tiende a fusionar regiones suficientemente cercanas en la imagen
(figura A1.4) mejorando así la conectividad de los objetos.
IEL2-2002-II-26
52
La erosión y la dilatación, así como a la apertura y el cierre están relacionados
por las relaciones de dualidad:
BABA cc∨
Θ=⊕ )( y BABA cc∨
•=)( o
La idea es que lo que un operador le hace a la imagen, su dual (reflejado) lo
hace al fondo (el complemento).
MORFOLOGÍA DE ESCALA DE GRISES
Una imagen de escala de grises se representa como una función (superficie)
que a cada punto del dominio de asigna un valor de intensidad:
RZf n →: :f grises deImagen
Si F y H son los subconjuntos de Zn donde están definidas f y h
respectivamente, la dilatación de la imagen f por el elemento de estructura h es:
{ } FzxHzzhzxf(f)δhf h ∈−∈+−==⊕ ,|)()(max
Y la erosión de la imagen f por h es:
{ })()(min)( zhzxffhfHz
h −+==Θ∈
ε
La dilatación (dependiendo del elemento de estructura que se use) agranda las
zonas claras de la imagen y la erosión las oscuras (ver figura A1.5). Si el EE que
se usa es plano (todos sus valores son 0), la dilatación equivale a un filtro máximo
móvil y la erosión a un mínimo, ambos con ventana dada por la forma del EE.
La apertura y el cierre se definen igual que para imágenes binarias como
composiciones de erosiones y dilataciones.
IEL2-2002-II-26
53
GRADIENTES MORFOLÓGICOS
Los gradientes morfológicos se consiguen con diferencias entre la imagen y
operadores extensivos y antiextensivos sobre ésta. Los tres tipos de gradientes
morfológicos más usados se definen así [7]:
Gradiente de Beucher: ) ()()( BIBIIg Θ−⊕=
Gradiente interno: ) ()( BIIIg Θ−=−
Gradiente externo: IBIIg −⊕= )()(
Donde B es el elemento de estructura elemental de la grilla considerada.
IEL2-2002-II-26
54
(a)
(b) (c)
Figura A1.1: Dilatación binaria. (a) Imagen original. (b) Elemento de estructura.
(c) Resultado de la dilatación.
(a)
(b)
Figura A1.2: Erosión binaria. (a) Imagen original. (b) Erosión binaria con un EE cuadrado de 5x5,
nótese cómo sólo se marcaron los objetos de 5x5 o más.
(a)
(b)
Figura A1.3: Apertura binaria. (a) Imagen original. (b) Apertura binaria con EE circular de radio 5.
IEL2-2002-II-26
55
(a)
(b)
Figura A1.4: Cierre binario. (a) Imagen original. (b) Cierre binario con EE circular de radio 5.
(a) (b)
(c)
Figura A1.5: MM en escala de grises. (a) Imagen original. (b) Erosión con cuadrado de 3x3.
(c) Dilatación con cuadrado de 3x3.
Figura A1.6: Gradiente morfológico binario interno. (a) Imagen original. (b) Gradiente morfológico interno.
IEL2-2002-II-26
56
APÉNDICE 2 – SISTEMAS DE COLOR
Este apéndice comprende un breve resumen de los sistemas de color a los que
se hace referencia en el documento, mas información se puede encontrar por
ejemplo en [15].
SISTEMA RGB
El sistema de color RGB (Red, Green, Blue o rojo, verde, azul) representa en
tres coordenadas las cantidades de rojo, verde y azul que combinadas
aditivamente producen un color dado. Es la representación más directa para usar
con monitores y televisores, que funcionan con combinaciones aditivas de luz roja,
verde y azul (ver figura A2.1).
SISTEMA CMY
El sistema de color CMY (Cyan, Magenta, Yellow o aguamarina, morado,
amarillo) representa en tres coordenadas las cantidades de aguamarina, morado y
amarillo que combinadas sustractivamente (como al usar pigmentos) producen un
color dado. La idea de la combinación sustractiva de pigmentos es la base de los
sistemas de impresión a color, por ejemplo. Los valores de CMY se pueden
obtener de los de RGB con la transformación:
−=
BGR
YMC
1
IEL2-2002-II-26
57
SISTEMA DE HERING
El sistema de color de Hering (o NCS: Natural Color System) representa un
punto en el espacio de color mediante una coordenada de intensidad y dos
coordenadas de procesos oponentes de color: Rojo-Verde y Amarillo-Azul (BW,
R-G, Y-B). Está basado en la observación (que está justificada fisiológicamente
por los procesos oponentes a nivel de células ganglionares en el sistema visual
humano) de que no hay un color intermedio entre el rojo y el verde ni entre el
amarillo y el azul, en otras palabras, que no existe por ejemplo un �rojo-verdoso�
(ver figura A2.2).
La representación en el espacio de Hering de un color se puede obtener de los
valores RGB con la transformación lineal:
−
−=
−−
BGR
BWBYGR
3/13/13/112/12/1
011
El espacio de Hering hace explícitos los colores básicos, incluyendo el amarillo
(que por ejemplo no es explícito en el sistema RGB).
SISTEMA HSV
En el sistema HSV (hue, saturation, value, o matiz, saturación, valor), la
coordenada circular h codifica el color con origen arbitrario en un tono rojizo. La
saturación es la medida de la �pureza� del color (o que tan �diluido� con blanco
está), valores de s cercanos a 0 indican baja cromaticidad, cercanos a 1 un color
puro. El valor es una coordenada de intensidad (ver figura a2.3).
IEL2-2002-II-26
58
Figura A2.1: Sólido de color RGB
Figura A2.2. Sistema de color de Hering
Figura A2.3. Sólido de color HSV.
IEL2-2002-II-26
59
REFERENCIAS BIBLIOGRÁFICAS
[1] MATHERON G, Random Sets and Integral Geometry, Wiley, New York, 1975.
[2] SERRA Jean, Image Analysis and Mathematical Morphology, Academic
Press, London, 1982.
[3] HARALICK R.M. and SHAPIRO L. Computer and Robot Vision. Addison-
Wesley, 1993.
[4] GONZÁLEZ R.C. and WOODS R.E. Digital Image Processing. Addison-
Wesley, 1992.
[5] LOUVERDIS G. VARDAVOULIA M.I. ANDREADIS I. TSALIDES Ph. A new
approach to morphological color image processing. Pattern Recognition,
vol.35, no.8, Aug. 2002. pp. 1733-41.
[6] HANBURY Allan G., SERRA Jean. Morphological operators on the unit circle.
IEEE Transactions on Image Processing, vol. 10, no.12, December 2001. pp.
1842-1850
[7] RIVEST Jean F., SOILLE Pierre, BEUCHER Serge. Morphological gradients. Proc. SPIE "Image Science and Technology", San Jose, California, Feb.
1992.
[8] BEUCHER Serge. The Watershed transformation applied to image
segmentation. 1Oth Pfefferkorn Conf. on Signal and Image Processing in
Microscopy and Microanalysis, 16-19 sept. 1991
IEL2-2002-II-26
60
[9] SERRA Jean, VINCENT Luc. An overview of morphological filtering. IEEE
Trans. on Circuits, Systems and Signal Processing, Vol. 11, N°1, 1992, pp.
47-108.
[10] VINCENT Luc. Granulometries and opening trees. Fundamenta Informaticae,
Vol. 41, No. 1-2, IOS Press, January 2000, pp. 57-90.
[11] BLOOMBERG Dan S. VINCENT Luc. Pattern matching using the blurr hit-
miss transform. Journal of Electronic Imaging, April 2000
[12] DI RUBERTO, DEMPSTER, KHAN, JARRA. Analysis of infected blood cell
images using morphological operators. Image and Vision Computing, vol. 20,
2002, pp. 133-146
[13] LANGE, VINCENT. Advanced Gray-Scale Morphological Filters for the
Detection of Sea Mines in Side-Scan Sonar Imagery. Proc SPIE Vol. 4038,
"Detection and Remediation Technologies for Mines and Minelike Targets",
August 2000, pp. 362-372.
[14] VARDAVOULIA, ANDREADIS, TSALIDES. Hardware implementation of soft
color morphological operations. Opt-Eng, vol. 41, no. 7, july 2002, pp. 1536-
1545.
[15] Color Models & Color Wheels, en:
http://www.handprint.com/HP/WCL/color6.html (consultada en 10-ene-2003)