Download - Avances en visión artificial gracias al Aprendizaje Profundo · Aprendizaje profundo ¿Por qué empezamos a oir hablar de Deep Learning 40 años más tarde? Las soluciones de aprendizaje

[email protected]

Avances en visión artificial gracias al Aprendizaje Profundo

Javier Becerra ElcintoDr. Ing. Telecomunicación

[email protected]

Un poco de historia

Imagen: Revista Trimestral de Histología Normal y Patológica, Santiago Ramón y Cajal (1888/1889)

[email protected]

Perceptron

La unidad básica de una red neuronal (McCulloch–Pitts/Rosenblatt [1957])

Le siguieron Adaline [1960], Neocognitron [1980], y otros modelos más complejos.

https://en.wikipedia.org/wiki/Perceptron

[email protected]

Respuestas neuronales en el cortex visual V1

D. Hubel & T. Wiesel [1968]

[email protected]

Algoritmos ML y Visión Artificial

Algoritmos tipo “feature engineering”Incorporan conocimiento del dominio al problema

Reconocimiento de objetos con SIFT [1999]

Detección de personas - HOG [2005]

Algoritmos tipo “data-driven”Los propios datos determinan el comportamiento del algoritmo

Reconocimiento facial con Eigenfaces [1987]

Segmentación usando GrabCut [2004]

Reconocimiento de dígitos manuscritos (MNIST) [1998]

http://dx.doi.org/10.1109/ICCV.1999.790410

http://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf

https://doi.org/10.1364%2FJOSAA.4.000519

https://www.microsoft.com/en-us/research/publication/grabcut-interactive-foreground-extraction-using-iterated-graph-cuts/?from=http%3A%2F%2Fresearch.microsoft.com%2Fapps%2Fpubs%2Fdefault.aspx%3Fid%3D67890#

http://dx.doi.org/10.1109/5.726791

[email protected]

Aprendizaje profundo

CS231N (Stanford University)

http://cs231n.stanford.edu/

[email protected]

¿Y el Aprendizaje Profundo?

Primera aparición registrada del término Deep Learning en 2000.

Popularizado por artículo del 2006.

Quiz: ¿en qué año se publicó el algoritmo que se considera como el primer ejemplo de “Deep Learning”?

[email protected]


¡¡¡En 1965!!!

GMDH (8 capas) [2015]

https://arxiv.org/abs/1404.7828

[email protected]


¿Por qué empezamos a oir hablar de Deep Learning 40 años más tarde?

Las soluciones de aprendizaje profundo no se han podido implementar de forma práctica hasta que:

●Se ha dispuesto de grandes bases de datos de test para entrenamiento.

●La capacidad de proceso disponible (en CPUs, GPUs, múltiples CPUs/GPUs conectados en red…) ha reducido los tiempos de cálculo hasta valores razonables.

[email protected]


¿Y en qué consiste el Aprendizaje profundo?

No hay una definición única, pero casi todas coinciden en que:Se trata de sistemas de aprendizaje multicapa en cascada, con unidades de procesamiento no lineal.

Pueden utilizar aprendizaje supervisado o aprendizaje no supervisado.

El aprendizaje de múltiples niveles de características o representaciones de datos: las características de más alto nivel se derivan de las características de nivel inferior para formar una representación jerárquica.

[email protected]


Vamos a ilustrarlo con una red neuronal sencilla:

playground.tensorflow.com

http://playground.tensorflow.com/

[email protected]

[email protected]

Aprendizaje profundo: arquitectura jerárquica

[email protected]

ImageNet Large Scale Visual Recognition Challenge

1.200.000 imágenes clasificadas en 1000 categorías

[email protected]

ImageNet Large Scale Visual Recognition Challenge

Presentación de Kaiming He en ICCV15

AlexNet: ImageNet Classification with Deep Convolutional Neural Networks [2012]

[email protected]

Algunas aplicaciones

Imagen generada mediante la red DeepDreamImagen generada mediante la red DeepDream

[email protected]

Google Deep Brain

●Red neuronal de convolución●8 capas●3 millones de nodos●1.000 millones de conexiones●16.000 procesadores●10.000.000 de imágenes (sin etiquetar, extraídas de Youtube)

…logran “descubrir” de forma autónoma la imagen de un gato

Quoc Le et al. [2011]


[email protected]

Facebook’s DeepFace

FBI “Next Generation Identification”: precisión del 85%.

Facebook’s DeepFace: precisión del 97%.

Entrenada a partir de 4 millones de fotografías de usuarios.

DeepFace [2014]

https://research.fb.com/publications/deepface-closing-the-gap-to-human-level-performance-in-face-verification/

[email protected]

Generative Adversarial Networks

Un gran avance en los métodos de generación de imágenes utilizando dos redes neuronales que compiten entre sí:●El discriminador: un “detective” que se conoce todas las obras de, digamos, Miró, y detecta cualquier Miró a la legua.●El generador: un “falsificador” incansable, y que nunca ha visto un ¡¡cuadro de Miró!! Él crea obras nuevas “partiendo de la nada”, y en función de la reacción del detective, va corrigiendo su estilo hasta lograr engañarlo.

Una mejora sustancial frente a métodos de optimización con maximización a posteriori utilizados previamente.

Ian Goodfellow et al [2014]


[email protected]

Generative Adversarial Networks

Algunos ejemplos online:● Image to image (basado en Isola et al. [2016])● Coloreando imágenes (basado en Zhang et al [2016])

https://affinelayer.com/pixsrv/


http://demos.algorithmia.com/colorize-photos/

http://richzhang.github.io/colorization/

[email protected]

GRACIAS POR SU ATENCIÓN