Avances en visión artificial gracias al Aprendizaje Profundo
Javier Becerra ElcintoDr. Ing. Telecomunicación
Un poco de historia
Imagen: Revista Trimestral de Histología Normal y Patológica, Santiago Ramón y Cajal (1888/1889)
Perceptron
La unidad básica de una red neuronal (McCulloch–Pitts/Rosenblatt [1957])
Le siguieron Adaline [1960], Neocognitron [1980], y otros modelos más complejos.
Algoritmos ML y Visión Artificial
Algoritmos tipo “feature engineering”Incorporan conocimiento del dominio al problema
Reconocimiento de objetos con SIFT [1999]
Detección de personas - HOG [2005]
Algoritmos tipo “data-driven”Los propios datos determinan el comportamiento del algoritmo
Reconocimiento facial con Eigenfaces [1987]
Segmentación usando GrabCut [2004]
Reconocimiento de dígitos manuscritos (MNIST) [1998]
¿Y el Aprendizaje Profundo?
Primera aparición registrada del término Deep Learning en 2000.
Popularizado por artículo del 2006.
Quiz: ¿en qué año se publicó el algoritmo que se considera como el primer ejemplo de “Deep Learning”?
Aprendizaje profundo
¡¡¡En 1965!!!
GMDH (8 capas) [2015]
Aprendizaje profundo
¿Por qué empezamos a oir hablar de Deep Learning 40 años más tarde?
Las soluciones de aprendizaje profundo no se han podido implementar de forma práctica hasta que:
●Se ha dispuesto de grandes bases de datos de test para entrenamiento.
●La capacidad de proceso disponible (en CPUs, GPUs, múltiples CPUs/GPUs conectados en red…) ha reducido los tiempos de cálculo hasta valores razonables.
Aprendizaje profundo
¿Y en qué consiste el Aprendizaje profundo?
No hay una definición única, pero casi todas coinciden en que:Se trata de sistemas de aprendizaje multicapa en cascada, con unidades de procesamiento no lineal.
Pueden utilizar aprendizaje supervisado o aprendizaje no supervisado.
El aprendizaje de múltiples niveles de características o representaciones de datos: las características de más alto nivel se derivan de las características de nivel inferior para formar una representación jerárquica.
Aprendizaje profundo
Vamos a ilustrarlo con una red neuronal sencilla:
playground.tensorflow.com
Aprendizaje profundo: arquitectura jerárquica
ImageNet Large Scale Visual Recognition Challenge
1.200.000 imágenes clasificadas en 1000 categorías
ImageNet Large Scale Visual Recognition Challenge
Presentación de Kaiming He en ICCV15
AlexNet: ImageNet Classification with Deep Convolutional Neural Networks [2012]
Algunas aplicaciones
Imagen generada mediante la red DeepDreamImagen generada mediante la red DeepDream
Google Deep Brain
●Red neuronal de convolución●8 capas●3 millones de nodos●1.000 millones de conexiones●16.000 procesadores●10.000.000 de imágenes (sin etiquetar, extraídas de Youtube)
…logran “descubrir” de forma autónoma la imagen de un gato
Quoc Le et al. [2011]
Facebook’s DeepFace
FBI “Next Generation Identification”: precisión del 85%.
Facebook’s DeepFace: precisión del 97%.
Entrenada a partir de 4 millones de fotografías de usuarios.
DeepFace [2014]
Generative Adversarial Networks
Un gran avance en los métodos de generación de imágenes utilizando dos redes neuronales que compiten entre sí:●El discriminador: un “detective” que se conoce todas las obras de, digamos, Miró, y detecta cualquier Miró a la legua.●El generador: un “falsificador” incansable, y que nunca ha visto un ¡¡cuadro de Miró!! Él crea obras nuevas “partiendo de la nada”, y en función de la reacción del detective, va corrigiendo su estilo hasta lograr engañarlo.
Una mejora sustancial frente a métodos de optimización con maximización a posteriori utilizados previamente.
Ian Goodfellow et al [2014]
Generative Adversarial Networks
Algunos ejemplos online:● Image to image (basado en Isola et al. [2016])● Coloreando imágenes (basado en Zhang et al [2016])
GRACIAS POR SU ATENCIÓN
Top Related