Big Data: Tendencias 2016 - WordPress.com...Big Data: Tendencias 2016 José Antonio Guerrero...

Big Data: Tendencias 2016

José Antonio Guerrero

jaguerrerod@ono.com BuleBar Café 2 Marzo 2016

Mi etapa profesional en Gestión Sanitaria

Estadística Multivariable vs Aprendizaje Automático

MACHINE LEARNING Arthur Samuel (1959): "Field of study that gives computers the ability to learn without being explicitly programmed“

Estadística Multivariable Paramétrica

Hipótesis:

Normalidad No correlación de errores Homocedasticidad No colinealidad

Bondad del ajuste:

Grados de libertad Descomposición de la varianza Estimaciones puntuales y por IC de errores y coeficientes Contraste de hipótesis

Asumir hipótesis sobre la distribución de los datos

Mal manejo de la colinealidad (Convergencia y estabilidad de las

soluciones)

La limitación en la forma funcional del modelo

Alta sensibilidad a observaciones extremas

Mal manejo de observaciones desconocidas

Problemas de escalabilidad

Mal manejo variables >> casos

Debilidades

Reproducibles Rápidos de ajustar Modelos interpretables (expresión analítica) Importancia relativa de variables Inferencia (bondad de ajuste, coeficientes)

Fortalezas

9 de cada 10 Científicos de Datos están buscando palabras con ‘V’ en vez de trabajando en Big Data

ML para Big Data Aplicaciones distribuidas

Doug Cutting

Volumen

Machine Learning for Spark

Variedad Bases de datos noSQL: Bases documentales: MongoDB, DynamoDB Bases de datos orientadas a columna: Hbase, Cassandra…

Velocidad

John Langford Elmer Fudd Vorpal Rabbit

David Sculley

Sofia – ML

FTRL : Follow the regularized leader

Hashing

Velocidad

Biclustering

Semisupervised Learning: Label propagation

Manifold

Semisupervised Learning: Label propagation

Selección de variables – Reducción dimensionalidad PCA (Análisis Componentes Principales) Stepwise Regularización: Lasso Ensembling: Muestreo de variables T-SNE (t-Distributed Stochastic Neighbor Embedding)

Big Data: Tendencias 2016 - WordPress.com...Big Data: Tendencias 2016 José Antonio Guerrero...

Documents

Transcript of Big Data: Tendencias 2016 - WordPress.com...Big Data: Tendencias 2016 José Antonio Guerrero...

LAS 10 TENDENCIAS PRINCIPALES DE big data · Apache Spark, un antiguo componente del ecosistema de Hadoop, se está convirtiendo en la plataforma de big data preferida entre las empresas.

Agenda ¿Qué es Big Data? ¿Por qué usar Big Data? ¿Quién usa Big Data? Hadoop Arquitectura de Hadoop.

Jornada de Información sobre la ... - topografia.upm.es. Topografia...topografia big data topografía big data 3dsatellte 'big topografia topografia Ãopografia big data fotogrametría,

Big Data para mortales

PostgreSQL Big Data

Introducció a Open Data / Big Data

Big data medellin_seminario_internacional

· 2020. 11. 18. · Técnico de Soporte Big Data / Técnico Aplicaciones Big Data/Responsable... Data Engineer / Ingeniero Big Data/ Ingeniero gobierno del dato Consultor Big Data

Ingenieria de Big Data

Nuevas tendencias del consumidor asociados con el Big Data ...

Proyecto big data

Plan Big Data

Big data para principiantes

Repensando big data

comercio Aplicaciones del Big Data en el 13 de Diciembre ... · Aplicaciones del Big Data en el comercio Alex Rayón Jerez , @alrayon, alex.rayon@deusto.es Nuevas tendencias en la

Comercialización, financiación y big dataEsquema • Introducción •El estado del “big data” y la e-science Big data y economía • La potencialidad de big data –Comercialización

Big data to Relevant Data //Ibertech Courses

Big data, universidad y....

Casos big data

Mejor proyecto big data