Post on 13-Feb-2017
Daniel Vila Suero Ontology Engineering Group
Pensando en los datos
Cita en la BNE: RDA y Linked Data15 Abril 2016
Grupo de investigación dirigido por Asunción Gómez Pérez
Linked Data-based Data Integration
Semantic e-Science
(Social) Semantic
Web
NLP and Multilingualism
Ontological Engineering
1995
1997 2000
2004 2008
Ontology Engineering Group 9
JSON-LD
SPARQLMotor de búsqueda NoSQL DB
Aplicación + API (Javascript)
Cliente HTTP API
Indexación y ranking
SPARQL endpoint
Ontología BNE
Acceso
Aplicación
JSON-LD
Datos
• La Web: Javascript + CSS3 + HTML5 + LD
• Crecer: Escalabilidad con el número de usuarios
• Los usuarios: Apps and us
• ”Pensar en los datos”: Datos primero, aplicación después
Arquitectura pensada para..
¿Pensar en los datos?
JSON-LD
SPARQLMotor de búsqueda NoSQL DB
Aplicación + API (Javascript)
Indexación y ranking
Ontología BNE
Aplicación
JSON-LD
Datos
Problema a resolver
Solución
Solución
“Pensar en los datos”: Abordar las soluciones desde el modelo de datos
(aplicación)
(datos)
“Pensar en los datos” con un ejemplo
¿De dónde vienen estas sugerencias? (2015)
Objetivo inicial (2014): Mostrar obras de un mismo tema
¿Cómo hacer esto?
Objetivo inicial (2014): Mostrar obras de un mismo tema
Situación inicial (60’s): Los temas están en los bibliográficos
Registros bibliográficos (Ediciones)
Registros autoridad (Obras)
Tema
Tema
Aplicación
Datos
Aplicación
?
Soluciones (2014): “Clásica” vs. “Pensar en los datos”
?Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras sobre un mismo tema
“Clásica” (1)Pregunto por ediciones sobre el mismo tema
Ediciones
Obras
Aplicación
Temas
Tema = Novelas picarescas
Ediciones (muchas)
Problemas: No es lo que queríamos. ¿cómo presentamos los resultados? (relevancia)
Soluciones (2014): “Clásica” vs. “Pensar en los datos”
?Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras sobre un mismo tema
“Clásica” (2)Pregunto por ediciones sobre el mismo tema
y por cada edición pregunto por su obra
Ediciones
Obras
Aplicación
Temas
Tema = Novelas picarescas
Enlaces a obras
Problemas: Dos consultas, + costoso, +complejo NO facilmente reutilizable
1
Recuperar obras
2 Obras
1
2
Pensar en los datos (2014)
?Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras sobre un mismo tema
Pensemos en los datos Obra
Edición Temas
Nueva relación (FRBR, RDA)
Ediciones
Obras
Temas
Nuevos enlaces
Pensar en los datos (2014)Pregunto por obras sobre el mismo tema
Ediciones
Obras
Aplicación
Temas
Tema = Novelas picarescas
Obras
Ventajas: Aplicación + rápida, menos compleja Beneficia a todo el servicio REUTILIZABLE Mejor presentación de resultados
(relevancia, agregación,
presentación)
Pensar en los datos (2015): Sugerencias
Misma funcionalidad (usando el buscador) Obras que compartan temas
Obras
Temas
Pensar en los datos (2016?): Valor añadido
Explotar la misma idea en distintos contextos:
> Obras con temas similares > Autores que hablan de los mismos temas > Temas que coinciden en diferentes obras
Obras
Temas
• Mayor impacto en todo el servicio: APIs, Motor de búsqueda, algoritmos de relevancia.
• Reutilización de funcionalidades
• El poder de los enlaces (the network effect):
“Cada nuevo enlace representa nuevas posibilidades”
Beneficios de pensar en los datos