Daniel A. Seara [email protected] Fundamentos funcionales de FAST para SharePoint.
-
Upload
manuelita-moraga -
Category
Documents
-
view
9 -
download
0
Transcript of Daniel A. Seara [email protected] Fundamentos funcionales de FAST para SharePoint.
Daniel A. [email protected]
Fundamentos funcionales de FAST para SharePoint
FUNDAMENTOS Y PROBLEMÁTICAS DE LAS BÚSQUEDAS
2
3
Información a disposición• El crecimiento del volumen de información es
exponencial• La distribución de la información implica cada vez
más repositorios
4
Sobre la información en el mundo real
• La búsqueda de información no implica conocimiento del proceso de búsqueda– Los humanos no saben habitualmente de algoritmos– Buscan lo que necesitan, no lo que se puede encontrar
• El cerebro funciona con mecanismos distintos a los ordenadores– Se busca por
• Aproximación • Alusión • Referencia
5
Ordenar para buscar• Las primeras experiencias de
búsqueda se basaron en el ordenamiento– El orden facilita la búsqueda
• Índices• Búsquedas binarias• Búsquedas en árbol b• Otros algoritmos
– El orden ¿facilita la búsqueda?• Las experiencias humanas se rigen por parámetros
mucho más aleatorios• El ejemplo de la lectura rápida
CASOS REALES DE BÚSQUEDAS NECESARIAS
6
7
Legales• “Casos juzgados los últimos 3 años por lesiones en accidentes de
tránsito”– Casos– juzgados– los– últimos– 3– años– por– lesiones– en– accidentes– de– tránsito
8
Legales• “Casos juzgados los últimos 3 años por lesiones en accidentes de
tránsito”– Casos– juzgados– los– últimos– 3– años– por– lesiones– en– accidentes– de– tránsito
9
Legales• “Casos juzgados los últimos 3 años por lesiones en accidentes de
tránsito”– Casos– juzgados– los– últimos– 3– años– por– lesiones– en– accidentes– de– tránsito
10
Médicos• Tratamientos naturales por vía oral efectivos en la angina de
pecho– Tratamientos– naturales– por– vía– oral– efectivos– en– la– angina– de– pecho
11
Médicos• Tratamientos naturales por vía oral efectivos en la angina de
pecho– Tratamientos– naturales– por– vía– oral– efectivos– en– la– angina– de– pecho
NO ES LO MISMO…
12
13
De las semánticas particulares• El mismo término tiene distintos significados
(Parónimos)– Tabla• Conjunto de registros (obviamente)• ¿Pedazo de Madera? • Fin de partido de ajedrez.
14
Según la R A E• 1. f. Pieza de madera plana, de poco grueso y cuyas dos caras son paralelas entre sí.• 2. f. Pieza plana y de poco espesor de alguna otra materia rígida.• 3. f. Cara más ancha de un madero.• 4. f. Dimensión mayor de una escuadría.• 5. f. diamante tabla.• 6. f. Parte que se deja sin plegar en un vestido.• 7. f. Doble pliegue ancho y plano que se hace por adorno en una tela y que deja en el exterior
un trozo liso entre doblez y doblez.• 8. f. Este trozo liso.• 9. f. tablilla (‖ en que se fijan anuncios).• 10. f. Índice de materias en los libros.• 11. f. Lista o catálogo de cosas puestas por orden sucesivo o relacionadas entre sí.• 12. f. Cuadro o catálogo de números de especie determinada, dispuestos en forma adecuada
para facilitar los cálculos. Tabla de multiplicar, de logaritmos, astronómica.• 13. f. Parte algo plana de ciertos miembros del cuerpo. Tabla del pecho, del muslo.• 14. f. Faja de tierra, y especialmente la labrantía comprendida entre dos filas de árboles.• 15. f. Cuadro o plantel de tierra en que se siembran verduras.• 16. f. Pedazo cuadrilongo de tierra dispuesto para plantar legumbres, vides o árboles.• 17. f. tabla de río.• 18. f. Aduana en los puertos secos.• 19. f. Mostrador de la carnicería.• 20. f. Puesto público de carne u otros alimentos.• 21. f. Superficie ovalada y con un hueco central, provista de una tapa, que se coloca sobre la
taza del retrete para sentarse sobre ella.• 22. f. Superficie del cuadro donde deben representarse los objetos y que se considera siempre
como vertical.• 23. f. Pint. Pintura hecha en tabla.• 24. f. desus. mesa (‖ mueble).• 25. f. desus. Establecimiento público de banca que hubo antiguamente en algunas ciudades de
España.• 26. f. ant. Mapa de la Tierra o de una parte de ella.• 27. f. pl. tablas reales.• 28. f. pl. En el juego de damas o en el de ajedrez, estado en el cual ninguno de los jugadores
puede ganar la partida.• 29. f. pl. Empate entre competidores. Hacer tablas un asunto. Quedar tablas.• 30. f. pl. Tablas de la Ley.• 31. f. pl. Escenario del teatro.• 32. f. pl. Soltura en cualquier actuación ante el público. Un actor con muchas tablas.• 33. f. pl. Conjunto de tres tablillas como las de San Lázaro, con cuyo ruido despertaban a los
frailes de algunas órdenes religiosas para que se juntasen a rezar maitines.• 34. f. pl. Taurom. Barrera o valla que circunda el ruedo.• 35. f. pl. Taurom. Tercio del ruedo inmediato a la barrera.
15
… y las personas buscan• Por concepto• Por idea• Por definición• Por función o acción• …más que la palabra en sí misma
EJEMPLOS DE FALLOS COMUNES
16
¿En que contexto?
17
Búsqueda no ponderada
18
El idioma del usuario importa
19
El idioma del usuario importa
20
¿Por qué FAST?Característica SharePoint
Foundation 2010Search Server 2010
Express Search Server 2010 SharePoint Server 2010
FAST Search Server 2010 for SharePoint
Búsq. Básica S S S S SBest Bets S S S SVisual Best Bets SSimilares SDuplicados SAlcances S S S SMejora por contexto SProps administradas S S S S*Federación S S S SSugerencias S S S SOrdenamiento por Ranking y perfil SRelevancia por promoción S S S S*Resultados ocultos S S S SProfundidad SVista previa documental SFederación Windows 7 S S S SBusqueda de Personas S SBúsqueda social S STaxonomías S SMulti-Tenant Hosting S SSoporte de indexación rica de web S
Caract. Distintivas• Visuales
– Presentación de vista previa en documentos, ppt, etc– «best bets» visuales
• Interacción– Ordenamiento por cualquiera de las propiedades administradas– Refinamiento de resultados– Vínculo a «Resultados Similares» por cada resultado– Agrupación de similares
• Búsqueda contextual– Promoción de relevancia de documentos individuales
• Vinculada a contexto del usuario
– Sinónimos en ambos sentidos
Caract. Distintivas
• Propiedades administradas– Formas verbales y sintácticas– Parametrización:• Para refinar búsqueda• Para ordenar• Para agrupar resultados
– Extractores de propiedades• Permiten eliminar, revalorizar y priorizar valores de
propiedades tanto para parametrización como para ranking
Caract. Distintivas
• Rank• «Frescura»• Proximidad• Autoridad• Contexto• Propiedades administradas• Posibilidad de crear «ranqueadores» personalizados
– Lingüismo• Corrección ortográfica previa a la indexación• Adaptación en el índice por tesauro, sinonimia y
conceptualización
Una búsqueda en FAST
Con la interfaz de resultados mejorada
Algunos resultados• Virgilio genera más de un 20% de los ingresos totales a través de la
búsqueda
• Aumento de comercio electrónico de Continental Airlines y optimización y ahorro en el proceso de administración de bienes interno
• Fianancial Times aumentó 300% visitas de la página de búsqueda
• BestBuy ofrece una experiencia de usuario única y puede permitirse el lujo de enormes picos de tráfico (el viernes negro)
• Globrix (bienes raíces) genera un nuevo flujo de ingresos con la agregación de contenido y geo-localización basada en la búsqueda
Daniel A. [email protected]
¿Preguntas?