Post on 29-Sep-2015
description
ANDREA CATALINA SANABRIA RAMIREZANDRES FELIPE ZUBIETA DAZAELECTIVA PROFESIONAL B2
MAP/REDUCESu ejecucin consta de dos fases principales, Map y Reduce, ambas programadas por el desarrollador. Se completan con una etapa interna, llamada Shuffle and sort, que permite vincular las dos fases anteriores. Cada una de ellas tiene una funcin
ESTRUCTURA MAP/REDUCEhttps://lh3.googleusercontent.com/2MFMkoSdpsR5BqnN7sxiIkQ9wikTsELElARqGUfpp1puWHS6lBbHiODtbX8ulXQXxpEj8VCIHCmLcqeCq0j7dVYetZOpHSxHTFV_ai5YQAy5F7pSI1QFy4WcTvAMP8yByg
ESTRUCTURA MAP/REDUCEMap: se aplica en paralelo para cada tem en la entrada de datos, gracias a este mapeo , a cada llamada se asignara un alista de pares clave /valor, el resultado es la creacin de un grupo por cada clave generada.
ESTRUCTURA MAP/REDUCEShuffle and sort: tiene dos misiones, por una parte se encarga de ordenar por clave (key) todos los resultados emitidos por el mapper y por otra parte recoge todos los valores intermedios pertenecientes a una clave para combinarlos en una lista asociada a ella.
ESTRUCTURA MAP/REDUCEReduce: esta funcin se aplica en paralelo para cada grupo asociado a un clave, el resultado es la produccin de una coleccin de valores para cada dominio, aunque tambin puede darse el caso de generar una llamada vaca , el resultado es la obtencin de una lista de valores.
ESTRUCTURA MAP/REDUCE
BIBLIOGRAFA http://cdn2.hubspot.net/hub/239039/file-884064500-pdf/docs/PWD_-_BIG_DATA_-_hadoop_-_que_significa_haddop_en_el_mundo_del_big_data.pdfhttps://github.com/GoogleCloudPlatform/appengine-mapreducehttps://github.com/GoogleCloudPlatform/appengine-mapreduce/wiki