Big Data Resumen Seccion A

download Big Data Resumen Seccion A

of 2

description

SDSADSADSADSAD

Transcript of Big Data Resumen Seccion A

Asignatura: Introduccin a la Ingeniera de SistemasSeccin: AIng. Guillermo Caldern RuizIntegrantes-Aguilar Valdivia Mauricio Carlos-Melo Gonzales Kevyn Mauro-Noguera Rafael Harold Edson-Pamo Delgado Rodrigo Edmur

Big Data: Storage Solution1. Qu es Big Data?Big Data son las grandes cantidades de datos, que no puede ser procesada o analizadas utilizando procesos o herramientas tradicionales.2. Evolucin del Big Data: Se puede considerar 3 periodos de evolucin:1er Periodo: A finales de los 90 comenz el primer periodo de evolucin de Big Data, teniendo como aspecto principal la adopcin del correo electrnico y archivos adjuntos.2do Periodo: Fue dada por el crecimiento masivo de la tecnologa digital. A la vez que comienza la aparicin de los datos no estructurados los cuales superan por mucho a los datos estructurados.3er Periodo. En los ltimos aos se vio impulsada por la informtica social, periodo durante el cual los datos no estructurados ocupan el 80% de los datos en general .Por el desmesurado crecimiento de datos comenzaron los problemas de almacenamiento3. Los formatos de datos que afectan al almacenamiento- Social media (forma ms comn de datos no estructurado)- Formatos de fotografa, audio y video- Investigacin espacial y aplicaciones geogrficas- Reportes e investigaciones de la cienciaTodos ellos contribuyen a un mayor grupo de datos no estructurados cada vez ms difciles de gestionar.

4. High Tech y Big Data

Las empresas High Tech se ven afectadas por la creciente tendencia analtica Big Data en las siguientes dos maneras:1. Las empresas tienen que esforzarse por entender los datos, esto abarca el anlisis de requisitos de rendimiento para diversos mercados y hacer estas funcionalidades disponibles a travs de sus productos. La solucin del problema se compone de la capacidad para gestionar grandes volmenes a alta velocidad utilizando motores de bsqueda (Advanced-Analytics: Soluciones que proporcionan herramientas y tcnicas que le ayudaran a predecir eventos futuros con confianza y lograr mejores resultados para su organizacin.)2. Las empresas de alta tecnologa quieren aprovechar la voz del cliente en lnea y en tiempo real a travs de las plataformas sociales para lograr as un anlisis detallado en los intereses de los clientes. Este es un problema de Big Data ya que las entradas de datos son enormes.

4.1. Caractersticas para un buen almacenamiento

- Capacidad: Que sea capaz de soportar datos no-estructurado y Big Data.

- Velocidad: Para contrarrestar esto se requiere soluciones de almacenamiento con un rendimiento escala web y escalabilidad lineal.

-Tipo: Requieren nuevas plataformas de anlisis de datos, sobre todo el marco Hadoop de cdigo abierto.

5. Soluciones: 5.1 Scale-Out: Arquitectura modular que comprende numerosos nodos que agrupan y configuran una extensa y masiva infraestructura de almacenamiento. Scale-Out no solo permite la expansin del almacenamiento sino que mantiene su funcionalidad y rendimiento ya que se expande.

5.1.1 Hadoop: .Es una sistema de archivos distribuido que almacena, procesa y analiza grandes volmenes de datos a travs de diferentes nodos y mantiene la tolerancia a fallos. Los beneficios de Hadoop son:

- Mejor escalabilidad.-Rentabilidad.-Rendimiento mejorado.

5.1.2 MapReduce: Es un tipo de programacin que procesa cantidades grandes de datos. Este modelo est compuesto por dos pasos que a la vez provienen de su nombre.

-1er paso Map, consiste en el mapeo de datos pasando por un proceso de filtrado que como resultado da otra coleccin de datos en el que se identifica un solo registro para cado valor utilizado como clave.

-2do paso Reduce, consiste en generar un nuevo grupo de datos provenientes del resultado del mapeo que por lo general reduce el nmero de particiones.

6. Conclusin:

Big Data como sabemos es una gran cantidad de datos; la cual las empresas quieren aprovechar de todos estos para el beneficio de s misma, extrayendo su valor real con la observacin de intereses y necesidades de las personas lo cual para hacer esto necesitan almacenar todos estos datos de una manera organizada y estructurada, he de ah que viene la problemtica del Big Data.El TCS, nos brinda las mejores alternativas de soluciones como el sistema Scale-Out entre otras para mitigar esta problemtica y as poder dar un mayor salto en el crecimiento de sus ventas con el uso correcto de estos datos.