Mapreduce para archivos binarios distribuidos

  • Cynthia Alejandra Martínez Pinto
  • Rosa María Michel Nava
  • Ruth Clementina Barragán López

Abstract

El flujo de datos generados diariamente se ha incrementado exponencialmente, al grado que resulta importante aprender a manejar y manipular esta información para no quedar rezagado. Grandes empresas como Oracle, IBM y Microsoft (por mencionar algunas), le están apostando al negocio del almacenamiento y análisis de esta abundante información.

La tendencia es hacer más accesible la manipulación de grandes datos (Big Data), donde Hadoop se ha convertido en un estándar para el manejo de esta información. Ha resultado muy efectivo para analizar datos No Estructurados en la nube, pero esto apenas comienza y en el campo de la astrofísica esta herramienta no es suficiente.

La técnica de MapReduce, es muy efectiva para el análisis de archivos de texto, sin embargo cuando se utiliza con archivos binarios distribuidos los resultados que se arrojan son erróneos. Por tal motivo, doctores de la Universidad de California, Riverside; trabajan en un framework denominado StratOS, que soluciona entre otras cosas, el manejo de este tipo de archivos.
Published
2016-03-27
Section
Artículos Científicos