domingo, 4 de noviembre de 2012

Big Data





Cada día existen mas y mas empresas que manejan una incalculable cantidad de información, casos en que hablamos de petabytes. Si a ello sumamos la gestión de data proveniente de redes sociales como, Facebook, Twitter y LinkedIn surge el concepto de Big Data.

Big Data, alude a un conjunto de datos cuyo tamaño está más allá de la capacidad de la mayoría de los software utilizados para capturar, gestionar y procesar la información dentro de un lapso tolerable. Es en este escenario que surge la necesidad, por parte de las organizaciones, de contar con un habilitador tecnológico que les permita aprovechar todo el potencial de su Big Data.

Las organizaciones experimentan un rápido aumento en los volúmenes de información que manejan y comienzan a gestionar data no tradicional como la proveniente de redes sociales, o multimedios.

Junto con el gigantesco volumen de datos, las organizaciones enfrentan el problema que la información está repartida por toda la estructura y en lugares físicos distantes.

En el Big Data debemos de considerar algunos puntos importantes como:

Ø  Integrar grandes volúmenes de data transaccional y de interacción.

Ø  Disponer de datos validados y confiables.

Ø  Proveer capacidades de auto servicio a usuarios, analistas, desarrolladores, data stewards, dueños de proyectos y usuarios de negocio
Servicios adaptativos de dato.

Ø  Administración de datos maestros

Teniendo herramientas a las que recurrir, es vital que las entidades que manejan una gran cantidad de datos pongan en práctica todas las acciones disponibles para gobernar su Big Data, y de este modo utilizarla como insumo para el negocio.

Dependiendo el auditorio, será la información que se presenté. Las mejores prácticas indica que una empresa debe tener menos de 10 indicadores, ya que sí se tienen más no será óptimo para la empresa debido a tanta información.

En nuestros días y en México, se puede ver que cada departamento tiene 20 indicadores (si es que tiene esa cultura) y no están homologados, por lo que el volumen de información es mucho y son tantas directrices que se pueden contradecir y en consecuencia los directivos no tomarán decisiones correctas.
Consideramos que los directivos deben dar los objetivos estratégicos de las empresas, de ahí cada departamento debe estar alineado a estos objetivos, claro que también debe existir un área reguladora que avale la información de cada área.

Ahora, una deficiencia actual es que la misma información se replica en varios sistemas. Por ejemplo, la información del estatus de un proyecto de gobierno, en una empresa de telecomunicaciones, se ve reflejada en el sitio del proyecto, en el sitio de ingenieros de campo, en reportes para el cliente, la dirección, proveedores, etcétera. Es necesario preguntarse si en un solo repositorio sería posible ingresar toda la información y que automáticamente los demás sistemas se actualicéis y se obtengan diferentes reportes dependiendo el nivel de detalle necesario.

Que beneficios existe en esto?

Pues son varios, en primer lugar las personas que recopilan la información tardarán menos tiempo en ingresarla.
Segundo no existirá contradicción en la información.
Tercero la información será confiable.
Cuarto se tendría a todos los niveles información actualizada.
Quinta se tendría eficacia en la información.
Sexta se lograría un repositorio de conocimiento general.

 




 

 





 


2 comentarios:

  1. Me parecio interesante el comentario de los 10 indicadores ¿tienes más información al respecto?

    Creo que el punto que comentas sobre el tener una estrategia para generar y almacenar información es muy importante ya que sí la generación de la información se ve desde un punto integral de la empresa, será más sencillo explotar esa información y nos toparemos con información menos redundante, más limpia y más fácil de manejar.

    ResponderEliminar
  2. Hola!

    Me parece que el tema de recolección y consulta de información centralizada es hacia donde están migrando, desde hace tiempo, la mayoría de las organizaciones.

    De hecho, si recuerdan, Erik nos mencionaba en clase acerca del péndulo en el que se ha movido la información. Inicialmente, era centralizada, luego con el surgimiento de redes pasó ser distribuida y hoy lo que vemos es una "centralización distribuida". En otras palabras, la información es provista a través de un sólo servicio, aunqu este esté distribuido en N cantidad de servidores. Para el usuario de la información esto es transparente.

    Hoy resultaría impensable que las organizaciones utilicen información inconsistente. No así la información redundante, ya que eso es importantísimo en cuestiones de seguridad.

    Saludos,
    Oscar Siva

    ResponderEliminar