By

Glosario Big Data (parte 1)

Actualmente se generan datos en abundancia y las empresas demandan saber no sólo lo que sucede en el presente, sino también lo que va a pasar en un futuro, requiriendo niveles de servicio mucho más exigentes que hace unos años. Como vemos, el Big Data está ahora en boca de todos y si queremos ponernos al día en las nuevas tendencias es vital que comencemos por el principio: el vocabulario.

El Big Data trae consigo una gran cantidad de palabras nuevas. Unas palabras que, a menudo, resultan complejas y que no cualquiera es capaz de entenderlas a la primera. Esto puede convertirse en una tarea abrumadora y es por eso que, desde IUTA, hemos creado una serie de artículos que iremos subiendo con el objetivo de recopilar los términos más conocidos en un Glosario Big Data online.

Primero de todo: ¿Qué es el Big Data?

Pero antes de profundizar en el tema, establezcamos una definición clara para Big Data, sin duda la palabra más importante de todas. Esencialmente, Big Data es el proceso de recoger un volumen muy grande de datos y su inmediato análisis para encontrar patrones, información oculta, correlaciones, etc. Este conjunto de datos es demasiado grande y complejo para un almacén de datos tradicional.

Y ahora te preguntarás: ¿cómo identificar Big Data? Hay “cinco uves” que se pueden usar para identificarlos:

  1. Volumen: los datos pesan igual o más que un petabyte.
  2. Variedad: existen diferentes tipos de datos que puedes analizar. A menudo, estos tipos de datos se dividen en tres categorías: los estructurados, los semiestructurados y los desestructurados.
  3. Velocidad: el procesamiento de datos necesario es sensitivo al tiempo.
  4. Veracidad: los datos son confiables.
  5. Valor: los datos pueden ser usados para dar un valor empresarial obvio.

Y bien, ahora que sabemos lo básico, profundicemos en la terminología Big Data:

DEFINICIONES Glosario Big Data (parte 1):

Agregación:

Un proceso de búsqueda, recopilación y presentación de datos.

Algoritmo:

Una fórmula matemática colocada en un software que realiza un análisis en un conjunto de datos.

Análisis de Correlación:

El Análisis de correlación es la herramienta estadística utilizada para estudiar la cercanía de la relación entre dos o más variables. Se dice que las variables están correlacionadas cuando el movimiento de una variable va acompañado por el movimiento de otra variable.

Análisis de Sentimiento:

La aplicación de funciones estadísticas en los comentarios que las personas hacen en la web y a través de las redes sociales para determinar cómo se sienten acerca de un producto o empresa.

Análisis Descriptivo:

Se trata del tipo de analítica más simple. El que permite condensar el Big Data en datos más pequeños, con piezas de información más manejable.

La mayoría de los datos en bruto no son aptos para el “consumo” humano, pero la información derivada de los mismos sí lo es. Por ello, el propósito de la analítica descriptiva es resumir lo que ha pasado. Y es eso precisamente lo que analizan la mayoría de empresas.

Análisis Predictivo:

La analítica predictiva es el siguiente paso para “reducir” datos. Ésta utiliza una gran variedad de estadísticas, modelos, minería de datos y técnicas de aprendizaje automático para estudiar datos recientes e históricos. De este modo, permite a los analistas hacer predicciones sobre el futuro.

El objetivo de la analítica Big Data predictiva, sin embargo, no es mostrar lo que pasará en el futuro. Eso es algo que no puede lograr la analítica. Pero sí puede plantear un escenario que podría darse, porque todos los análisis predictivos son probabilísticos por naturaleza.

En la mayoría de casos reales en las empresas, la analítica predictiva se utiliza para predecir datos que no se tienen en base a los datos con los que cuentan.

Análisis Prescriptivo:

La tecnología emergente de la analítica prescriptiva va más allá de los modelos descriptivos y predictivos, recomendando uno o varios itinerarios de acción y mostrando las posibles consecuencias de cada decisión.

No deja de ser un tipo de analítica predictiva para cuando se necesita utilizar la información y actuar. En cualquier caso, no se predice un futuro posible sino varios dependiendo de las acciones y la toma de decisiones.

Por tanto, este tipo de analítica necesita un modelo predictivo con dos componentes adicionales: datos procesables y un sistema de realimentación que rastree las consecuencias de las acciones sugeridas. Un modelo prescriptivo es capaz de predecir consecuencias basándose en diferentes opciones de acción; pero también puede recomendar el mejor camino para cualquier consecuencia preestablecida.

Anonimización:

La eliminación de enlaces entre personas en una base de datos y sus registros para evitar el descubrimiento de la fuente de los registros.

API (Application Programming Interface):

Una interfaz o “intermediario” que permite que dos programas de software interactúen entre sí. En el contexto de las operaciones de cambio, una API se refiere a la interfaz o plataforma que permite que su plataforma se conecte con el mercado. Las API tienen múltiples funciones que facilitan el intercambio de información, incluidas las cotizaciones de precios de divisas en tiempo real, la ejecución de operaciones y las confirmaciones de órdenes y transacciones.

¿Te gusta el Big Data? Fórmate en IUTA

Si estás interesado y quieres conocer más acerca del enorme mundo del análisis de datos y Big Data, no dudes en revisar el máster en Data Analytics que ofrecemos en IUTA. Un máster con una preparación amplia en el área de Big Data y Data science, con título propio de la Universidad de Alcalá, una de las mejores universidades de España.

Para más información entra en la web de IUTA y revisa nuestros programas formativos o ponte en contacto con nosotros a través de este enlace, te atenderemos encantados.

Y hasta aquí la parte 1 de nuestro glosario Big Data ¿Qué te ha parecido? ¿Te resulta interesante? ¿Crees que es bueno tener un glosario online?

Si te ha servido de ayuda, no olvides compartir nuestro contenido para que pueda llegar a todo aquel interesado en formarse y dominar el sector del Big Data. En próximos artículos seguiremos ampliando nuestro glosario online con palabras de la A a la Z.

¡No te pierdas el próximo artículo de la serie, parte 2!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *