By

Glosario Big Data (parte 2)

El camino hacia la transformación digital es crítico para el mundo de los negocios. Las organizaciones que se embarcan en este camino, deben considerar cómo se puede optimizar cada aspecto de su negocio para cumplir con los nuevos objetivos digitales y el actual potencial de crecimiento. Las grandes cantidades de datos y los análisis desempeñan un papel fundamental en la transformación digital, lo que permite a las organizaciones optimizar sus procesos existentes y mantenerse por delante de la competencia.

Un mundo repleto de gente, siete mil millones de personas, en el que cada vez la interconectividad llega más rápido y a más lugares. Una era en la que, la mecánica, deja paso más que nunca a la ingeniería y que, lo rutinario, deja paso a un tiempo de evolución, de pensamiento, de ideas. Un mundo repleto de información. Información que, como si de la misma teoría del caos de Edward Lawrence se tratara, podría ser aprovechada y utilizada para aprender y evolucionar.

El análisis de datos es el futuro, y el futuro exigirá habilidades para trabajos como analistas funcionales, ingenieros de datos, científicos de datos (Data Scientists) y analistas avanzados. Gente capaz de entender y trabajar con todos esos datos.

Es por eso que el Big Data nos recuerda que hay que seguir aprendiendo. Las habilidades lo son todo y más aún en un entorno de empresa.

Con la finalidad de poder tener una comprensión adecuada del vocabulario y de los conceptos más importantes, hemos creado desde IUTA un glosario Big Data online. En la primera parte de este pudimos ver lo que significan palabras como Análisis de Correlación, Algoritmo, API (Application Programming Interface), Agregación y muchos otros.

¡Hoy seguimos con la parte 2!

DEFINICIONES Glosario Big Data (parte 2):

Base de Datos:

Repositorio organizado o estructurado sistemáticamente de información indexada (generalmente como un grupo de archivos de datos vinculados) que permite una fácil recuperación, actualización, análisis y salida de datos.

Almacenados, por lo general en un ordenador, estos datos podrían estar en forma de gráficos, informes, scripts, tablas, textos y un largo etcétera que representa casi todo tipo de información.

Big Table:

Es un sistema de base de datos desarrollado por Google. Es adecuado para almacenar grandes cantidades de datos a alto rendimiento y baja latencia. Google usa BigTable para sus propios servicios, como Google Search, Google Analytics, Google Maps o Gmail, pero también lo ofrece como un servicio en la nube para terceros.

Business Intelligence (BI):

El término Business Intelligence (BI) se refiere a tecnologías, aplicaciones y prácticas para la recopilación, integración, análisis y presentación de información comercial. El objetivo del BI es respaldar una mejor toma de decisiones comerciales. Básicamente, los sistemas de Business Intelligence son sistemas de soporte de decisiones (DSS) impulsados por datos.

Cassandra:

Es un tipo de base de datos NoSQL diseñado y desarrollado para manejar grandes cantidades de datos en múltiples servidores. La elección correcta cuando se necesita escalabilidad y alta disponibilidad sin comprometer el rendimiento. Es de código abierto, lo que significa que su código fuente está libremente disponible para que cualquiera pueda estudiarlo, modificarlo y usarlo.

Algunas de las compañías populares cuyas aplicaciones son conocidas por usar Cassandra incluyen: Facebook, Twitter, Cisco, Netflix, eBay, Comcast, Reddit y Adobe entre otros.

Cloud Computing:

La computación en la nube es el uso de varios servicios informáticos, como plataformas de desarrollo de software, servidores, almacenamiento y software, a través de Internet, a menudo denominado “nube” o “cloud”.

Cloudera:

Cloudera es un fabricante estadounidense de software. La compañía se especializa en software alrededor de Apache Hadoop y ofrece su propia distribución de Hadoop.

Es una de las distribuciones Apache Hadoop más populares del mundo, lo que permite la informática de alto rendimiento (HPC) y las aplicaciones de Big Data. La solución cuando se tienen que analizar y procesar grandes volúmenes de datos. Las posibles áreas de aplicación se pueden encontrar en finanzas, logística, administración de campañas o Internet de las cosas (IoT) y otras áreas.

Cluster:

Grupo de servidores independientes (por lo general, muy cerca el uno del otro) interconectados a través de una red dedicada para trabajar como un recurso centralizado de procesamiento de datos. Los clústeres son capaces de realizar múltiples instrucciones complejas mediante la distribución de la carga de trabajo en todos los servidores conectados.

Clustering:

En el contexto de las bases de datos, se refiere a la capacidad de varios servidores o instancias para conectarse a una única base de datos. Una instancia es la colección de memoria y procesos que interactúa con una base de datos, que es el conjunto de archivos físicos que realmente almacenan datos.

Cluster Analysis:

Técnica de clasificación estadística en la que los casos, datos u objetos (eventos, personas, cosas, etc.) se subdividen en grupos (clusters) de modo que los elementos en un clúster son muy similares (pero no idénticos) entre sí y muy diferentes de los de otras agrupaciones. Es una herramienta de descubrimiento que revela asociaciones, patrones, relaciones y estructuras en grandes cantidades de datos.

Couch DB:

Es una base de datos documental de código abierto, similar a MongoDB.

CouchDB permite almacenar datos con documentos JSON, acceder a documentos usando un navegador web (a través de HTTP) y también consultar, combinar y transformar documentos con JavaScript.

¿Te gusta el mundo del Big Data? Fórmate en IUTA

Si estás interesado y quieres conocer más acerca de este amplio mundo en constante crecimiento, no dudes en informarte acerca del máster en Data Analytics (MDA) que ofrecemos en IUTA.

Ofrece una preparación amplia en el área de la Tecnología, el Big Data y el Data Science. Al finalizar, recibirás el título propio de la Universidad de Alcalá, una de las mejores de España.

Y hasta aquí la segunda parte de nuestro glosario Big Data. ¿Qué te ha parecido? Si te ha gustado, no olvides compartir este artículo en las redes para que llegue a más gente.

Seguiremos ampliando nuestro glosario online con palabras de la A a la Z. ¡No te pierdas el próximo artículo de la serie, la parte 3!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *