By

Glosario Big Data (parte 4)

Las empresas de hoy tienen enormes oportunidades a la hora de aprovechar el Big Data para mejorar su competitividad. En esta nueva era del Internet of Things, la información y los datos en sus organizaciones provienen de una multitud de fuentes distintas en todo el mundo. Todo, y todos, están conectados a todo y a todos por un dispositivo y por datos.

Para hacer frente a este gran reto de datos, se necesita comenzar por lo básico: entender los conceptos y la terminología del Big Data. Con esa finalidad hemos creado desde IUTA un Glosario Big Data online. En la tercera parte pudimos ver lo que significan palabras como Data Warehouse (DW), Dark Data, DaaS, Data Mining y muchos otros.

¡Hoy seguimos con la parte 4!

DEFINICIONES Glosario Big Data (parte 4):

Deep Thunder:

Servicio de predicción meteorológica de IBM que proporciona datos meteorológicos a organizaciones tales como los servicios públicos, que utilizan los datos para optimizar la distribución de energía.

Document management:

La práctica de rastrear y almacenar documentos electrónicos e imágenes escaneadas de documentos en papel.

Document Store Databases:

Una base de datos orientada a documentos que está especialmente diseñada para almacenar, administrar y recuperar documentos, también conocidos como datos semiestructurados.

Drill:

Framework de software de código abierto que admite aplicaciones distribuidas de uso intensivo de datos para el análisis interactivo de conjuntos de datos a gran escala.

EC2:

(Amazon Elastic Compute Cloud) Servicios de datacenter de Amazon Web Services, una empresa de Amazon.com para desarrolladores. Los servidores están disponibles con Windows Server, OpenSolaris y varios sistemas operativos Linux, así como bases de datos y aplicaciones de servidor web. Usando las interfaces de programación (API) de Amazon, las aplicaciones pueden aumentar o disminuir la capacidad de procesamiento bajo.

Elasticsearch:

Es un motor de búsqueda de código abierto, construido sobre Apache Lucene y lanzado bajo una licencia de Apache. Está basado en Java y puede buscar e indexar archivos de documentos en diversos formatos.

Escalabilidad:

La escalabilidad es una característica de un sistema, modelo o función que describe su capacidad para hacer frente y funcionar bajo una carga de trabajo creciente o en expansión. Un sistema que se adapta bien podrá mantener o incluso aumentar su nivel de rendimiento o eficiencia cuando sea probado por mayores demandas operativas.

Estructura de Datos:

Se refiere a métodos de organización de unidades de datos dentro de los conjuntos de datos más grandes. Lograr y mantener estructuras de datos específicas ayuda a mejorar el acceso y el valor de los datos. Las estructuras de datos también ayudan a los programadores a implementar diversas tareas de programación.

ETL:

Extraer, Transformar y Cargar (ETL) se refiere al proceso de almacenamiento de datos que simultáneamente lee (o extrae) datos de los sistemas fuente; convierte los datos en el formato adecuado para consultas y análisis; y lo carga en un DW, un almacén de datos operacionales o una tienda de datos. Los sistemas ETL comúnmente integran datos de múltiples aplicaciones o sistemas que pueden estar alojados en hardware separado y administrados por diferentes grupos o usuarios. ETL se usa para ensamblar un subconjunto temporal de datos para informes ad-hoc, migrar datos a nuevas bases de datos o convertir bases de datos en un nuevo formato o tipo.

Exabyte:

Una unidad extraordinariamente grande de datos digitales, un Exabyte (EB) es igual a 1,000 Petabytes o mil millones de gigabytes (GB).

Exploratory Data Analysis (EDA):

Es un enfoque para analizar datos. Es donde el investigador toma una vista panorámica de los datos y trata de encontrarle sentido. A menudo es el primer paso en el análisis de datos, implementado antes de que se apliquen las técnicas estadísticas formales. Aunque se pueden usar técnicas estadísticas específicas, como crear histogramas o diagramas de cajas, EDA no es un conjunto de técnicas o procedimientos; el Manual de estadísticas de ingeniería llama a EDA una “filosofía”.

External Data:

Datos que existen fuera de un sistema.

Failover:

Conocido también como “Fallover” o “conmutación por error”. Es la capacidad constante para cambiar automáticamente y sin problemas a una copia de seguridad altamente fiable. Esto puede ser operado de manera redundante o en modo operativo en espera ante la falla de un servidor primario, aplicación, sistema u otro componente del sistema primario.

El objetivo principal es eliminar, o al menos reducir, el impacto en los usuarios cuando se produce una falla en el sistema.

Fast Data:

Es la aplicación de análisis de big data a volúmenes de datos más pequeños para resolver un problema en tiempo real o casi en tiempo real o para crear un beneficio comercial.

Flume:

Flume es un framework para poblar Hadoop con datos. Los agentes están ocupados en toda la infraestructura de TI (por ejemplo, dentro de los servidores web, servidores de aplicaciones y dispositivos móviles), para recopilar datos e integrarlos en Hadoop.

Gephi:

Es un software de código abierto para visualización y análisis de redes. Ayuda a los Data Analysts a revelar de manera intuitiva patrones y tendencias, resaltar los valores atípicos y contar historias con sus datos. Utiliza un motor de renderizado 3D para mostrar gráficos grandes en tiempo real y para acelerar la exploración.

Grid Computing:

Es la realización de funciones informáticas utilizando recursos de múltiples sistemas distribuidos. Grid Computing involucra archivos grandes y se usa con más frecuencia para múltiples aplicaciones. Los sistemas que comprenden una red de Grid Computing no tienen que ser similares en diseño o en la misma ubicación geográfica.

¿Quieres saber todo sobre el Big Data? Fórmate en IUTA

Si cada vez te atrae más el mundo Big Data y quieres adquirir conocimientos sobre ello a un nivel profesional, no dudes en revisar el Máster en Data Analytics que ofrecemos en IUTA. ¡Fórmate con nosotros y prepárate para el éxito!

Y hasta aquí la cuarta parte de nuestro glosario Big Data. Si te ha servido de ayuda, no olvides compartir nuestro contenido para formarse y dominar el sector.

Seguiremos ampliando nuestro glosario online con palabras de la A a la Z. ¡No te pierdas el próximo artículo de la serie, la parte 5!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *