By

Glosario Big Data (parte 3)

Las empresas de hoy tienen enormes oportunidades de aprovechar el Big Data para mejorar su competitividad. En esta nueva era del Internet-of-Things (IoT), la información y los datos en sus organizaciones provienen de una multitud de fuentes diferentes en todo el mundo. Todo y todos están conectados a todo y a todos por un dispositivo y por datos.

Para hacer frente a este gran reto de datos, se necesita comenzar por lo básico: entender los conceptos y términos del Big Data. Con esa finalidad hemos creado desde IUTA un glosario Big Data online. En la segunda parte pudimos ver lo que significan palabras como Base de Datos, Couch DB, Business Intelligence (BI), Cloud Computing y muchos otros.

¡Hoy seguimos con la parte 3!

DEFINICIONES Glosario Big Data (parte 3):

DaaS (Database as a service):

Es un modelo de servicio de computación en la nube que brinda a los usuarios algún tipo de acceso a una base de datos sin la necesidad de configurar hardware físico, instalar software o configurar el rendimiento.

Dark Data:

Los datos oscuros o Dark Data, son un tipo de datos no estructurados, sin etiquetar y sin explotar que se encuentran en los repositorios de datos y no se han analizado ni procesado. Es similar al Big Data, pero difiere en la forma en que los administradores de TI y negocios lo descuidan en términos de valor.

Al Dark Data también se le conoce como Dusty Data.

Dashboard:

Es una herramienta de gestión de la información que rastrea visualmente, analiza y muestra indicadores clave de rendimiento (KPI), métricas y puntos clave de datos para controlar el estado de una empresa, departamento o proceso específico. Un dashboard es la forma más eficiente de rastrear múltiples fuentes de datos, ya que proporciona una ubicación central para que las empresas supervisen y analicen el rendimiento.

Data Analyst:

Es el profesional cuyo enfoque de análisis y solución de problemas se relaciona con datos, tipos de datos y relaciones entre elementos de datos dentro de un sistema comercial o sistema de TI.

Otros títulos comunes para este rol son: Data Modeler, Business Intelligence Analyst, Data Warehouse Analyst, Systems Analyst, Business Analyst (término genérico), etc.

Data Governance:

Es un control que garantiza que la entrada de datos por parte de un miembro del equipo de operaciones o por un proceso automatizado cumple con estándares precisos. Utilizada por las organizaciones para ejercer control sobre los procesos y métodos utilizados por sus administradores de datos y custodios de datos con el fin de mejorar la calidad de los datos.

Data Governor:

Profesional que utiliza la supervisión de la calidad de los datos en comparación con los datos de producción para comunicar los errores en los datos a los miembros del equipo operacional o al equipo de soporte técnico para la acción correctiva.

Data Mining:

Proceso de analizar patrones ocultos de datos según diferentes perspectivas para la categorización en información útil, que se recopila y ensambla en áreas comunes, como Data Warehouses, para análisis eficientes, algoritmos de minería de datos, facilitando la toma de decisiones comerciales y otros requisitos de información para en última instancia, reducir los costos y aumentar los ingresos.

La minería de datos o Data Mining también se conoce como Data Discovery y Knowledge Discovery.

Data Science:

Es un campo del Big Data que busca proporcionar información significativa a partir de grandes cantidades de datos complejos. La ciencia de datos (Data Science), o ciencia basada en datos, combina diferentes campos de trabajo en estadística y computación para interpretar datos con el propósito de tomar decisiones.

Data Set:

Es una colección de datos. Generalmente corresponde a los contenidos de una sola tabla de base de datos, o una única matriz de datos estadísticos, donde cada columna de la tabla representa una variable particular y cada fila corresponde a un miembro dado del Data Set en cuestión.

Los conjuntos de datos o Data Set que son tan grandes que las aplicaciones de procesamiento de datos tradicionales son inadecuadas para manejarlos se conocen como Big Data.

Data Warehouse (DW):

Un almacén de datos o Data Warehouse es una colección de información corporativa y datos derivados de sistemas operativos y fuentes de datos externos. Diseñado para respaldar las decisiones comerciales al permitir la consolidación de datos, el análisis y la generación de informes en diferentes niveles agregados. Los datos se llenan en el DW a través de los procesos de extracción, transformación y carga.

Datos en Tiempo Real:

Los datos en tiempo real se refieren a los datos que se presentan a medida que se adquieren.

Datos Estructurados:

Los datos estructurados son datos que se han organizado en un repositorio formateado, generalmente una base de datos, de modo que sus elementos se puedan direccionar para un procesamiento y análisis más efectivos.

Datos no estructurados:

Se refiere a los datos que siguen a un formulario que está menos ordenado que elementos como páginas de hojas de cálculo, tablas de bases de datos u otros conjuntos de datos lineales u ordenados. De hecho, el término “conjunto de datos” es útil porque está asociado con datos que están en arreglos limpios y accesibles, sin contenido adicional, y que están vinculados o etiquetados en una estructura específica.

Datos Semiestructurados:

Los datos semiestructurados son información que no reside en una base de datos relacional pero que tiene algunas propiedades organizacionales que hacen que sea más fácil de analizar.

DBMS (Database management system):

Es un paquete de software diseñado para definir, manipular, recuperar y administrar datos en una base de datos. Un DBMS generalmente manipula los datos en sí, el formato de los datos, los nombres de los campos, la estructura del registro y la estructura del archivo. También define reglas para validar y manipular estos datos.

Algunos ejemplos de DBMS son: MySQL, SQL Server, Oracle, dBASE y FoxPro.

¿Quieres saber todo del Big Data? Fórmate en IUTA

Si cada vez te atrae más el mundo Big Data y quieres adquirir conocimientos sobre ello a nivel profesional, no dudes en revisar el Máster en Data Analytics que ofrecemos en IUTA. Fórmate con nosotros y prepárate para el éxito.

Y hasta aquí la tercera parte de nuestro glosario Big Data. No olvides compartir nuestro contenido para que llegue a tod@ interesad@ en formarse y dominar el sector.

Seguiremos ampliando nuestro glosario online con palabras de la A a la Z. ¡No te pierdas el próximo artículo de la serie, la parte 4!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *