¿Cómo sería un almacén de datos en la nube ideal?

¿Cómo sería un almacén de datos en la nube ideal?

almacén de datos

Si tienes un almacén de datos, es muy posible que ya te hayas preguntado si es el momento de migrarlo a la nube. Se trata de una decisión importante, ya que la mayoría de las empresas han trabajado durante muchos años en su almacén de datos y para cambiarlo necesitan una buena razón.

Dependiendo del proveedor con quien hables, puede que te presente razones diferentes para justificar esa migración. Incluso puede que te sugieran una solución diferente.

 

KYO - CTA Texto - DM

 

Sin embargo, parece obvio que lo que debes hacer es repensar el papel del almacén de datos en la nube. En otras palabras, pregúntate: “¿cómo debe ser un almacén de datos en la nube?”.

Se trata de una pregunta compleja, pero basándonos en el ideal de lo que debería ser un almacén de datos en la nube podríamos decir que debería cumplir algo parecido a esto:

 

Separar almacenamiento y computación

La nube es el lugar donde el almacenamiento es más barato y la computación se puede pedir a la carta.

Un almacén de datos en la nube debería separar radicalmente el almacenamiento de datos del motor que realiza la computación. Esto permite almacenar el mayor número de datos posible y tantos tipos diferentes de motores de cálculo como sean necesarios para procesar y crear el almacén de datos.

Esta separación cambia significativamente la economía del almacén de datos porque no es necesario construir un sistema grande para manejar las necesidades de almacenamiento máximo dentro de un sistema local.

 

Con motores específicos a demanda para dar soporte a las cargas de trabajo

La capacidad de la nube para poner en marcha tantos motores de computación diferentes como sea necesario con el objetivo de manejar las cargas de trabajo reduce la complejidad de un almacén de datos.

Algunos de estos motores se utilizarán y seguirán funcionando después, manejando solicitudes bajo demanda o esperando trabajos por lotes. Otros procesan solo una carga de trabajo y luego desaparecen. El aspecto que se debe tener en cuenta es que cada uno de estos motores se debe crear en una infraestructura separada que no compita con los otros. Esto simplifica la implementación.

 

Rehacer el optimizador basándose en la potencia de la nube

El rendimiento de un almacén de datos está determinado por la calidad del optimizador que analiza las consultas SQL y que determina cómo se ejecutarán. La nube tiene mucha potencia de cálculo, memoria de varias velocidades y costes, y cantidades masivas de almacenamiento de bajo coste. El optimizador ideal de un almacén de datos en la nube debe adaptarse para utilizar estas nuevas capacidades. Por ejemplo, debería ser posible almacenar en caché una gran cantidad de resultados de consultas, dada la disponibilidad de almacenamiento de bajo coste.

 

Manejar el volumen y la variedad del Big Data

Seguramente es mucho más fácil ampliar un almacén de datos para manejar varios tipos de datos no estructurados que hacerlo con Hadoop y un poderoso motor SQL. Un almacén de datos en la nube debe ser capaz de procesar una gran cantidad de documentos no estructurados básicos y extraer datos estructurados de ellos.

 

Ejecución de consultas mediante múltiples repositorios

Tener un solo almacén de datos es un modelo de trabajo anticuado. En cualquier organización de tamaño significativo, existe la una necesidad de disponer de múltiples repositorios.

 

Tener Movimiento de Datos y Capacidad de Replicación escalables

Un almacén de datos en la nube debe tener una estrategia para mover datos de forma escalable desde y hacia el almacén de datos, y para poder replicarlos y sincronizarlos. Esta es otra capacidad clave necesaria para soportar un mundo multirepositorio y multinube.

Podríamos hablar todavía de más dimensiones como la compatibilidad con la transmisión de datos, la seguridad y la recuperación de desastres, etc. Se pueden conseguir muchas más sugerencias, pero la idea de este artículo es iniciar una conversación sobre cómo debería ser un almacén de datos en la nube ideal, y para ello hemos empezado aportando estas 6 ideas. Ahora es tu turno.

 

KYO - CTA horizontal - DM