Por qué las bases de datos relacionales no manejan bien el Big Data

Por qué las bases de datos relacionales no manejan bien el Big Data

bases de datos relacionales

Para las empresas, Big Data es sinónimo de grandes oportunidades y no menores desafíos. Entre otros aspectos, afrontar la nueva realidad significa buscar una eficaz alternativa a las bases de datos relacionales para satisfacer las necesidades que generan los grandes datos.

Sobre todo, en cuanto a su almacenamiento, procesamiento y análisis, ya que las tradicionales bases de datos no se concibieron para ello, razón por la que son gestores inapropiados.

 

KYO - CTA Texto - Cloud

 

Más allá de las bases de datos relacionales

Sin dejar de ser compatibles con el sistema tradicional, las tecnologías de Big Data abren nuevas posibilidades para satisfacer necesidades de negocio de un modo hasta ahora inimaginable.

Tanto por su bajo coste, dotándolas de una gran eficiencia, como por el escenario que dibujan, dentro del cual su uso constituye una clara ventaja competitiva.

Ya no se trata de un escenario manejable, a la medida de los convencionales almacenes de datos. Big Data obliga a evolucionar hacia un nuevo paradigma, desde la gestión de un pequeño número de datos, sistemas y aplicaciones a una explosión de todos ellos.

La proliferación de aplicaciones, sistemas e ingentes cantidades de datos de muy distinto tipo, que se cuentan por petabytes, es el signo de los nuevos tiempos.

Así las cosas, se impone adoptar una alternativa tecnológica que complemente y en algunos casos sustituya a las bases de datos relacionales. Implementada junto con otras tecnologías, sistemas, una nueva cultura y habilidades necesarios para extraer todo el potencial de los datos.

 

¿Por qué no son válidas para el Big Data?

Hasta hace nada, las bases de datos relacionales eran la tecnología dominante para el almacenamiento y gestión de los datos de las organizaciones.

Su ineficiencia para abordar los requerimientos de Big Data obedece a muy distintas razones. Veamos algunas de las principales:

  • No están diseñadas para el cambio: El modelo relacional no es flexible frente a los cambios. En concreto, los proyectos de modelado de datos exigen una gran inversión de tiempo y dinero, con lo que acusan una alta ineficiencia.
  • No están diseñadas para manejar variedad: Puesto que están diseñadas para gestionar datos estructurados en un marco ad hoc, tienen enormes dificultades para manejar datos heterogéneos de distintos tamaños. Aunque es posible configurarlas para tal fin es a costa de una complejidad del esquema que no resulta factible.
  • No están diseñadas para escalabilidad y resiliencia: También estos aspectos pueden corregirse mediante reingeniería, pero en la práctica puede afirmarse que las bases de datos relacionales tampoco satisfacen estos dos importantes requerimientos.
  • No están diseñadas para cargas de trabajo mixtas: La capacidad de manejar cargas de trabajo mixtas, es decir, operativas y de análisis, también resulta ineficiente. Resulta compleja y poco flexible y, en general, su ejecución no ofrece un buen rendimiento. Sobre todo habida cuenta de la complejidad creada desde su división en la década de los 90 entre bases de datos optimizadas para cargas de trabajo operativas y analíticas, respectivamente.
  • No están preparadas para el desarrollo de aplicaciones modernas: Para la creación de aplicaciones actualmente se recurre a lenguajes de programación orientados a objetos, lo cual implica tratar a las estructuras de datos como tales. Un enfoque muy diferente del manejo de las bases de datos relacionales que se intenta paliar con la técnica del mapeo objeto-relacional (ORM). Sin embargo, se aumenta la complejidad y la probabilidades de código erróneo al tiempo que se reduce el rendimiento.
  • No están diseñadas para medir el tiempo: El modelo relacional ha tenido que ir más allá de su modelo original para resolver las formas de gestión de tiempo con el fin de poder hacer un seguimiento de los datos variables en el tiempo. Pero lo hacen de un modo limitante, con desarrollos complicados e implementaciones que varían de un proveedor a otro.
  • No son eficaces en devolver resultados por relevancia: Carecen del nivel de sofisticación de indexación necesario para equipararse al rendimiento que pueda ofrecer un motor de búsqueda creado con tecnología de Big Data. Frente a ésta, aquella devolvería una lista de resultados sobre la base de un simple orden de valores, ignorando información no estructurada, impidiendo la obtención de información relevante.

 

KYO - CTA horizontal - Cloud

Compartir

Escribe tu comentario

Tu dirección de correo electrónico no será publicada.