El almacenamiento de objetos en la nube y el almacenamiento de escala horizontal son dos buenas opciones para almacenar grandes cantidades de datos. Si bien ambas pueden ser beneficiosas desde una perspectiva de gestión, el almacenamiento de objetos está de subida como alternativa al almacenamiento de escala horizontal por sus capacidades mejoradas en varias áreas.
Escala y eficiencia
Las arquitecturas de almacenamiento tradicionales, ya sea de escala vertical o escala horizontal, utilizan una estructura jerárquica similar a un árbol de sistema de archivos para gestionar bloques de datos en el sistema de almacenamiento. La información que facilita esta gestión de datos –donde están escritos, qué bloques están asociados en archivos, información de acceso, etc.– se llama metadatos, y crece a medida que el sistema de almacenamiento se llena. Al igual que un sistema de archivos, hay un límite superior en el número de bloques de datos que un sistema de almacenamiento puede manejar, uno que está relacionado con la capacidad del sistema para procesar un conjunto cada vez mayor de metadatos.
En lugar de la estructura semejante a un sistema de archivos, el almacenamiento de objetos en la nube utiliza una estructura de valor de clave para organizar los datos, la cual crea un índice simple de las ID de los objetos (la clave), cada uno de los cuales está asociado con la ubicación de un objeto de datos discreto (el valor). En lugar de crear metadatos que describen la ubicación de un bloque dentro de una jerarquía de varios niveles, un sistema de almacenamiento de objetos solo almacena su número de identificación. Esto crea una estructura organizacional horizontal que es mucho más eficiente que las arquitecturas de almacenamiento tradicionales. Generan mucho menos metadatos y requieren un menor número de pasos de procesamiento de metadatos para tener acceso a los datos, permitiendo a los sistemas de almacenamiento de objetos crecer mucho más.
Costo en escala
La protección de datos en los sistemas de almacenamiento tradicionales requiere hacer copias adicionales de los archivos, por lo general almacenadas en varias ubicaciones. A medida que estos sistemas crecen, el costo de crear esas copias adicionales puede llegar a ser prohibitivo. Las arquitecturas basadas en objetos son ideales para tecnologías tales como la codificación de borrado y la distribución de datos, ya que pueden proporcionar esta protección de datos y resiliencia mediante la ampliación de metadatos sin crear varias copias de cada archivo.
Resiliencia de datos
Relacionado con la dificultad de almacenar copias adicionales de los datos está el uso de RAID para proporcionar resiliencia de datos y garantizar la disponibilidad durante fallos de los componentes. Cuando las unidades en un sistema basado en RAID se vuelven muy grandes, el ciclo de reconstrucción puede tardar días en completarse, haciendo que el sistema sea vulnerable a un segundo o tercer fallo de un componente. El código de borrado en las arquitecturas de almacenamiento de objetos en la nube elimina este largo tiempo de reconstrucción y soporta mayores niveles de resiliencia para satisfacer el perfil de riesgo de una empresa.