viernes, 13 de noviembre de 2015

Por qué elegir sistemas de almacenamiento de objetos en lugar de almacenamiento de archivos

El almacenamiento de archivos tradicional puede tener dificultades manejando las masivas cantidades actuales de metadatos. El almacenamiento de objetos se ha convertido en un sustituto popular.

Los sistemas de almacenamiento de objetos han sido promovidos como "la siguiente gran cosa" durante casi una década, a pesar de que aún no han desarrollado un racional suficientemente convincente para desplazar el almacenamiento convencional basado en el sistema de archivos en la mayoría de los ambientes. Sin embargo, conforme el almacenamiento se vuelve cada vez más poblado con archivos grandes y pequeños –los llamados "datos no estructurados”– discutir todos estos datos en una estructura jerárquica de volúmenes, directorios y subdirectorios soportados por estructuras complejas de nodos y extensiones de inodos es cada vez más y más difícil de manejar.

En algunos casos, las empresas informan almacenar cientos de millones de archivos muy pequeños en un solo directorio, usado para construir una página web. En otros casos, las empresas han registrado digitalmente imágenes médicas o videos de videovigilancia como archivos, que necesitan no solo ser buscados y recuperados rápidamente, sino también modificados con la adición de metadatos altamente granulares para permitir su uso eficiente. En resumen, el sistema de archivos está empezando a deshilacharse en los bordes, a medida que cambian los requisitos de almacenamiento.

El almacenamiento de objetos implica la sustitución de las estructuras del sistema de archivos tradicionales con un marco orientado a objetos. Básicamente, en lugar de organizar los archivos en un árbol jerárquico de archivos, los objetos de datos y los archivos se organizan en contenedores o "cubos", cada uno con su propia y única identificación o clave. El acceso se hace simplemente mediante la clave o la ID. La mayoría de los metadatos sobre el objeto o el archivo son almacenados con el objeto o el archivo, lo que reduce la carga de la gestión de metadatos que hay en la mayoría de los sistemas de archivos.

¿Qué es exactamente el almacenamiento de objetos? Se trata de una arquitectura de almacenamiento que aborda y maneja unidades individuales de almacenamiento. A continuación, asigna los objetos un identificador único, de modo que los objetos pueden ser recuperados sin conocer su ubicación física.

Los sistemas básicos de almacenamiento de objetos son fáciles de implementar y operar, y son bastante minimalistas en términos de funcionalidad. Los usuarios pueden almacenar, recuperar, copiar y borrar objetos, y especificar qué usuarios tienen qué permisos para llevar a cabo cuáles funciones. Cada vez más, los estándares REST de la World Wide Web Consortium se están emparejando con el almacenamiento de objetos para facilitar la integración con otras aplicaciones y métodos de acceso a datos basados en los sistemas de archivos tradicionales. Las APIs y primitivos REST se utilizan para interactuar con contenedores y objetos, lo que permite el uso de motores de búsqueda externos –en el caso de las tiendas de objetos de nube pública populares– y otras funciones de software de aplicación para interactuar directamente con objetos (en el caso de algunos sistemas de edición de video).

Los sistemas de almacenamiento de objetos también permiten a los usuarios definir los metadatos almacenados con el objeto en un grado mucho mayor y con una extensión mucho más granular de lo que es posible con la mayoría de los sistemas de archivos. Esta es una muy buena noticia para las aplicaciones de archivo, el análisis de grandes datos y otros casos en que los volúmenes de datos son grandes y la búsqueda detallada de metadatos puede dar un gran valor.

El almacenamiento de objetos también está pensado para hacer un mejor uso de la capacidad del disco que un sistema de archivos tradicional, ya que el espacio no está reservado para archivos incompletos, y debido a que los registros de las rutas de directorio y los nombres de archivo normalmente consumen poco espacio en el disco. De hecho, en las implementaciones más elegantes de sistemas de almacenamiento de objetos –tales como Caringo Swarm– solo los objetos se escriben en el disco, mientras que un pequeño registro sin estado se mantiene en la memoria RAM, lo que acelera considerablemente las operaciones.

Con el control sobre la estructura de objetos y metadatos, se puede hacer mejor uso de los servicios de protección de datos. La operación de copia de datos se puede aplicar a los objetos que realmente requieren múltiples copias separadas basadas en las políticas centradas en metadatos. Los archivos que están cambiando con menor frecuencia pueden delegarse a procesos como la codificación de borrado, en lugar de a las copia espejo o mirroring.

Algunos proveedores están trabajando para encontrar maneras de organizar mejor los datos en cachés y buffers al recodificarlas inicialmente como un objeto, y luego utilizar los metadatos de objetos para ayudar en la gestión de la caché. Amazon ha puesto en marcha el almacenamiento de objetos en su Simple Storage Service y lo soporta con protocolos basados ​​en REST de especialidad que se han convertido en una parte tan importante del léxico de interconexión de almacenamiento como Fibre Channel, iSCSI o NFS.

Recuerde, si usted está almacenando datos en servicios en la nube, es probable que ya esté utilizando sistemas de almacenamiento de objetos en la actualidad. Si no es así, es el momento de considerar cómo el almacenamiento de objetos puede beneficiarlo. almacenamiento de objetos