La medida de un software de respaldo puede ser el poder de las herramientas de recuperación. Evite estos errores al respaldar servidores virtuales.
Con todas las opciones que tienen los administradores hoy en día, a veces puede ser fácil olvidarse de los respaldos de los servidores virtuales, sobre todo con la replicación siendo utilizada en el centro de datos. Sin embargo, la replicación no cubre todo. El propósito principal de un respaldo es crear una copia de los datos importantes que no está en línea para los hackers, o en caso de que tenga problemas de software o esos errores ocasionales que crean los administradores de sistemas. Las nubes y los entornos virtualizados traen sus propios desafíos a la hora de realizar las copias de seguridad. Las VM son transitorias y los datos están en constante movimiento. Los administradores de sistemas necesitan tener una estrategia de respaldo de servidores virtuales implementada para asegurarse de que cada respaldo se maneja correctamente.
El enfoque en el manejo de los sistemas virtuales es imponer una estructura de gestión de datos. Es importante averiguar qué datos necesitan ser guardados y dónde existe la copia primaria. Esta información tiene que ser superpuesta con la frecuencia de respaldo con base en políticas de objetivo de punto de recuperación, las cuales probablemente diferirán de un conjunto de datos a otro. Aquí es donde la replicación tiene un impacto. Si se hace correctamente, con geodiversidad a través de múltiples zonas, se niegan un montón de mecanismos de fallas, como problemas de hardware o de energía.
Geodiversidad e instantáneas como parte de una estrategia de respaldo
La geodiversidad, junto con instantáneas frecuentes, ofrece un buen nivel de disponibilidad e integridad de datos. Las instantáneas limitan la exposición a eventos de software, mientras que proporciona un retroceso (rollback) controlado. Los problemas de hackeo, por desgracia, tienen una imagen diferente, ya que un hackeo puede pasar desapercibido durante días o incluso semanas, como han demostrado algunos casos recientes de alto perfil.
Por supuesto, la geodiversidad puede no ser una opción fácil con nubes puramente privadas o clústeres de servidores virtuales, que tienden a poner el énfasis nuevamente en el respaldo como un vehículo de protección.
El arte en el manejo de estos problemas es determinar cuando comenzó el hackeo, dando una imagen de línea de base del almacenamiento de datos, y luego entender los conjuntos de datos afectados por el hackeo. Aquí es donde los buenos paquetes de respaldo se destacan del resto. En muchos sentidos, la medida de un buen software de respaldo es lo poderosas que son las herramientas de recuperación.
La estrategia de respaldo en un entorno virtual se compone de dos partes. Los datos almacenados en el almacenamiento en red pueden ser protegidos en el dispositivo de almacenamiento, lo que simplifica la protección de los datos compartidos por muchas máquinas y proporciona un vehículo más simple para la recuperación. Por otro lado, los archivos de datos específicos para una VM en particular necesitan ser tratados de la misma forma en que son tratados los archivos del servidor. Este es especialmente el caso si se proporciona almacenamiento en instancias locales para las máquinas virtuales.
El almacenamiento en red es mejor manejado por la instantánea, y luego por el proceso de respaldo. Esto debería mantener los datos en un nivel autoconsistente si es necesaria la recuperación. El respaldo incremental ahorra en el tráfico WAN, con independencia de si los datos se representan en el almacenamiento de disco local antes de ser trasladados a un lugar distante.
Donde la gestión de datos es menos estructurada, como es el caso en el que muchos arrendatarios acceden al conjunto de VMs, es en el respaldo de almacenamiento en red, que carece de la visibilidad para manejar el mapa de datos fragmentados. En este caso, la mejor opción es recurrir al respaldo de la máquina virtual. Hay dos opciones para ello: Una es una respaldar un conjunto de archivos seleccionados en cada máquina; la alternativa es simplemente respaldar toda el VM. A menudo, la última es la opción elegida, simplemente porque es más fácil de configurar, gestionar, e igual de importante, fácil de restaurar.
Un error frecuente es suponer que las máquinas virtuales se comportan igual que los entornos heredados. Los administradores utilizan herramientas de respaldo tradicionales, con agentes en las máquinas virtuales, entre otras. En muchos casos, estas herramientas están deliberadamente obsoletas –estando un par de versiones atrás– de forma que se logre la estabilidad demostrada. Con la rápida evolución del software en la nube y los entornos virtuales, esto impide el uso de las vías y APIs diseñadas específicamente para respaldos eficientes, lo que puede alentar las operaciones de forma espectacular.
Hay muchas herramientas que soportan el respaldo de VM. Los grandes proveedores de nube tienen sus propias ofertas, al igual que los proveedores de hipervisores. Las herramientas de terceros aprovechan los conjuntos de APIs y ofrecen sus propios enfoques, especialmente en el área de recuperación.
Una última cuestión es la ubicación del respaldo. El rendimiento de la WAN en todo el mundo, en general, no está al día con las necesidades de tráfico, especialmente en los Estados Unidos. Este es un problema menor con las máquinas virtuales en la nube pública, que tienen acceso a los conjuntos de almacenamiento local como una primera parada en el proceso de respaldo, y luego pueden utilizar la geodiversidad inherente de estas nubes para mover los datos fuera del sitio. Las nubes públicas también tienen opciones para el archivado, y evoluciones recientes de Google, por ejemplo, han trasladado las velocidades de acceso muy cerca de los datos en línea por una fracción del costo.
Para las nubes privadas y los clústeres virtualizados más simples, el respaldo local es la respuesta a corto plazo, con una transferencia no integrada de datos a una nube pública como una opción, pero el movimiento hacia las nubes híbridas abre el almacenamiento en la nube, con todos sus beneficios marginales en geodiversidad y facilidad de uso. En última instancia, el almacenamiento en la nube tiene demasiados beneficios para ignorarlo, probablemente poniendo fin al uso de mecanismos de almacenamiento local y bibliotecas de cintas. Estos serán reemplazados por puertas de enlace de respaldo en nube, probablemente ejecutándose ellas mismas en máquinas virtuales, con respaldos almacenados en caché durante un tiempo a nivel local, debido a la evidencia de que los respaldos recientes representan la mayoría de las restauraciones. searchdatacenter