Errores Comunes y Soluciones en Copias de Seguridad BMR con Azure Backup Server

Al implementar copias de seguridad de Bare Metal Recovery (BMR) utilizando Azure Backup Server (MABS) o System Center Data Protection Manager (DPM), los usuarios pueden encontrar errores que impiden la correcta realización de estas copias. Uno de los errores más frecuentes se manifiesta cuando el sistema de copia de seguridad de Windows (WSB) en el equipo protegido experimenta una falla, a menudo indicada por un identificador de evento específico (por ejemplo, WSB Event ID 517) y un código de error de WSB (como 0x6B48C3A0).

Estos errores suelen estar asociados con inconsistencias en la réplica del escritor de orígenes de datos que no son VSS, lo que provoca que la réplica no sea coherente con el origen de datos protegido. En tales escenarios, todas las actividades de protección del origen de datos fallarán hasta que se logre una sincronización y una comprobación de coherencia adecuadas.

Otros mensajes de error comunes pueden incluir la incapacidad de leer o escribir en el almacenamiento implicado en la operación actual, o la imposibilidad de completar la operación de copia de seguridad iniciada en un momento específico con códigos de error como "0x8078015B". Este último indica que las Copias de seguridad de Windows han encontrado un problema al acceder a una carpeta compartida remota, sugiriendo que se reintente la operación asegurándose de que la carpeta compartida remota esté disponible y sea accesible.

Causas y Diagnóstico de Errores en Copias de Seguridad BMR

La raíz de estos errores puede ser multifacética. Un problema recurrente es la incapacidad de Windows Server Backup (WSB) para comunicarse adecuadamente a través de SMB (Server Message Block) con el servidor de copia de seguridad. Esto puede ocurrir si el servicio del servidor no se está ejecutando correctamente, si los discos presentan una latencia elevada de E/S que impide la respuesta de SMB, o si el sistema de archivos subyacente tarda demasiado en responder a una operación.

En el contexto de BMR, el servidor de copia de seguridad de Windows escribe directamente en el recurso compartido de DPM o Azure Backup Server. Si la comunicación a través de SMB falla, puede manifestarse como un error. Es crucial verificar que el servicio del servidor esté operativo y que los discos respondan de manera oportuna.

Otro escenario de error se presenta con el mensaje 'Error irrecuperable durante una operación del complemento ‘Copias de seguridad de Windows Server (Wbadmin.msc)‘'. Este error suele estar relacionado con la corrupción o inconsistencia en el catálogo de copias de seguridad o en sus archivos de registro internos. La consola de administración de copias de seguridad lanza una excepción irrecuperable en estos casos.

La solución a estos problemas puede implicar la instalación del componente 'Copias de seguridad de Windows Server' si no está activado.

Configuración y Requisitos para BMR

Una copia de seguridad de BMR, por definición, incluye una copia de seguridad del estado del sistema. El estado del sistema se refiere a la copia de seguridad de los archivos del sistema operativo, lo que permite la recuperación cuando un equipo se inicia pero ha perdido archivos del sistema y el registro. Una copia de seguridad de reconstrucción completa, por otro lado, abarca los archivos del sistema operativo y todos los datos de volúmenes críticos, excluyendo los datos de usuario.

Cuando se ejecuta una copia de seguridad del estado del sistema, el servidor de copia de seguridad se comunica con WSB para solicitar dicha copia. Por defecto, ambos sistemas suelen utilizar la unidad con más espacio libre disponible. Sin embargo, si el servidor de protección está en un clúster, una unidad de clúster podría ser seleccionada. Si la propiedad de esta unidad cambia a otro nodo y se intenta una copia de seguridad del estado del sistema, la unidad no estará disponible, provocando un error en la copia de seguridad.

Gestión del Almacenamiento y Espacio en Disco

Durante el proceso de copia de seguridad, WSB crea una carpeta llamada WindowsImageBackup en la raíz de la carpeta de restauración. Todos los datos de la copia de seguridad se colocan en esta carpeta. Es importante destacar que esta carpeta y su contenido no se eliminan automáticamente al finalizar la copia de seguridad o la transferencia, y se crea una nueva carpeta para cada copia de seguridad.

En el caso de BMR, el trabajo de copia de seguridad se guarda directamente en un recurso compartido en el servidor de Azure Backup Server o DPM. El servidor de copia de seguridad llama a WSB y comparte el volumen de réplica para esa copia de seguridad de BMR. En esta situación, no es necesario que WSB utilice la unidad con más espacio libre.

La protección a corto plazo en cinta (disco a cinta o D2T) no es compatible con BMR. Para la protección de BMR, a diferencia de la protección del estado del sistema, el servidor de copia de seguridad no tiene requisitos de espacio en el equipo protegido, ya que WSB transfiere directamente las copias de seguridad al servidor de copia de seguridad.

Azure Backup Server reserva una cantidad específica de espacio en el volumen de réplica para BMR, típicamente 30 GB. Esta asignación se puede modificar en la configuración del grupo de protección o mediante cmdlets de PowerShell. Es fundamental ajustar este valor según el tamaño esperado de las copias de seguridad de BMR en el entorno, ya que DPM no calcula el tamaño del origen de datos de BMR por sí mismo.

El tamaño aproximado de una copia de seguridad de BMR se puede calcular como la suma del espacio utilizado en todos los volúmenes críticos, que incluyen el volumen de arranque, el volumen del sistema y el volumen que aloja datos del estado del sistema (como Active Directory).

Al migrar de la protección del estado del sistema a la protección de BMR, esta última requiere menos espacio en el volumen de puntos de recuperación, aunque el espacio adicional en el volumen no se recupera automáticamente. Por el contrario, al pasar de la protección del estado del sistema a BMR, se necesita más espacio en el volumen de réplica, y este volumen se amplía automáticamente. Si se pasa de BMR a la protección del estado del sistema, se necesita más espacio en el volumen de puntos de recuperación, y DPM podría intentar aumentar el volumen automáticamente.

Diagrama esquemático mostrando el flujo de una copia de seguridad BMR desde el servidor protegido hasta el servidor de Azure Backup/DPM.

Pasos para la Implementación y Configuración

La implementación de Azure Backup Server o DPM es el primer paso. Posteriormente, se debe configurar el almacenamiento, que puede ser en disco, cinta o en la nube con Azure. A continuación, se instala el agente de protección en cada equipo que se desea proteger.

Es importante recordar que no se puede proteger BMR y el estado del sistema para el mismo equipo en grupos de protección diferentes. Cuando se selecciona BMR, el estado del sistema se habilita automáticamente.

Configuración de Copias de Seguridad a Corto y Largo Plazo

En la configuración de protección de datos, se especifica cómo se gestionarán las copias de seguridad a corto y largo plazo. La copia de seguridad a corto plazo se realiza inicialmente en disco, con la opción de transferir los datos del disco a Azure Backup para almacenamiento a corto o largo plazo.

Para el almacenamiento a corto plazo en disco, se define el rango de retención y la frecuencia de las copias de seguridad incrementales. También se puede configurar una copia de seguridad completa rápida (Express Full Backup).

Para el almacenamiento a largo plazo en cinta, se especifica el período de retención (de 1 a 99 años) y la frecuencia de las copias de seguridad. En el caso de usar una unidad de cinta independiente, DPM puede utilizar la misma cinta para copias de seguridad diarias hasta que no haya suficiente espacio.

El tamaño total de los datos a respaldar y el espacio en disco a aprovisionar en el servidor de copia de seguridad son configuraciones clave. El servidor de copia de seguridad elegirá un volumen de copia de seguridad adecuado, pero las opciones de volumen se pueden editar en los detalles de asignación de disco.

Gestión de la Replicación y Comprobaciones de Coherencia

La elección del método de creación de réplica determina cómo se gestiona la replicación inicial de los datos. Si se opta por la replicación a través de la red, se recomienda seleccionar una hora de menor tráfico. Las opciones de comprobación de coherencia permiten automatizar este proceso, ya sea ejecutándose solo cuando los datos de réplica son inconsistentes o según una programación definida.

Las copias de seguridad en línea en Azure dependen de una copia de seguridad previa basada en disco local. La replicación inicial se puede realizar por red o mediante propagación sin conexión utilizando la característica Azure Import.

Proceso de Recuperación

Una vez configurada la copia de seguridad, la replicación inicial de los datos se inicia al crear el grupo de protección. Cuando finaliza, el estado del grupo de protección se muestra como "Correcto".

La recuperación del estado del sistema o BMR se puede realizar en una ubicación de red. Para una copia de seguridad de BMR, se utiliza el Entorno de Recuperación de Windows (WinRE) para iniciar el sistema y conectarlo a la red. Posteriormente, se emplea Windows Server Backup para recuperar los datos desde la ubicación de red.

Los puntos de recuperación disponibles se visualizan en un calendario. Al especificar el destino de la recuperación, es crucial asegurarse de que el destino seleccionado disponga de espacio suficiente para los datos. En la pantalla de opciones de recuperación, se configuran los ajustes de seguridad y se puede optar por utilizar instantáneas de hardware basadas en SAN para una recuperación más rápida, si la infraestructura lo soporta.

Para que la restauración funcione correctamente, la carpeta compartida debe estar configurada adecuadamente. La carpeta que se comparte debe estar un nivel por encima de WindowsImageBackup, de modo que la raíz de la carpeta compartida sea la propia WindowsImageBackup.

Durante el proceso de recuperación, se puede seleccionar una imagen del sistema, buscarla en la red y, si aparece una advertencia, confirmarla. El sistema buscará las copias de seguridad específicas disponibles en ese punto de recuperación. Finalmente, se elige cómo restaurar la copia de seguridad, incluyendo la opción de formatear y reparticionar discos, para luego iniciar la restauración.

Soluciones a Errores Específicos y Mensajes de Advertencia

Existen varios errores y advertencias que pueden surgir durante el proceso de copia de seguridad y recuperación de BMR:

  • Error irrecuperable en el complemento de Copias de seguridad de Windows Server: Puede deberse a corrupción en el catálogo de copias de seguridad o archivos de registro. Asegurarse de que el componente 'Copias de seguridad de Windows Server' está instalado y activado es el primer paso.
  • Error al acceder a carpetas compartidas remotas: Verificar la disponibilidad y accesibilidad de la carpeta compartida, y asegurarse de que el servicio del servidor esté en ejecución y que los discos no tengan latencia alta que impida la respuesta SMB.
  • Credenciales de almacén no válidas: Descargar el archivo de credenciales más reciente del almacén, intentar descargarlas en un directorio local diferente, o crear un nuevo almacén.
  • Problemas con la configuración de fecha y hora: Asegurarse de que la configuración de fecha y hora en los sistemas sea correcta.
  • Exceso de archivos en c:\windows\temp: Mover o eliminar archivos obsoletos de la carpeta Temp si contiene más de 65000 archivos.
  • Problemas con certificados: Eliminar el certificado Windows Azure Tools desde el nodo Personal > Certificados en la consola de Administrar certificados de equipo y volver a intentar el registro en el cliente de Azure Backup.
  • Directivas de grupo implementadas: Asegurar que no interfieren con el registro del almacén.
  • Agente de MARS desactualizado: Instalar la versión más reciente del agente de MARS (2.0.9249.0 o posterior).
  • Ausencia de Windows Server Backup en el servidor protegido: Instalar Windows Server Backup si no está presente.
  • Espacio insuficiente en el grupo de almacenamiento: Comprobar el espacio en el grupo de almacenamiento de DPM o Azure Backup Server y asignar almacenamiento adicional si es necesario.
  • Servicio de instantáneas de volumen deshabilitado: Configurar el Servicio de instantáneas de volumen (VSS) para que se inicie manualmente y luego iniciar el servicio.
  • Error al crear instantánea del volumen: Intentar aumentar el espacio en la réplica y en el volumen de punto de recuperación.
  • Servicio OBEngine no en ejecución: Iniciar el servicio OBEngine utilizando el comando net start OBEngine.
  • Frase de contraseña de cifrado no establecida: Configurar una frase de contraseña de cifrado y verificar la existencia de la ubicación temporal (ScratchLocation) en el registro.
  • Restauración en servidor alternativo no asociado al mismo almacén: Asegurarse de que tanto el servidor a recuperar como el servidor original estén asociados al mismo almacén de Recovery Services.
  • Errores en trabajos de puntos de recuperación para máquinas virtuales VMware: Restablecer el CTK (Change Tracking) en VMware, verificar la ausencia de discos independientes, y detener y volver a proteger las máquinas virtuales afectadas.
  • Problemas de conectividad de red o configuración de proxy: Asegurar una conectividad de red adecuada y una configuración de proxy correcta.
  • Discos agregados al grupo de almacenamiento con particiones: Eliminar los volúmenes existentes en los discos antes de agregarlos al grupo de almacenamiento.
  • No se ha podido modificar la directiva de copia de seguridad: Verificar que la versión del agente de copia de seguridad y de Azure Backup Server sean compatibles y que el período de retención esté configurado por encima de los valores mínimos especificados.
  • Error inesperado durante la ejecución del trabajo: Configurar el espacio de almacenamiento de instantáneas como ilimitado o intentar eliminar el grupo de protección existente y crear varios nuevos.
  • PIN de seguridad incorrecto o expirado: Generar un PIN de seguridad válido desde el portal de Azure.
  • Uso de cuentas profesionales o educativas para retransmisión SMTP: Asegurarse de que la opción de retransmisión anónima esté habilitada en Exchange, o configurar IIS para actuar como retransmisión a Office 365.
  • Error en la instalación de Microsoft Azure Recovery Services: Asegurar la correcta conectividad de red, configuración de proxy y que se está ejecutando el agente MARS más reciente.
  • Propiedades de VMware apuntando a una instancia antigua de MABS: Eliminar la referencia a la instancia antigua de MABS en los atributos personalizados de vCenter y modificar el grupo de protección en la nueva instancia.

Curso de Windows Admin Center - Configuración de Azure Backup

La solución de estos errores a menudo requiere una combinación de verificación de configuraciones, ajuste de parámetros y aseguramiento de la correcta comunicación entre los diferentes componentes del sistema de copia de seguridad.

tags: #w #201 #6error #en #la #copia