Sempre que falamos sobre alta disponibilidade, nos vem à cabeça redundância e DR. Particularmente, sempre que vou em um cliente, e desenhamos uma solução em conjunto, ao perguntar sobre RTO e RPO, temos uma pausa.
Como ter um RTO e RPO consistente, principalmente em sites DR remotos?
Muitas vezes, por não conhecer a solução, o responsável por abrir as portas para o SF no novo ambiente, esquece de apresentar uma solução extremamente importante para minimizar o impacto e possibilitar, de maneira automática e sem investimentos pesados, uma solução de replicação de dados.
O Volume Replicator, mais conhecido como VVR, é uma solução que permite a replicação de Volumes entre sistemas através de WAN ou LAN, de maneira síncrona ou assíncrona, e é nesse ponto que é importante elucidar as diferenças para o cliente, mas quanto isso ocorre, muitas vezes isso é feita de maneira superficial, sem realmente entender como o processo ocorre.
Apesar de muitos outros pontos que podemos usar no VVR, ao apresentar para o cliente as possibilidade de replicação, devemos antes solucionar como o VVR irá trabalhar com a replicação baseado no business e continuidade do ambiente.
Em uma replicação, tanto síncrona quanto assíncrona, o VVR irá se utilizar da área de SRL (Storage Replication Log) para fazer a gravação das alterações existente no volume. A partir desse ponto que elas se diferem.
Em uma replicação síncrona, o VVR irá mandar as informações assim que elas chegam ao SRL primário, aguardando então a resposta do destino. Essa transferência é feita diretamente para a memória, fazendo assim com que a latência de escrita seja desconsiderada nessa replicação. Após isso, existe então o check entre o site primário e o secundário, e em caso de inconsistência, a replicação é refeita.
Já em uma replicação assíncrona, o VVR irá enviar as informações localizadas no SRL baseadas em disponibilidade de recurso. Sem usar a memória, a escrita é feita diretamente no disco, usando o SRL para garantir a ordem correta da escrita, evitando assim inconsistência nos dados. Sendo assim, a replicação estará sempre alguns passos atrasados do site primário.
Esses conceitos são de grande importância para a sugestão ao cliente, isso por que nem sempre a utilização de uma replicação síncrona implica no melhor cenário. O principal vilão disso, falando da realidade brasileira hoje, é a latência entre sites.
Quanto sugerido ao cliente, é de extrema importância que exista um entendimento não apenas nos recursos de hardware e software, mas também nos mecanismos que usaremos nas transferências. Note por favor que foi levado apenas em consideração WAN e LAN. Existem outros mecanismos que podemos utilizar, mas que não foram abordados nesse momento.