Como discutido no post anterior sobre HA e DR em ambientes on-premise, garantir a continuidade operacional e a integridade dos dados é crucial para o sucesso de qualquer empresa. No contexto on-premise, essas estratégias envolvem investimentos em hardware redundante, configuração de clusters e replicações locais para evitar falhas e garantir recuperação rápida.
Com a migração para ambientes cloud, a aplicação de HA e DR se adaptou às características da infraestrutura oferecida por provedores de nuvem. Nesse novo cenário, as organizações podem integrar as técnicas de alta disponibilidade e recuperação de desastres de maneira mais acessível e flexível, beneficiando-se dessas práticas sem a necessidade de uma grande infraestrutura física.
Neste post, exploraremos as implementações de HA e DR na nuvem, focando nas soluções do Azure para garantir resiliência, escalabilidade e custo-benefício.
High Availability (HA)
Nos ambientes de banco de dados em cloud, a replicação lógica de dados e serviços em diversas regiões geográficas garante a alta disponibilidade. Isso garante que, mesmo diante de falhas, o sistema continue operando. No Azure, por exemplo, existem várias soluções para garantir HA, como:
Availability Sets
Os Availability Sets distribuem VMs em conjuntos lógicos, garantindo que as instâncias fiquem separadas fisicamente dentro da mesma região. Cada VM associa-se a um fault domain e a um update domain, que são grupos que fazem agrupamentos físicos e lógicos (permitidos três fault domains e 20 update domains por Availability Set). Um fault domain agrupa VMs que compartilham o mesmo hardware, fonte de alimentação e rede. Já um update domain agrupa as VMs que podem ser reiniciadas/atualizadas em conjunto, para que, durante esse processo, outro grupo esteja disponível.
Além da disponibilidade durante reinicializações, essa feature oferece proteção contra falhas de hardware, reduzindo a possibilidade de interrupções no serviço. Nesse caso, o cliente paga apenas por VM criada, sem custos vinculados ao Availability Set em si.
Availability Zones
As Availability Zones são zonas localizadas dentro de uma mesma região do Azure, ficando perto o suficiente para minimizar a latência e longe o bastante para se isolarem de desastres naturais ou outros incidentes que possam afetar todas de uma vez. Essas estruturas contam com um ou mais datacenters independentes, com fontes de alimentação, refrigeração e redes redundantes. Nesse cenário, se uma das zonas, porventura, para de funcionar, as outras devem permanecer funcionais.
Apesar da alta disponibilidade das Availability Zones, uma zona inteira pode ser afetada na pior das hipóteses. Por isso, existem region pairs em outra região na mesma área geográfica, a pelo menos 300 milhas de distância. Os Region Pairs alocam réplicas dos serviços primários utilizados em uma região, permitindo que o failover automático aconteça em casos de falha.
Azure Load Balancer
Serviço de balanceamento de carga, oferecido pelo Azure. Ele permite a distribuição do tráfego de rede de entrada, que chega no front-end, entre instâncias de uma aplicação ou VMs (backend pool instances). Esse recurso evita a sobrecarga das instâncias, distribuindo o fluxo de dados conforme a capacidade de processamento disponível e outros critérios avaliados no processo. O Azure Load Balancer provê escalabilidade ao tráfego de rede, distribuindo as solicitações à medida que aumentam e garantindo alta disponibilidade nas aplicações que recebem o fluxo.
Em casos de falha de uma instância, redirecionam-se as solicitações para outra instância que possa realizar o processamento. Assim como, caso ocorram falhas a nível de uma região do Azure, encaminha-se o tráfego para a região mais próxima de forma automática.
Azure VM Scale Sets
O recurso do Azure que permite a criação e o gerenciamento de conjuntos de VMs idênticas para lidar com cargas de trabalho em escala. Conforme a demanda, o número de VMs é ajustado automaticamente, melhorando o desempenho e a disponibilidade das aplicações durante picos de carga. Além disso, esse serviço não possui custos adicionais, sendo cobrados apenas os valores vinculados às VMs, Load Balancers e Managed Disks utilizados em um Scale Set.
Disaster Recovery (DR)
O DR na cloud envolve a recuperação de dados e serviços após eventos adversos, minimizando o tempo de inatividade e perdas de dados. No Azure, os principais serviços são:
Azure Site Recovery (ASR)
O Azure Site Recovery (ASR) trabalha com a replicação de workloads em máquinas físicas ou VMs para um ambiente secundário, seja ele físico ou próprio do Azure (réplica em outra região do Azure, por exemplo). Essa estratégia permite, em casos de falhas no ambiente primário, fazer failover para o local secundário e manter as aplicações acessíveis nesse ponto. Além disso, além das replicações de VMs do Azure, o ASR possibilita que esse processo seja feito em VMs locais e em VMs VMware. Com isso, utilizando esse recurso, também é possível realizar testes nos planos de replicação e DR sem interromper demais processos em andamento, entre várias outras vantagens que o Azure Site Recovery oferece.
Azure Backup
O Azure provê serviços simplificados de backup para a proteção dos dados e aplicações contra perdas e demais incidentes, realizando backups de VMs, databases, servidores on-premise e aplicações, e os armazenando em cloud ou localmente. Além disso, o processo de restauração desses backups também é simples, pois a armazenamento ocorre em um cofre dos Serviços de Recuperação e a gestão é feita através de pontos de recuperação, possibilitando a restauração dos dados a partir do ponto desejado.
Optar pelo Azure Backup oferece vantagens como automatização, redução de custos (paga-se pelos recursos em uso), escalabilidade e segurança com criptografia, garantindo eficiência e proteção.
–
Focando nos recursos das plataformas cloud, as estratégias de HA e DR tornam-se fundamentais para garantir a continuidade dos negócios em cenários imprevisíveis, sem a necessidade de estruturas físicas complexas. Portanto, para empresas que buscam aprimorar seus ambientes de bancos de dados, em infraestruturas resilientes e ágeis, a combinação de HA e DR em ambientes de cloud é indispensável. A escolha de uma arquitetura que suporte falhas e promova uma recuperação ágil não é mais um diferencial, e sim um fator necessário e determinante para o sucesso em um mercado cada vez mais dependente da tecnologia.
Por hoje era isso, pessoal. Espero que tenham gostado.
Até o próximo post! 😊
Por Camile Ferreira Pedrolo