Quando se trata de alta disponibilidade em computação em nuvem, as empresas adoram ir ao limite. O marketing dos fornecedores listam três, quatro e cinco “noves” para o tempo de inatividade, portanto, pode ser difícil para as equipes de TI determinar quanto tempo de atividade eles realmente precisam para seus próprios aplicativos.
Falhas e interrupções são um resultado compreensível para provedores de nuvem que operam em grande escala. Porém, provedores devem encontrar um equilíbrio entre eficiência operacional e alta disponibilidade.
Empresas como Google, Amazon e Microsoft têm acordos de nível de serviço (SLAs) de pelo menos 99,9% de disponibilidade (três noves) para cada serviço pago, mas não mais que 99,99% (quatro noves).
Para uma perspectiva, 99,9% de disponibilidade significa apenas nove horas de inatividade em um ano e 99,99% significa menos de uma hora de inatividade em um único ano.
Quando os profissionais de TI falam sobre um serviço altamente disponível, é a isso que se referem. Os principais provedores de nuvem podem cumprir a barreira relativamente alta nesses acordos, apesar das complexidades envolvidas, graças a exércitos de engenheiros talentosos e décadas de processos estabelecidos.
Normalmente, a empresa típica não pode replicar isso, mas não significa que seus clientes ou partes interessadas deixarão o tempo de inatividade desnecessário diminuir.
Na prática, sua empresa precisa de um SLA bem fundamentado que dite a disponibilidade do seu serviço, e tudo começa com a compreensão da complexidade que faz da sua solução.
Por que os SLAs são importantes?
Um acordo de nível de serviço (SLA) é um contrato entre um provedor de serviços e seus clientes, que documenta quais serviços o provedor fornecerá e define os padrões de serviço que o provedor é obrigado a cumprir.
Os provedores de serviços precisam de SLAs para ajudá-los a gerenciar as expectativas do cliente e definir os níveis de gravidade e as circunstâncias sob as quais eles não são responsáveis por interrupções ou problemas de desempenho.
Os clientes também podem se beneficiar dos SLAs, porque o contrato descreve as características de desempenho do serviço – que podem ser comparadas com os SLAs de outros fornecedores – e estabelece os meios para corrigir problemas de serviço.
O SLA é normalmente um dos acordos básicos que os provedores de serviços têm com seus clientes. Muitos provedores determinam um contrato de serviço principal para estabelecer os termos e condições gerais em que trabalharão com os clientes.
Além disso, o SLA é geralmente incorporado por referência no contrato principal do provedor de serviços. Quando um contrato é fechado, o SLA agrega maior especificidade quanto aos serviços prestados e às métricas que serão utilizadas para medir seu desempenho.
Alta disponibilidade na prática
Um site estático simples pode facilmente esperar atingir quatro noves (99,99%) ou mais de tempo de atividade, porque existem poucos pontos potenciais de falha.
Sim, existe o servidor web e a máquina em que ele está sendo executado, mas com a adição de um endereço IP flutuante, um balanceador de carga e um servidor redundante, seria raro se você tivesse algum tempo de inatividade evitável.
Agora, considere um aplicativo da web mais complexo. Embora quatro noves ainda sejam possíveis, a pressão para alcançá-los aumenta à medida que você adiciona componentes à mistura, como servidores de banco de dados e de cache ou armazenamento de objetos.
Divida o aplicativo em microsserviços, e o número de pontos de falha em potencial também aumenta.
Conforme a complexidade de um aplicativo aumenta, também cresce o risco de perder um nove em suas métricas de disponibilidade. Embora você sempre possa jogar mais redundâncias no problema, também aumentará seus custos e criará complexos desafios computacionais.
Afinal, manter várias cópias de um banco de dados em sincronia dificilmente é um problema trivial.
Com todas as informações disponíveis sobre o que você pode fazer para atingir diferentes níveis de disponibilidade?
A próxima etapa é identificar as consequências de perder um nove em seu SLA. Por exemplo, como seus clientes vão reagir se você tiver 54 minutos de inatividade em vez de 540 minutos ou 5.400 minutos? Quantos clientes você perderá em cada um desses níveis?
Esses são os tipos de perguntas que devem ser considerados ao elaborar seu SLA. Alta disponibilidade é importante na computação em nuvem, mas não deve consumir todos os seus recursos.
Embora o tempo de atividade de cinco noves (99,999%) possa ser impressionante para um gigante do e-commerce, seus clientes podem ser muito mais tolerantes com o tempo de inatividade do que, digamos, um provedor de serviços de emergência.
Certifique-se de não gastar tempo e energia excessivos em redundâncias desnecessárias.
Sobre a SND Soluções em Tecnologia
A SND é uma empresa que visa oferecer soluções de tecnologia para clientes de todo o Brasil. São mais de 33 anos trazendo soluções completas para o setor da tecnologia com honestidade e assertividade, sempre usando a inovação e pioneirismo ao nosso favor.
Preocupada com o constante movimento tecnológico, a SND inova e se adapta às necessidades e tendências do mercado mundial. Além de investir em produtos e infraestrutura, contamos também com profissionais qualificados e dispostos para colaborar com o crescimento de nossos clientes.
Mais que intermediar negócios fornecemos soluções agregadas, complementando o serviço e criando novas oportunidades através de uma relação estreita e de respeito mútuo.