Armazenando de Cold Data [Archival] nas Provedoras de Cloud Computing – AWS, Azure e GCP

Posted on agosto 15, 2017

1


Introdução

O armazenamento de arquivos, backups e dados na Nuvem é na verdade um dos primeiros passos quando empresas estão querendo iniciar em qualquer plataforma de Cloud Computing, com isso é importante saber como tirar o máximo e quais as opções disponíveis. Muitos pensam que a quantidade de arquivos dentro da nuvem não influencia tanto o valor pago, de fato, passar essa responsabilidade para uma provedora de Cloud faz com que a equipe de Infraestrutura possa respirar muito bem, armazenamento remete a storage que por sua vez não é barato, portanto se fizermos a comparação de preço será claro que guardar seus dados na nuvem pode ser muito vantajoso porém sem a estratégia correta pode passar a ser uma das maiores fontes de billing na sua Cloud, antes de começar qualquer projeto é interessante entender quais os tipos e tecnologias que podem te ajudar com isso, mas antes disso vamos entender um pouco sobre os tipos.

Cold, Warm, Hot Data

Image result for cold hot warm icon

Normalmente dividimos a característica do dados em 3 tipos – Cold (Frio), Warm (Morno) e Hot (Quente), esse tipo de divisão é muito importante entender, trazendo para o SQL Server imagine que quando falamos de dados frios estamos falando de acesso ao disco, quando falamos de warm remetemos ao buffer pool extension que passa a ser um intermédio entre o disco e a memória e por último quando mencionamos algo hot que se refere a memória, sendo assim conseguimos definir da seguinte forma:

ColdInformações que não precisam ser acessadas urgentemente ou que não são tocadas frequentemente, geralmente podemos falar de arquivos de backups ou dados não acessados com uma grande frequência, com isso o custo aqui é mais baixo do que o hot layer, esses dados são guardados e gerenciados longe das máquinas e por isso o tempo de recuperação passa a ser maior, até porque nessa camada é aceitável que você tenha um maior tempo para recuperar as informações caso algum problema ou necessidade aconteça.

Warm = Exatamente o meio entre os dois mundos, informações que podem ser acessadas quase que frequentemente porém pode ser aceitável um maior tempo para a recuperação desse dado ou registro.

Hot = Dados que necessitam ser acessados instantaneamente, performance premium, geralmente informações que são críticas para o negócio e que por isso precisam estar disponíveis o mais rápido possível, pensando nesse tipo de acesso normalmente falamos de SSDs para trazer mais rapidez e performance na hora do acesso a informação para que a mesma possa ser carregada em memória o quanto antes.

AWS, Azure e GCP para Cold Data

Os mais famosos provedores de Cloud Computing oferecem serviços específicos para o armazenamento de dados frios [cold] dentro da cloud, aqui irei mostrar como você pode tirar o máximo do armazenamento de dados archival de cada uma.

Amazon Web Services

Image result for amazon glacier icon

O Amazon Glacier é a proposta da Amazon para a realização do armazenamento dos dados frios, ele é o mais barato da categoria dentre todas as ofertas e custa $0.004 por GB por Mês e com durabilidade de 99.999999999%. Ponto importante é que por se tratar do gerenciamento de dados frios o tempo de recuperação padrão para esse tipo de armazenamento é de 3-5 horas ou seja você deve incluir isso no seu SLA, para mais informações navegue aqui.

Google Cloud Platform

Image result for google nearline

A proposta da Google se difere um pouco, eles oferecem o serviço Google Nearline & ColdLine aonde o Nearline oferece o layer de warm data e o ColdLine oferece o armazenamento archival. O billing também se difere consideravelmente, para o NearLine temos o valor de $1/c por GB aonde o ColdLine custa $0.7 por GB, importante entender que a Google oferece a granularidade por tipo, isso passa a ser bem interessante para o mapeamento do seu SLA. para mais informações navegue aqui.

Microsoft Azure 

Image result for azure storage icon

No Microsoft Azure, utilizamos o famoso Azure Blob Storage com a criação pelo tipo – cool storage tier, ele que irá acomodar os dados frios. Possui a disponibilidade de 99% e com preço reduzido por se tratar de armazenamento archival. Para realizar a criação desse tipo siga esse tutorial passo a passo – https://docs.microsoft.com/en-us/azure/storage/storage-blob-storage-tiers 

AWS Vs. GCP Vs. Microsoft Azure

Image result for aws  gcp  azure

Recomendo a leitura desse blog post no qual @Richard.Burley mostra a comparação entre os 3 além do preço e qual seria mais atrativo para essa função.