O que é RAID? Revelando os prós e contras de 15 configurações RAID!
|
|
Tempo de leitura 15 min
|
|
Tempo de leitura 15 min
Com a crescente quantidade de dados, o espaço de armazenamento é vital. Atualmente, jogos AAA podem exigir centenas de gigabytes de espaço, enquanto um filme em Blu-ray 4K HD pode chegar a 70/80 gigabytes. Até mesmo as fotos e vídeos em HDR que tiramos com nossos celulares ocupam bastante espaço de armazenamento.
Geralmente compramos um disco rígido quando nosso espaço de armazenamento é insuficiente. No entanto, podemos enfrentar o problema de partições de disco rígido quando temos mais de um. Para dados importantes, pode ser necessário realizar backups manuais dos arquivos em outro disco rígido para aumentar a segurança dos dados.
Então, como podemos aproveitar vários discos rígidos? O uso de RAID nos permite utilizar múltiplos discos rígidos para aumentar a capacidade de armazenamento e a segurança dos dados.
Proposta pelo Prof. D.A. Patterson, de Berkeley, Califórnia, em 1988, criou o RAID (redundant array of cheap disks), também conhecido como matriz redundante de discos independentes.
RAID é a combinação de múltiplos discos independentes em um grupo de discos de grande capacidade, utilizando discos individuais para fornecer dados gerados pelo efeito aditivo, a fim de melhorar o desempenho de todo o sistema de discos, e armazenando dados redundantes para aumentar sua tolerância a falhas.
Em resumo, oferece muitas vantagens, pois combina vários discos rígidos independentes em um grupo de discos rígidos de alta capacidade para aumentar significativamente as velocidades de leitura e gravação, além de contar com recursos de proteção de dados.
O RAID possui diferentes níveis e variações, incluindo RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6, RAID F1, RAIDZ, JBOD, SHR, SHR2 e RAID híbrido.

Imagem de www.ufsexplorer.com
O RAID pode ser categorizado em dois tipos principais: RAID por hardware e RAID por software.
O RAID por hardware apresenta-se em duas formas. Um gabinete RAID externo é particularmente caro e geralmente utilizado para armazenamento empresarial. Outra forma consiste em adicionar uma placa controladora RAID ao computador.

Imagem da Wikipédia
As placas controladoras RAID oferecem velocidades mais rápidas e maior estabilidade devido ao cache presente na placa, o que pode melhorar as velocidades de leitura e gravação. A estabilidade é aprimorada, pois as placas controladoras de alta qualidade são equipadas com baterias. A bateria da placa controladora garante que os dados sejam gravados no disco rígido antes que a energia seja interrompida, proporcionando assim segurança aos dados. As novas placas controladoras são mais caras do que as antigas, sendo adequadas para quem tem um orçamento limitado.

Imagem da Wikipédia
Apesar das muitas vantagens do RAID por hardware, uma armadilha potencial que devemos evitar é o recurso RAID integrado à placa-mãe. Isso porque o array pode ser perdido em caso de problema na placa-mãe, como uma falha no overclock ou uma bateria descarregada. O RAID integrado à placa-mãe não se compara ao segundo tipo de RAID: o RAID por software.
RAID por software é o uso de software para simular RAID. As primeiras versões de RAID não eram muito estáveis e a velocidade não era tão alta quanto a do RAID por hardware. No entanto, com a otimização contínua da tecnologia, a diferença de desempenho entre RAID por software e RAID por hardware diminuiu consideravelmente. O RAID por software é uma escolha comum em muitos dispositivos NAS para uso doméstico. Clique para ler mais: O que é armazenamento NAS??

O nível RAID começa em 0 e vai até 7. Vamos começar com o RAID 0. Imagine os discos rígidos como baldes e as operações de leitura/gravação como o processo de encher esses baldes com água. Essa analogia facilita a compreensão do RAID.
Informações resumidas sobre RAID 0
Prós: Velocidades de leitura/gravação rápidas (sem velocidades aleatórias de leitura/gravação); utiliza todo o espaço do disco rígido.
Contras: Sem proteção de dados
Dica: RAID 0 não pode ser usado para armazenar dados importantes.
A velocidade de leitura/gravação é limitada pela interface do disco rígido quando há apenas um disco, similar ao tamanho de um balde que limita a velocidade de enchimento com água. Se você puder encher os dois baldes ao mesmo tempo, a velocidade de leitura/gravação será duas vezes maior do que com um único disco rígido. Este é o nível de armazenamento RAID 0.
O RAID 0 combina dois ou mais discos para formar um grande disco lógico com uma capacidade total equivalente à soma das capacidades de todos os discos rígidos. Quando os dados são gravados, eles são segmentados e armazenados em discos separados, permitindo que vários discos lidem com operações de leitura e gravação simultaneamente.
O RAID 0 apresenta uma grande desvantagem, apesar de ter a maior velocidade e capacidade. Sua excelente velocidade resulta em falta de redundância e tolerância a falhas. Todos os dados serão perdidos e irrecuperáveis se um dos discos rígidos do array for danificado. Como os dados são armazenados em segmentos, o dano a qualquer um dos discos rígidos resultará em recuperação incompleta dos dados. Portanto, não é recomendável usar RAID 0 para armazenar dados importantes.

Imagem da Wikipédia
Informações resumidas sobre RAID 1
Prós: Alta segurança, sem perda de dados mesmo se um dos discos for danificado.
Contras: Baixa utilização do disco, sem aumento na velocidade de gravação.
Qual RAID é adequado para armazenar dados importantes? O RAID 1 é o mais seguro, utilizando dois discos rígidos que espelham um ao outro para armazenar os mesmos dados em cada disco. Todos os dados podem ser lidos, desde que nenhum dos discos rígidos do array esteja danificado. O RAID 1 tem a mesma velocidade de leitura que o RAID 0, mas a velocidade de leitura pode aumentar se vários discos rígidos forem usados. No entanto, a velocidade de gravação é a mesma que a de um único disco rígido e não pode ser aumentada.
Um disco rígido danificado em RAID 1 pode ser desconectado e o array restaurará automaticamente os dados para o disco rígido recém-inserido, um processo conhecido como reconstrução do array.
O problema do RAID 1 é a sua relação custo-benefício relativamente baixa.. Mesmo que você utilize 100 discos rígidos em RAID 1, a capacidade final será equivalente apenas à capacidade de um único disco rígido. Se o tamanho de cada disco rígido for diferente, a capacidade final será baseada na capacidade do menor disco rígido. A taxa de utilização geral do RAID 1 é a mais baixa entre todos os níveis de RAID. RAID 0 e RAID 1 podem ser considerados dois extremos, com o RAID 0 oferecendo velocidades ultrarrápidas, enquanto o RAID 1 é ultrasseguro.
Você pode considerar RAID 2, 3, 4, 5 ou 6 se busca aumentar a capacidade e a segurança, mas não se preocupa com a velocidade.

Imagem da Wikipédia
Os sistemas RAID 2, 3 e 4 foram projetados para aplicações específicas, mas raramente são utilizados e muitas placas controladoras não suportam esses níveis devido a diversas limitações.
O RAID 2 requer pelo menos três discos rígidos. Ao ler e gravar dados, é necessário codificá-los em tempo real e gravar os dados segmentados em discos rígidos diferentes. A quantidade total de dados obtida será maior do que a dos dados originais. Além disso, o RAID 2 exige a verificação de integridade dos dados em tempo real durante as operações de leitura/gravação. A sobrecarga de hardware é maior, pois o algoritmo de verificação de integridade utilizado é mais complexo.

O RAID 3 requer pelo menos três discos rígidos e possui uma sobrecarga de hardware relativamente baixa devido a algoritmos mais simples. Durante as operações de leitura e gravação, os dados são gravados em diferentes discos rígidos em segmentos, enquanto os checksums são armazenados separadamente em outro disco rígido. No entanto, o checksum de um disco precisa ser acessado para cada operação de leitura e gravação, pois se danifica facilmente sob alta carga por um longo período. Os dados não podem ser recuperados quando o checksum de um disco é corrompido.

Imagem da Wikipédia
RAID 4 é semelhante ao RAID 3, mas os dados são segmentados de forma diferente. O RAID 4 também armazena dados de paridade em um disco rígido separado. Ao contrário do RAID 3, o RAID 4 é segmentado por blocos de dados, cujo tamanho é determinado pelo sistema e geralmente é muito maior que um bit. Assim, a gravação de arquivos pequenos será mais rápida no RAID 4 do que no RAID 3. No entanto, a probabilidade de recuperação de dados em um disco corrompido sem checksum é menor do que no RAID 3. Nem o RAID 3 nem o RAID 4 conseguem recuperar dados quando o checksum de um disco está corrompido.

Imagem da Wikipédia
O RAID 5 é semelhante ao RAID 3, exceto pelo fato de que o RAID 3 armazena dados de paridade em um único disco rígido, enquanto o RAID 5 distribui os dados de paridade entre vários discos rígidos. Os dados em outros discos rígidos e o checksum podem trabalhar juntos para a recuperação de dados quando um disco rígido é danificado, diferentemente do RAID 3, onde um checksum corrompido causa a falha de todo o array.

Imagem da Wikipédia
O RAID 5 requer pelo menos três discos rígidos. Um terço do espaço é usado para armazenar informações redundantes, ou checksums, enquanto dois terços são usados para armazenar dados brutos. A velocidade de leitura do RAID 5 é semelhante à do RAID 0, mas a velocidade de gravação pode não ser tão rápida. No entanto, os dados e checksums nos outros discos rígidos podem ser usados para obter a recuperação completa dos dados, mesmo que um dos discos rígidos do array seja corrompido, já que um terço do espaço é usado para armazenar checksums. Portanto, o RAID 5 é mais seguro que o RAID 0.
Em um ambiente corporativo, o File Server frequentemente considera o RAID 5 como uma opção para seu sistema de armazenamento. Servidor de Arquivos O servidor de arquivos é o repositório central de todos os arquivos compartilhados da empresa, como documentos comerciais, relatórios financeiros e arquivos de projetos. Ele precisa garantir que esses arquivos estejam acessíveis a funcionários autorizados o tempo todo. A capacidade do RAID 5 de se recuperar da falha de um único disco o torna uma opção atraente para servidores de arquivos. Quando um disco rígido falha no array RAID 5 do servidor de arquivos, o servidor pode continuar operando e fornecendo acesso à maioria dos arquivos enquanto o array é reconstruído.
O RAID 5 oferece maior segurança, mas também apresenta desvantagens. Primeiramente, a probabilidade de um disco rígido mecânico encontrar um erro de leitura irrecuperável (URE) ao ler dados é muito baixa, podendo ocorrer apenas uma vez a cada 12 TB de dados. Basta um único erro URE para que o RAID 5 interprete que há algo errado com os dados e inicie a reconstrução do array.
Múltiplas reconstruções podem fazer com que os discos rígidos operem sob alta carga por longos períodos. Se os discos foram comprados ao mesmo tempo e um deles falhar, o estado dos outros discos também pode ficar instável, levando a danos adicionais.
Como o RAID 5 permite que apenas um disco rígido seja danificado, os dados não serão salvos se outro disco rígido for danificado durante o processo de reconstrução. Não é recomendável usar RAID 5, pois ele tem uma baixa taxa de sucesso na reconstrução de arrays e oferece segurança inferior em comparação com o RAID 6.
Os níveis de RAID são um fator essencial na escolha de uma solução de armazenamento. Para dispositivos NAS, seja uma configuração de 2 ou 4 baias, a configuração RAID apropriada deve ser considerada. Compreender esses fatores-chave ajudará você a tomar uma decisão informada. Explore os detalhes de Opções de armazenamento NAS de 2 e 4 baias.
O RAID F1 possui um layout de array baseado no RAID 5 e foi projetado para unidades de estado sólido (SSDs). Otimizado para minimizar o desgaste por gravação dos SSDs, o RAID F1 armazena checksums em um SSD para reduzir a quantidade de gravações em outros SSDs. O sistema suporta transferência automática de dados quando o SSD está se aproximando do seu limite de gravação. No entanto, o RAID F1 geralmente não é acessível ao público em geral devido aos altos preços dos SSDs.
RAID 6 e RAID 5 são dois níveis comuns de RAID. Comparado ao RAID 5, o RAID 6 adiciona espaço redundante em disco rígido para dados de paridade e requer pelo menos quatro discos rígidos.
O RAID 6 oferece alta segurança de dados porque utiliza dois algoritmos de checksum diferentes, garantindo a recuperação completa dos dados mesmo quando dois discos rígidos são corrompidos. Em comparação, o RAID 5 é menos seguro. No entanto, a quantidade de checksums no RAID 6 é o dobro da do RAID 5, pois o primeiro utiliza dois algoritmos de checksum que exigem maior poder computacional. Isso significa que o RAID 6 não consegue ler ou gravar dados tão rapidamente quanto o RAID 5.

Imagem da Wikipédia
Se você não está satisfeito com RAID 0 a 6 e quer saber se existem tipos de RAID que oferecem as vantagens de todos os níveis, continue lendo para saber mais sobre RAID híbrido.
RAID 10 é o RAID híbrido mais comum. Combinando os modos RAID 1 e RAID 0, o RAID 10 garante a segurança dos dados e aumenta drasticamente as velocidades de leitura e gravação, mas a capacidade disponível é apenas metade da sua capacidade total.
O RAID 10 requer pelo menos quatro discos rígidos, dois dos quais serão usados para formar o RAID 1 e outros dois para formar o RAID 0.
Além do RAID 10, existem os arrays RAID 50 e RAID 60. O RAID 50 é uma combinação de RAID 5 e RAID 0, que utiliza o RAID 5 para armazenar dados e informações de paridade em múltiplos discos rígidos e combina esses discos rígidos para formar um grande espaço de armazenamento distribuído (striped) utilizando RAID 0, aumentando assim a capacidade de armazenamento e o desempenho de leitura/gravação. O RAID 60 é uma combinação de RAID 6 e RAID 0 e adota uma abordagem semelhante para aumentar a capacidade de armazenamento e o desempenho de leitura/gravação, ao mesmo tempo que oferece melhor redundância e segurança de dados.
JBOD, que significa "just a bunch of disks" (apenas um conjunto de discos), utiliza um modelo especial de armazenamento de dados. Em JBOD, os dados são armazenados sequencialmente nos discos, começando pelo primeiro. Apenas uma enorme partição, contendo a capacidade de todos os discos rígidos, é visível no sistema. No entanto, os dados se tornam inacessíveis se qualquer um dos discos rígidos falhar. Pior ainda, todo o array falha se o primeiro disco rígido for danificado, pois ele é o único local de armazenamento para segmentação de dados.
A vantagem do JBOD é que ele trata vários discos rígidos como um todo, com a capacidade total dos discos disponível para uso. Além disso, apenas um disco é usado por operação de gravação. Isso significa que os outros discos ficam ociosos durante as operações de leitura e gravação, e o uso excessivo não causa danos. No entanto, o JBOD apresenta desvantagens significativas. Sua segurança de dados é relativamente baixa, pois a falha de qualquer disco rígido pode levar à perda de dados. Em segundo lugar, as velocidades de leitura e gravação ainda não melhoraram e permanecem as mesmas de um único disco rígido. Portanto, o JBOD não é recomendado para aplicações que exigem alta segurança de dados e alto desempenho de leitura/gravação.
O Unraid é um sistema operacional baseado em Linux, semelhante ao JBOD, e suporta redundância de dados. No Unraid, um ou dois discos rígidos podem ser configurados para verificação de dados. Uma capacidade maior é necessária para recuperar os dados caso um ou dois discos rígidos falhem.
O Unraid oferece expansão de capacidade prática, pois os usuários só precisam inserir um novo disco rígido no sistema para expandir o espaço de armazenamento. Mesmo que mais de um disco rígido apresente defeito, apenas os dados do disco corrompido serão perdidos. Os demais discos do array continuarão funcionando normalmente.
No entanto, o Unraid apresenta duas grandes desvantagens que limitam seu uso. Primeiro, ele é pago, com preços que variam de 59 a 129, o que é relativamente barato. Similarmente ao JBOD, o Unraid tem velocidades de gravação mais lentas porque a operação extra de checksum aumenta o tempo de gravação. De fato, as velocidades de gravação do Unraid podem ser ainda mais lentas do que as do JBOD, o array mais lento de todos.
No entanto, o Unraid oferece muito espaço de armazenamento, tornando-o ideal para usuários que não necessitam de alto desempenho.
O Synology Hybrid RAID (SHR) é um modo de array exclusivo, voltado principalmente para novos usuários que não têm conhecimento sobre arrays. O SHR pode determinar e usar automaticamente o modo RAID apropriado de acordo com o número e a capacidade dos discos rígidos.
No SHR, a capacidade de um disco rígido é usada para armazenar dados de verificação por padrão. Se cada disco rígido tiver a mesma capacidade e apenas um disco rígido for usado, o SHR é equivalente a um disco rígido normal sem qualquer proteção de dados. Quando dois discos rígidos são usados, o SHR adota um modo semelhante ao RAID 1. O SHR é semelhante ao RAID 5 quando três discos rígidos são usados. O SHR 2 armazena checksums em dois discos rígidos e requer quatro discos rígidos, semelhante ao RAID 6.
O SHR facilita a atualização de um para dois arrays redundantes de discos, oferecendo mais flexibilidade do que o RAID convencional. No entanto, a recuperação de dados só pode ser feita no GroupHi, já que o SHR é um modo dedicado para esse ambiente. É necessário um software especializado para a recuperação de dados, pois os discos rígidos usados em outros computadores podem não conseguir ler os dados diretamente. Contudo, esse software apresenta certas limitações na recuperação de dados.
RAID Z é um RAID por software baseado no sistema ZFS. O ZFS é um sistema de arquivos de 128 bits que suporta recursos avançados, incluindo:
RAID Z é um dos recursos do ZFS, onde não é necessário software ou hardware adicional para implementar RAID. Existem três tipos de RAID Z: RAID Z1, RAID Z2 e RAID Z3.
Em conjunto com os recursos do ZFS, o RAID-Z é uma excelente opção. No entanto, o RAID-Z também apresenta algumas desvantagens, incluindo o alto consumo de memória. O ZFS precisa de muita memória para cache; cada bloco T de espaço deve corresponder a 1 GB de memória, caso contrário, o desempenho será afetado. Recomenda-se começar com pelo menos 8 GB. Também é fundamental utilizar memória dedicada ao código de correção de erros (ECC), caso contrário, a probabilidade de erros nos dados será menor.
A segunda desvantagem é a necessidade de expansão da capacidade.Se um terceiro disco rígido tiver sido usado para formar um RAID Z1, será necessário adicionar um grupo adicional de até seis discos rígidos. Essa configuração não é tão prática quanto o RAID 5 e o RAID 6, que permitem expandir a capacidade com um novo disco rígido.
Neste artigo, descrevemos o conceito de RAID, bem como as vantagens e desvantagens de 15 níveis diferentes de RAID. Compreender as características dos vários níveis de RAID permite que os usuários escolham uma solução de armazenamento adequada às suas necessidades e melhorem a segurança e a confiabilidade dos dados.