Сравнение типов RAID, используемых в серверах и СХД
https://altastor.ru/tech/raid/
Технология объединения физических дисков в логический том — RAID — имеет огромное количество вариаций. Практическую реализацию в системах хранения данных и серверном оборудовании можно встретить у следующих спецификаций: RAID 0, 1, 3, 4, 5, 6, DP, 10, 50, 60, однако в коммерческом применении как правило используются только некоторые из них.
Таблица сравнения коммерчески используемых типов RAID
Тип RAID | Производительность в IOPS при операциях записи | Производительность во время цикла восстановления (Rebuild) | Время восстановления RAID | Эффективность использования дискового пространства |
---|---|---|---|---|
RAID 5 | Хорошая | Плохая | Плохое | Очень хорошая |
RAID 6 | Плохая | Хорошая | Плохое | Хорошая |
RAID 10 | Лучшая | Лучшая | Лучшее | Плохая |
RAID DP | Очень хорошая | Очень хорошая | Хорошее | Хорошая |
RAID TEC | Хорошая | Хорошая | Хорошее | Очень хорошая |
RAID 0
RAID 0 — массив дисков с чередованием данных (страйп). При использовании RAID 0 блоки данных записываются по очереди на каждый диск, что существенно увеличивает производительность операций чтения и записи. Избыточность данных отсутствует, поэтому выход из строя любого диска ведет к потере данных всей RAID-группы.
Использование:
Рекомендуется использовать RAID 0 для быстрого доступа к неважным или временным данным, когда требуется высокая производительность и имеется возможность в случае сбоя восстановить информацию. Типичным сценарием использования можно назвать пост-обработку видео или кэширование данных.
Преимущества:
- самая высокая скорость чтения и записи;
- 100% эффективность использования дискового пространства.
Недостатки:
- самая низкая надежность хранения данных.
Формула эффективности:
S * N, где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 1
RAID 1 — зеркалированный массив дисков (зеркало). Блоки данных записываются на все диски одновременно, поэтому допустим выход из строя всех дисков, кроме одного. Данная конфигурация обладает наименьшей эффективностью использования дискового пространства, и, как следствие, наибольшей стоимостью при использовании трех и более дисков.
Использование:
Рекомендуется использовать RAID 1 для максимального повышения надежности хранения и доступности данных. Наиболее частым сценарием является зеркалирование двух системных дисков серверов.
Преимущества:
- самая высокая степень надежности при использовании трех и более дисков;
- самая высокая скорость чтения за счет параллельных запросов ко всем дискам сразу.
Недостатки:
- самая низкая эффективность использования дискового пространства при трех и более дисках;
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.
Формула эффективности:
S, где S — объем наименьшего диска.
RAID 3
RAID 3 — массив дисков с побайтным чередованием с одним выделенным диском четности на группу. Байты данных записываются поочередно на все диски, кроме одного. Отдельный диск выделяется для хранения информации о четности.
Использование:
Из-за побайтового чередования RAID 3 подходит для работы с большими файлами, однако на практике не используется в коммерческих задачах в связи с невысокой надежностью.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
Недостатки:
- снижена скорость записи в IOPS по сравнению с RAID 0, DP, 10;
- высокая нагрузка на диск четности и, как следствие, снижение его срока эксплуатации;
- в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
- низкая скорость работы с блоками малого размера.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 4
RAID 4 — массив дисков с поблочным чередованием с одним выделенным диском четности на группу. Принцип работы похож на RAID 3, но данные разбиваются не на байты, а на блоки. Это увеличивает производительность при работе с небольшими файлами. Слабым местом RAID 4 является диск четности, на который ложится большая нагрузка в RAID-группе. Как следствие, диск четности почти всегда первым выходит из строя.
Использование:
RAID 4 ранее использовался в дисковых массивах NetApp серии FAS, где недостаток надежности компенсировался принципом записи файловой системы WAFL (Write Anywhere File Layout). Рекомендуется только для временных и неважных данных. На данный момент RAID 4 в СХД NetApp вытесняется RAID DP.
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы для NL-SAS составляет 7 дисков; для SAS или SSD — от 8 до 14 дисков.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность дискового пространства по сравнению с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
Недостатки:
- высокая нагрузка на диск четности и, как следствие, снижение срока эксплуатации (за исключением использования в системах NetApp серии FAS);
- в случае выхода из строя диска четности, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 5
RAID 5 — массив дисков с поблочным чередованием с одной контрольной суммой. При построении RAID 5 для контрольных сумм не выделяется отдельный диск, как в RAID 4, вместо этого данные циклически записываются на все диски. Аналогично RAID 4, RAID 5 позволяет производить параллельную запись, что существенно увеличивает производительность. Нагрузка на диск четности равномерно распределяется по всем дискам в массиве.
Использование:
RAID 5 широко применяется в реальных бизнес-задачах. Типовым сценарием является использование в серверах в области хранения данных для пользовательских приложений и выполнения транзакций. Использовать в СХД рекомендуется в первую очередь для маловажной информации с небольшой нагрузкой на диски, например, в системах видеонаблюдения.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства в сравнении с RAID 1, 6, DP, 10;
- базовый уровень надежности, допустим выход из строя одного диска.
Недостатки:
- в случае выхода из строя одного диска, процесс восстановления (rebuild) RAID-группы резко повышает нагрузку на диски, что может спровоцировать выход второго диска внутри группы и привести к потере данных;
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10.
Формула эффективности:
S * (N - 1), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 6
RAID 6 — массив дисков с поблочным чередованием с двумя контрольными суммами. Данные распределяются по дискам массива по очереди, в качестве информации для восстановления используется схема двойной четности. RAID 6 может выдержать отказ двух дисков одновременно, однако низкая производительность по операциям ввода-вывода (IOPS) ограничивает область применения.
Использование:
Сценарии применения RAID 6 аналогичны RAID 5 с уклоном в более надежное хранение информации. RAID 6 широко применяется в системах хранения данных, где не важна высокая транзакционная производительность — архивное хранение, видеонаблюдение стратегических объектов, использование в системах безопасности, а также для надежного хранения критически важных данных.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
Недостатки:
- самая низкая скорость записи в IOPS;
- эффективность использования дискового пространства ниже, чем у RAID 5.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID DP
RAID DP — массив дисков с двойной четностью в линейке продукции FAS компании NetApp. Под контрольные суммы выделяются два отдельных диска. Благодаря использованию файловой системы WAFL транзакционная производительность выше, чем в RAID 5 и RAID 6.
Использование:
Является основным типом RAID в оборудовании NetApp линейки FAS. Рекомендуется для SSD дисков, SATA/NL-SAS дисков объемом менее 6TB (для дисков большего объема рекомендуется RAID-TEC).
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 14 до 20 дисков.
Преимущества:
- высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
- высокая скорость записи в IOPS по сравнению с RAID 5 и RAID 6, приближается к RAID 10;
- высокая степень надежности по сравнению с RAID 5, допустим выход из строя двух дисков.
Недостатки:
- данный RAID используется только в дисковых массивах NetApp серии FAS;
- эффективность использования дискового пространства ниже чем у RAID 5.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID TEC
RAID TEC — массив дисков с тройной четностью в линейке продукции FAS компании NetApp. Данный тип RAID разработан для медленных объемных дисков с устойчивой производительностью во время восстановления.
Использование:
Рекомендуется для SATA/NL-SAS дисков объемом 6TB и более.
В соответствии с рекомендациями компании NetApp, оптимальный размер RAID группы — от 20 до 29 дисков.
Преимущества:
- высокая скорость чтения по сравнению с дисками, не объединенными в RAID;
- высочайшая степень надежности в сочетании с хорошей эффективностью хранения (около 89% при RAID группе в 29 дисков).
Недостатки:
- данный RAID используется только в дисковых массивах NetApp серии FAS.
Формула эффективности:
S * (N - 3), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 10
RAID 10 — массив дисков с зеркалированием и чередованием. Представляет собой массив RAID 0 из нескольких массивов RAID 1. В реализации RAID 10 на практике каждый подмассив RAID 1 состоит из двух дисков, поэтому допускается выход из строя не более одного диска в каждом подмассиве. RAID 10 обладает самой высокой производительностью и надежностью, при этом эффективность использования дискового пространства составляет 50%.
Использование:
Основным сценарием применения является использование для работы с базами данных (Oracle, SAP HANA, SQL) и другими высокотранзакционными нагрузками.
Преимущества:
- самая высокая скорость чтения и записи среди коммерчески используемых типов RAID;
- повышенная надежность по сравнению с RAID 5.
Недостатки:
- эффективность использования дискового пространства 50%.
Формула эффективности:
S * N / 2, где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 50
RAID 50 — массив дисков, состоящий из чередования массивов RAID 5. Реализуется построением страйпа (RAID 0) из RAID 5. Допускается отказ не более одного диска в каждом подмассиве. Производительность RAID 50 выше, чем при использовании RAID 5, и стремится к RAID10, но надежность недостаточна для применения в реальных бизнес-задачах.
Использование:
Поддерживается ограниченным количеством производителей, т.к. не рекомендуется к использованию ввиду низкой надежности. Возможная модель использования предполагает хранения временных или неважных данных.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- высокая эффективность использования дискового пространства по сравнению с RAID 1, 6, DP, 10.
Недостатки:
- незначительное снижение скорости записи в IOPS по сравнению с RAID 0, DP, 10;
- недостаточная надежность для коммерческого использования.
Формула эффективности:
S * (N - 2), где N — количество дисков в массиве, S — объем наименьшего диска.
RAID 60
RAID 60 — массив дисков, состоящий из чередования массивов RAID 6. Реализуется построением страйпа (RAID 0) из RAID 6. Допускается отказ до двух дисков в каждом подмассиве. Обладает базовой надежностью и невысокой эффективностью используемого пространства . Для построения минимальной RAID-группы требуется 8 дисков.
Использование:
Поддерживается ограниченным количеством производителей, т.к. не обладает явными преимуществами по сравнению с использованием других типов RAID. Область практического применения ограничена.
Преимущества:
- значительное повышение скорости чтения по сравнению с дисками, не объединенными в RAID;
- базовая надежность хранения.
Недостатки:
- невысокая эффективность использования дискового пространства по сравнению с RAID 5, 6, DP.
- скорость записи в IOPS ниже, чем у RAID 0, DP, 10.
Формула эффективности:
S * (N - 4), где N — количество дисков в массиве, S — объем наименьшего диска.