RAID-массивы — основная информация о работе

RAID-массивы — основная информация о работе

RAID (Redundant Array of Independent Disks) — это взаимодействие двух и более носителей таким образом, чтобы дать дополнительные возможности, недостижимые с одним диском. RAID в основном используется для:

— повысить надежность системы (устойчивость к отказам системы),

— ускорить поток данных,

— увеличить доступное пространство данных (как целостную логическую единицу).

Типы решений

— Аппаратные решения

— Внутренние контроллеры

— Внешние матрицы

— (серверы Qnap)

— Просит основной со встроенным контроллером

— Программные решения

— Windows Сервер, Windows 10

— Линукс

— Сервер Mac OS X

Программный RAID

В программном RAID системное программное обеспечение, установленное на компьютере, отвечает за управление дисковым массивом. В некоторых операционных системах уже реализованы необходимые компоненты, особенно в серверных версиях Windows и Linux.

Программный RAID часто является самым дешевым и простым решением, но он сильно нагружает процессоры компьютера. Кроме того, материнские платы обычно имеют только один или два разъема для дисков, что ограничивает возможность параллельного обращения к дискам и, следовательно, производительность.

Типы RAID

Что касается типов RAID, то есть уровни от RAID0, 1, 2, 3, 4.. до RAID7 и конфигурация JBOD

Эта конфигурация названа в честь Just a Bunch of Driver и предназначена для работы с дисками.

с помощью матричного контроллера, выполняющего роль обычного контроллера жесткого диска. Таким образом, каждый из физических дисков обрабатывается отдельно как логический диск. Эта конфигурация не обеспечивает никакой безопасности или избыточности.

RAID 0 (зачистка)

Он основан на соединении двух или более физических дисков вместе, чтобы они воспринимались как один логический диск.

— Результирующее пространство данных равно N * емкости наименьшего диска.

— Общая скорость равна N — Умножить скорость самого медленного диска

Данные записываются на диски. Поэтому достигается значительное ускорение операций записи и чтения за счет распараллеливания этих операций на всех дисках массива. Предпосылкой для более высокой скорости является работа с полосами или последовательностями блоков данных, размер которых больше, чем один блок данных RAID 0.

RAID 0 не является избыточным, поэтому 0 в названии.

Преимущества RAID 0:

— пространство всех дисков рассматривается как единая логическая единица

— ускорение записи и чтения по сравнению с одним диском

Недостатки RAID 0:

— отсутствие устойчивости к выходу из строя любого из приводов

— Емкость массива = N * размер наименьшего диска

— N* повышена теоретическая вероятность отказа. Из-за выхода из строя отдельных дисков

— потеря данных при выходе из строя одного диска.

Пример применения RAID 0

Три диска 1Тб, 2Тб, 4Тб были объединены в RAID 0. Получившееся пространство имеет N* емкость наименьшего, т.е. 3 Тб. Скорость записи или чтения почти в три раза выше, чем у одного диска. Конечно, общая скорость в 3 раза превышает скорость самого медленного диска, потому что контроллер

рейд должен ждать самый медленный диск при чтении/записи. Следовательно, предлагаются идентичные диски с одинаковой скоростью и емкостью. Три диска по 1 ТБ будут иметь одинаковый размер массива и одинаковую скорость.

Использование RAID 0

Это решение хорошо подходит для создания дешевых и производительных массивов для обработки больших мультимедийных файлов или захвата. Хранить важные данные на RAID 0 не рекомендуется из-за повышенного риска потери данных в случае выхода из строя одного из дисков.

RAID 1 (зеркалирование)

Он заключается в репликации работы двух и более физических дисков (копия 1:1). Емкость, полученная в результате этой комбинации, равна размеру одного носителя. RAID 1 также известен как зеркалирование. Скорость записи и чтения зависит от используемой конфигурации:

Записывать:

— последовательная запись на последовательные диски матрицы — длительность операции равна сумме длительностей всех операций

— параллельная запись на все диски матрицы — продолжительность равна продолжительности операции на самом медленном диске

Чтение:

— последовательное чтение с последовательных дисковых массивов — при определенном соотношении чтений можно добиться такой же скорости, как в RAID 0

— чтение только с указанных дисков — используется при существенной разнице в скорости чтения с отдельных дисков.

Преимущества использования RAID 1:

— Устойчивость к сбоям N-1 диска с массивом из N-дисков

— возможное увеличение скорости чтения

Недостатки RAID 1:

— снижена скорость записи из-за необходимости записи одной и той же информации сразу на N дисков

— потеря емкости (общий размер матрицы такой же, как емкость самого маленького диска)

Пример 1

— Три диска по 500 Гб, 1 Тб и 1 Тб были объединены в RAID 1. Получившийся массив имеет размер 500 Гб. Если в какой-то момент один или даже два диска выходят из строя. Матрица до сих пор работает.

Применение RAID 1

Решение безопасное, простое и эффективное одновременно. Он в основном ориентирован на защиту данных.

RAID 2

Данные на каждом диске матрицы разбиты на полосы — блоки. Информация сохраняется 1 бит на полосу.

— Таким образом, RAID 2 использует восемь бит для данных и два дополнительных бита для кода ECC. Тогда можно не только найти ошибки данных, но и точно их локализовать.

Такое разделение битов для отдельных дисков требует не менее десяти дисков для матрицы. Другими словами, для RAID 2 требуется 8 дисковых емкостей для обработки данных и 2 дополнительных диска для хранения сгенерированного кода Хэмминга для исправления ошибок.

С учетом возможности параллельных обращений ко всем накопителям скорость чтения увеличивается в восемь раз, но уже при записи скорость ниже производительности одиночного накопителя — из-за необходимости записи и вычисления больших постоянных блоков ECC.

— диски, объединенные в RAID 2, логически выглядят как один большой диск. Общая емкость RAID 2 представляет собой сумму емкостей дисков, на которых хранятся данные (не включая диски ECC).

— Код Хэмминга может обнаруживать и исправлять 1 битовую ошибку.

— RAID 2 работает, проверяя бит четности.

Преимущества RAID 2:

— любой диск (как с данными, так и с кодом Хэмминга) может быть пересобран другими дисками в случае повреждения

— Возможность исправления ошибок данных

Недостатки RAID 2:

— Постоянная необходимость точной синхронизации дисков с кодом Хэмминга (иначе происходит дезорганизация данных и полная бесполезность этих дисков)

— длительная генерация кода Хэмминга замедляет работу всей системы

Применение RAID 2

— Полезно для дисков и компьютерных систем, требующих проверки данных.

— В настоящее время используется редко и только в наборах мейнфреймов, где требуется очень высокий уровень защиты данных.

RAID 3

— Пользовательские данные в этой матрице хранятся на N-1 дисках, потому что один диск используется для записи контрольных сумм.

— RAID 3 работает как RAID 0, с той разницей, что RAID 3 использует вспомогательный диск, на который записываются коды четности, рассчитанные специальным процессором.

Контрольные суммы создаются в результате вычисления логической функцией XOR.

— В случае выхода из строя любого диска, после замены этого диска на рабочий, данные будут перестроены на основе контрольных сумм и оставшихся дисков.

Преимущества RAID 3:

— отказоустойчивость 1 диска

— более высокая скорость чтения

Недостатки RAID3:

— меньшая скорость записи из-за пересчета контрольных сумм контроллером каждый раз. (Этот недостаток компенсируется использованием аппаратных RAID-контроллеров)

— в случае сбоя диска доступ к данным замедляется из-за подсчета контрольной суммы

— восстановление матрицы после замены диска является значительной вычислительной нагрузкой и замедляет все операции с матрицей

— единый, отдельный диск для контрольных сумм очень сильно нагружен и обычно является узким местом в работе всей матрицы

Применение RAID 3

RAID 3 в силу своей специфики позволяет значительно повысить свою производительность в результате параллельной работы при чтении больших файлов. Поэтому это решение в основном используется для обработки больших файлов данных на отдельных компьютерах. Хорошо работает с решениями САПР и захватом видео

RAID 4

RAID 4 структурно аналогичен RAID 3. Разница в том, что блоки данных имеют больший размер (16, 32, 64 или 128 кБ). Такие полосы записываются на диски аналогично уровню RAID 0.

— Для каждой строки записанных данных сгенерированный блок четности записывается на диск четности.

В случае сбоя диска данные воссоздаются с помощью соответствующих математических операций с оставшегося носителя. Матрица RAID 4 работает очень хорошо, поэтому при последовательной записи и чтении данных, т.е. для операций над очень большими файлами.

— В случае небольших файлов — сохранение небольшой порции данных требует генерации соответствующих блоков четности для каждой операции ввода-вывода. Следовательно, каждый раз, когда данные записываются, системе приходится ждать обработки блоков четности. При частых операциях записи мелких файлов это очень сильно тормозило бы работу всей матрицы.

RAID 4 — преимущества:

— устойчивость к отказам одного диска

— хорошая скорость чтения

Недостатки RAID 4:

— восстановление матрицы после замены диска — это операция, которая разгружает вычислительную часть системы (большое снижение производительности)

— единый, отдельный диск для хранения контрольных сумм обычно является узким местом по производительности всей матрицы

— Скорость записи ниже, чем у RAID 3

Применение RAID 4

— RAID 4 ускорит работу массивов, в результате параллельных обращений, только при чтении больших файлов. Поэтому этот уровень используется для обработки больших связанных объемов данных с нескольких компьютеров. Он также хорошо работает с файлами CAD/CAM и обработкой видео.

RAID 5

— В RAID 5 биты четности распределены по всем носителям матрицы. RAID 5 позволяет восстанавливать данные в случае отказа любого диска, используя данные и коды коррекции, хранящиеся на других дисках. (Не то что в RAID 3. на одном специально выделенном для этого, что снижает затраты и повышает эффективность).

RAID 5 имеет более высокую скорость чтения, чем RAID 1, но при использовании скорость записи немного падает. Пятый уровень намного безопаснее для данных — в случае сбоя система автоматически восстановит потерянные данные с одного диска, правда, снизив текущую производительность массива. К счастью, это замедление носит временный характер. После монтирования нового диска и восстановления данных производительность массива приходит в норму.

— Матрица может состоять из трех и более дисков. Размер массива из N дисков составляет N -1 дисков. При объединении дисков разной емкости получаем объем наименьшего диска раз N -1. Контрольные суммы данных разбиваются на N частей, каждая из которых хранится на отдельном диске, и вычисляется из соответствующего фрагмента данных, хранящихся на других N-1 дисках. Эти суммы получены из математических расчетов.

Преимущества RAID 5:

— устойчивость к выходу из строя одного диска

— скорость чтения — сравнима с массивом RAID 0 из N-1 дисков

Недостатки RAID 5:

— медленная скорость записи из-за необходимости пересчитывать контрольные суммы при каждой записи (можно устранить благодаря аппаратному контроллеру RAID 5)

— в случае выхода из строя одного из дисков доступ к данным достаточно медленный из-за необходимости подсчета контрольных сумм

— восстановление матрицы после замены диска является операцией, требующей значительных вычислительных ресурсов и вызывающей значительное замедление операций чтения и записи. Во время этой операции матрица не устойчива к дальнейшим повреждениям.

Применение RAID 5

Операции записи в RAID 5 практически параллельны, а загрузка данных и контрольные суммы равномерно распределяются по всем дискам массива, поскольку нет выделенного диска четности.

Распределение данных поровну на все диски дает много преимуществ — в т.ч. хорошая производительность чтения, что особенно важно при обращении к нескольким небольшим блокам данных. Поэтому RAID 5 часто используется в системах баз данных и серверах транзакций.

RAID 5 также хорошо работает с RAID 0 — эта комбинация называется RAID 0 + 5 или RAID 50. RAID 0 + 5 обеспечивает такую ​​же хорошую производительность, но обеспечивает большую отказоустойчивость, чем RAID 5.

RAID 5 позволяет вам использовать объем пространства, равный емкости наименьшего носителя, умноженной на количество дисков минус 1.

Пример

Если в матрице 6 дисков емкостью 2 ТБ, 3 ТБ, 4 ТБ, 4,5 ТБ, 6 ТБ, 6 ТБ.

Самый маленький диск — 2 ТБ, поэтому доступная емкость — 2 ТБ * (6-1) = 2 ТБ * 5 = 10 ТБ.

RAID 6

RAID 6 — это не что иное, как преобразованный массив RAID 5 (иногда можно встретить описание RAID 5+1). RAID 6 В отличие от уровня 5 содержит две независимые контрольные суммы для каждого диска. Матрица 6 дорогая в реализации, но обеспечивает высокий уровень безопасности.

— На уровнях матрицы с 3 по 5 допускается отказ только одного диска. Если снова произойдет сбой, данные больше нельзя будет восстановить с помощью XOR с оставшихся дисков.

Таким образом, конструкция RAID 6 идет дальше, дополняя RAID 5 дополнительным блоком четности на каждом диске. В результате можно восстановить данные RAID technology даже после отказа двух дисков. Однако дополнительная безопасность замедляет запись по сравнению с RAID 3–5.

Преимущества использования RAID 6:

— устойчивость к выходу из строя до 2-х дисков

— скорость работы быстрее, чем скорость одного диска

— очень высокая безопасность данных.

— Подходит для многодисковых массивов

Недостатки RAID 6:

— Запись занимает гораздо больше времени, чем в младших массивах (RAID 3, 4, 5)

— Большую часть дискового пространства занимают контрольные суммы (актуально для небольшого количества дисков).

Применение RAID 6

Это решение обеспечивает высокий уровень безопасности, поэтому оно используется в системах баз данных, где требуются дополнительные контрольные суммы.

RAID 0 + 1

Такой массив реализован в виде RAID 1, элементами которого являются массивы RAID 0. Такой массив имеет преимущества как RAID 0 (скорость операций чтения и записи), так и RAID 1 (защита данных в случае аварии). отказ одного диска). Выход из строя одного диска приводит к тому, что все становится RAID 0.

Для создания RAID 1 + 0 требуется минимум 4 диска одинаковой емкости. Также требуется четное количество дисков в таком массиве.

Преимущества RAID 0+1:

— производительность аналогична RAID 0

— безопасность зеркального массива — RAID 1 — в особом случае еще выше (отказ более одного диска в одном зеркале)

— гораздо проще реализовать, чем RAID 3, 5 и 6

RAID 0+1 Недостатки:

— более высокая стоимость хранения данных, чем в случае RAID 0,2,3,4,5,6, за счет использования большего количества дисков.

RAID 10

Также известен как RAID 1+0. Массив реализован как RAID 0, элементами которого являются массивы RAID1. Также требуется четное количество дисков. Эта матрица строится аналогично RAID 0+1, за исключением того, что из маленьких зеркал создается большой страйп, благодаря чему при замене поврежденного диска перестраивается только фрагмент всей матрицы.

Преимущества RAID 10 :

— Скорость RAID 0

— защищенность массива RAID 1 — в особом случае еще выше (отказ более одного диска разных зеркал)

— гораздо проще реализовать, чем RAID 3, 5 и 6

Недостатки RAID 10:

— повышенные затраты на хранение данных, чем в случае с RAID 0,2,3,4,5,6, из-за необходимости задействовать большее количество носителей.

Матрикс RAID

В результате объединения массивов RAID 1 и RAID 0 также создаются логические массивы на двух дисках, где часть дисков используется для RAID 0, а часть для RAID1. Это решение называется MATRIX RAID и сочетает в себе преимущества и недостатки обоих массивов с тем, что они расположены на двух дисках в разных разделах (раздел RAID0 и раздел RAID1). Таким образом, отказ одного из них полностью замораживает RAID0, сохраняя данные на RAID1. Таким образом, в каждом разделе хранятся разные типы данных. Некоторым требуется скорость, некоторым требуется безопасность данных.

— Первый из них теоретически характеризуется двукратной скоростью выполнения над ним операций, как при чтении, так и при записи данных.

— Второй гарантирует сохранность данных в случае выхода из строя одного из дисков, двойную скорость чтения и одинарную скорость записи.

Возможные режимы RAID

Логический диск, т.е. набор физических дисков, соединенных в массив, управляемый системой, может находиться в любом из четырех состояний:

— оптима — это нормальная, корректная работа всех жестких дисков матрицы.

— degraded — правильная работа матричного логического диска, но один или несколько физических жестких дисков (из которых состоит логический диск) вышли из строя,

— ребилд — процесс восстановления данных матричной системой, при переходе из деградированного состояния в оптимальное состояние, для корректной работы требуется отремонтировать или заменить неисправный диск на исправный физический диск и перестроить данные на новый диск,

— dead — система не может работать, в этом состоянии повреждены критические физические диски, восстановить ранее сохраненные данные невозможно.

В такой системе возможно только восстановление лабораторных данных, если ранее не открывалась резервная копия логического диска матрицы.

Подводить итоги:

— Матрицы не защищают систему от потери данных. Они могут только ограничить эту возможность. Наиболее надежными являются подсистемы массивов хранения, в которых все компоненты, включая контроллер, матрицу, блоки питания и охлаждения, зарезервированы.

— К сожалению, необратимая потеря данных чаще всего вызвана человеческим фактором, а не неисправностью оборудования.

 

Разное