Почему нельзя использовать raid 5 для сервера базы данных
Содержание:
Как создать RAID-массив
Так как же на практике создается рейд из жестких дисков. Есть два способа аппаратный и программный. В случае аппаратной реализации нам потребуется специальный RAID-контролер, который и будет обеспечивать объединение дисков в массив по выбранной схеме, причем он не зависит от операционной системы и для ОС наш массив будет просто одним диском.
Он может быть встроен в некоторые материнские платы, но при этом чаще всего довольно простой и его возможности обычно ограниченны несколькими наиболее распространенными вариантами подключения. Узнать есть ли в материнской плате интегрированный RAID-контролер и какие уровни RAID-массива он поддерживает можно в спецификации материнской платы.
Если встроенный контролер отсутствует или его возможности вас не устраивают, то можно воспользоваться внешним RAID-контролером, который устанавливается в PCI-слот материнской платы. Такой вариант считается самым правильным, но одновременно и самым дорогим, поскольку их стоимость довольно немаленькая.
Впрочем, есть способ «для бедных», позволяющий эмулировать работу RAID-контролера на программном уровне. Другими словами, специальная программа работающая внутри ОС обеспечивает его работу. Однако нужно понимать, что при этом на его работу затрачиваются ресурсы центрального процессорапроцессора и оперативной памяти, что в конечном итоге негативно сказывается на общей производительности компьютера, к тому же сюда нужно прибавить возможные софтовые глюки в ОС, что не добавляет надежности. Поэтому программный вариант рейд-массива рассматривать в серьез не стоит.
Чтобы создать RAID-массив нужно загрузиться в BIOS и выставить в настройках работы дисков режим RAID, сохраняем изменения и выходим из BIOS. В процессе загрузки компьютера появится сообщение с помощью каких клавиш можно попасть в меню настройки RAID-массива (например, Ctrl—F). Здесь следуя подсказкам системы создаем новый массив и делаем нужные настройки. После этого можно работать с созданным RAID-массивом как с обычным диском.
Будьте внимательны, создание, удаление массивов приводит к удалению всей информации имеющейся на дисках. Так же может потребоваться установка специального драйвера для работы контролера.
Подводя итог, можно сделать некоторые выводы об использовании RAID массивов. Они получили широкое распространение в серверах и компьютерных системах организаций. В тоже время для домашних пользователей компьютера выгоды от их использования не столь очевидны. Ведь придется потратиться на несколько одинаковых дисков, часть из которых будет недоступна для хранения данных. Да и спасти информацию в случае сбоя в работе RAID-массива гораздо труднее и дороже, поскольку вероятно придется обращаться к профессионалам, а это дополнительные расходы.
Может потребоваться более мощный блок питания и/или компьютерный корпус большего размера с хорошим охлаждением. Как видите затраты требуются не маленькие. Возможно более эффективно будет потратиться на один быстрый диск, например SSD, а сохранность информации обеспечивать периодическим созданием копий.
Есть еще один момент в технологии RAID, который нужно понимать. Она страхует только от физического выхода из строя накопителей и не защищает информацию от случайного удаления, вирусов, сбоев в работе контролера, bad-блоков и тому подобного.
RAID 2, 3, 4, 5, 6 — что такое и с чем едят их?
Описание этих массивов тут по стольку по скольку, т.е. чисто для справки, да и то в сжатом (по сути описан только второй) виде. Почему так? Как минимум в силу низкой популярности этих массивов среди рядового (да и в общем-то любого другого) пользователя и, как следствие, малого опыта использования оных мною.
RAID 2 зарезервирован для массивов, которые применяют некий код Хемминга (не интересовался что это, посему рассказывать не буду). Принцип работы примерно такой: данные записываются на соответствующие устройства так же, как и в RAID 0, т.е они разбиваются на небольшие блоки по всем дискам, которые участвуют в хранении информации.
Оставшиеся же (специально выделенные под оное) диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо винчестера из строя возможно восстановление информации. Тобишь в массивах такого типа диски делятся на две группы — для данных и для кодов коррекции ошибок
Например, у Вас два диска являют собой место под систему и файлы, а еще два будут полностью отведены под данные коррекции на случай выхода из строя первых двух дисков. По сути это что-то вроде нулевого рейда, только с возможностью хоть как-то спасти информацию в случае сбоев одного из винчестеров. Редкостно затратно, — четыре диска вместо двух с весьма спорным приростом безопасности.
RAID 3, 4, 5, 6.. Про них, как бы странно это не звучало на страницах этого сайта, попробуйте почитать на Википедии. Дело в том, что я в жизни сталкивался с этими массивами крайне редко (разве что пятый попадался под руку чаще остальных) и описать доступными словами принципы их работы не могу, а перепечатывать статью, с выше предложенного ресурса решительно не желаю, как минимум, в силу наличия в оных зубодробительных формулировок, которые даже мне понятны со скрипом.
RAID 10 (RAID 1 + RAID 0)
In this part of the tutorial I will cover RAID 10. In the previous section, I already explained RAID 0 (striping without parity). However, to understand RAID 10, you need to understand how RAID 1 works as well.
What is RAID 1?
RAID 1 is known as disk mirroring. Disk mirroring means that data is written to two disks at the same time.
In a RAID 1 configuration, the data in Disk 0 is written to Disk 1. It clearly offers redundancy. Meaning that if one physical disk fails, you will not lose your data. Moreover, if you replace the failed disk you can rebuild the array.
However, RAID 1 has some clear disadvantages. In the first place, the volume offers half the size of the disks that make up the array. This is because same data is written to both disks. Now, if you are writing to two disks, it will clearly lead to reduced write speed as well.
RAID 10 Explained
RAID 10 is stripping (RAID 0) two sets of mirrored arrays (RAID 1).
From the diagram above, you can see two sets of mirrored disks combined to create a stripped disk.
The benefit of RAID 10 is that it offers the data redundancy of RAID 1 (mirroring) and the performance of RAID 0 (Stripping without parity). The disadvantage of RAID 10 is that it offers just 50% of the size of the physical disks that make up the array.
Теория: Уровни RAID и принципы восстановления данных
Чаще всего сейчас используются массивы уровней 0, 1, 10, 5, 50. В последнее время наблюдается возрастающий интерес к шестому уровню.
Ниже приведена краткая информация о принципах работы массивов. Более подробно, об этом можно прочитать в соответствующей статье.
RAID 0 – использование чередующейся записи (страйп). Строится из двух и более накопителей. Информация записывается на все диски массива блоками определенного (8кб,16кб,32кб,64 кб, 128кб…) размера. Файлы, размер которых один блок, равномерно распределяются по двум или более дискам.
Из-за отсутствия избыточности или дублирования данных, при выходе из строя одного из дисков, восстановить информацию в полном объеме невозможно без использования данных с неисправного накопителя. Исключением будут лишь файлы, размер которых меньше размера блока. Для полноценного восстановления информации в таких случаях необходимо сначала снять данные с неисправного диска, после чего восстанавливать RAID.
В случаях, когда все диски исправны, а массив отказывается корректно работать, восстановление производится программными методами, которые описаны
RAID 1 – использование технологии зеркалирования (зеркало). Строится из двух дисков. Информация одновременно пишется на оба накопителя, каждый диск является полной копией своего собрата. В случае выхода из строя одного из дисков массив остается работоспособным.
Если происходит сбой в работе контроллера и массив перестает определяться, то восстановление данных можно выполнить, воспользовавшись советами из статьи «Простое восстановление данных». Для этого один из дисков следует подключить к компьютеру на прямую, минуя RAID контроллер. Если повезёт, после подключения Ваши данные могут оказаться доступными и без использования программ, описанных в вышеуказанной статье.
RAID 10 – это объединение уровня 0 с уровнем 1, т.е. два страйпа объединяются в зеркало. В массиве используются минимум 4 диска. Он может остаться работоспособным при выходе из строя одного из составляющих его RAID 0.
При возникновении проблемы, в первую очередь необходимо определить, с чем именно возникли неполадки – с контроллером или с дисками
Когда проблема на уровне контроллера, Вам следует определить, какие винчестеры являются парами, составляющими страйпы
Здесь важно не перепутать диски, т.к. это приведет к потерянному времени и отсутствию результата
После того, как это станет известно, берётся одна такая пара, и с неё снимается информация таким же образом, как и с самостоятельного RAID 0.
Во время эксплуатации RAID 10, случается и такое, что выходят из строя два диска. Здесь возможны следующие варианты:
1) Оба диска принадлежат к одному страйпу, контроллер корректно обрабатывает исключительную ситуацию, и массив продолжает функционировать нормально.
2) Оба диска принадлежат к одному страйпу, но массив разваливается. В этом случае просто берём исправный страйп, и программно собираем его (об этом ниже).
3) Диски принадлежат к разным страйпам, но в одном из них уцелел первый, а в другом второй накопитель. Попробуйте программно собрать из них RAID 0.
4) Вышли из строя одноимённые диски разных страйпов. Увы Один из сломанных дисков придётся отремонтировать, или каким-либо ещё образом снять с него данные. Затем программная сборка.
RAID 5 – массивы с контролем четности. Основным его достоинством является распределение блоков информации и контрольных блоков четности по всем дискам массива. Для создания такого массива требуется минимум три диска. Объём массива равен сумме объёмов составляющих его накопителей, минус один диск. Блоки контроля чётности используются для вычисления недостающей информации при выходе из строя одного из накопителей, составляющих массив. Таким образом, при утрате одного из дисков данные не теряются, и массив может продолжать работу.
Но, случается и такое, что после выхода из строя одного накопителя, контроллер неверно обрабатывает исключительную ситуацию и массив перестает корректно работать, либо полностью «падает». Подобный сбой может возникнуть также во время выполняемого после замены диска перестроения массива. Иногда в течение короткого времени после смерти первого диска, выходит из строя ещё один.
Если массив не работает, и количество неисправных дисков не более одного, то его можно собрать При выходе из строя двух накопителей, сначала потребуется восстановить работоспособность, или снять информацию на исправный диск с одного из них, и лишь затем можно заняться сборкой массива.
Finding The Right RAID Solution For Your Needs
The only way you’ll be able to make the most of this technology is if you find the right RAID solution for you.
Let’s break down the most common – and often leveraged – types of RAID.
We’ll start with this summarizing infographic and will then dive into each RAID level to explain further.
RAID 0 (Striping)
This RAID level uses data striping. What this means is that each piece of data is split into segments and these segments are spread across the different disks in the RAID 0 system.
With RAID 0, writing and reading happens simultaneously from all the drives in the array so the I/O performance improvement can be very significant.
In the illustration above of how RAID 0 works, we can see that the different data is spread out across all disks.
Because this is such a performance-focused solution and not a reliability solution you won’t find any data protection with RAID 0.
If a disk in the RAID 0 system fails – the system fails, and all data spread across the disks will be gone.
RAID 1 (Mirroring)
RAID 1 is commonly referred to as a “disk mirroring” solution. RAID 1 will be implemented with at least two disks and always with an even number of disks (2, 4, 6, 8, etc.).
In the illustration above of how RAID 1 works, we can see that the same data is written to both drives. If A1 – A4 is lost on Disk 0 because the disk failed, it’s still available on Disk 1.
RAID 1 can also provide storage (I/O) performance improvement for read operations. Having the data in two copies means being able to read it simultaneously so the read I/O speed can be up to twice as fast.
RAID 5 (Parity)
Parity is a small amount of data that can accurately describe larger amounts of data in case data restoration needs to happen.
You’ll be able to swap the damaged disk out and replace with a brand new one, with the RAID 5 system mirroring your data and rebuilding the system on the fly as necessary.
RAID 5 also provides up to two times performance improvement for read operations thanks to the striping.
How Does Parity Work?
Let’s see a simplified example of Parity works.
Data in computers is represented by bits. Bits are either 0 or 1.
If we have 4 disks, and we take 1 bit of each disk, we’ll get something like this:0 1 0 X | Parity 0
Our X marks a dead disk. We don’t know if the bit from this disk is 0 or a 1. We do, however, know that the parity calculation was 0. Meaning, if you add up all bits, you should end up with 0.
As a reminder, in binary single-digit calculations:0 + 0 = 00 + 1 = 11 + 1 = 0
So based on our Parity above, we know that: 0 + 1 + 0 + X = 0
If X is 0: 0 + 1 + 0 + 0 = 0 <- This is FALSE
If X is 1: 0 + 1 + 0 + 1 = 0 <- This is TRUE
Therefore, X = 1 and that’s how parity is used to restore data in case a drive dies.
It’s worth mentioning that because of the overhead of parity calculations, RAID 1 or RAID 10 are often preferred to RAID 5 or RAID 6 as these latter RAID levels use parity.
RAID 10 (Mirroring + Striping)
In the illustration above, we see that we have two sub-arrays that work the same way RAID 1 works, but between these two sub-arrays, data is stripped across the disks. That’s why, A1 appears twice on the first sub-array but not once on the second.
If Disk 2 died, we would still have all data on disk 3. And thanks to the RAID 0 functionality integrated into RAID 10, performance is improved even more than it would with only RAID 1.
Keep in mind that RAID10 will result in 50% usable capacity, the same way it would with RAID 1. For example, 4 disks of 1 TB each will yield 2 TB of usable disk space.
RAID For SSD Caching
Another option that not all providers can offer you (but we can because we’re absolutely awesome) is to use RAID to create a system which automatically caches your most used data in SSD and saves the less often used in SATA.
This caching mechanism constantly proves itself and brings exceptional performance boosts to those who need a lot of storage, with high performance but without the price tag of many high-capacity SSD drives.
Sounds interesting? Request a free quote for a dedicated server with SSD caching at the button below.
Hardware RAID vs Software RAID
A hardware RAID controller costs money but has no overhead on the server.
A software RAID is free but does carry some overhead on the server and may be less reliable under certain circumstances.
You see? We told you we’ll keep it simple.
RAID 0 — что это и с чем его едят?
И так.. RAID 0 (он же, страйп («Striping»)) — используется от двух до четырех (больше, — реже) жестких дисков, которые совместно обрабатывают информацию, что повышает производительность. Чтобы было понятно, — таскать мешки одному человеку дольше и сложнее чем вчетвером (хотя мешки остаются все теми же по своим физ свойствам, меняются лишь мощности с ними взаимодействующие). Программно же, информация на рейде такого типа, разбивается на блоки данных и записывается на оба/несколько дисков поочередно.
Один блок данных на один диск, другой блок данных на другой и тд. Таким образом существенно повышается производительность (от количества дисков зависит кратность увеличения производительности, т.е 4-ые диска будут бегать шустрее чем два), но страдает безопасность данных на всём массиве. При выходе из строя любого из входящих в такой RAID винчестеров (т.е. жестких дисков) практически полностью и безвозвратно пропадает вся информация.
Почему? Дело в том, что каждый файл состоит из некоторого количества байт.. каждый из которых несет в себе информацию. Но в RAID 0 массиве байты одного файла могут быть расположены на нескольких дисках. Соответственно при «смерти» одного из дисков потеряется произвольное количество байтов файла и восстановить его будет просто невозможно. Но файл то не один.
В общем при использовании такого рейд-массива настоятельно рекомендуется делать постоянные бэкапы ценной информации на внешний носитель. Рейд действительно обеспечивает ощутимую скорость — это я Вам говорю на собственном опыте, т.к у меня дома уже годами установлено такое счастье.
Сравнение raid 10 vs raid 5
Говоря о выборе между «десятым» raid и любым другим, на ум обычно приходит мысль о рейд 5. Raid 5 похож на первый по своему назначению, с той лишь разницей, что для него требуется минимум 3 накопителя. Причем один из них не будет доступен в качестве места для записи данных, на нем будет храниться лишь служебная информация.
Пятый рейд способен пережить выпадение (поломку) только одного жесткого, поломка второго повлечет за собой потерю всех данных. Однако, рейд пятого уровня — хороший и дешевый способ продлить жизнь накопителям и снизить вероятность их поломки. Для того, чтобы наше сравнение было эффективным и наглядным, попробую упорядочить преимущества и недостатки пятого рейда перед десятым:
- Емкость массива raid 5 равна общему объему дисков за вычетом объема одного диска. В то время как в рейд 10, по факту, доступна лишь половина объема накопителей.
- При операциях чтения/записи взаимодействие с потоками данных может вестись параллельно с нескольких дисков. Поэтому скорость записи или чтения возрастает, по сравнению с обычным жестким диском. Но, без хорошего рейд-контроллера скорость будет не сильно высокой.
- Производительность рейд 5 в операциях случайного чтения/записи блоков ниже на 10–25% в сравнении с десятым. При поломке одного из дисков в пятом рейде весь массив переходит в критический режим — все операции записи и чтения сопровождаются дополнительными манипуляциями, производительность при этом резко падает.
Итак, что же мы имеем в итоге: рейд 10 имеет лучшую отказоустойчивость и скорость, по сравнению с рейд 5. Однако, собрать такой массив из дисков будет по карману далеко не каждому. Рейд 5 — некое промежуточное решение между нулевым массивом и зеркалом (рейд 1). О том, как сделать raid 10 из четырех дисков будет рассказано чуть ниже, хотя я уже затрагивал «вскользь» эту тему в статье, ссылка на которую указана вверху. Конечно же, для этой цели лучше использовать аппаратный уровень — нужен специальный контроллер, но хорошее оборудование стоит дорого.
Так называемый «фейк рейд» (встроенный в материнскую плату) не отличается надежностью и быстротой, использовать не рекомендую. Лучше уж тогда организовать это все на программном уровне. Ну а сейчас, подробный пример создания массива на четырех дисках, используя рейд-контроллер. Для начала через BIOS выбираем соответствующую утилиту.
Затем, в меню утилиты выбираем пункт «инициализация драйверов».
Выделяем все наши диски.
Снова возвращаемся к главному меню утилиты и выбираем пункт «создать массив».
И на последнем шаге — указываем тип массива, его размер и другие параметры.
До скорых встреч на страницах блога pc-information-guide.ru
RAID 1
Уровень RAID 1 («mirroring») требует для реализации четного количества жестких дисков: они разбиваются на пары, и вся информация считывается или записывается одновременно на два винчестера, полностью дублирующих друг друга. Другими словами, в массиве RAID 1 из двух HDD содержание обоих жестких дисков будет абсолютно идентичным в любой момент времени. Соответственно, безвозвратная потеря данных возможна лишь в том случае, если из строя выйдут сразу оба винчестера. Такой массив не только повышает надежность хранения информации, но и увеличивает скорость чтения данных, т. к. их можно «тянуть» сразу с двух дисков. При этом скорость записи остается такой же, как и у одного накопителя. Понятно, что объем логического диска, созданного с помощью RAID 1, будет в два раза меньше суммарного объема винчестеров. В целом массив первого уровня очень практичен и часто применяется пользователями, обеспокоенными сохранностью данных.
RAID 1+0
Заметим, что массивы уровней 0 и 1 можно объединять между собой, если это позволяет RAID-контроллер. Для полноценной реализации подобной конфигурации потребуется четыре накопителя: два будут работать в режиме RAID 0, а еще два — дублировать все их действия. В результате мы получим и скорость, и надежность. К тому же в данном случае допустим выход из строя сразу двух дисков, если это не «винчестеры-клоны». Сочетание этих двух уровней часто называют RAID 10, однако за этим же именем в ряде случаев может прятаться обычный RAID 1 — за это стоит сказать спасибо маркетологам, интерпретирующим чтение с двух дисков как полноценный RAID 0.
RAID 7.3
Изначально RAID был исключительно аппаратной технологией. Физический RAID-контроллер способен поддерживать несколько массивов различных уровней одновременно, однако более эффективная реализация RAID возможна с помощью программных компонентов (драйверов). Так, ядро Linux позволяет гибко управлять RAID-устройствами. Взяв за основу модули ядра Linux и технологии помехоустойчивого кодирования, разработчики программной технологии RAIDIX сумели создать решение для построения высокопроизводительных отказоустойчивых СХД на базе стандартных комплектующих.
ПО RAIDIX позволяет работать с массивами уровней RAID 0, RAID 5, RAID 6 и RAID 10. Среди патентованных алгоритмов «Рэйдикс» – уникальные уровни RAID 7.3 и N+M.
RAID 7.3 является аналогом RAID 6 с двойной четностью, но имеет более высокую степень надёжности. RAID 7.3 – уровень чередования блоков с тройным распределением четности, который позволяет восстанавливать данные при отказе до трех дисков в массиве и достигать высоких скоростных показателей без дополнительной нагрузки на процессор. RAID 7.3 существенно снижает вероятность отказа дисков без потерь в производительности и стоимости и зачастую используется для крупных массивов объемом более 32 ТБ.
Разновидности RAID
Скоростной Рейд 0
Рейд 0 не имеет ничего схожего с надежностью, ведь он только повышает скорость. Вам необходимо как минимум 2 винчестера и в этом случае данные будут как бы «разрезаться» и записываться на оба диска одновременно. То есть вам будет доступен полностью объем этих дисков и теоретически это значит, что вы получаете в 2 раза более высокую скорость чтения/записи.
Но, давайте представим, что один из этих дисков сломался — в этом случае неизбежна потеря ВСЕХ ваших данных. Иначе говоря, вам все равно придется регулярно делать бекапы, чтобы иметь возможность потом восстановить информацию. Здесь обычно используется от 2 до 4 дисков.
Рейд 1 или «зеркало»
Тут надежность не снижается. Вы получаете дисковое пространство и производительность только одного винчестера, зато имеете удвоенную надежность. Один диск ломается — информация сохранится на другом.
Массив уровня RAID 1 не влияет на скорость, однако объем — тут в вашем распоряжении лишь половина от общего пространства дисков, которых, к слову, в рейд 1 может быть 2, 4 и т.д., то есть — четное количество. В общем, главной «фишкой» рейда первого уровня является надежность.
Рейд 10
Совмещает в себе все самое хорошее из предыдущих видов. Предлагаю разобрать — как это работает на примере четырех HDD. Итак, информация пишется параллельно на два диска, а еще на два других диска эти данные дублируются.
Как результат — увеличение скорости доступа в 2 раза, но и объем только лишь двух из четырех дисков массива. Но вот если любые два диска сломаются — потери данных не произойдет.
Рейд 5
Этот вид массива очень схож с RAID 1 по своему назначению, только теперь уже надо минимум 3 диска, один из них будет хранить информацию, необходимую для восстановления. К примеру, если в таком массиве находится 6 HDD, то для записи информации будут использованы всего 5 из них.
Из-за того, что данные пишутся сразу на несколько винчестеров — скорость чтения получается высокая, что отлично подойдет для того, чтобы хранить там большой объем данных. Но, без дорогущего рейд-контроллера скорость будет не сильно высокой. Не дай БОГ один из дисков поломается — восстановление информации займет кучу времени.
Рейд 6
Этот массив может пережить поломку сразу двух винчестеров. А это значит, что для создания такого массива вам потребуется как минимум четыре диска, при всем при том, что скорость записи будет даже ниже, нежели у RAID 5.
Учтите, что без производительного рейд-контроллера такой массив (6) собрать вряд ли удастся. Если у вас в распоряжении всего 4 винчестера, лучше собрать RAID 1.
Заключение
В заключении ещё раз отметим – если данные очень важны, отложите эксперименты на другое время, и обратитесь к специалистам. Советуем это, зная печальный опыт многих людей.
Версия от 27.03.2009.Валерий Пьянков, R.LAВ, восстановление RAID массивов.
Основное условие распространения – сохранение ссылок, содержащихся в тексте данной статьи и подписи.
Отзывы о статье Восстановление RAID массивов простыми методами 10.09.2008 |
Толковая статья. Хорошо бы еще рассказать о массивах уровней 1Е, 5Е, 6 -они теперь часто встречаются 11.09.2008 |
Да, я сейчас планирую заняться написанием статьи о массивах. В этой статье не упоминали их т.к. доступного софта для сборки массивов уровней 1Е, 5Е пока еще нет, а статья сама именно о их восстановлении. 11.09.2008 |
Очень хорошая статья!!! Интересная и понеятная! З.Ы. Вы случайно не педогог….? 27.09.2008 |
Наверное не педогог…А получился бы отличный… 27.09.2008 |
Нет, не педагог 29.09.2008 |
написано грамотно и доступно! Побольше таких лекций! 06.11.2008 |
Большое спасибо за статью. Даный материал помог мне написать реферат на тему : «Обслуживание RAID — масивов ПК» с дисциплины «Диагностика КС» (возможно отзыв позволить быстрее нагуглить эту статью нуждающимся в ней). 05.02.2010 |
Спасибо Старался 05.02.2010 |
спасибо за статью, сейчас как раз пробую востановить RAID 5, 4HDDx 320Gbкак что отпишу, действительно это очень долго, но я так понимаю просто не хватает ресурсов (жадные директора)Валерию спасибо за консультации по телефону 10.10.2010 |
|