Немного истории и описание технологий

Развитие многих электронных компонентов персонального компьютера (например, процессоров) значительно опережает совершенствование дисковых накопителей.

Что, по сути, заставляет рядовых пользователей, имеющих ценную информацию, столкнуться с неприятными последствиями выхода из строя электронно-механических винчестеров. Зачастую, проблема на локальном уровне решается подключением нескольких жестких дисков и грамотная реализация программно-аппаратных технологий распределения многочисленных потоков информации. К коллективным сложным системам хранения большого объема данных (например, сервера популярного видеохостинга youtube.com) требуется постоянная доступность, отказоустойчивость и производительность. Потери от ошибок в мировом масштабе могут исчисляться сотнями миллиардов долларов! Поэтому еще в XX веке были разработаны основные уровни массивов, избыточных массивов независимых дисков (RAID).

Что такое RAID массивы. Немного истории и описание технологий

Еще в 1987 году Гарт Гибсон, Рэнди Катц и Дэвид Паттерсон в научной статье изложили основные идеи организации массивов RAID, используемых сегодня для совершенствования уже разработанных методов организации хранения данных. Главная задача развития в этой отрасли – разрешить конфликт трех основных величин: надежность, цена и производительность.

Поэтому стали разрабатывать многочисленные архитектуры (в том числе и многоуровневые) построения RAID-массивов на основе пяти уже существующих уровней, которые незамысловато обозначаются цифрами от 0 до 6.

Поэтому стали разрабатывать многочисленные архитектуры (в том числе и многоуровневые) построения RAID-массивов на основе пяти уже существующих уровней, которые незамысловато обозначаются цифрами от 0 до 6. Все 6 типов архитектуры были закреплены как стандарт в 1992 году на организованном консорциуме. Сегодня существует уже 8 базовых стандартных одноуровневых массивов. Главное задача в веке XXI остается такой же: стремление к меньшим потерям производительности, реализация стройной структуры доступа к хранящейся информация и, конечно же, своевременное устранение ошибок чтения и записи увеличивающихся потоков информации.

Первый «RAID 0»

Каждая архитектура имеет свои особенности. Рассмотрим их подробнее. Первый «RAID 0» как таковой избыточности не имеет. На этом уровне осуществляется быстрый и в то же время простой способ увеличения производительности всей системы. Причем скорость работы такого массива будет прямо пропорциональна количеству задействованных дисков. Стоит заметить, что в этом случае ровно во столько же раз возрастает вероятность сбоя и ошибок всей системы. Восстановить информацию после возникновения нештатных ситуаций не представляется возможным! В упрощенной форме по этому принципу организуются простые массивы пользователей ПК, ошибки которых решаются в основном приобретением более дорогостоящего оборудования (жестких дисков). Идея зеркалирования реализована в архитектуре «RAID 1». Здесь главное преимущество – надежность. В результате повреждения информации на одном диске, потоки данных станут транслироваться с другого. Естественно, что ни о каком выигрыше в скорости не может быть и речи.

«RAID 2» использует код Хемминга. Принцип работы заключается в том, что вся входящая информация делится на «слова» определенной длины, зависящей от количества задействованных дисков. Дальше для каждого созданного «отрезка» вычисляется код коррекции, который успешно сохраняется на диске, в выделенное специально для этих целей место. Такой способ организации успешно решает проблемы двойных и одиночных ошибок. Однако в масштабах предприятия этот уровень не получил должного признания по причине низкого КПД при работе с большим количеством запросов. «RAID 3,4 и 5» — это массивы, на которых реализуется принцип четности в случае одиночных неисправностей. Если, например, ставится задача организовать постоянный доступ к большим файлам с низкой частотой запросов, то архитектура «RAID 3» станет наиболее приемлемым вариантом. Однако для реализации этого уровня необходимо как минимум три жестких диска. Вся информации в этой конкретной ситуации делится на два винчестера, а на третий записываются контрольные суммы. В случае сбоя одного из дисков, целостность всего массива не нарушается. «RAID 4» практически не используется, так как организовать работу ассиметричной системы ввода-вывода довольно сложно и тем более сложно восстановить хранящиеся на винчестерах блоки информации.

«RAID 5» нашел компромисс между надежностью «RAID 1» и скоростью «RAID 0»

«RAID 5» нашел компромисс между надежностью «RAID 1» и скоростью «RAID 0». Однако в этом случае RAID-контроллер плохо справляется с потоками входящей информации, так как загружается, в основном расчетами корректирующих кодов. «RAID 6» практически похож на «RAID 5». Главное особенность шестого является реализация двух независимых схем контроля четности независимо друг от друга.

«RAID 6» практически похож на «RAID 5». Главное особенность шестого является реализация двух независимых схем контроля четности независимо друг от друга

RAID-системы по способу реализации делятся на аппаратные и программные. В первом случае, требуется приобретение дорогостоящих контроллеров. Специальное ПО, конечно же, дешевле. Однако оно создает дополнительную нагрузку на вычислительные мощности ЭВМ. В последнее время стоимость RAID-контроллеров снизилась. Реализация аппаратного, более качественного способа хранения информации, стала возможной не только в пределах дорогих «мэйнфреймов», но и на рабочих станциях и на серверах начального уровня. При выборе архитектуры хранения данных, необходимо руководствоваться, в первую очередь, задачами, которые вы ставите перед своей информационной системой. И, конечно же, помнить, что стоимость системы защиты никогда не должна превышать собственную стоимость защищаемой информации.

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *