Архитектура Аудит Военная наука Иностранные языки Медицина Металлургия Метрология
Образование Политология Производство Психология Стандартизация Технологии


Хранение больших объемов информации



Пути повышения надежности, целостности и скорости при хранении и обработке информации больших объемов

Один из путей повышения надежности, целостности, скорости при хранении и обработке информации больших объемов получившим наибольшее распространение в РФ является использование RAID (redundant array of independent disks - «избыточный (резервный) массив независимых дисков») технологии. В настоящее время разработаны и эксплуатируются более десятка различных вариантов RAID в зависимости от целей и задач решаемых при обработке информации. Перечислять все варианты, в виду ограниченности данного курса по времени, не будем.

Рассмотрим некоторые из них.

RAID 1

Два диска — минимальное количество для построения «зеркального» массива

Рис. 5.44. Схема RAID 1

RAID 1 (mirroring — «зеркалирование») — массив из двух дисков, являющихся полными копиями друг друга. Не следует путать с массивами RAID 1+0, RAID 0+1 и RAID 10, в которых используется более двух дисков и более сложные механизмы зеркалирования.

Обеспечивает приемлемую скорость записи и выигрыш по скорости чтения при распараллеливании запросов.

Имеет высокую надёжность — работает до тех пор, пока функционирует хотя бы один диск в массиве. Вероятность выхода из строя сразу двух дисков равна произведению вероятностей отказа каждого диска, т.е. значительно ниже вероятности выхода из строя отдельного диска. На практике при выходе из строя одного из дисков следует срочно принимать меры — вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва.

Недостаток RAID 1 в том, что по цене двух жестких дисков пользователь фактически получает лишь один.

RAID 5

Рис. 5.45. Схема RAID 5

Основным недостатком уровней RAID от 2-го до 4-го является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков. Под контрольными суммами подразумевается результат операции XOR (исключающее или). Xor обладает особенностью, которая даёт возможность заменить любой операнд результатом, и, применив алгоритм xor, получить в результате недостающий операнд. Например: a xor b = c (где a, b, c — три диска рейд-массива), в случае если a откажет, мы можем получить его, поставив на его место c и проведя xor между c и b: c xor b = a. Это применимо вне зависимости от количества операндов: a xor b xor c xor d = e. Если отказывает c тогда e встаёт на его место и проведя xor в результате получаем c: a xor b xor e xor d = c. Этот метод по сути обеспечивает отказоустойчивость 5 версии. Для хранения результата xor требуется всего 1 диск, размер которого равен размеру любого другого диска в raid.

RAID5 получил широкое распространение, в первую очередь, благодаря своей экономичности. Объём дискового массива RAID5 рассчитывается по формуле (n-1)*hddsize, где n — число дисков в массиве, а hddsize — размер наименьшего диска. Например, для массива из четырех дисков по 80 гигабайт общий объём будет (4 — 1) * 80 = 240 гигабайт. На запись информации на том RAID 5 тратятся дополнительные ресурсы и падает производительность, так как требуются дополнительные вычисления и операции записи, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких дисков массива могут обрабатываться параллельно.

Производительность RAID 5 заметно ниже, в особенности на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25% от производительности RAID 0 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи сервера заменяется на контроллере RAID на три - одну операцию чтения и две операции записи). Недостатки RAID 5 проявляются при выходе из строя одного из дисков — весь том переходит в критический режим (degrade), все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность. При этом уровень надежности снижается до надежности RAID-0 с соответствующим количеством дисков (то есть в n раз ниже надежности одиночного диска). Если до полного восстановления массива произойдет выход из строя, или возникнет невосстановимая ошибка чтения хотя бы на еще одном диске, то массив разрушается, и данные на нем восстановлению обычными методами не подлежат. Следует также принять во внимание, что процесс RAID Reconstruction (восстановления данных RAID за счет избыточности) после выхода из строя диска вызывает интенсивную нагрузку чтения с дисков на протяжении многих часов непрерывно, что может спровоцировать выход какого-либо из оставшихся дисков из строя в этот наименее защищенный период работы RAID, а также выявить ранее необнаруженные сбои чтения в массивах cold data (данных, к которым не обращаются при обычной работе массива, архивные и малоактивные данные), что повышает риск сбоя при восстановлении данных.

Минимальное количество используемых дисков равно трём.

Помимо базовых уровней RAID 0 - RAID 6, описанных в стандарте «Common RAID Disk Drive Format (DEF) standard», существуют комбинированные уровни с названиями вида «RAID α +β » или «RAID α β », что обычно означает «RAID β, составленный из нескольких RAID α ».

Ниже приведена таблица сравнения уровней RAID.

 

Таблица 5.9

Сравнение уровней RAID

Уровень Количество дисков Эффективная ёмкость* Допустимое количество вышедших из строя дисков Надёжность Скорость чтения Скорость записи Примечание
от 2 S * N нет очень низкая высокая высокая полная потеря данных при выходе из строя любого из дисков!
от 2 S N-1 диск высокая высокая низкая двойная стоимость дискового пространства
1E от 3 S * N / 2 N/2-1 диск высокая высокая низкая двойная стоимость дискового пространства
от 4, чётное S * N / 2 от 1 до N/2 дисков** средняя высокая высокая двойная стоимость дискового пространства
от 3 S * (N - 1) 1 диск средняя высокая средняя  
от 6, чётное S * (N - 2) от 1 до 2 дисков*** низкая высокая высокая  
от 6, чётное S * (N - 1) / 2 от 2 до N/2+1 дисков**** высокая высокая низкая двойная стоимость дискового пространства
5E от 4 S * (N - 2) 1 диск средняя высокая высокая резервный накопитель работает на холостом ходу и не проверяется
5EE от 4 S * (N - 2) 1 диск средняя высокая высокая резервный накопитель работает на холостом ходу и не проверяется
от 4 S * (N - 2) 2 диска высокая высокая низкая  
от 8, чётное S * (N - 4) от 2 до 4 дисков*** средняя высокая средняя  
от 8, чётное S * (N - 2) / 2 от 4 до N/2+2 дисков**** высокая высокая низкая двойная стоимость дискового пространства

 

* N — количество дисков в массиве, S — объём наименьшего диска.

** Информация не потеряется, если выйдут из строя диски в пределах разных зеркал.
*** Информация не потеряется, если выйдет из строя одинаковое кол-во дисков в разных stripe'ах.

**** Информация не потеряется, если выйдут из строя диски в пределах одного зеркала.

Нестандартные уровни RAID

RAID 7

RAID 7 - зарегистрированная торговая марка компании Storage Computer Corporation, отдельным уровнем RAID не является. Структура массива такова: на дисках хранятся данные, один диск используется для складирования блоков чётности. Запись на диски кешируется с использованием оперативной памяти, сам массив требует обязательного ИБП; в случае перебоев с питанием происходит повреждение данных.

RAID 7 массив с оптимизированной асинхронностью для повышения производительности и высокой скорости ввода-вывода. Optimized Asynchrony for High I/O Rates as well as High Data Transfer Rates

RAID 7® является зарегистрированной торговой маркой Storage Computer Corporation (SCC)

Для понимания архитектуры RAID 7 рассмотрим ее особенности:

1. все запросы на передачу данных обрабатываются асинхронно и независимо;

2. все операции чтения/записи кешируются через высокоскоростную шину x-bus;

3. диск четности может быть размещен на любом канале;

4. в микропроцессоре контроллера массива используется операционная система реального времени ориентированная на обработку процессов;

5. система имеет хорошую масштабируемость: до 12-ти host-интерфейсов, и до 48-ми дисков;

6. операционная система контролирует коммуникационные каналы;

7. используются стандартные SCSI диски, шины, материнские платы и модули памяти;

8. используется высокоскоростная шина X-bus для работы с внутренней кеш-памятью;

9. процедура генерации четности интегрирована в кеш;

10. диски, присоединенные к системе, могут быть задекларированы как отдельно стоящие;

11. для управления и мониторинга системы можно использовать SNMP агент.

Преимущества:

- высокая скорость передачи данных и высокая скорость обработки запросов (1.5 - 6 раз выше других стандартных уровней RAID);

- высокая масштабируемость хост-интерфейсов;

- скорость записи данных увеличивается с увеличением количества дисков в массиве;

- для вычисления четности нет необходимости в дополнительной передаче данных.

Недостатки:

- собственность одного производителя;

- очень высокая стоимость на единицу объема;

- короткий гарантийный срок;

- не может обслуживаться пользователем;

- нужно использовать блок бесперебойного питания для предотвращения потери данных из кеш-памяти.

Программный (software) RAID

Для реализации RAID можно применять не только аппаратные средства, но и полностью программные компоненты (драйверы). Например, в системах на ядре Linux существуют специальные модули ядра, а управлять RAID-устройствами можно с помощью утилиты mdadm. Программный RAID имеет свои достоинства и недостатки. С одной стороны, он ничего не стоит (в отличие от аппаратных RAID-контроллеров, цена которых от $250). С другой стороны, программный RAID использует ресурсы центрального процессора, и в моменты пиковой нагрузки на дисковую систему процессор может значительную часть мощности тратить на обслуживание RAID-устройств.

Ядро Linux 2.6.28 (последнее из вышедших в 2008 году) поддерживает программные RAID следующих уровней: 0, 1, 4, 5, 6, 10. Реализация позволяет создавать RAID на отдельных разделах дисков, что аналогично описанному выше Matrix RAID. Поддерживается загрузка с RAID.

ОС семейства Windows NT, такие как Windows NT 3.1/3.5/3.51/NT4/2000/XP/2003 изначально, с момента проектирования данного семейства, поддерживает программный RAID 0, RAID 1 и RAID 5 (см. Dynamic Disk). Более точно, Windows XP Pro поддерживает RAID 0. Поддержка RAID 1 и RAID 5 заблокирована разработчиками, но, тем не менее, может быть включена, путем редактирования системных бинарных файлов ОС, что запрещено лицензионным соглашением. Windows 7 поддерживает программный RAID 0 и RAID 1, Windows Server 2003 — 0, 1 и 5. Windows XP Home не поддерживает RAID.

В ОС FreeBSD есть несколько реализаций программного RAID. Так, atacontrol, может как полностью строить программный RAID, так и может поддерживать полуаппаратный RAID на таких чипах как ICH5R. Во FreeBSD, начиная с версии 5.0, дисковая подсистема управляется встроенным в ядро механизмом GEOM. GEOM предоставляет модульную дисковую структуру, благодаря которой родились такие модули как gstripe (RAID 0), gmirror (RAID 1), graid3 (RAID 3), gconcat (объединение нескольких дисков в единый дисковый раздел). Также существуют устаревшие классы ccd (RAID 0, RAID 1) и gvinum (менеджер логических томов vinum). Начиная с FreeBSD 7.2 поддерживается файловая система ZFS, в которой можно собирать следующие уровни RAID: 0, 1, 5, 6, а также комбинируемые уровни.

OpenSolaris и Solaris 10 используют Solaris Volume Manager, который поддерживает RAID-0, RAID-1, RAID-5 и любые их комбинации как 1+0. Поддержка RAID-6 осуществляется в файловой системе ZFS.


Поделиться:



Популярное:

  1. Визига. Пищевая рыбная мука. Концентраты. Упаковка и хранение
  2. Закон больших чисел и центральная предельная теорема
  3. Контроль объемов, сроков, качества и условий предоставления медицинской помощи по обязательному медицинскому страхованию
  4. Лекция по гистологии №10. Мозжечок. Кора больших полушарий
  5. Локализация функций в коре больших полушарий
  6. Макросреда определяется характеристиками, присущими большим группам людей. Одной из наиболее значимых в контексте безопасности больших групп людей является толпа.
  7. Незаконные приобретение, передача, сбыт, хранение, перевозка или ношение оружия, его основных частей, боеприпасов, взрывчатых веществ и взрывных устройств. Незаконное изготовление оружия.
  8. Обжалование заключений страховой медицинской организации по оценке контроля объемов, сроков, качества и условий предоставления медицинской помощи
  9. Определение дыхательных объемов при проведении спирографии
  10. Определение объемов дополнительных земляных работ
  11. Основные показатели объемов национального производства и методы их расчета в системе национальных счетов
  12. Первая помощь – это комплекс мер, направленных на восстановление или сохранение жизни и здоровья пострадавшего, осуществляемых немедицинскими работниками.


Последнее изменение этой страницы: 2016-04-11; Просмотров: 1150; Нарушение авторского права страницы


lektsia.com 2007 - 2024 год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! (0.02 с.)
Главная | Случайная страница | Обратная связь