МОДЕЛЬ НАДЕЖНОСТИ ДИСКОВЫХ МАССИВОВ RAID-6 С ДВОЙНОЙ ИЗБЫТОЧНОСТЬЮ Рахман П.А.

Уфимский государственный нефтяной технический университет


Номер: 8-1
Год: 2015
Страницы: 57-60
Журнал: Актуальные проблемы гуманитарных и естественных наук

Ключевые слова

избыточный дисковый массив, среднее время наработки до отказа, цепь Маркова, redundant disk array, mean time to failure, Markov chain

Просмотр статьи

⛔️ (обновите страницу, если статья не отобразилась)

Аннотация к статье

Рассматриваются марковская модель надежности дисковых массивов с двойной избыточностью, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

Текст научной статьи

В последние три десятилетия наблюдается бурное развитие информационных технологий и их внедрение в самые различные сферы деятельности человека, и информация, представленная в электронном виде, стала ключевой частью жизни и работы не только организаций, но и каждого отдельного человека. Более того, сохранность и доступность информации для ее пользователей, как правило, имеет критическую важность, а потеря данных нередко может приводить к катастрофическим последствиям. В такой ситуации анализ показателей надежности систем [1, 2], в частности дисковых массивов, имеет достаточно высокую актуальность, особенно для предприятий среднего и крупного масштабов, поскольку такой анализ также позволяет косвенно оценивать риски потери данных и принимать соответствующие управленческие решения, и при необходимости внедрять дополнительные технические средства защиты информации. В рамках научной деятельности [3-8] автором исследовались показатели надежности современных систем передачи, обработки и хранения данных, в частности показатели надежности избыточных дисковых массивов с чередованием данных RAID-6. В результате была выведена формула для оценки среднего время наработки до отказа дискового массива RAID-6. Массив RAID-6 состоит из n ≥ 4 независимых дисков одинаковой емкости и сохраняет работоспособность при отказе не более двух (любых) дисков. Массив RAID-6 является компромиссом между отказоустойчивостью и избыточностью. На каждом из дисков 2 / n часть дискового пространства отводится для хранения избыточной (контрольной) информации, вычисляемой по пользовательским данным, хранящимся на других дисках. Это позволяет в случае отказа любого одного или двух дисков вычислять недостающую информацию по пользовательским данным и контрольной информации, хранящимся на оставшихся дисках. При отказе любых трех дисков, равно как и при отказе любого третьего диска до того, как произойдет замена и полное восстановление одного из двух ранее отказавших других дисков, все пользовательские данные всего массива теряются. Полезная емкость массива составляет (n - 2) / n часть от суммарной емкости дисков. Перейдем теперь к рассмотрению марковской модели надежности дискового массива RAID-6. Массив RAID-6 может находиться в одном из трех состояний: • Состояние 0 - все диски исправны, массив работоспособен и пользовательские данные доступны. • Состояние 1 - один из дисков неисправен, ожидает замены и завершения репликация данных после замены, массив работоспособен за счет оставшихся n - 1 дисков, пользовательские данные доступны. • Состояние 2 - два диска неисправны, ожидают замены и завершения репликация данных после замены, массив работоспособен за счет оставшихся n - 2 дисков, пользовательские данные доступны. • Состояние 3 - массив неработоспособен и данные недоступны. Интенсивность отказов дисков . Диски могут отказывать независимо друг от друга. Кроме того, пусть при отказе одного или двух дисков, помимо базовой интенсивности отказов становится существенной интенсивность ошибок чтения диска, поскольку для расчета «недостающей» информации требуются чтение данных со всех оставшихся n - 1 или n - 2 дисков. Интенсивность регенерация информации (процедура rebuild) на замененном диске за счет избыточных данных составляет . Будем считать, что время замены отказавшего диска несущественно по сравнению со временем регенерации информации за счет использования технологии автоматической горячей замены дисков (hot-spare). Также будем считать, что после отказа и замены двух дисков информация на замененных дисках регенерируется последовательно - сначала регенерируется информация на одном диске, после завершения регенерации начинается регенерация на втором диске. Кроме того, пусть в системе возможны критические виды ошибок контроллера дискового массива, которые переводят систему из любого работоспособного состояния напрямую в неработоспособное состояние. Интенсивность критических ошибок контроллера . Более того, при отказе одного или двух дисков, на контроллер ложится дополнительная нагрузка в силу необходимости расчета недостающей информации и регенерации данных на замененных дисках, и к базовой интенсивности ошибок добавляется дополнительная интенсивность . Тогда с учетом всего вышесказанного модель надежности избыточного дискового массива RAID-6 выглядит следующим образом (рис. 1): Рис. 1. Граф состояний модели надежности дискового массива RAID-6. Соответственно, система дифференциальных уравнений Колмогорова-Чепмена для этой цепи выглядит следующим образом: (1) Где, λ - интенсивность отказов дисков, ε - добавочная интенсивность ошибок в режиме чтения данных для восстановления информации на замененных дисках, μ - интенсивность восстановления дисков, n - общее количество дисков, σ - интенсивность ошибок контроллера дискового массива, δ - дополнительная интенсивность ошибок контроллера при регенерации данных после замены отказавшего диска. Учитывая, что состояние 0 является начальным, а состояние 3 - финальным неработоспособным, при которых теряются все данные, автором была выведена расчетная формула для оценки среднего времени наработки до отказа массива RAID-6 с потерей всех данных : (2) В частности, для массива RAID-6 состоящего из n = 6 дисков, интенсивностью отказов дисков λ = 1/120000 час-1, добавочной интенсивностью ошибок чтения данных ε = 1/300 час-1, интенсивностью восстановления μ = 1/24 час-1, интенсивностью критических ошибок контроллера σ = 1/1200000 час-1 и дополнительная интенсивность ошибок контроллера δ = 1/1200000 час-1 была получена следующая оценка средней наработки до потери данных: T = 189916 часов. Полученные автором теоретические результаты использовались в многолетней практике проектирования и эксплуатации систем хранения, обработки и передачи данных НИУ МЭИ (ТУ), Балаковской АЭС, ОАО «Красный Пролетарий» и ряда других предприятий.

Научные конференции

 

(c) Архив публикаций научного журнала. Полное или частичное копирование материалов сайта возможно только с письменного разрешения администрации, а также с указанием прямой активной ссылки на источник.