МОДЕЛЬ НАДЕЖНОСТИ КАСКАДНЫХ ДИСКОВЫХ МАССИВОВ RAID-01 С ЗЕРКАЛИРОВАНИЕМ И ЧЕРЕДОВАНИЕМ ДАННЫХ Рахман П.А.

Уфимский государственный нефтяной технический университет


Номер: 8-1
Год: 2015
Страницы: 63-66
Журнал: Актуальные проблемы гуманитарных и естественных наук

Ключевые слова

избыточный дисковый массив, среднее время наработки до отказа, цепь Маркова, redundant disk array, mean time to failure, Markov chain

Просмотр статьи

⛔️ (обновите страницу, если статья не отобразилась)

Аннотация к статье

Рассматриваются марковская модель надежности каскадных дисковых массивов с зеркалированием и чередованием данных, формула для расчета среднего времени наработки до отказа дискового массива, а также пример расчета.

Текст научной статьи

Современный мир практически невозможно представить без технических систем, ставших неотъемлемой частью как повседневной жизни и профессиональной деятельности человека, так и ключевыми элементами различных предприятий и отраслей экономики. Помимо функциональных возможностей и основных технических характеристик, которые в первую очередь интересуют конечных потребителей и производителей, таких как: производительность, мощность, емкость и т.п., не менее важными являются показатели надежности [1, 2], так как от них напрямую зависит эффективность и безопасность эксплуатации технических систем. Соответственно, разработка моделей и методов для расчета показателей надежности систем передачи, обработки и хранения данных является актуальной и критически важной задачей. В рамках научной деятельности [3-8] автором исследовались показатели надежности современных систем передачи, обработки и хранения данных, в частности показатели надежности каскадных дисковых массивов RAID-01. В результате была выведена формула для оценки среднего время наработки до отказа каскадного дискового массива RAID-01. Каскадный массив RAID-01 представляет собою массив RAID-1 с зеркалированием данных, объединяющий 2 массива RAID-0 с чередованием данных по n дисков в каждом (рис. 1). Массив RAID-01 строится из четного количества (2n) дисков. Рис. 1. Структурная схема двухуровневого дискового массива RAID-01 В лучшем случае каскадный массив RAID-01 сохраняет работоспособность при отказах вплоть до n дисков в случае, если все они оказываются в рамках одного массива RAID-0. В таком случае только отказ n+1-го диска приведет к неизбежной потере данных, поскольку тогда уже второй массив RAID-0 также окажется разрушенным, поскольку сам по себе он не обладает никакой отказоустойчивостью. В худшем случае отказ даже двух дисков, оказавшихся в разных массивах RAID-0, приводит к потере данных. Соответственно, каскадный массив устойчив к отказу любого одного диска и к некоторым сочетаниям отказов большего числа дисков, но не более n дисков. Рассмотрим теперь модель надежности отказоустойчивой системы хранения данных на базе каскадного массива RAID-01. Пусть задана система хранения данных на базе каскадного массива RAID-01, состоящего из 2n идентичных дисков. Интенсивность отказов дисков составляет . Диски могут отказывать независимо. Если система находится в состоянии 0 (все диски исправны), то отказ любого из 2n дисков приводит в состояние 1. В состоянии 1 возможен отказ любого из 2n - 1 дисков, причем отказ любого из n - 1 дисков, находящихся RAID-0 массиве, в котором содержится ранее отказавший диск, приводит систему в состояние 2, а отказ любого из n дисков, находящихся в другом RAID-0 массиве, приводят систему в аварийное состояние F. В состоянии 2 возможен отказ любого из 2n - 2 дисков, причем отказ любого из n - 2 дисков, находящихся RAID-0 массиве, в котором содержатся ранее отказавшие диски, приводит систему в состояние 3, а отказ любого из n дисков, находящихся в другом RAID-0 массиве, приводят систему в аварийное состояние F. И так далее, вплоть до состояния n. После отказа n дисков, находящихся в рамках одного массива RAID-0, система оказывается в состоянии n и все еще сохраняет работоспособность, но отказ любого из оставшихся n дисков (все они находятся в другом массиве RAID-0) приведет систему в аварийное состояние F. При отказе дисков, находящихся в рамках одного массива RAID-0, массив RAID-1 после замены неисправных дисков запускает регенерацию информации путем простого копирования данных из второго массива RAID-0, причем считываются данные всех n дисков. Интенсивность регенерация информации на замененном диске составляет . Будем считать, что время замены отказавшего диска несущественно по сравнению со временем регенерации информации за счет использования технологии автоматической горячей замены дисков (hot-spare). Информация на дисках в рамках массива RAID-0 регенерируются параллельно в рамках единого процесса, и этот процесс завершается одновременно для всех дисков, поэтому будем упрощенно считать, что интенсивность регенерации данных во всем массиве RAID-0 также равна . В случае если во время регенерации отказывает очередной диск из массива RAID-0, на котором идет регенерации информации, будем упрощенно считать, что процесс регенерации сбрасывается, и он начинается заново после замены неисправного диска. После успешного завершения процедуры регенерации система переходит в полностью исправное состояние 0. Кроме того, пусть при регенерации информации в массиве RAID-0, на дисках второго массива RAID-0, с которых идет копирование информации, помимо базовой интенсивности отказов также становится существенной интенсивность ошибок чтения диска, и эта интенсивность добавляется к базовой интенсивности отказов диска. Кроме того, пусть в системе возможны критические виды ошибок RAID-контроллера, которые переводят систему из любого работоспособного состояния j = 0…n напрямую в аварийное состояние. Интенсивность критических ошибок контроллера составляет . Тогда с учетом всего вышесказанного марковская модель отказоустойчивой системы хранения данных на базе массива RAID-01 выглядит следующим образом (рис. 2): Рис. 2. Граф состояний модели надежности дискового массива RAID-01. Где, λ - интенсивность отказов дисков, ε - добавочная интенсивность ошибок в режиме чтения данных для восстановления информации на замененных дисках, μ - интенсивность восстановления дисков, n - общее количество дисков, σ - интенсивность ошибок контроллера дискового массива. В результате аналитического решения марковской модели автором была выведена расчетная формула для оценки среднего времени наработки до отказа массива RAID-01 с потерей всех данных: (1) В частности, для массива RAID-01 состоящего из общего числа 2n = 12 дисков, интенсивностью отказов дисков λ = 1/120000 час-1, добавочной интенсивностью ошибок чтения данных ε = 1/112 час-1, интенсивностью восстановления μ = 1/9 час-1, интенсивностью критических ошибок контроллера σ = 1/1200000 час-1 была получена следующая оценка средней наработки до потери данных: T = 30060 часов. Полученные автором теоретические результаты использовались в многолетней практике проектирования и эксплуатации систем хранения, обработки и передачи данных НИУ МЭИ (ТУ), Балаковской АЭС, ОАО «Красный Пролетарий» и ряда других предприятий.

Научные конференции

 

(c) Архив публикаций научного журнала. Полное или частичное копирование материалов сайта возможно только с письменного разрешения администрации, а также с указанием прямой активной ссылки на источник.