Про RAID-ы.
Mar. 14th, 2013 03:05 pmУ нас в конторе есть небольшой RAID. Thecus 4100, из серии "карманных". Туда влезает, как ясно из названия 4 диска. Данных у нас не особо много, и до последнего времени туда вообще было вставлено 2 винта. И, соответственно, использовался RAID-1.
Но, понадобилось больше пространства, и были докуплены еще 2 диска (WD, 1 гектар чорной икры). Я заглушил box, радостно вставил диски и...
Короче, решил переконфигурировать все это дело на более прогрессивный RAID-6, который может жить начиная с 4-х носителей. Ок. Почему бы и нет? Thecus радостно пожужжал дисками и сказал, что online-реконфигурация началась. Я иногда посматривал на прогресс. За день прошло где-то процентов 20.
К чести коробки (там правда все равно внутре линупс) она оставалась в on-line. По крайней мере - поначалу. И тем временем постепенно что-то там XOR-ила, пересчитывала, и писала на новые диски. К исходу третьего кажется дня, прогресс достиг 42.6% и на этом встал. Затем web-интерфейс перестал откликаться.
Здраво поразмыслив, через 5-6 часов я решил сделать shutdown. А что еще оставалось? Разумеется, shutdown не смог завершиться штатно. Увы. Коробку пришлось выключить. После Reset-а (есть ли жизнь). Она сначала сказала, что никаких RAID-partitions не нашлось вообще (о ужас!) но, через пару минут сообщила, что все же нашла какую-то хрень, и начала восстанавливать. За час проходило около 10%. На этой нейтральной ноте я ушел домой.
Утром подключившись к RAID-у я увидел все те же два диска в конфигурации зеркало (Тарковского). И 2 диска в резерве. Повторно запускать online-реконфигурацию я не стал.
Ибо сказано - не искушай...
Просто тупо скопировал весь контент по самбе (благо, нашлось 500 свободных гигабайт) и пересоздал массив заново, уже с 0 и на четырех дисков с RAID-6. Вся эта канитель, с backup-ом и заливкой взад заняла еще пару дней.
По результатам, встает несколько вопросов:
1. Нахрена нужна возможность on-line реконфигурации, если она ведет к потенциальной (а судя по форумам - и реальной) потере данных компании?
2. Почему жалких 500 Gb должны переноситься больше 2-х суток (!), при средней скорости последовательной записи на блины никак не меньше 30 Мб в секунду (а максимальная - зашкаливает за 100!), и наличии супер-пупер мощного RAID-контроллера, который и XOR-ит, и AND-ит и Рида-Сало-мона считает (наверное).
3. Нахрена, опять же, нужна такая возможность, если копирование руками через samba работает таки быстрее! Почему в рамках коробки, нельзя сделать все нормально? Пусть даже, с временной недоступностью хранилища (я согласен на эту опцию на час-два).
Некому ответить...
P.S. И тайваньцами я недоволен...
Но, понадобилось больше пространства, и были докуплены еще 2 диска (WD, 1 гектар чорной икры). Я заглушил box, радостно вставил диски и...
Короче, решил переконфигурировать все это дело на более прогрессивный RAID-6, который может жить начиная с 4-х носителей. Ок. Почему бы и нет? Thecus радостно пожужжал дисками и сказал, что online-реконфигурация началась. Я иногда посматривал на прогресс. За день прошло где-то процентов 20.
К чести коробки (там правда все равно внутре линупс) она оставалась в on-line. По крайней мере - поначалу. И тем временем постепенно что-то там XOR-ила, пересчитывала, и писала на новые диски. К исходу третьего кажется дня, прогресс достиг 42.6% и на этом встал. Затем web-интерфейс перестал откликаться.
Здраво поразмыслив, через 5-6 часов я решил сделать shutdown. А что еще оставалось? Разумеется, shutdown не смог завершиться штатно. Увы. Коробку пришлось выключить. После Reset-а (есть ли жизнь). Она сначала сказала, что никаких RAID-partitions не нашлось вообще (о ужас!) но, через пару минут сообщила, что все же нашла какую-то хрень, и начала восстанавливать. За час проходило около 10%. На этой нейтральной ноте я ушел домой.
Утром подключившись к RAID-у я увидел все те же два диска в конфигурации зеркало (Тарковского). И 2 диска в резерве. Повторно запускать online-реконфигурацию я не стал.
Ибо сказано - не искушай...
Просто тупо скопировал весь контент по самбе (благо, нашлось 500 свободных гигабайт) и пересоздал массив заново, уже с 0 и на четырех дисков с RAID-6. Вся эта канитель, с backup-ом и заливкой взад заняла еще пару дней.
По результатам, встает несколько вопросов:
1. Нахрена нужна возможность on-line реконфигурации, если она ведет к потенциальной (а судя по форумам - и реальной) потере данных компании?
2. Почему жалких 500 Gb должны переноситься больше 2-х суток (!), при средней скорости последовательной записи на блины никак не меньше 30 Мб в секунду (а максимальная - зашкаливает за 100!), и наличии супер-пупер мощного RAID-контроллера, который и XOR-ит, и AND-ит и Рида-Сало-мона считает (наверное).
3. Нахрена, опять же, нужна такая возможность, если копирование руками через samba работает таки быстрее! Почему в рамках коробки, нельзя сделать все нормально? Пусть даже, с временной недоступностью хранилища (я согласен на эту опцию на час-два).
Некому ответить...
P.S. И тайваньцами я недоволен...