Хорошо

Huawei RH5885 - цикл жизни SSD Популярное

Последний ответ фев 05, 2021 11:44:10 359 12 2 0 0

 

Добрый день, коллеги!


Сегодня наглядно продемонстрируем, как чтение логов позволяет принять своевременные решения, которые помогут избежать остановки в работе оборудования и сервисов.

 

Итак, приступим.

 

Для начала разберёмся с показателем Media Wearout Indicator, на основании значений которого мы будем делать свои выводы далее в тексте.

 

Media Wearout Indicator – показатель, который определяет количество возможных для диска циклов перезаписи NAND Flash памяти, которые происходят при записи данных на диск. Когда его значение составляет 100%, диск ещё не проводил цикл перезаписи NAND Flash памяти и его жизненный цикл только начался. Когда значение падает до 1%, оно уже не меняется - диск выработал ресурс полностью, то есть произвёл максимальное количество операций очистки памяти и нуждается в замене.

 

 

Описание проблемы

 

В сервере Huawei RH5885 V3 установлены SSD-диски, размером 2.5 дюйма. Часть дисков уже выработали свой ресурс, часть уже подошли к критической отметке использования.

 

Анализ проблемы

 

Согласно отчёту о доставке оборудования, который мы получили, используя серийный номер сервера, SSD-накопители были доставлены такого-то Июля, 201Х некоего года J  

 

Теперь нам нужно проверить показатель Media Wearout Indicator в логах, именно он демонстрирует состояние диска.

 

Итак, приступим к проверке логов.

 

Имея на руках серийный номер диска, мы можем найти его в логах сервера:

 

Media Wearout Indicator


 

Выделенный на изображении диск имеет показатель Media Wearout Indicator 2%, что очень близко к критической отметке в 1%. Это означает, что диск нуждается в замене, так как его ресурс практически полностью выработан.

 

Такой же показатель имеет и другой диск, который был приобретён в то же самое время:

 

Media Wearout Indicator


 

Показатель Media Wearout Indicator также составляет 2%, рекомендация – замена диска.

 

Теперь рассмотрим третий диск, который был приобретён некоего Июля, 201Х года:

 

Media Wearout Indicator


Как мы видим, показатель Media Wearout Indicator составляет 1%, что означает, что диск полностью выработал свой ресурс. Такой диск нуждается в немедленной замене.

 

Основная причина

 

Износ дисков не сопровождается предупредительными сообщениями.

 

Показатель Media Wearout Indicator может служить определённой метрикой износа накопителей, позволяющая запланировать профилактические действия, которые помогут избежать полной остановки сервисов и отказа оборудования.

 

Решение

 

Несмотря на всю технологичность нового оборудования, человеческий фактор всё ещё имеет решающее значение. Следите за своим оборудованием, снимайте логи и проводите профилактические меры для поддержания его состояния и состояния Ваших сервисов в состоянии непрерывной работы.

 

Надеемся, что данный материал будет для Вас полезен и интересен. Всегда задавайте интересующие Вас вопросы.

 

А как часто Вы проводите профилактику на оборудовании? Отвечайте в комментариях!!!

 

Хорошего дня)


  • x

Ruslan555
Опубликовано 2021-2-4 19:50:48

То есть система даже не уведомит дополнительно заблаговременно что диску конец приходит? Здорово. Это только у Хуавей или у всех так? То есть придется Лазить по логам и анализировать остаточный ресурсруками или с помощью софта ?

Развернуть
  • x

Rinat
Author Опубликовано 2021-2-4 23:19:24

Не знаю правильно нет,  рекомендуют 5% на заметку и контроль,  3% замена

Развернуть
  • x

Kelebrimber
Админ Опубликовано 2021-2-5 06:31:10

Ирония заключается в том, что диск, который система рекомендует к немедленной замене, может проработать ещё достаточное время, полгода, например. Иногда доходит до абсурда, когда мы рекомендуем замену диска, приезжает новый, а старый всё ещё в работе и заказчик решает его поменять после выхода из строя. И этот "умерший" диск благополучно ещё несколько месяцев трудится, действуя всем на нервы))) Чаще всего диск не один, работает в RAID, а если ещё и в RAID 5, так там и не страшно даже)

Рекомендации верные, 5% на контроль, 3% планировать замену.

Основной посыл - в Enterprise сегменте диски меняют только вперёд ногами, если иное не обусловлено правилами организации. Сталкивался с подобным не один раз.

Хорошего дня)

Развернуть
  • x

Ruslan555
Опубликовано 2021-2-5 11:44:10
Опубликовано пользователем Kelebrimber в 2021-02-05 06:31 Ирония заключается в том, что диск, который система рек ...
Но в отличие от СХД здесь нет продвинутой системы "добоя" дисков и вполне возможна ситуация что диск умрет не один, а с коллегами по рейду?
Развернуть
  • x

Kelebrimber
Kelebrimber Опубликовано 2021-2-5 12:35 (0) (0)
Разумеется такая ситуация возможна, но я никогда не поверю, что профессионал своего дела не проводит профилактику оборудования самостоятельно и без алармов хотя бы раз в месяц)  
Ruslan555
Ruslan555 Ответить Kelebrimber  Опубликовано 2021-2-5 12:43 (0) (0)
О, интересно. То есть вы заходите на каждый сервак имеющий ссд и вручную смотрите логи "какой диск скоро крякнет?" :-)  
Kelebrimber
Kelebrimber Ответить Ruslan555  Опубликовано 2021-2-5 12:49 (0) (0)
Зависит от величины хозяйства) И юных падаванов никто не отменял, отличная образовательная практика) А если серьёзно, то сбор логов, как и их чтение не занимает много времени)  
Kelebrimber
Kelebrimber Ответить Kelebrimber  Опубликовано 2021-2-5 12:50 (0) (0)
Когда знаешь, что искать) Может спасти пятую точку от множества проблем)  
Ruslan555
Ruslan555 Ответить Kelebrimber  Опубликовано 2021-2-5 13:12 (0) (0)
Ну на юнгах далеко не уедешь. Значит все-таки не все в подряд смотрится, а прикидывается где потенциально будут траблы..где высокая нагрузка и старые диски..  
Ruslan555
Ruslan555 Ответить Kelebrimber  Опубликовано 2021-2-5 13:13 (0) (0)
Безусловно, про точку.. К чему спич:постоянно ходить по всем сопровождаемым-нереально.  
Kelebrimber
Kelebrimber Ответить Ruslan555  Опубликовано 2021-2-5 13:15 (0) (0)
Разумеется) Enterprise железки потому и придумали, чтобы в них можно было не постоянно смотреть))) ИМХО)  
Ruslan555
Ruslan555 Ответить Kelebrimber  Опубликовано 2021-2-5 13:36 (0) (0)
 

Комментарий

Выполните вход в систему, чтобы ответить на пост. Вход | Регистрация
Отправить

Внимание! В целях защиты правовых интересов Вас, сообщества и третьих лиц, не публикуйте любой материал, содержащий политические высказывания, порнографию, упоминание азартных игр, употребление наркотиков, а также материал, нарушающий коммерческую тайну или содержащий персональные данные пользователей. Также не предоставляйте данные от вашей учетной записи. Вы будете нести ответственность за все действия, выполняемые под вашим аккаунтом. Подробная информация: “Пользовательское соглашение.”

My Followers

Авторизуйтесь и пользуйтесь всеми преимуществами участника!

Вход

Заблокировать
Вы уверены, что хотите заблокировать этого пользователя?
Пользователи из вашего черного списка не могут комментировать ваши посты, не могут упоминать вас, не могут отправлять личные сообщения.
Напоминание
Пожалуйста, привяжите свой мобильный номер чтобы получить бонус за приглашение.