Conséquences d’une panne de disque dur, Tolérance de panne compromise – HP Contrôleur HP Smart Array P700m Manuel d'utilisation

Page 20

Advertising
background image

Remplacement, déplacement ou ajout de disques durs 20

Le service Event Notification consigne un événement dans le journal des événements système

Microsoft® Windows® et dans le journal IML.

L’utilitaire ADU répertorie tous les disques défectueux.

Pour plus d’informations sur le diagnostic des problèmes de disque dur, reportez-vous au

manuel HP ProLiant Servers Troubleshooting Guide (Manuel de résolution des problèmes des
serveurs HP ProLiant).

ATTENTION :

il est possible qu’un disque considéré comme défectueux par le contrôleur

semble opérationnel une fois que le système est redémarré ou après avoir été retiré et réinséré
(dans le cas des disques hot-plug). Toutefois, une utilisation continue de tels disques marginaux

risque de provoquer des pertes de données. Remplacez le disque au plus vite.

Conséquences d’une panne de disque dur

En cas de panne du disque dur, toutes les unités logiques du même module RAID sont affectées. Chaque

unité logique du module peut utiliser une méthode de tolérance de pannes différente. Par conséquent,

chaque unité logique peut être affectée différemment.

Les configurations en RAID 0 ne tolèrent pas de panne de disque. Si un disque physique du module

RAID est défectueux, l’état de toutes les unités logiques sans tolérance de panne du même module
RAID sera également défectueux.

Les configurations en RAID 1+0 peuvent tolérer plusieurs pannes de disques tant qu’aucun disque
défectueux ne se trouve en mode miroir par rapport à un autre disque défectueux.

Les configurations en RAID 5 tolèrent la défaillance d’un disque.

Les configurations RAID 6 (ADG) peuvent tolérer la panne simultanée de deux disques.

Tolérance de panne compromise

En cas de défaillance d’un nombre de disques durs supérieur à la limite autorisée par la méthode de

tolérance de panne, cette tolérance se trouve compromise et l’unité logique tombe en panne. Dans ce

cas, toutes les demandes du système d’exploitation sont rejetées et renvoient des erreurs irréversibles.
Vous risquez fort de perdre des données, même si celles-ci peuvent parfois être récupérées (voir la

section «

Récupération de données à la suite d’une tolérance de panne compromise

», page

21

).

Une tolérance de panne compromise peut par exemple se produire lorsqu’un disque d’un module RAID

tombe en panne pendant la reconstruction d’un autre disque du module. Si le module RAID ne dispose
pas de disque de secours en ligne, toutes les unités logiques de ce module qui sont configurées avec la

tolérance de panne RAID 5 seront défectueuses.
La tolérance de panne peut également être compromise par des problèmes non liés au disque, comme un

câble défectueux ou la coupure provisoire de l’alimentation d’un système de stockage. Dans de tels cas,
il n’est pas nécessaire de remplacer les disques physiques. Vous risquez toutefois de perdre des données,

en particulier si le système était occupé lors de l’incident.

Advertising