Conséquences d’une panne de disque dur, Tolérance de panne compromise – HP Contrôleur HP Smart Array E200 Manuel d'utilisation

Page 25

Advertising
background image

Remplacement, déplacement ou ajout de disques durs 25

Pour plus d’informations sur le diagnostic des problèmes de disque dur, reportez-vous au manuel
HP Servers Troubleshooting Guide
(Manuel de résolution des problèmes des serveurs HP).

ATTENTION : il est possible qu’un disque considéré comme défectueux par le contrôleur semble

opérationnel une fois que le système est redémarré ou après avoir été retiré et réinséré (dans le cas des
disques hot-plug). Toutefois, une utilisation continue de tels disques marginaux risque de provoquer des
pertes de données. Remplacez le disque au plus vite.

Conséquences d’une panne de disque dur

En cas de panne du disque dur, toutes les unités logiques du même module RAID sont affectées. Chaque
unité logique d’un module RAID peut utiliser une méthode de tolérance de panne différente et ainsi,
chaque unité logique peut être affectée différemment.

Les configurations en RAID 0 ne tolèrent pas de panne de disque. Si un disque physique du module
RAID est défectueux, l’état de toutes les unités logiques sans tolérance de panne du même module
RAID sera également défectueux.

Les configurations en RAID 1+0 peuvent tolérer plusieurs pannes de disques tant qu’aucun disque
défectueux ne se trouve en mode miroir par rapport à un autre disque défectueux.

Les configurations en RAID 5 tolèrent la défaillance d’un disque.

Tolérance de panne compromise

En cas de défaillance d’un nombre de disques durs supérieur à la limite autorisée par la méthode de
tolérance de panne, cette tolérance se trouve compromise et l’unité logique tombe en panne. Dans ce
cas, toutes les demandes du système d’exploitation sont rejetées et renvoient des erreurs irréversibles.
Vous risquez fort de perdre des données, même si celles-ci peuvent parfois être récupérées (reportez-vous
à la section «

Récupération de données à la suite d’une tolérance de panne compromise

», page

25

).

Une tolérance de panne compromise peut par exemple se produire lorsqu’un disque d’un module RAID
tombe en panne pendant la reconstruction d’un autre disque du module. Si le module RAID ne dispose
pas de disque de secours en ligne, toutes les unités logiques de ce module qui sont configurées avec la
tolérance de panne RAID 5 seront défectueuses.

La tolérance de panne peut également être compromise par des problèmes non liés au disque, comme un
câble défectueux ou la coupure provisoire de l’alimentation d’un système de stockage. Dans de tels cas, il
n’est pas nécessaire de remplacer les disques physiques. Vous risquez toutefois de perdre des données,
en particulier si le système était occupé lors de l’incident.

Récupération de données à la suite d’une tolérance de panne compromise

Si la tolérance de panne est compromise, l’insertion de disques de secours n’améliore pas l’état du
volume logique. Si des messages d’erreurs irréversibles apparaissent sur l’écran, exécutez plutôt la
procédure ci-après pour récupérer les données.

1.

Mettez tout le système hors tension puis sous tension à nouveau. Dans certains cas, il arrive qu’un
disque continue de fonctionner suffisamment longtemps pour vous permettre de réaliser des copies
des fichiers importants.
Si un message POST 1779 s’affiche, appuyez sur F2 pour réactiver le(s) volume(s) logique(s).
Gardez à l’esprit qu’une perte de données s’est probablement produite et que les données du
volume logique sont suspectes.

2.

Faites des copies des données importantes, si possible.

3.

Remplacez tous les disques défectueux.

Advertising