Conséquences d’une panne de disque dur, Tolérance de panne compromise – HP Modular Smart Array HP 60 Manuel d'utilisation

Page 33

Advertising
background image

Résolution des problèmes 33

HP SIM peut détecter à distance des disques défectueux sur un réseau. (Pour plus d’informations

sur HP SIM, reportez-vous à la documentation fournie sur le CD Management.)

L’utilitaire ADU répertorie tous les disques défectueux.

CPQONLIN identifie les disques défectueux dans un environnement NetWare.

Pour plus d’informations sur le diagnostic des problèmes de disque dur, reportez-vous au manuel

HP ProLiant Servers Troubleshooting Guide (Manuel de résolution des problèmes des serveurs

HP ProLiant).

ATTENTION : il est possible qu’un disque considéré comme défectueux semble opérationnel une fois que

le système est redémarré ou après avoir été retiré et réinséré (dans le cas des disques hot-plug). Toutefois,
une utilisation continue de tels disques marginaux risque de provoquer des pertes de données. Remplacez

le disque au plus vite.

Conséquences d’une panne de disque dur

En cas de panne du disque dur, toutes les unités logiques du même module RAID sont affectées. Chaque

unité logique du module peut utiliser une méthode de tolérance de panne différente et ainsi, chaque unité

logique peut être affectée différemment.

Les configurations en RAID 0 ne tolèrent pas de panne de disque. Si un disque physique du module

RAID est défectueux, l’état de toutes les unités logiques sans tolérance de panne du même module

RAID sera également défectueux.

Les configurations en RAID 1+0 peuvent tolérer plusieurs pannes de disques tant qu’aucun disque

défectueux ne se trouve en mode miroir par rapport à un autre disque défectueux (sans disque de

secours désigné).

Les configurations en RAID 5 peuvent tolérer une panne de disque (disque de secours désigné).

Les configurations en RAID 6 avec ADG peuvent tolérer la panne simultanée de deux disques

(disque de secours désigné).

Tolérance de panne compromise

En cas de défaillance d’un nombre de disques durs supérieur à la limite autorisée par la méthode de

tolérance de panne, cette tolérance se trouve compromise et l’unité logique tombe en panne. Dans ce

cas, toutes les demandes du système d’exploitation sont rejetées et renvoient des erreurs irréversibles.

Vous perdrez vraisemblablement des données, bien qu’elles puissent parfois être restaurées.
Une tolérance de panne compromise peut par exemple se produire lorsqu’un disque d’un module RAID

tombe en panne pendant la reconstruction d’un autre disque du module. Si le module RAID ne dispose

pas de disque de secours en ligne, toutes les unités logiques de ce module qui sont configurées avec la

tolérance de panne RAID 5 seront défectueuses.
La tolérance de panne peut également être compromise par des problèmes non liés au disque, comme

un câble défectueux ou la coupure provisoire de l’alimentation d’un système de stockage. Dans de tels

cas, il n’est pas nécessaire de remplacer les disques physiques. Vous risquez toutefois de perdre des

données, en particulier si le système était occupé lors de l’incident.

Récupération de données à la suite d’une tolérance de panne compromise

Si la tolérance de panne est compromise, l’insertion de disques de secours n’améliore pas l’état du

volume logique. Pour restaurer les données, procédez comme suit :

1.

Vérifiez que les câbles et les connecteurs ne sont pas mal branchés, sales, cassés ou courbés,

sur tous les périphériques.

2.

Mettez le boîtier de stockage hors tension

Mise hors tension du serveur

», page

12

).

Advertising