Événements liés – HP Logiciel HP Matrix Operating Environment Manuel d'utilisation

Page 43

Advertising
background image

avec le reste du SRD, le cluster partiel qui en résulte continue de fonctionner sans lui. Le maître
ignore simplement le nœud manquant jusqu'à ce qu'il soit de nouveau disponible.

Vous pouvez utiliser la commande gwlmstatus pour surveiller la disponibilité. Elle peut vous
indiquer si des hôtes ne parviennent pas à rejoindre le SRD d'un nœud ou si certains hôtes du
SRD ne répondent pas. Pour plus d'informations, consultez gwlmstatus(1M).

REMARQUE :

Les tentatives de reconstruction des SRD peuvent expirer. Dans ce cas, aucun SRD

n'est déployé et l'allocation des ressources n'est plus gérée. Si cela se produit, consultez HP Matrix
Operating Environment Release Notes
et suivez les actions recommandées dans la section “Data
Missing in Real-time Monitoring (Données manquantes dans la surveillance en temps réel).”

Événements liés

Vous pouvez configurer les événements System Insight Manager suivants relatifs à cette fonction
de redémarrage automatique :

Node Failed to Rejoin SRD on Start-up (Le nœud n'a pas pu rejoindre le SRD au démarrage).

SRD Reformed with Partial Set of Nodes (Le SRD s'est reconstruit avec un ensemble partiel de
nœuds).

SRD Communication Issue (Problème de communication avec le SRD).

Pour des informations sur l'activation et l'affichage de ces événements, consultez Optimize
(Optimiser)

→Global Workload Manager→Events (Événements).

Vous pouvez afficher ces événements avec l'élément Event Lists (Listes d'événements) situé dans le
volet gauche de System Insight Manager.

Les sections suivantes expliquent comment gérer certains de ces événements.

Événement “Node Failed to Rejoin SRD on Start-up” (Le nœud n'a pas pu rejoindre le SRD au
démarrage)

Si l'événement “Node Failed to Rejoin SRD on Start-up” (Le nœud n'a pas pu rejoindre le SRD au
démarrage) s'affiche :
1.

Redémarrez gwlmagent sur chacun des nœuds gérés du SRD concerné :

#/opt/gwlm/bin/gwlmagent --restart

2.

Vérifiez que l'agent a rejoint le SRD en surveillant la vue Shared Resource Domain (Domaine
de ressource partagée) dans System Insight Manager ou à l'aide de la commande gwlm
monitor

.

3.

Si le problème persiste, vérifiez les fichiers /var/opt/gwlm/gwlmagent.log.0 et /var/
opt/gwlm/gwlmcmsd.log.0

pour y trouver des messages de diagnostic supplémentaires.

Événements “SRD Communication Issue” (Problème de communication avec le SRD) et “SRD Reformed
with Partial Set of Nodes” (Le SRD s'est reconstruit avec un ensemble partiel de nœuds)

REMARQUE :

Il faut au minimum 3 nœuds gérés dans le SRD pour qu'il se reconstitue avec un

ensemble partiel de nœuds.

REMARQUE :

Les événements “SRD Communication Issue” (Problème de communication avec le

SRD) ne sont pas activés par défaut. Pour les voir, configurez vos événements dans System Insight
Manager via la barre de menu HP Matrix OE visualization à l'aide de Tools (Outils)

→Global

Workload Manager

→Events (Événements).

Si le SRD contient n nœuds et que vous obtenez n - 1 événements “SRD Communication Issue”
(Problème de communication avec le SRD), mais aucun événement “SRD Reformed with Partial Set
of Nodes” (Le SRD s'est reconstruit avec un ensemble partiel de nœuds) dans les 5 minutes qui
suivent le premier événement “SRD Communication Issue” (Problème de communication avec le

Redémarrage automatique des nœuds gérés par gWLM dans les SRD (haute disponibilité)

43

Advertising