Fonctionnement du redémarrage automatique – HP Logiciel HP Matrix Operating Environment Manuel d'utilisation

Page 42

Advertising
background image

Redémarrage automatique des nœuds gérés par gWLM dans les SRD
(haute disponibilité)

Chaque fois qu'un nœud géré démarre, l'agent gWLM de ce nœud tente automatiquement de
rejoindre le nœud dans son SRD afin de fournir une haute disponibilité. Les seules tâches de
configuration à effectuer pour que ce comportement survienne sont les suivantes :
1.

Assurez-vous que la valeur GWLM_AGENT_START du fichier /etc/rc.config.d/gwlmCtl
de chaque nœud géré est définie sur 1. Vous pouvez exécuter la commande ci-après sur
chaque système sur lequel gwlmagent est exécuté afin que la modification soit effectuée à
votre place :

#/opt/gwlm/bin/gwlmagent --enable_start_on_boot

Dans le même fichier, la valeur doit être GWLM_CMS_START=1 sur le système sur lequel
gwlmcmsd

est exécuté. Cependant, si vous avez exécuté vseinitconfig lors de l'installation,

cette modification a été effectuée automatiquement.

2.

(Facultatif) Modifiez la propriété

com.hp.gwlm.node.HA.minimumTimeout

dans le fichier /etc/opt/gwlm/conf/gwlmagent.properties afin de définir le nombre
minimum de secondes qui doivent s'écouler avant qu'un nœud géré se considère séparé de
son SRD. Configurez cette propriété afin de vous assurer que les nœuds gérés ne se considèrent
pas prématurément séparés de leur SRD en cas de problèmes de réseau mineurs.

gWLM n'utilise cette valeur que si elle est supérieure à 10 fois l'intervalle d'allocation de
gWLM. Par exemple, avec un intervalle d'allocation de 15 secondes, un nœud peut rester
2,5 minutes sans communiquer avec son SRD avant que l'agent gWLM du nœud ne tente une
reconnexion avec le SRD.

Cette fonctionnalité fonctionne mieux lorsqu'un seul nœud géré est perdu à la fois ou que tous les
nœuds gérés sont perdus.

REMARQUE :

Si une vPar emprunte des cœurs à d'autres vPar lorsqu'elle perd le contact avec

son SRD, les cœurs empruntés peuvent être séparés de ce dernier. Si la vPar est inactive pendant
un certain temps, vérifiez que le SRD s'est reconstitué sans cette vPar et qu'il dispose d'assez de
cœurs pour respecter ses engagements. Si ce n'est pas le cas, essayez d'utiliser vparmodify
pour récupérer quelques cœurs. (Si la vPar ne répond pas, vous ne pourrez pas la modifier
localement et seules certaines versions de HP-UX Virtual Partitions vous permettront de modifier
facilement la vPar à distance.)

De même, si une nPar a plusieurs cœurs actifs (grâce à Instant Capacity) lorsqu'elle perd le contact
avec son SRD, vous devrez peut-être modifier sa taille manuellement de façon à récupérer ces
cœurs pour les nPar encore présentes dans le SRD. Pour plus d'informations, consultez la
documentation sur Instant Capacity.

Fonctionnement du redémarrage automatique

Lorsqu'un nœud géré démarre, l'agent gWLM (gwlmagent) démarre automatiquement si
GWLM_AGENT_START

est défini sur 1 dans le fichier /etc/rc.config.d/gwlmCtl. L'agent

vérifie alors le fichier /etc/opt/gwlm/deployed.config pour déterminer son CMS. Il tente
ensuite de contacter le CMS pour qu'il redéploie sa vue du SRD. Si le CMS ne peut être contacté,
le SRD du fichier deployed.config est déployé tant que tous les nœuds le permettent.

En général, lorsqu'un SRD est interrompu par l'indisponibilité d'un nœud ou d'un CMS, ou par
des problèmes de communication réseau, gWLM tente de reconstituer le SRD. gWLM maintient le
concept de cluster pour les nœuds d'un SRD. Dans un cluster, un seul nœud est maître. Si le nœud
maître perd contact avec le reste du SRD, ce dernier peut poursuivre sans lui, sous forme de cluster
partiel, en choisissant unanimement un nouveau maître. Si un nœud non maître perd le contact

42

Autres tâches de configuration et d'administration

Advertising