| España-Español |
|
|
|
![]() |
Guía del usuario de HP Integrity Essentials Global Workload Manager: A.03.00.00 > Capítulo 5 Tareas adicionales de configuración y administraciónReinicio automático de los nodos administrados de gWLM en los dominios de recursos compartidos (Alta disponibilidad) |
|
Siempre que se inicia un nodo administrado, el agente gWLM del nodo intenta volver a unirse automáticamente al nodo en su dominio de recursos compartidos, aportando alta disponibilidad. Los únicos pasos de configuración que tiene que dar para que este comportamiento tenga lugar son:
Esta característica funciona mejor cuando se pierde un nodo administrado a la vez o se pierden todos los nodos administrados.
Cuando un nodo administrado se inicia, el agente gWLM (gwlmagent) se inicia automáticamente si GWLM_AGENT_START está definido en 1 en el archivo /etc/rc.config.d/gwlmCtl. A continuación, el agente comprueba el archivo /etc/opt/gwlm/deployed.config para determinar su servidor CMS. Acto seguido, trata de ponerse en contacto con el servidor CMS para que éste vuelva a desplegar su vista del dominio de recursos compartidos. Si no se puede contactar con el servidor CMS, el dominio de recursos compartidos del archivo deployed.config se despliega mientras todos los nodos estén de acuerdo. En general, cuando la desactivación de un nodo o problemas de comunicaciones de red perturban un dominio de recursos compartidos, gWLM intenta reformar el dominio de recursos compartidos. gWLM mantiene el concepto de un clúster para los nodos de un dominio de recursos compartidos. En un clúster, un nodo es un maestro y los demás nodos son no maestros. Si el nodo maestro pierde el contacto con el resto del dominio de recursos compartidos, el resto del dominio de recursos compartidos puede continuar sin él, en forma de clúster parcial, acordando unánimemente un maestro nuevo. Si un nodo no maestro pierde la comunicación con el resto del dominio de recursos compartidos, el clúster parcial resultante sigue funcionando sin el nodo perdido. El maestro simplemente omite el nodo que falta hasta que vuelva a estar disponible.
Se pueden configurar los siguientes sucesos SIM en relación con esta característica de reinicio automático:
Para obtener información sobre la habilitación y consulta de estos sucesos, consulte el menú «Configure Events» de gWLM. A continuación, podrá consultar estos sucesos utilizando el elemento Event Lists del panel izquierdo del administrador SIM. Las siguientes secciones explican cómo manejar algunos de los sucesos. Si ve este suceso:
Si tiene un dominio de recursos compartidos que contiene n nodos y obtiene n - 1 de los sucesos «SRD Communication Issue» pero ningún suceso «SRD Reformed with Partial Set of Nodes» en un plazo de 5 inutos (suponiendo un intervalo de asignación de 15 egundos) después del primer suceso «SRD Communication Issue» tal vez tenga que reiniciar el agente gwlmagent en cada nodo administrado del dominio de recursos compartidos afectado: # /opt/gwlm/bin/gwlmagent --restart Si gWLM no puede reformar un dominio de recursos compartidos, se puede borrar manualmente dicho dominio, según se describe más adelante. El comando analizado más adelante es un comando avanzado para borrar un dominio de recursos compartidos. El método recomendado para eliminar normalmente un sistema host de la administración consiste en utilizar el comando gwlm undeploy. A partir de los agentes A.02.50.00.x, un dominio de recursos compartidos se puede borrar manualmente con el siguiente comando: # gwlm reset --host=host donde host especifica el sistema host con el dominio de recursos compartidos que ha de borrarse. Si el comando anterior no funciona, siga el procedimiento dado en la sección siguiente. El siguiente procedimiento borra un dominio de recursos compartidos independientemente de la versión de los agentes del dominio de recursos compartidos.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||