Explicamos una posible solución al error Cannot synchronize host 192.168.x.x. Cannot contact the specified host (192.168.x.x). The host may not be available on the network, a network configuration problem may exist, or the management services on this host may not be responding, que se produce en los hosts ESXi de un clúster VMware vCenter. Mostraremos cómo acceder por SSH o por iRMC a la consola de un host VMware ESXi.
Motivo del error Cannot synchronize host The host may not be available on the network VMware ESXi
El error:
Cannot synchronize host 192.168.x.x. Cannot contact the specified host (192.168.x.x). The host may not be available on the network, a network configuration problem may exist, or the management services on this host may not be responding
Puede ser debido a varios factores, uno de ellos ocurre cuando se ha alcanzado el límite de 10GB de los ficheros de la base de datos SQL Server del VMware vCenter. En este caso, si se accede al clúster VMware, los hosts pueden quedar en este estado de error, mostrando las máquinas virtuales en modo «Orphaned» y desactivadas (no se podrán realizar acciones sobre ellas). En el siguiente artículo explicamos cómo vaciar la base de datos SQL Server para evitar este error:
Si tras liberar el espacio en la BD y reiniciar la máquina virtual con el vCenter aún sigue mostrándose este error en los hosts (nodos del clúster), es posible que tengamos que aplicar los pasos que indicamos a continuación para solucionarlo.
En estos casos, aunque no se pueden ver las máquinas virtuales en el clúster VMware vCenter, sí que se puede acceder a cada nodo por separado y consultar el estado de las máquinas virtuales, e incluso realizar algunas tareas sobre ellas (ninguna que tenga que ver con el clúster como moverlas de host). Esto nos puede ayudar por si necesitamos apagar o encender alguna máquina, tarea que desde el clúster VMware no podrá realizarse hasta que solventemos el problema.
Recomendaciones antes de realizar el proceso
Por supuesto, como todo proceso en un sistema de virtualización, conviene tener copia de seguridad de todas las máquinas virtuales y de la base de datos del clúster vCenter. En principio no es un proceso peligroso el que explicaremos a continuación, pues únicamente se trata de reiniciar servicios, pero siempre es recomendable proceder con precaución.
Antes de solucionar el error, conviene decir que el proceso requerirá de reiniciar algunos los servicios de cada host (nodo ESXi) y esto provocará un corte de red de las máquinas virtuales que tenga, durante unos 20 segundos. Según las pruebas realizadas se pierden unos 7 paquetes de ping durante el proceso. Las máquinas virtuales de cada host permanecerán encendidas (no se apagarán).
En caso de no disponer de acceso SSH a cada host ESXi, podremos reiniciar los servicios (como explicamos a continuación), accediendo físicamente al nodo, conectando un monitor y un teclado. Otra opción es acceder desde la consola iRMC, en la opción Video Redirection (JWS), si el servidor lo permite. En el caso de un servidor Fujitsu, desde «Console Redirection» – «Video Redirection (JWS)»:
Nos descargará un enlace a aplicación JNLP de Java, que abriremos con Java Web Launcher:
Si tenemos la versión correcta de Java nos mostrará la consola del servidor:
Y desde aquí podremos realizar el proceso que explicamos a continuación, sin necesidad de acceder por SSH.
Solución al error Cannot synchronize host The host may not be available on the network VMware ESXi
Para solucionar el error:
Cannot synchronize host 192.168.x.x. Cannot contact the specified host (192.168.x.x). The host may not be available on the network, a network configuration problem may exist, or the management services on this host may not be responding
Tendremos que reiniciar los servicios de cada nodo del clúster (host) y necesitaremos, para ello, acceder a cada nodo por SSH. Comprobaremos que tenemos habilitado el acceso SSH de cada nodo, lo podemos hacer como indicamos en el siguiente artículo:
Accederemos al primer nodo, lo ideal es realizar esta operación primero en el nodo que es Master del clúster:
En caso de no ser posible, accederemos a alguno que tenga pocas máquinas virtuales o que las máquinas virtuales no sean críticas, pues, como hemos comentado anteriormente, se cortará la conexión unos segundos. Y es conveniente probar este método en un servidor ESXi que no sea crítico, para ver si da resultado y solventa el problema.
Para acceder por SSH podemos usar, por ejemplo, PuTTY. En nuestro caso accederemos al nodo master, con la IP 192.168.1.11:
Nos solicitará usuario y contraseña de acceso al ESXi, lo introduciremos. Si todo es correcto accederemos a la línea de comandos (shell o consola). Desde aquí ejecutaremos el siguiente comando para acceder a la interfaz del ESXi (a la misma pantalla que veríamos si estuviésemos sentados delante del equipo con VMware ESXi:
dcui
Por ello, en caso de disponer de acceso físico al los nodos o host de ESXi podremos seguir las siguientes instrucciones sin necesidad de acceder por SSH.
El comando anterior mostrará la Interfaz de Usuario de la Consola Directa. Pulsaremos F2 para iniciar sesión:
Nos solicitará usuario y contraseña del host ESXi, lo introduciremos:
Accederemos a la consola, nos desplazaremos con las teclas de cursor a la opción «Troubleshooting Options» y pulsaremos INTRO:
Seleccionaremos «Restart Management Agents» y pulsaremos INTRO:
Antes de reiniciar los servicios nos pedirá confirmación, pulsaremos F11 para reiniciarlos, teniendo en cuenta que se perderá el acceso a las máquinas virtuales y al host durante unos segundos:
Durante el reinicio, el nodo puede mostrar mensajes de error como este:
Esperaremos unos minutos a que en la consola muestre:
Stopping management agents. Done.
Starting management agents. Done.
Pulsaremos INTRO en la ventana anterior y cerraremos la consola SSH. Ahora esperaremos unos minutos a que desaparezca el error del nodo (host ESXi).
En muchas ocasiones, reiniciando los servicios del nodo master, el resto se recuperan del error transcurridos unos minutos y sin tener que reiniciar sus servicios. Si esto no ocurre y el resto de nodos siguen presentando el mismo error, repetiremos el proceso anterior para cada nodo.
Al finalizar el proceso, los nodos deben quedar sin errores y perfectamente sincronizados: