Cómo monitorizar todos los sensores (temperatura, humedad, puertas abiertas, fuentes de alimentación, SAI, estado de las bombas, etc.) de armarios rack autocontenidos, usando el sistema de monitorización Pandora FMS y el protocolo SNMP. Realizamos la monitorización para sistemas de sensores del fabricante Rittal CMC, aunque el proceso es similar para otros fabricantes.

Configurar SNMP en sistema de sensores Rittal CMC

En primer lugar, deberemos activar el protocolo SNMP en el sistema de sensores Rittal CMC del armario rack autocontenido. Estos sistemas incorporan una dirección IP de gestión. Accederemos a ella vía web y pulsaremos en la pestaña «Configuración» y en «SNMP»:

En la ventana de configuración SNMP, en «Hosts permitidos», añadiremos la IP del servidor de monitorización Pandora FMS. Y configuraremos o bien SNMPv1/2c o bien SNMPv3, según el que queramos usar (el más seguro es SNMP v3). Indicaremos los datos básicos de SNMP, para SNMPv1 y v2c indicaremos únicamente el valor de «Leer comunidad», pues será este el que Pandora FMS use para la conexión SNMP. Si usamos SNMP v3, deberemos indicar un nombre de usuario y contraseña. En este ejemplo usaremos SNMPv1/v2.

Guardaremos los datos pulsando en «Guardar» y ya tendremos listo el sistema de sensorítica Ritta para que Pandora FMS pueda conectarse a él y obtener los datos de los sensores.

Añadir agente (dispositivo Rittal CMC) en Pandora FMS

Añadiremos un nuevo agente en el servidor de monitorización de Pandora FMS. Para ello, accederemos a la gestión web de Pandora FMS y pulsaremos en «Recursos» – «Gestionar agentes»:

Pulsaremos en «Crear agente»:

Introduciremos los datos básicos del agente:

  • Alias: un nombre corto y descriptivo, por ejemplo «CMC_PU_Sensores_Rack_CPD».
  • Dirección IP: muy importante indicar la dirección IP del dispositivo de sensorítica Ritall CMC.
  • Descripción: una descripción del agente, por ejemplo «Sensores armarios rack autocontenidos CPD».

Una vez introducidos los datos, pulsaremos en «Crear»:

Con esto ya tendremos el dispositivo dado de alta en el sistema de monitorización Pandora FMS. Ahora podremos añadir los módulos (sensores, sondas), como indicamos a continuación.

Añadir módulos (sensores, sondas) SNMP en Pandora FMS

Añadiremos un módulo SNMP en Pandora FMS por cada sensor de Ritta (mostramos listado de todos los sensores en el siguiente punto de este tutorial, con su correspondiente MIB SNMP y sus posibles estados.

Para dar de alta un módulo SNMP en Pandora FMS, desde el dispositivo creado anteriormente, pulsaremos en «Gestionar»:

Pulsaremos en «Módulos»:

En el desplegable «Tipo», elegiremos «Crear un nuevo módulo de servidor de red». Y pulsaremos en «Crear»:

Introduciremos los siguientes datos básicos (al menos):

  • Nombre [1]: un nombre descriptivo para el sensor/módulo/sonda, por ejemplo, en este caso vamos a añadir un sensor que nos obtenga la temperatura del pasillo caliente de los armarios rack, por lo que en «nombre» introduciremos «Pasillo_caliente_Temperatura».
  • Tipo [2]: en este desplegable, elegiremos el tipo de datos que recibiremos. Casi todos los sensores devuelven un tipo de datos numérico. En el caso de la temperatura, será un valor numérico, por lo que elegiremos «Remote SNMP network agent, numeric data».
  • Umbral Warning [3]: si lo deseamos, podremos establecer un umbral para alerta, de forma que si la temperatura supera esta umbral, el módulo pasará a estado «waring». Podremos usar los propios umbrales que indica el dispositivo (los mostramos en el punto siguiente) o bien establecer unos propios. Por ejemplo, en «Min.» de «Umbral Warning» introduciremos «30», de forma que si la temperatura supera los 30 grados, el módulo pasará a estado de waring.
  • Umbral crítico [4]: mismo comportamiento que Umbral Warning. Por ejemplo, en «Min.» de «Umbral crítico» introduciremos «35». De esta forma, si la temperatura está entre 30 y 35 el módulo pasará a estado Warning y si supera los 35 grados el módulo pasará a estado crítico.
  • IP objetivo [5]: muy importante que aquí se haya introducido la dirección IP del dispositivo Rittal CMC y que desde el equipo de Pandora FMS server tenga acceso a esta IP.
  • Comunidad SNMP [6]: si usamos las versiones 1 y 2c de SNMP, indicaremos aquí la comunidad (debe coincidir con la introducida en el dispositivo, como hemos explicado en el punto anterior).
  • SNMP version [7]: en este desplegable indicaremos la versión de SNMP que vamos a usar, debe coincidir con la elegida en el dispositivo (como hemos explicado en el punto anterior).
  • SNMP OID [8]: si conocemos la MIB SNMP de este sensor, la introduciremos aquí directamente. Para la temperatura del pasillo caliente es «.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.2». Si no la conocemos, podemos explorar las MIB mediante SNMP walk, como indicamos a continuación.
  • Descripción [9]: introduciremos un texto descriptivo para este sensor, por ejemplo «Temperatura pasillo caliente».

Pandora FMS permite explorar claves SNMP desde la propia creación del agente. Si queremos comprobar que la clave MIB existe en el dispositivo y ver qué valor tiene actualmente, pulsaremos en «SNMP walk»:

En la ventana de SNMP walk exploraremos por la clave y subclave hasta el valor que estamos buscando:

Muy importante, dado que este sensor en concreto arroja los datos (la temperatura) multiplicados por 100, es decir, si la temperatura actual del pasillo caliente es de 21,4 grados centígrados (como en la captura anterior), el valor que devuelve es 2140. Por ello, para que este módulo/sensor devuelva un valor entendible, lo podemos dividir por 100. Para ello, en la parte inferior, en «Opciones avanzadas», pulsaremos en el botón «Personalizar» en «Posprocesado»:

Introduciremos el valor «0.01»:

De esta forma, el valor guardado en el módulo será el valor que se obtenga del dispositivo Rittal en la clave MIB introducida dividido entre 100.

Añadiremos todos los módulos (en el punto siguiente los indicamos), de la misma forma, regulando los umbrales mínimo y máximo para el estado de warning y el de crítico, para cada uno de ellos. Por ejemplo, para los módulos cuyo valor de estado normal es 4 (como por ejemplo Pasillo_caliente_Temperatura_Estado), definiremos estos umbrales:

  • Umbral Warning Min.: 0
  • Umbral Warning Máx.: 0
  • Umbral crítico Min.: 0
  • Umbral crítico Máx.: 4

De esta forma, si el valor del módulo es diferente de 4, pasará a estado crítico.

Una vez añadidos todos los módulos al agente podremos consultar su estado:

Listado de módulos/sensores/sondas de sistema Rittal CMC con su MIB SNMP y sus posibles estados y umbrales

A continuación, mostramos listado de los sensores (sondas, agentes) más importantes de un sistema Rittal CMC y su MIB SNMP correspondiente, así como sus posibles estados de normal, alerta o error:

Módulo/Sensor/SondaMIB SNMP (OID)Estados, umbrales
Pasillo_caliente_Temperatura.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.2Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 40, HighWarning -> 35, LowAlarm -> 10, LowWarning -> 5
Pasillo_caliente_Temperatura_Estado .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.94 = Correcto
Puerta.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.120 = Cerrada
SAI_Entrada.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.181 = Correcto
SAI_Entrada_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.214 = Correcto
SAI_Salida.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.241 = Correcto
SAI_Salida_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.274 = Correcto
Rele_Alarma.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.311 = Correcto
Rele_Alarma_Estado .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.3210 = Correcto/Desconectado
Sistema_CAN1.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.40Umbrales en dispositivo: HighAlarm -> 900mA, HighWarning -> 700mA
Sistema_CAN2.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.47Umbrales en dispositivo: HighAlarm -> 900mA, HighWarning -> 700mA
Sistema_CAN1_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.444 = Correcto
Sistema_CAN2_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.514 = Correcto
Sistema_Temperatura.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.54Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80, HighWarning -> 70, LowAlarm -> -30, LowWarning -> -25
Sistema_Temperatura_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.614 = Correcto
Sistema_Supply_24V.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.64En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 28V, HighWarning -> 27V, LowAlarm -> 19V, LowWarning -> 21V
Sistema_Supply_24V_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.704 = Correcto
Sistema_Supply_5V0.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.73En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 55V, HighWarning -> 54V, LowAlarm -> 45V, LowWarning -> 46V
Sistema_Supply_5V0_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.794 = Correcto
Sistema_Supply_2V3.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.82En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 33,3V, HighWarning -> 35,6V, LowAlarm -> 29,7V, LowWarning -> 30,4V
Sistema_Supply_2V3_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.884 = Correcto
Pasillo_frio_Temperatura_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.2.2Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 35, HighWarning -> 30, LowAlarm -> 5, LowWarning -> 10
Pasillo_frio_Temperatura_Estado_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.2.94 = Correcto
Pasillo_frio_Humedad_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.2.12En porcentaje pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80%, HighWarning -> 75, LowAlarm -> 5, LowWarning -> 10
Pasillo_frio_Humedad_Estado_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.2.194 = Correcto
Punto_de_Rocio_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.2.22Temperatura en grados centígrados pero dividida entre 100
Inundacion_Posicion_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.3.20 = Correcto
Inundacion_Estado_Rack1.1.3.6.1.4.1.2606.7.4.2.2.1.11.3.44 = Correcto
Pasillo_frio_Temperatura_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.4.2Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 35, HighWarning -> 30, LowAlarm -> 5, LowWarning -> 10
Pasillo_frio_Temperatura_Estado_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.4.94 = Correcto
Pasillo_frio_Humedad_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.4.12En porcentaje pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80%, HighWarning -> 75, LowAlarm -> 5, LowWarning -> 10
Pasillo_frio_Humedad_Estado_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.4.194 = Correcto
Punto_de_Rocio_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.4.22Temperatura en grados centígrados pero dividida entre 100
Inundacion_Posicion_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.5.20 = Correcto
Inundacion_Estado_Rack2.1.3.6.1.4.1.2606.7.4.2.2.1.11.5.44 = Correcto
Reles_Alarma_STS_1_A.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.21 = Correcto
Reles_Alarma_STS_1_A_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.54 = Correcto
Reles_Alarma_STS_1_B.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.81 = Correcto
Reles_Alarma_STS_1_B_Estado1.3.6.1.4.1.2606.7.4.2.2.1.11.6.114 = Correcto
Reles_Alarma_STS_2_A.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.141 = Correcto
Reles_Alarma_STS_2_A_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.174 = Correcto
Reles_Alarma_STS_2_B.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.201 = Correcto
Reles_Alarma_STS_2_B_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.234 = Correcto
Reles_Alarma_Fallo_Bomba_LCU1.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.261 = Correcto
Reles_Alarma_Fallo_Bomba_LCU1_Estado .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.294 = Correcto
Reles_Alarma_Fallo_Bomba_LCU2.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.321 = Correcto
Reles_Alarma_Fallo_Bomba_LCU2_Estado .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.354 = Correcto
Reles_Alarma_LCU_1.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.381 = Correcto
Reles_Alarma_LCU_1_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.414 = Correcto
Reles_Alarma_LCU_2.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.441 = Correcto
Reles_Alarma_LCU_2_Estado.1.3.6.1.4.1.2606.7.4.2.2.1.11.6.474 = Correcto