Cómo monitorizar todos los sensores (temperatura, humedad, puertas abiertas, fuentes de alimentación, SAI, estado de las bombas, etc.) de armarios rack autocontenidos, usando el sistema de monitorización Pandora FMS y el protocolo SNMP. Realizamos la monitorización para sistemas de sensores del fabricante Rittal CMC, aunque el proceso es similar para otros fabricantes.
- Configurar SNMP en sistema de sensores Rittal CMC.
- Añadir agente (dispositivo Rittal CMC) en Pandora FMS.
- Añadir módulos (sensores, sondas) en Pandora FMS.
- Listado de módulos/sensores/sondas de sistema Rittal CMC con su MIB SNMP y sus posibles estados y umbrales.
Configurar SNMP en sistema de sensores Rittal CMC
En primer lugar, deberemos activar el protocolo SNMP en el sistema de sensores Rittal CMC del armario rack autocontenido. Estos sistemas incorporan una dirección IP de gestión. Accederemos a ella vía web y pulsaremos en la pestaña «Configuración» y en «SNMP»:
En la ventana de configuración SNMP, en «Hosts permitidos», añadiremos la IP del servidor de monitorización Pandora FMS. Y configuraremos o bien SNMPv1/2c o bien SNMPv3, según el que queramos usar (el más seguro es SNMP v3). Indicaremos los datos básicos de SNMP, para SNMPv1 y v2c indicaremos únicamente el valor de «Leer comunidad», pues será este el que Pandora FMS use para la conexión SNMP. Si usamos SNMP v3, deberemos indicar un nombre de usuario y contraseña. En este ejemplo usaremos SNMPv1/v2.
Guardaremos los datos pulsando en «Guardar» y ya tendremos listo el sistema de sensorítica Ritta para que Pandora FMS pueda conectarse a él y obtener los datos de los sensores.
Añadir agente (dispositivo Rittal CMC) en Pandora FMS
Añadiremos un nuevo agente en el servidor de monitorización de Pandora FMS. Para ello, accederemos a la gestión web de Pandora FMS y pulsaremos en «Recursos» – «Gestionar agentes»:
Pulsaremos en «Crear agente»:
Introduciremos los datos básicos del agente:
- Alias: un nombre corto y descriptivo, por ejemplo «CMC_PU_Sensores_Rack_CPD».
- Dirección IP: muy importante indicar la dirección IP del dispositivo de sensorítica Ritall CMC.
- Descripción: una descripción del agente, por ejemplo «Sensores armarios rack autocontenidos CPD».
Una vez introducidos los datos, pulsaremos en «Crear»:
Con esto ya tendremos el dispositivo dado de alta en el sistema de monitorización Pandora FMS. Ahora podremos añadir los módulos (sensores, sondas), como indicamos a continuación.
Añadir módulos (sensores, sondas) SNMP en Pandora FMS
Añadiremos un módulo SNMP en Pandora FMS por cada sensor de Ritta (mostramos listado de todos los sensores en el siguiente punto de este tutorial, con su correspondiente MIB SNMP y sus posibles estados.
Para dar de alta un módulo SNMP en Pandora FMS, desde el dispositivo creado anteriormente, pulsaremos en «Gestionar»:
Pulsaremos en «Módulos»:
En el desplegable «Tipo», elegiremos «Crear un nuevo módulo de servidor de red». Y pulsaremos en «Crear»:
Introduciremos los siguientes datos básicos (al menos):
- Nombre [1]: un nombre descriptivo para el sensor/módulo/sonda, por ejemplo, en este caso vamos a añadir un sensor que nos obtenga la temperatura del pasillo caliente de los armarios rack, por lo que en «nombre» introduciremos «Pasillo_caliente_Temperatura».
- Tipo [2]: en este desplegable, elegiremos el tipo de datos que recibiremos. Casi todos los sensores devuelven un tipo de datos numérico. En el caso de la temperatura, será un valor numérico, por lo que elegiremos «Remote SNMP network agent, numeric data».
- Umbral Warning [3]: si lo deseamos, podremos establecer un umbral para alerta, de forma que si la temperatura supera esta umbral, el módulo pasará a estado «waring». Podremos usar los propios umbrales que indica el dispositivo (los mostramos en el punto siguiente) o bien establecer unos propios. Por ejemplo, en «Min.» de «Umbral Warning» introduciremos «30», de forma que si la temperatura supera los 30 grados, el módulo pasará a estado de waring.
- Umbral crítico [4]: mismo comportamiento que Umbral Warning. Por ejemplo, en «Min.» de «Umbral crítico» introduciremos «35». De esta forma, si la temperatura está entre 30 y 35 el módulo pasará a estado Warning y si supera los 35 grados el módulo pasará a estado crítico.
- IP objetivo [5]: muy importante que aquí se haya introducido la dirección IP del dispositivo Rittal CMC y que desde el equipo de Pandora FMS server tenga acceso a esta IP.
- Comunidad SNMP [6]: si usamos las versiones 1 y 2c de SNMP, indicaremos aquí la comunidad (debe coincidir con la introducida en el dispositivo, como hemos explicado en el punto anterior).
- SNMP version [7]: en este desplegable indicaremos la versión de SNMP que vamos a usar, debe coincidir con la elegida en el dispositivo (como hemos explicado en el punto anterior).
- SNMP OID [8]: si conocemos la MIB SNMP de este sensor, la introduciremos aquí directamente. Para la temperatura del pasillo caliente es «.1.3.6.1.4.1.2606.7.4.2.2.1.11.1.2». Si no la conocemos, podemos explorar las MIB mediante SNMP walk, como indicamos a continuación.
- Descripción [9]: introduciremos un texto descriptivo para este sensor, por ejemplo «Temperatura pasillo caliente».
Pandora FMS permite explorar claves SNMP desde la propia creación del agente. Si queremos comprobar que la clave MIB existe en el dispositivo y ver qué valor tiene actualmente, pulsaremos en «SNMP walk»:
En la ventana de SNMP walk exploraremos por la clave y subclave hasta el valor que estamos buscando:
Muy importante, dado que este sensor en concreto arroja los datos (la temperatura) multiplicados por 100, es decir, si la temperatura actual del pasillo caliente es de 21,4 grados centígrados (como en la captura anterior), el valor que devuelve es 2140. Por ello, para que este módulo/sensor devuelva un valor entendible, lo podemos dividir por 100. Para ello, en la parte inferior, en «Opciones avanzadas», pulsaremos en el botón «Personalizar» en «Posprocesado»:
Introduciremos el valor «0.01»:
De esta forma, el valor guardado en el módulo será el valor que se obtenga del dispositivo Rittal en la clave MIB introducida dividido entre 100.
Añadiremos todos los módulos (en el punto siguiente los indicamos), de la misma forma, regulando los umbrales mínimo y máximo para el estado de warning y el de crítico, para cada uno de ellos. Por ejemplo, para los módulos cuyo valor de estado normal es 4 (como por ejemplo Pasillo_caliente_Temperatura_Estado), definiremos estos umbrales:
- Umbral Warning Min.: 0
- Umbral Warning Máx.: 0
- Umbral crítico Min.: 0
- Umbral crítico Máx.: 4
De esta forma, si el valor del módulo es diferente de 4, pasará a estado crítico.
Una vez añadidos todos los módulos al agente podremos consultar su estado:
Listado de módulos/sensores/sondas de sistema Rittal CMC con su MIB SNMP y sus posibles estados y umbrales
A continuación, mostramos listado de los sensores (sondas, agentes) más importantes de un sistema Rittal CMC y su MIB SNMP correspondiente, así como sus posibles estados de normal, alerta o error:
Módulo/Sensor/Sonda | MIB SNMP (OID) | Estados, umbrales |
Pasillo_caliente_Temperatura | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.2 | Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 40, HighWarning -> 35, LowAlarm -> 10, LowWarning -> 5 |
Pasillo_caliente_Temperatura_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.9 | 4 = Correcto |
Puerta | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.12 | 0 = Cerrada |
SAI_Entrada | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.18 | 1 = Correcto |
SAI_Entrada_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.21 | 4 = Correcto |
SAI_Salida | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.24 | 1 = Correcto |
SAI_Salida_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.27 | 4 = Correcto |
Rele_Alarma | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.31 | 1 = Correcto |
Rele_Alarma_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.32 | 10 = Correcto/Desconectado |
Sistema_CAN1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.40 | Umbrales en dispositivo: HighAlarm -> 900mA, HighWarning -> 700mA |
Sistema_CAN2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.47 | Umbrales en dispositivo: HighAlarm -> 900mA, HighWarning -> 700mA |
Sistema_CAN1_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.44 | 4 = Correcto |
Sistema_CAN2_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.51 | 4 = Correcto |
Sistema_Temperatura | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.54 | Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80, HighWarning -> 70, LowAlarm -> -30, LowWarning -> -25 |
Sistema_Temperatura_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.61 | 4 = Correcto |
Sistema_Supply_24V | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.64 | En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 28V, HighWarning -> 27V, LowAlarm -> 19V, LowWarning -> 21V |
Sistema_Supply_24V_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.70 | 4 = Correcto |
Sistema_Supply_5V0 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.73 | En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 55V, HighWarning -> 54V, LowAlarm -> 45V, LowWarning -> 46V |
Sistema_Supply_5V0_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.79 | 4 = Correcto |
Sistema_Supply_2V3 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.82 | En voltios pero dividido entre 100. Umbrales en dispositivo: HighAlarm -> 33,3V, HighWarning -> 35,6V, LowAlarm -> 29,7V, LowWarning -> 30,4V |
Sistema_Supply_2V3_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.1.88 | 4 = Correcto |
Pasillo_frio_Temperatura_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.2.2 | Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 35, HighWarning -> 30, LowAlarm -> 5, LowWarning -> 10 |
Pasillo_frio_Temperatura_Estado_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.2.9 | 4 = Correcto |
Pasillo_frio_Humedad_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.2.12 | En porcentaje pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80%, HighWarning -> 75, LowAlarm -> 5, LowWarning -> 10 |
Pasillo_frio_Humedad_Estado_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.2.19 | 4 = Correcto |
Punto_de_Rocio_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.2.22 | Temperatura en grados centígrados pero dividida entre 100 |
Inundacion_Posicion_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.3.2 | 0 = Correcto |
Inundacion_Estado_Rack1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.3.4 | 4 = Correcto |
Pasillo_frio_Temperatura_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.4.2 | Temperatura en grados centígrados pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 35, HighWarning -> 30, LowAlarm -> 5, LowWarning -> 10 |
Pasillo_frio_Temperatura_Estado_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.4.9 | 4 = Correcto |
Pasillo_frio_Humedad_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.4.12 | En porcentaje pero dividida entre 100. Umbrales en dispositivo: HighAlarm -> 80%, HighWarning -> 75, LowAlarm -> 5, LowWarning -> 10 |
Pasillo_frio_Humedad_Estado_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.4.19 | 4 = Correcto |
Punto_de_Rocio_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.4.22 | Temperatura en grados centígrados pero dividida entre 100 |
Inundacion_Posicion_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.5.2 | 0 = Correcto |
Inundacion_Estado_Rack2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.5.4 | 4 = Correcto |
Reles_Alarma_STS_1_A | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.2 | 1 = Correcto |
Reles_Alarma_STS_1_A_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.5 | 4 = Correcto |
Reles_Alarma_STS_1_B | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.8 | 1 = Correcto |
Reles_Alarma_STS_1_B_Estado | 1.3.6.1.4.1.2606.7.4.2.2.1.11.6.11 | 4 = Correcto |
Reles_Alarma_STS_2_A | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.14 | 1 = Correcto |
Reles_Alarma_STS_2_A_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.17 | 4 = Correcto |
Reles_Alarma_STS_2_B | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.20 | 1 = Correcto |
Reles_Alarma_STS_2_B_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.23 | 4 = Correcto |
Reles_Alarma_Fallo_Bomba_LCU1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.26 | 1 = Correcto |
Reles_Alarma_Fallo_Bomba_LCU1_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.29 | 4 = Correcto |
Reles_Alarma_Fallo_Bomba_LCU2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.32 | 1 = Correcto |
Reles_Alarma_Fallo_Bomba_LCU2_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.35 | 4 = Correcto |
Reles_Alarma_LCU_1 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.38 | 1 = Correcto |
Reles_Alarma_LCU_1_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.41 | 4 = Correcto |
Reles_Alarma_LCU_2 | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.44 | 1 = Correcto |
Reles_Alarma_LCU_2_Estado | .1.3.6.1.4.1.2606.7.4.2.2.1.11.6.47 | 4 = Correcto |