Cómo quitar un disco duro y sustituirlo por uno nuevo en un entorno de Proxmox en clúster y con hiperconvergencia Ceph.
- Requisitos para sustituir disco duro en entorno de virtualización Proxmox clusterizado con Ceph.
- Revisión previa del disco a sustituir en el nodo correspondiente.
- Quitar disco duro en sistema hiperconvergente Ceph de clúster Proxmox.
- Conectar y agregar al clúster Ceph el nuevo disco duro.
Requisitos para sustituir disco duro en entorno de virtualización Proxmox clusterizado con Ceph
Dispondremos de un entorno de virtualización clusterizado con Proxmox. En el siguiente enlace explicamos cómo montar un clúster Proxmox de varios nodos:
Dispondremos de un sistema de almacenamiento compartido hiperconvergente con Ceph en todos los nodos del clúster Proxmox. En el siguiente enlace explicamos cómo montar un sistema de hiperconvergencia de almacenamiento compartido Ceph en Proxmox:
Para poder quitar un disco duro sin peligro, deberemos disponer de discos y espacio suficiente libre en el resto de nodos del clúster Proxmox. En caso de duda, lo recomendable es añadir el disco duro nuevo antes de quitar el actual.
En este ejemplo, quitaremos un disco duro de 500GB marca Hitachi por uno de 1TB marca Seagate. Lo haremos quitando el disco previamente, antes de coloar el nuevo, para probar el clúster Ceph y verificar que no hay problema por quitar un disco. Esto lo hacemos porque es un entorno de pruebas. Por ello, deberemos disponer de espacio suficiente y de discos suficientes en el sistema de hiperconvergencia Ceph para que admita quitar este disco sin que haya pérdida de datos. Puede haber, de forma temporal, una degradación del clúster, pero sin pérdida de datos, hasta que hagamos la sustitución y el sistema Ceph haga el «reparto» de datos al nuevo disco.
Revisión previa del disco a sustituir en el nodo correspondiente
En primer lugar, revisaremos el disco a sustituir en el nodo donde esté conectado. En este caso, el disco está en el nodo proxmox, por ello, accediendo a la consola de gestión web de Proxmox (es indiferente al nodo que nos conectemos inicialmente), seleccionaremos el nodo que contiene el disco a quitar y sustituir, en este caso el nodo proxmox [1], pulsaremos en «Disks» [2] y comprobaremos que el disco aparece y está siendo usado por LVM, Ceph, así como el OSD que tiene asignado [3], en este caso:
/dev/sdb (LVM, Ceph OSD.6) de 500GB marca Hitachi
Como podemos comprobar, tiene asignado el OSD.6 en el nodo proxmox.

Nos aseguraremos de que el sistema Ceph no tiene warning y está en estado HEALTH_OK:

Si el sistema presenta algún warning o bien si no estamos seguros de que soporte la retirada de un disco sin perder información, lo ideal es conectar y agregar al clúster Ceph el nuevo disco antes de retirar el actual.
También podremos comprobar el espacio usado y el disponible del clúster Ceph, así nos aseguremos de que podremos prescindir del disco. En este caso, tenemos usados 906,82GB de 11,83TB, por lo que hay espacio libre disponible más que de sobra. En caso de tener un porcentaje de ocupación elevado, lo conveniente es conectar el disco duro nuevo, agregándolo al clúster, antes de quitar el actual.

De esta forma, tendremos la seguridad de que podremos quitar el disco sin sufrir pérdida de datos.
Quitar disco duro en sistema hiperconvergente Ceph de clúster Proxmox
Una vez que hayamos obtenido el OSD asignado al disco, y de habernos asegurado de que el sistema Ceph admite el prescindir de un disco sin pérdida de información, procederemos a desactivar el disco y a quitarlo definitivamente. Para ello, desde la consola web de gestión de Proxmox (desde cualquier nodo del clúster), accederemos a «Ceph» – «OSD» [1], desplegaremos el nodo con el OSD a retirar (el nodo proxmox), seleccionaremos el OSD a retirar, en este caso el osd.6 [2] y pulsaremos en «Out» [3]:

Una vez en estado «out», seguiremos seleccionando el OSD a retirar y pulsaremos en «Stop»:

Cuando el OSD pase a estado down y out, podremos eliminarlo definitivamente, pulsando en el menú «More» – «Destroy»:

Si queremos eliminar la información que pueda contener, marcaremos «Cleanup Disks». Pulsaremos en «Remove»:

Una vez eliminado el disco, podremos desconectarlo y retirarlo del equipo. En función del tipo de equipo de que dispongamos, puede que haya que hacer el proceso previo apagado del servidor.
Conectar y agregar al clúster Ceph el nuevo disco duro
Dependiendo de los equipos del clúster, es probable que para conectar un disco duro haya que apagar el servidor (el nodo). Si es así y no admite conexión de discos en caliente, seleccionaremos el nodo y, asegurándonos de que las máquinas virtuales que contiene están migradas a otros nodos, pulsaremos en «Shutdown» para apagarlo:

Conectaremos el nuevo disco duro al equipo físico y lo arrancaremos. Una vez arrancado, accederemos a la consola de gestión web y seleccionaremos el nodo Proxmox que contiene el nuevo disco duro, pulsaremos en «Disks» [1], seleccionaremos el disco nuevo insertado, que en el campo «Usage» aparecerá con un valor diferente a «LVM, Ceph…». Pulsaremos en «Wipe Disk»:

Si estamos seguros de que hemos elegido el disco duro nuevo y no tiene datos, pulsaremos en «Yes» para eliminar sus datos y dejarlo preparado para poderlo agregar al clúster Ceph:

Agregaremos el OSD al clúster Ceph, desde «Ceph» – «OSD» [1], pulsando en «Create: OSD» [2]:

Elegiremos el disco conectado en «Disk», en este caso «/dev/sdb» y pulsaremos en «Create»:

En unos segundos, el disco quedará agregado al clúster Ceph y empezará a usarlo para replicar datos de otros OSD:
