Au travail, nous utilisons un serveur Dell Power Edge R710 pour gérer plusieurs VMs de développements. Pour l’hyperviseur et connaissant mes obédiences, nous sommes partis sur une solution Open source à savoir ProxMox VE. Dell fourni pas mal d’outils pour monitorer leurs machines mais rien pour Proxmox basée sur une Debian et ne disposant pas d’interface graphique.
Bref, suite à une visite de la salle blanche, je me suis rendu compte que l’un des disques durs RAID 5 était en erreur sans qu’aucune de mes sondes ne me remonte la moindre information. J’ai donc dû rechercher des informations sur la carte contrôleur RAID (une LSI MegaSAS 9260) pour voir comment sous Linux et plus particulièrement sous Debian, je pouvais lui faire cracher des informations.
Après un peu de recherche, je suis tombé sur un dépôt apt qui propose un outil appelé megacli supportant cette carte et qui permet de retourner les informations en ligne de commande. De là, j’ai fais un petit cron qui va lancer une analyse et rechercher les mots tels que « Degraded » ou « Failed » et me voila avec une solution de surveillance rapide.
De Cascador le 25 mai 2015
Hello,
Si ça peut te servir : http://www.admin-linux.fr/?p=8535
http://www.admin-linux.fr/?p=5634
Tcho !