Proxmox: Ceph Error Module 'devicehealth has failed'

Bei der aktuellen Clusterkonfiguration ist es ohne Zutun zu folgendem Fehler im Ceph gekommen, aktuell in der Version 17.2.1, aber ich habe den Fehler auch bei anderen Versionen gefunden.

Klingt erst einmal hochdramatisch, bekommt man aber schnell in den Griff.

Die Lösung findet sich auch im Proxmox Forum (archiv)

Just did the same thing , I discovered than device_healths_metrics appear to be created by manager so

1 – Create a new manager , if you already have a second manager go to step two
2 – delete the first manager ( there is no data loss here ) , wait for the standby one to become active
3 – Recreate the initial manager , the pool is back

I re-deleted the device_health_metrics pool just to confirm and the problem Re-appeared , solved the same way

Tatsächlich eine Sache von zwei Minuten, dann ist der Fehler erst einmal weg. Bei den anderen produktiven Clustern ist das bisher nicht aufgetreten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert