Suche

Hardwaredefekt

Festplattenanalyse und -identifizierung bei angezeigtem Defekt in SOUL

1.Smartctl downloaden & installieren:

a) Auf SOUL stable/xxx mit Ubuntu Linux
sudo su -
cd /tmp
aptitude update
aptitude download smartmontools
dpkg -i smart*

b) Auf SOUL soul3/1xxx mit Core OS
toolbox dnf install -y smartmontools
toolbox --bind=/dev:/dev

2. Analyse durchführen:
smartctl -a /dev/sd[X]

3. Falls smartmon = disabled:
smartctl -s on /dev/sd[X]

4. Schnelle Analyse:
...
197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0
...

Steht da KEINE 0 ist die Platte DEFINITIV defekt!

Bei den 2,5″ Platten ist folgender Wert interessant
Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 0

Dieser kann leicht erhöht sein. Wenn aber die Festplatte aus dem RAID geflogen ist und sonst keine Fehler aufweist,
dann kann ein erhöhter Wert auf elektromechanische Probleme hinweisen und die Festplatte muss ausgetauscht werden:

Description
Write Error Rate / Multi-Zone Error Rate (Western Digital) S.M.A.R.T. parameter indicates the total number of errors appearing while recording data to a hard disk. This may be caused by problems with disk surface or the read/write heads.

Recommendations
Although this parameter is not considered critical by the most hardware vendors, degradation of this parameter may indicate electromechanical problems of the disk. Regular backup is recommended. If no other (critical) parameters report a problem,
hardware replacement is recommended on mission critical systems only.

ZFS-RAID reparieren

  1. Laufwerksbuchstaben [Y] der neuen Festplatte ohne Partitionen ermitteln mit „lsblk“
    lsblk
  2. ID des defekten RAID-Devices ermitteln mit „zpool status“
    Die ID des Devices der ehemaligen Festplatte kann in der roten Zeile ausgelesen werden. In diesem Beispiel ist es „14438330742384875477“. Das Format der ID kann abweichen.
    zpoolstatus
  3. Neue Festplatte ins RAID hängen:
    Da Sie nun wissen, welchen Buchstaben [Y] die neue Festplatte und welche ID das
    defekte RAID-Device hat, können Sie die neue Festplatte ins RAID hängen.
    Dies geschieht mit „zpool replace -f protonet_storage <offline_id> <neue_hdd>“Eine Ausgabe darf nach diesem Befehl nicht erfolgen. Wenn doch, Befehl und ID auf Korrektheit überprüfen:
    zpoolreplace
  4. RAID-Status überprüfen mit „zpool status“:
    Meldungen wie „Resilvering“ sind hier normal. Diese bedeutet, dass der Resync des RAID’s im Gange ist. Der Screenshot zeigt den Status nach dem Resync.
    zpoolstatus2
  5. Bereits während des „Resilverings“ können Sie den Server herunterfahren und ohne den DBS-Stick wieder starten.
  6. Wenn der Server wieder normal startet, sind die Arbeiten abgeschlossen.
  7. Bitte informieren Sie den Kunden, dass der Festplatten-Status noch einige Zeit auf Rot bleiben kann, bis der Resync vollständig abgeschlossen ist.
    Sollte dies am nächsten Tag noch nicht wieder auf Grün stehen, bitte beim Protonet-Support melden.

Videoanleitung Festplattentausch Maya

 

Achtung
Modifikationen der Hardware geschehen auf eigene Gefahr. Bei Veränderungen an Hardware und Gehäuse erlischt der Garantie- und eventuell kostenfreie Supportanspruch. Wir haben die Software ausschließlich mit unserer Hardwarekonfiguration getestet und können nicht garantieren, dass diese auf einer geänderten Konfiguration weiterhin einwandfrei läuft.

Videoanleitung Festplattentausch Carla/Carlita

Achtung

Modifikationen der Hardware geschehen auf eigene Gefahr. Bei Veränderungen an Hardware und Gehäuse erlischt der Garantie- und eventuell kostenfreie Supportanspruch. Wir haben die Software ausschließlich mit unserer Hardwarekonfiguration getestet und können nicht garantieren, dass diese auf einer geänderten Konfiguration weiterhin einwandfrei läuft.