====== Analyse der System Performance High Load Average, Low CPU ======
Auf einem Linux System steigt urplötzlich die Load Average ohne das aber geleichzeitig die CPU Last ansteigt.
Auch ist ein signifikanter Anstieg von I/O Zeiten nicht zu beobachten.
==== Analyse: ====
Top Kommando:
top
... load average: 124.63, 99.59, 107.64
Tasks: 2886 total, 6 running, 2880 sleeping, 0 stopped, 0 zombie
Cpu(s): 1.5%us, 1.2%sy, 0.0%ni, 97.2%id, 0.1%wa, 0.0%hi, 0.0%si, 0.0%st
...
Load Historie mit Sar auswerten:
sar -q
..
02:20:01 PM 8 4179 117.76 116.14 108.70
02:30:01 PM 4 4229 124.02 122.32 115.39
..
Status D (Uninterruptible sleep (usually IO)) der wartenden Prozesse untersuchen:
ps auxf | awk '{if($8=="D") print $0;}'
Ein Prozess im Status "D" kann nicht abgebrochen werden.
Zitat:
//...
Frequently the most effective manner to do this without hitting the power switch is to pull the power chord.
..//
Über lsof püfen, was für Dateien von diesen Prozessen geöffnet sind:
lsof
Kontrolle von /var/log/messages auf Fehler bzgl. dem obigen Verzeichnis Pfad oder ähnlichen I/O Meldungen:
cat /var/log/messages
Eine mögliche Ursache kann in einem "defekten" NFS Mounts liegen, die Prozesse wollen auf den NFS Mount zugreifen und die Prozesse warten lange auf eine Antwort.
==== Quellen ====
* https://blogs.oracle.com/ksplice/entry/disown_zombie_children_and_the
* https://openvz.org/Processes_in_D_state