OT: jak namierzyć przyczynę wysokiego load?
Jacek Konieczny
jajcus at jajcus.net
Wed Mar 13 13:52:48 CET 2013
On Wed, 13 Mar 2013 10:50:41 +0100 (CET)
Jacek Osiecki <joshua w hybrid.pl> wrote:
> coś takiego chodzi? (wynik vps aux):
>
> USER PID CONTEXT %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND root 1370 0 MAIN 0.0
> 0.0 0 0 ? D Jan21 45:53 [md2_raid1]
> root 4799 0 MAIN 0.0 0.0 0 0 ? D Jan21 7:15 [jbd2/drbd0-37]
> http 5227 38 srv-oldwww1 0.2 0.2 732748 55124 ? DN 09:44 0:00 /usr/sbin/httpd.prefork
> http 6792 38 srv-oldwww1 0.0 0.1 729888 38792 ? DN 09:47 0:00 /usr/sbin/httpd.prefork
> http 7038 38 srv-oldwww1 0.2 0.2 742920 59508 ? DN 09:48 0:00 /usr/sbin/httpd.prefork
To by się zgadzało z moimi przypuszczeniami – procesy są zatrzymane w
stanie 'D', zapewne czekają na jakąś operację na filesystemie…
Ale md2_raid też czeka… na czym ty tam raid masz?
> > Stawiam na problemy z siecią i DRBD/OCFS.
>
> Wydaje mi się mało prawdopodobne by sieć była tu przyczyną.
> Statystyki pokazują niewielki ruch sieciowy - w porywach do 20Mbps,
> zaś serwery to dwie maszyny w OVH stojące w sąsiednich szafach, obie
> z łączem 1Gbit...
Nie ważne jakie łącze i jaki maksymalny ruch, ale jak to faktycznie
działa. Sprawdzałeś, chociażby pingiem, faktyczne opóźnienia i straty
pakietów?
> > - spróbować montować z noatime,nodiratime, żeby ograniczyć ilość
> > zapisów/blokad
>
> Mount pokazuje mi takie parametry:
>
> /dev/drbd0 on /home type ocfs2
> (rw,noatime,_netdev,heartbeat=local,nointr,data=ordered,errors=remount-ro,
> atime_quantum=60,localalloc=59,coherency=full,user_xattr,noacl)
Nie używam ocfs, więc trudno mi się tu konkretnie wypowiadać. Możliwe,
że coś da się zmienić. 'noatime' już jest, więc dodanie nie pomoże.
> > – pogmerać z parametrami DRBD
>
> Coś więcej poza ustawieniem max. przepustowości (syncer { rate
> 50M; })?
To zależy, czy teraz, podczas normalnej pracy, DRBD wykorzystuje to
maksimum. Jeżeli tak, to jak najbardziej.
> Tak jak pisałem, nie wygląda na to by ruch sieciowy choćby dążył ku
> wartościom przy których jakakolwiek priorytetyzacja by była
> potrzebna...
Wciąż mogą to być problemy z siecią.
Pozdrowienia,
Jacek
More information about the pld-devel-pl
mailing list