OT: jak namierzyć przyczynę wysokiego load?

Jacek Konieczny jajcus at jajcus.net
Wed Mar 13 13:52:48 CET 2013


On Wed, 13 Mar 2013 10:50:41 +0100 (CET)
Jacek Osiecki <joshua w hybrid.pl> wrote:
>   coś takiego chodzi? (wynik vps aux):
> 
> USER       PID CONTEXT             %CPU %MEM    VSZ   RSS TTY STAT START   TIME COMMAND root      1370     0 MAIN           0.0
> 0.0      0     0 ?        D    Jan21  45:53 [md2_raid1] 
> root 4799     0 MAIN           0.0  0.0      0     0 ?        D    Jan21  7:15 [jbd2/drbd0-37] 
> http      5227    38 srv-oldwww1    0.2  0.2 732748 55124 ?   DN   09:44   0:00 /usr/sbin/httpd.prefork
> http      6792    38 srv-oldwww1    0.0  0.1 729888 38792 ?   DN   09:47   0:00 /usr/sbin/httpd.prefork 
> http      7038    38 srv-oldwww1    0.2  0.2 742920 59508 ?   DN   09:48  0:00 /usr/sbin/httpd.prefork

To by się zgadzało z moimi przypuszczeniami – procesy są zatrzymane w
stanie 'D', zapewne czekają na jakąś operację na filesystemie…
Ale md2_raid też czeka… na czym ty tam raid masz?

> > Stawiam na problemy z siecią i DRBD/OCFS.
> 
> Wydaje mi się mało prawdopodobne by sieć była tu przyczyną.
> Statystyki pokazują niewielki ruch sieciowy - w porywach do 20Mbps,
> zaś serwery to dwie maszyny w OVH stojące w sąsiednich szafach, obie
> z łączem 1Gbit...

Nie ważne jakie łącze i jaki maksymalny ruch, ale jak to faktycznie
działa. Sprawdzałeś, chociażby pingiem, faktyczne opóźnienia i straty
pakietów?

> > - spróbować montować z noatime,nodiratime, żeby ograniczyć ilość
> >  zapisów/blokad
> 
> Mount pokazuje mi takie parametry:
> 
> /dev/drbd0 on /home type ocfs2 
> (rw,noatime,_netdev,heartbeat=local,nointr,data=ordered,errors=remount-ro,
> atime_quantum=60,localalloc=59,coherency=full,user_xattr,noacl)

Nie używam ocfs, więc trudno mi się tu konkretnie wypowiadać. Możliwe,
że coś da się zmienić. 'noatime' już jest, więc dodanie nie pomoże.

> > – pogmerać z parametrami DRBD
> 
> Coś więcej poza ustawieniem max. przepustowości (syncer { rate
> 50M; })?

To zależy, czy teraz, podczas normalnej pracy, DRBD wykorzystuje to
maksimum. Jeżeli tak, to jak najbardziej.

> Tak jak pisałem, nie wygląda na to by ruch sieciowy choćby dążył ku 
> wartościom przy których jakakolwiek priorytetyzacja by była
> potrzebna...

Wciąż mogą to być problemy z siecią.

Pozdrowienia,
	Jacek


More information about the pld-devel-pl mailing list