Re: OT: jak namierzyć przyczynę wysokiego load?

Jacek Osiecki joshua at hybrid.pl
Wed Mar 13 10:50:41 CET 2013


On Tue, 12 Mar 2013, Jacek Konieczny wrote:

> On Tue, 12 Mar 2013 14:37:25 +0100 (CET)
> Jacek Osiecki <joshua w hybrid.pl> wrote:

>> Od jakiegoś czasu walczę z niekończącymi się alertami o wysokim
>> loadzie na różnych serwerach. Konkretniej - to na dwóch, które
>> działają w tandemie i mają spięte bazy mysql (replikacja) oraz
>> filesystemy /home (DRBD+OCFS2).

> 'Load' mówi ile procesów w jednej chwili che coś od systemu.
> Jeżeli masz file-system na DRBD+OCFS, to wystarczy, że file-system
> przez chwilę będzie zatrzymany przez problemy z siecią, a już wszystkie
> procesy, które cokolwiek chcą tam zapisać (czy nawet odczytać, jeśli
> masz włączone atime) się zatrzymają w stanie 'D' i zaczną być wliczane
> do tego 'loadu'.

  coś takiego chodzi? (wynik vps aux):

USER       PID CONTEXT             %CPU %MEM    VSZ   RSS TTY      STAT START   TIME COMMAND
root      1370     0 MAIN           0.0  0.0      0     0 ?        D    Jan21  45:53 [md2_raid1]
root      4799     0 MAIN           0.0  0.0      0     0 ?        D    Jan21   7:15 [jbd2/drbd0-37]
http      5227    38 srv-oldwww1    0.2  0.2 732748 55124 ?        DN   09:44   0:00 /usr/sbin/httpd.prefork
http      6792    38 srv-oldwww1    0.0  0.1 729888 38792 ?        DN   09:47   0:00 /usr/sbin/httpd.prefork
http      7038    38 srv-oldwww1    0.2  0.2 742920 59508 ?        DN   09:48   0:00 /usr/sbin/httpd.prefork

> Stawiam na problemy z siecią i DRBD/OCFS.

Wydaje mi się mało prawdopodobne by sieć była tu przyczyną. Statystyki 
pokazują niewielki ruch sieciowy - w porywach do 20Mbps, zaś serwery to 
dwie maszyny w OVH stojące w sąsiednich szafach, obie z łączem 1Gbit...

> Jak rozumiem używasz DRBD w konfiguracji active-active. W takim

W sensie double primary? Tak.

> - spróbować montować z noatime,nodiratime, żeby ograniczyć ilość
>  zapisów/blokad

Mount pokazuje mi takie parametry:

/dev/drbd0 on /home type ocfs2 
(rw,noatime,_netdev,heartbeat=local,nointr,data=ordered,errors=remount-ro,
atime_quantum=60,localalloc=59,coherency=full,user_xattr,noacl)

> – pogmerać z parametrami DRBD

Coś więcej poza ustawieniem max. przepustowości (syncer { rate 50M; })?

> – sprawdzić połączenie sieciowe, o ile możliwe zrobić dedykowane dla
>  DRBD i/lub dla klastra/DLM
> – poustawiać priorytety ruchu tak, żeby łącze nigdy nie było wysycone

Tak jak pisałem, nie wygląda na to by ruch sieciowy choćby dążył ku 
wartościom przy których jakakolwiek priorytetyzacja by była potrzebna...

Pozdrawiam,
-- 
Jacek Osiecki joshua w ceti.pl GG:3828944
I don't want something I need. I want something I want.


More information about the pld-devel-pl mailing list