OT: Czym monitorujecie serwery?

Jacek Osiecki joshua w hybrid.pl
Śro, 8 Lut 2012, 13:41:04 CET


Witam,

Czego używacie do monitorowania swoich serwerków?
Teraz używam nagiosa, smokeping i cacti - każdy ma swoje zady i walety
i zakresy zastosowań:
  - smokeping: fajny, porządne wykresy, ale nie da się (albo nie znalazłem
    ani google nie zna takiej możliwości) definiować użytkowników którym
    udostępniałbym tylko część danych, problemy gdy chciałoby się zmienić
    częstotliwość próbkowania (albo wszystkie wykresy idą do śmieci albo
    trzeba się bawić w importy/eksporty), trochę upierdliwe i niezbyt
    elastyczne dodawanie nowych testów, ograniczony zakres zastosowań
  - nagios: szybka konfiguracja przez pliki, bezproblemowe rozszerzanie
    listy testów za pomocą nrpe (lokalnego agenta), można np. sobie na
    każdym serwerze zdefiniować inną listę filesystemów do sprawdzania
    wolnego miejsca, inne komendy do sprawdzania poprawności działania
    RAIDów (czy to soft, czy hardware), własne testy (np. raportowanie
    czy wykonały się nocne backupy). Niestety - wady to trzy stany (OK,
    WARNING, ERROR, no dobra - cztery stany bo jest UNKNOWN), brak
    możliwości monitorowania wydajności (obciążenie systemu, czasy
    odpowiedzi apache'a itp.)
  - cacti: bardzo ładne monitorowanie mnóstwa parametrów, porządne wykresy.
    Wady: wszystko jest badane po snmp (albo przez http), więc gdy serwer
    nagios nie ma łączności z badanym serwerem to mamy dziury w wykresach
    (najczęściej tam gdzie właśnie najbardziej nas interesuje co się
    działo). Do tego KOSZMARNA konfiguracja - wszystko się wyklikuje, nawet
    jak się przygotuje host template to potem czeka człowieka w porywach do
    pół godziny klikania, plus pamiętanie co i w jakiej kolejności zrobić
    żeby wykresy się w ogóle pojawiły. A jak się czasami zrobi coś nie tak
    (np. skasuje serwis z listy) to w ogóle amba, dochodź człowieku jak to
    przywrócić...

BTW, jak jest z cacti w PLD? Nadal nie da się zainstalować:

Przygotowywanie...          ###################################### [100%]
    1:cacti-plugin-boost     ###################################### [ 20%]
Adding user cacti UID=184.
    2:cacti                  ###################################### [ 40%]
FATAL: Cannot connect to MySQL server on 'localhost'. Please make sure you 
have specified a valid MySQL database name in 'include/config.php'
Przeładowanie usługi Lighttpd Web Server.........................  [ ZROBIONE ]
    3:cacti-spine            ###################################### [ 60%]
    4:cacti-doc              ###################################### [ 80%]
    5:cacti-setup            ###################################### [100%]

I bądź tu mądry co z nim zrobić :(

Jest jeszcze zabbix: niby fajny, ma dobrze przemyślany interfejs na którym 
bardzo dużo widać na jednym ekranie, konfiguracja nawet jest znośna, 
ale... jest cholernie sztywny - nie zdefiniujesz sobie własnego testu i 
już. Ba - od bardzo dawna ludzie błagają o testy np. IMAPs, a tu niestety 
"niedasie" i porady żeby sobie testować samego IMAPa albo sprawdzać czy da 
się połączyć z portem 993 (co wcale nie musi oznaczać że IMAPs działa). 
Nagios potrafi nie tylko się połączyć ale nawet zalogować do testowej 
skrzynki i sprawdzić czy wszystko się zgadza...

Jakieś inne propozycje? Szukałem różnych opcji - bezpłatnych, choć nie 
wykluczam czegoś co by było w miarę niedrogie (a nie jak nagios XI w cenie
od 1000$)...

Pozdrawiam,
-- 
Jacek Osiecki joshua w ceti.pl GG:3828944
I don't want something I need. I want something I want.


Więcej informacji o liście pld-users-pl