OT: Czym monitorujecie serwery?

Wojciech Błaszkowski wojciech w blaszkowski.com
Śro, 8 Lut 2012, 13:52:12 CET


Dnia Wednesday 08 of February 2012, Jacek Osiecki napisał:
>   - nagios: szybka konfiguracja przez pliki, bezproblemowe rozszerzanie
>     listy testów za pomocą nrpe (lokalnego agenta), można np. sobie na
>     każdym serwerze zdefiniować inną listę filesystemów do sprawdzania
>     wolnego miejsca, inne komendy do sprawdzania poprawności działania
>     RAIDów (czy to soft, czy hardware), własne testy (np. raportowanie
>     czy wykonały się nocne backupy). Niestety - wady to trzy stany (OK,
>     WARNING, ERROR, no dobra - cztery stany bo jest UNKNOWN), brak
>     możliwości monitorowania wydajności (obciążenie systemu, czasy
>     odpowiedzi apache'a itp.)

Byzydura :) 
Za pomocą nagiosa możesz monitorować nawet temperaturę za oknem czy obroty 
wiertarki. Konieczne są 2 rzeczy: monitorowana rzecz z odpalonym Linuksem i 
plugin NRPE. Do obciążenia systemu można stosować choćby wbudowany check_load. 
Generalnie dużą część pluginów można napisać w 2h samemu. Polecam Pythona. 
Nadaje się do tego GENIALNIE.

Jeśli przyjmiemy, że:

– 0, oznaczające normalną pracę
– 1, ostrzeżenie
– 2, stan krytyczny
– 3, stan nieustalony

To przykładowy opis algorytmu pomiaru danego stanu będzie wyglądał tak:
- ustawienie dla zwracanego stanu wartości 3.
- próba pobrania próbki do monitorowania, której niepowodzenie zwraca 
aktualnie ustalony stan i kończy algorytm.
- obróbka (parsowanie) uzyskanych danych.
- próba przyrównania uzyskanej wartości do jednej z wartości zadanych, której
niepowodzenie ustawia zwracany stan do wartości 1 i kończy algorytm.
- zwrócenie stanu uzyskanego w ostatniej próbie i zakończenie algorytmu.

Dla mnie 4 stany w zupełności wystarczają, aby wszcząć czerwony alarm, zerknąć 
na maszynę lub spokojnie pić kawę ;-)

-- 
Pozdrawiam,

Wojciech Błaszkowski
www.blaszkowski.com
GSM: +48 600 197 207
JID: wojtosz w jabber.biz.pl


Więcej informacji o liście pld-users-pl