raid1
Adam Gapiński
adas-news w artikon.pl
Czw, 20 Kwi 2006, 20:26:04 CEST
Witam!
Dell PowerEdge 1600 + 2 dyski SCSI i na tym raid1 (mirror). Kontroler SCSI:
01:04.0 SCSI storage controller: LSI Logic / Symbios Logic 53c1030 PCI-X
Fusion-MPT Dual Ultra320 SCSI (rev 07)
Ostatnio mu się zdarzyło:
Apr 15 03:33:14 sepserwer kernel: mptbase: ioc0: IOCStatus(0x0048): SCSI
Task Terminated
Apr 15 03:33:35 sepserwer kernel: mptbase: Initiating ioc0 recovery
Apr 15 03:33:59 sepserwer kernel: scsi: Device offlined - not ready after
error recovery: host 0 channel 0 id 0 lun 0
Apr 15 03:34:00 sepserwer kernel: mptbase: ioc0: IOCStatus(0x0048): SCSI
Task Terminated
Poszukiwania w google dały rezultat, że to wina sterownika i po restarcie
maszyny będzie OK (softwarowy restart nie wystarczy bo coś tam w biosie
itp.) Co ciekawsze dotyczy to jajka 2.6, bo na 2.4 działa reset softwarowy.
Gdzieś się też dokopałem, że pomaga na to upgrade kernela do 2.6.12 (na tej
maszynie mam jeszcze 2.6.8, ale o tym za moment).
Teraz 2 problemy:
1. ponieważ przez awarię jeden z dysków (sda) "wyleciał" mi z macierzy
ponowna synchronizacja zrobi się sama po czymś takim:
# mdadm -a /dev/md0 /dev/sda3
(zakładając, że /dev/md0 działa teraz tylko z /dev/sdb3)?
2. próbowałem upgrade kernela do najnowszego z main
kernel-grsecurity-2.6.14.7-5 , ale nie chce mi zamontować / - zawartość
initrd taka jak dla poprzedniego kernel-2.6.8-3.6. I teraz - coś mu brakuje
w initrd, czy może coś nie tak z partycjami, bo przy starcie krzyczy, że
nie może znaleźć superblocka a partycje są na dyskach typu fd (ktoś
niedawno pisał, że przesiadka jest bezbolesna przy takim typie partycji):
/dev/sdb3 131 739 4891792+ fd Linux raid
autodetect
Jeśli jeszcze coś potrzeba to mam zdalny dostęp do maszyny - komunikat przy
starcie mogę podać w poniedziałek po południu, bo wtedy będę przy konsoli.
Co ciekawe prawie dobę później wywaliło drugą partycję (sda4) z /dev/md1) i
tearaz przetrzepałem dysk pod kontem badblocków - brak, smartctl też nie
pokazuje nic ciekawego - dysk wygląda na całkowiecie sprawny, ale macierze
(obie) pracują tylko na /dev/sdb... Wcześniej maszyna działala bez zarzutu
od 09.2004, więc raczej to jakaś rzadka przypadłość, ale dziwi mnie to,
że "poleciały" dwie macierze w odstępie jednodniowym i to w dodatku akurat
w weekend kiedy nikt nie pracował...
pozdrawiam
--
Adam Gapiński ::::: adas-news (at) artikon (dot) pl
Na pytanie *Która godzina?* chciałem zainstalować rdate... (/me 18.05.2004)
Więcej informacji o liście dyskusyjnej pld-users-pl