raid1

Adam Gapiński adas-news w artikon.pl
Czw, 20 Kwi 2006, 20:26:04 CEST


Witam!
Dell PowerEdge 1600 + 2 dyski SCSI i na tym raid1 (mirror). Kontroler SCSI:
01:04.0 SCSI storage controller: LSI Logic / Symbios Logic 53c1030 PCI-X 
Fusion-MPT Dual Ultra320 SCSI (rev 07)

Ostatnio mu się zdarzyło:
Apr 15 03:33:14 sepserwer kernel: mptbase: ioc0: IOCStatus(0x0048): SCSI 
Task Terminated
Apr 15 03:33:35 sepserwer kernel: mptbase: Initiating ioc0 recovery
Apr 15 03:33:59 sepserwer kernel: scsi: Device offlined - not ready after 
error recovery: host 0 channel 0 id 0 lun 0
Apr 15 03:34:00 sepserwer kernel: mptbase: ioc0: IOCStatus(0x0048): SCSI 
Task Terminated

Poszukiwania w google dały rezultat, że to wina sterownika i po restarcie 
maszyny będzie OK (softwarowy restart nie wystarczy bo coś tam w biosie 
itp.) Co ciekawsze dotyczy to jajka 2.6, bo na 2.4 działa reset softwarowy. 
Gdzieś się też dokopałem, że pomaga na to upgrade kernela do 2.6.12 (na tej 
maszynie mam jeszcze 2.6.8, ale o tym za moment). 

Teraz 2 problemy:
1. ponieważ przez awarię jeden z dysków (sda) "wyleciał" mi z macierzy 
ponowna synchronizacja zrobi się sama po czymś takim:
# mdadm -a /dev/md0 /dev/sda3 
(zakładając, że /dev/md0 działa teraz tylko z /dev/sdb3)?

2. próbowałem upgrade kernela do najnowszego z main 
kernel-grsecurity-2.6.14.7-5 , ale nie chce mi zamontować / - zawartość
initrd taka jak dla poprzedniego kernel-2.6.8-3.6. I teraz - coś mu brakuje 
w initrd, czy może coś nie tak z partycjami, bo przy starcie krzyczy, że 
nie może znaleźć superblocka a partycje są na dyskach typu fd (ktoś 
niedawno pisał, że przesiadka jest bezbolesna przy takim typie partycji):
/dev/sdb3             131         739     4891792+  fd  Linux raid 
autodetect

Jeśli jeszcze coś potrzeba to mam zdalny dostęp do maszyny - komunikat przy 
starcie mogę podać w poniedziałek po południu, bo wtedy będę przy konsoli.

Co ciekawe prawie dobę później wywaliło drugą partycję (sda4) z /dev/md1) i 
tearaz przetrzepałem dysk pod kontem badblocków - brak, smartctl też nie 
pokazuje nic ciekawego - dysk wygląda na całkowiecie sprawny, ale macierze 
(obie) pracują tylko na /dev/sdb... Wcześniej maszyna działala bez zarzutu 
od 09.2004, więc raczej to jakaś rzadka przypadłość, ale dziwi mnie to, 
że "poleciały" dwie macierze w odstępie jednodniowym i to w dodatku akurat 
w weekend kiedy nikt nie pracował...

pozdrawiam
-- 
Adam Gapiński ::::: adas-news (at) artikon (dot) pl
Na pytanie *Która godzina?* chciałem zainstalować rdate... (/me 18.05.2004)


Więcej informacji o liście dyskusyjnej pld-users-pl