Moje boje z softraid.
Roman Kolasiewicz
rkolasiewicz w excellent.com.pl
Śro, 13 Lis 2002, 14:04:54 CET
-----BEGIN PGP SIGNED MESSAGE-----
Hash: MD5
Witam!
Mam w firmie nowy serwerek na plycie SGH2 intela z macierza hotswapowa
i dwoma dyskami SCSI. Bez wiekszych problemow udalo mi sie zrobic RAID1
pomiedzy doma partycjami na obu dyskach:
[root w xeon /root]# fdisk -l /dev/sda /dev/sdb
Disk /dev/sda: 36.7 GB, 36703918080 bytes
255 heads, 63 sectors/track, 4462 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/sda1 1 131 1052226 82 Linux swap
/dev/sda2 * 132 132 8032+ fd Linux raid autodetect
/dev/sda3 133 4462 34780725 fd Linux raid autodetect
Disk /dev/sdb: 36.7 GB, 36703918080 bytes
255 heads, 63 sectors/track, 4462 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes
Device Boot Start End Blocks Id System
/dev/sdb1 1 131 1052226 82 Linux swap
/dev/sdb2 * 132 132 8032+ fd Linux raid autodetect
/dev/sdb3 133 4462 34780725 fd Linux raid autodetect
[root w xeon /root]# cat /etc/fstab
/dev/md0 / ext2 defaults 1 1
/dev/md1 /boot ext2 defaults 1 2
/dev/sda1 swap swap defaults 0 0
/dev/sdb1 swap swap defaults 0 0
I jak na razie prawie wszystko chodzi tak, jak myslalem.
Problem pojawia sie w przypadku wyjecia jednego z dyskow z macierzy - po jego
usunieciu i wydaniu komendy "raidhotremove /dev/mdx /dev/sdxx" dysk bezproblemowo
jest usuwany z softraida i serwer dalej sobie hula. Ale napadla mnie mysl, ze
przeciez po wsunieciu tego dysku bez restartu serwera powinienem moc go wlozyc
do macierzy i ponownie zsynchronizowac raida (raidhotadd /dev/mdx /dev/sdxx) i tu
niestety nastapila klapa, bo to nie zadzialalo!
Okazuje sie, ze macierz caly czas informuje kontroler scsi o tym, ze dysk jest
podlaczony - nawet po jego fizycznym wyciagnieciu z serwera dysk dalej jest
raportowany jako istniejacy w systemie, no chyba ze ja cos zle
robie... (btw. ten blad z declare znika po zastosowaniu /bin/bash jako
srodowiska wykonywania, obecnie jest /bin/sh)
[root w xeon /root]# rescan-scsi-bus
Host adapter 0 (aic7xxx) found.
Host adapter 1 (aic7xxx) found.
/sbin/rescan-scsi-bus[113]: declare: not found
/sbin/rescan-scsi-bus[114]: declare: not found
Scanning for device 0 0 0 0 ...
OLD: Host: scsi0 Channel: 00 Id: 00 Lun: 00
Vendor: IBM Model: IC35L036UCD210-0 Rev: S5BS
Type: Direct-Access ANSI SCSI revision: 03
Scanning for device 0 0 1 0 ...
OLD: Host: scsi0 Channel: 00 Id: 01 Lun: 00
Vendor: IBM Model: IC35L036UCD210-0 Rev: S5BS
Type: Direct-Access ANSI SCSI revision: 03
Scanning for device 0 0 6 0 ...
OLD: Host: scsi0 Channel: 00 Id: 06 Lun: 00
Vendor: ESG-SHV Model: SCA HSBP M15 Rev: 0.10
Type: Processor ANSI SCSI revision: 02
new device(s) found. 0 7 0 ...
device(s) removed.
I kupa - bo dysku fizycznie w systemie nie ma :( (wyciagalem sdb,
czyli 0 0 1 0).
Probowalem recznie robic tak, jak robi ten skrypt, czyli:
echo "scsi remove-single-device 0 0 1 0" ale nic to nie dalo...
Ma ktos jakies pomysly jak to zmusic do dzialania?
Pozatym zrobilem sobie /boot rowniez na raid1, wszystko pieknie rusza
ale ...tylko z dysku primary, a mi sie wydawalo ze z secondary tez
powinno ruszyc - jakas specjalna opcja dla lilo jest wymagana?
kernel-smp-2.4.18-2 (z nest)
glibc-2.2.5-22
scsiutils-1.7.2.10.0.97-1
Best regards,
Roman
- --
-----BEGIN PGP SIGNATURE-----
Version: 2.6
iQEVAwUAPdJN/K8UxZNaC9cNAQGv8AgAn6jWxSO49aHv3nS/oqcnV2TkMDAzAvJk
9USnNNl53WytJBD/IYCg+9s+iAd5281Y51+5SyNNwpli8/n1RGeXXDgXG7ho03n4
oAsfaItzQ9/0RebIySNv7zGcSakBLxziZiCan9H8dHUUjyMZG4Z+GpbW9Yfh03N6
I6of/PzQqIG3Fg1/QPP64ADJIht17PkmAEyJ6I7Le7DNH45kfO8AJiUIz/azkyjW
6/QbmLa/ie7VQUzBYMeu2UYiA/WVvRCt9Q4vTdlkvTT079Q2DJmsSO8b/ZgwW80r
ynL7ZqeScRFOOtEq2tuesWNsf7GnjM4t8F8s32R1ollPf6hwvl9fUA==
=hu96
-----END PGP SIGNATURE-----
Więcej informacji o liście dyskusyjnej pld-users-pl