Moje boje z softraid.

Roman Kolasiewicz rkolasiewicz w excellent.com.pl
Śro, 13 Lis 2002, 14:04:54 CET


-----BEGIN PGP SIGNED MESSAGE-----
Hash: MD5

Witam!

Mam w firmie nowy serwerek na plycie SGH2 intela z macierza hotswapowa
i dwoma dyskami SCSI. Bez wiekszych problemow udalo mi sie zrobic RAID1
pomiedzy doma partycjami na obu dyskach:

[root w xeon /root]# fdisk -l /dev/sda /dev/sdb

Disk /dev/sda: 36.7 GB, 36703918080 bytes
255 heads, 63 sectors/track, 4462 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot    Start       End    Blocks   Id  System
/dev/sda1             1       131   1052226   82  Linux swap
/dev/sda2   *       132       132      8032+  fd  Linux raid autodetect
/dev/sda3           133      4462  34780725   fd  Linux raid autodetect

Disk /dev/sdb: 36.7 GB, 36703918080 bytes
255 heads, 63 sectors/track, 4462 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

   Device Boot    Start       End    Blocks   Id  System
/dev/sdb1             1       131   1052226   82  Linux swap
/dev/sdb2   *       132       132      8032+  fd  Linux raid autodetect
/dev/sdb3           133      4462  34780725   fd  Linux raid autodetect

[root w xeon /root]# cat /etc/fstab
/dev/md0        /       ext2    defaults        1       1
/dev/md1        /boot   ext2    defaults        1       2
/dev/sda1       swap    swap    defaults        0       0
/dev/sdb1       swap    swap    defaults        0       0

I jak na razie prawie wszystko chodzi tak, jak myslalem.

Problem pojawia sie w przypadku wyjecia jednego z dyskow z macierzy - po jego
usunieciu i wydaniu komendy "raidhotremove /dev/mdx /dev/sdxx" dysk bezproblemowo
jest usuwany z softraida i serwer dalej sobie hula. Ale napadla mnie mysl, ze
przeciez po wsunieciu tego dysku bez restartu serwera powinienem moc go wlozyc
do macierzy i ponownie zsynchronizowac raida (raidhotadd /dev/mdx /dev/sdxx) i tu
niestety nastapila klapa, bo to nie zadzialalo!

Okazuje sie, ze macierz caly czas informuje kontroler scsi o tym, ze dysk jest
podlaczony - nawet po jego fizycznym wyciagnieciu z serwera dysk dalej jest
raportowany jako istniejacy w systemie, no chyba ze ja cos zle
robie... (btw. ten blad z declare znika po zastosowaniu /bin/bash jako
srodowiska wykonywania, obecnie jest /bin/sh)

[root w xeon /root]# rescan-scsi-bus
Host adapter 0 (aic7xxx) found.
Host adapter 1 (aic7xxx) found.
/sbin/rescan-scsi-bus[113]: declare: not found
/sbin/rescan-scsi-bus[114]: declare: not found
Scanning for device 0 0 0 0 ...
OLD: Host: scsi0 Channel: 00 Id: 00 Lun: 00
      Vendor: IBM      Model: IC35L036UCD210-0 Rev: S5BS
      Type:   Direct-Access                    ANSI SCSI revision: 03
Scanning for device 0 0 1 0 ...
OLD: Host: scsi0 Channel: 00 Id: 01 Lun: 00
      Vendor: IBM      Model: IC35L036UCD210-0 Rev: S5BS
      Type:   Direct-Access                    ANSI SCSI revision: 03
Scanning for device 0 0 6 0 ...
OLD: Host: scsi0 Channel: 00 Id: 06 Lun: 00
      Vendor: ESG-SHV  Model: SCA HSBP M15     Rev: 0.10
      Type:   Processor                        ANSI SCSI revision: 02
 new device(s) found. 0 7 0 ...
 device(s) removed.

I kupa - bo dysku fizycznie w systemie nie ma :( (wyciagalem sdb,
czyli 0 0 1 0).
Probowalem recznie robic tak, jak robi ten skrypt, czyli:
echo "scsi remove-single-device 0 0 1 0" ale nic to nie dalo...

Ma ktos jakies pomysly jak to zmusic do dzialania?

Pozatym zrobilem sobie /boot rowniez na raid1, wszystko pieknie rusza
ale ...tylko z dysku primary, a mi sie wydawalo ze z secondary tez
powinno ruszyc - jakas specjalna opcja dla lilo jest wymagana?

kernel-smp-2.4.18-2 (z nest)
glibc-2.2.5-22
scsiutils-1.7.2.10.0.97-1


Best regards,
 Roman
- --

-----BEGIN PGP SIGNATURE-----
Version: 2.6

iQEVAwUAPdJN/K8UxZNaC9cNAQGv8AgAn6jWxSO49aHv3nS/oqcnV2TkMDAzAvJk
9USnNNl53WytJBD/IYCg+9s+iAd5281Y51+5SyNNwpli8/n1RGeXXDgXG7ho03n4
oAsfaItzQ9/0RebIySNv7zGcSakBLxziZiCan9H8dHUUjyMZG4Z+GpbW9Yfh03N6
I6of/PzQqIG3Fg1/QPP64ADJIht17PkmAEyJ6I7Le7DNH45kfO8AJiUIz/azkyjW
6/QbmLa/ie7VQUzBYMeu2UYiA/WVvRCt9Q4vTdlkvTT079Q2DJmsSO8b/ZgwW80r
ynL7ZqeScRFOOtEq2tuesWNsf7GnjM4t8F8s32R1ollPf6hwvl9fUA==
=hu96
-----END PGP SIGNATURE-----



Więcej informacji o liście dyskusyjnej pld-users-pl