Problemy kernelowe

Michał Margula alchemyx w uznam.net.pl
Pon, 22 Wrz 2003, 12:48:54 CEST


Hej!

	Postanowiłem, że opiszę ostatnie tygodnie moich walk z kernelem. Sposób w 
jaki wykorzystacie te informacje nalezy już do Was. Być może z tego mojego 
bredzenia wyniknie coś sensownego.

Fakty:
	Serwer na PLD, 2 x Xeon 2.66, 1.5 GB RAMu, macierz softwarowa RAID1 na 
AIC79xx. Dwie sieciówki e1000 i pięć e100 (jedna dwuportowa). Przeznaczenie 
serwera to router i transparent proxy. Trzy sieciówki e100 połączane w 
bridge.

Sytuacja pierwsza:
	Kernel 2.4.20-9 od Cięciwy. "Zamieranie" bridge. Przestaje przesyłac dane. 
Inne interfejsy (nie w bridge) działają poprawnie. W kernelu błędy o treści:

kernel: br_netfilter: Argh!! br_nf_post_routing: bad mac.raw 
pointer.[eth5][br0]

Wymiana sterowników sieciówki z eepro100 na e100 dostarczane przez Intela 
rozwiązuje problem.

Sytuacja druga:
	Po kilku dniach działania znowu przestaje funkcjonować bridge. Tym razem bez 
śladów w logach. Inne interfejsy działają bez zarzutu (te nie w bridge). 
Restartowanie sieci nic nie pomaga. Sytuacja stabilizuje się dopiero po 
restarcie maszyny. Ponadto od czasu do czasu przy restarcie pokazuje sie oops 
przy "składaniu" interfejsów, jest w nim coś o module IPv6. Dodanie "alias 
ipv6 off" oraz upgrade do 2.4.21 z katalogu PLD-2.0 rozwiązuje problem. Na 
jakiś czas.

Sytuacja trzecia:
	System siada z "pełnoekranowym" ooopsem. Jest w nim coś o squidzie. Nie 
potrafiłem wymyślić póki co rozwiązania. Na razie wyjąłem pamięci (było 
pomieszane 2 x 256 i 2 x 512). Czy to może być przyczyną?

Planowane kolejne kroki (według kolejności zmian):
- kompilacja własnego 2.4.22 bez żadnych patchy
- odpalenie kernela z innej dystrybucji (RedHat?)
- inna dystrybucja (gentoo?)
- inny system operacyjny (FreeBSD?)

Przyznam, że jestem odrobinę podłamany i powoli zaczynam wątpić w Linuksa. 
Żeby było jasne - nikogo nie winie, po prostu sam nie mam czasu na 
dochodzenie w czym problem, a nie każdy ma możliwość testowania zmian na 
maszynach SMP.

Może macie jakieś pomysły, propozycje? Może to cholerne filtrowanie bridge coś 
chrzani?


-- 
Michał Margula, alchemyx w uznam.net.pl, http://alchemyx.uznam.net.pl/
"W życiu piękne są tylko chwile" [Ryszard Riedel]



Więcej informacji o liście dyskusyjnej pld-kernel