Gå til innhold

Software RAID problem


megda

Anbefalte innlegg

Hei

 

Har et problem med en maskin satt opp med Linux-raid...

 

Maskinen har to disker, med tre partisjoner. Boot-partisjonen er md0 og er angitt i grub.conf.

 

Smartd har begynt å rapportere om lesefeil på ene disken, så jeg tenkte det var lurt å få skiftet den ut. Samtidig detter serveren ned hver eneste lørdag natt kl 04:00. Jeg har sterk mistanke om at dette skyldes at synkroniseringen feiler og systemet henger. Antar at det er faste tidspunkt hvor dette forsøkes og at dette tilfeldigvis er på den tiden den forsøker dette.

 

Jeg skrudde av maskinen og tok ut ene disken med feil (iallefall den jeg trodde hadde feil). Men da stoppet bare Linux i oppstarten av Linux, uten feilmelding eller noe. Skjermbildet sto bare stille.

 

Så prøvde jeg å boote den andre disken, i tilfelle jeg hadde tatt ut feil disk. Da kom meldingen "GRUB" og ikke noe mer.

 

Når begge diskene var i igjen, så bootet den og virket hele uken (RAID status viser OK, men Smartd viser enda flere feil) frem til den falt ned på lørdag igjen (konsollet svarer ikke).

 

Dette virker utrolig merkelig. Selv om en disk ikke er i, så skal jo maskinen boote fordet? Og /md0 er jo riktig startsted for booting..

 

Jeg prøvde også å ta ut ene disken mens det hele var i gang, men da kom melding om Hardware reset opp og den bootet og stoppet i oppstarten inntil begge diskene var satt inn..

 

Noen som har anelse om hva dette skyldes eller kjenner igjen symptomene?

 

 

/dev/md0:

Version : 0.90

Creation Time : Sat Apr 4 08:56:19 2009

Raid Level : raid1

Array Size : 363518720 (346.68 GiB 372.24 GB)

Used Dev Size : 363518720 (346.68 GiB 372.24 GB)

Raid Devices : 2

Total Devices : 2

Preferred Minor : 0

Persistence : Superblock is persistent

 

Update Time : Mon Feb 15 15:41:18 2010

State : clean

Active Devices : 2

Working Devices : 2

Failed Devices : 0

Spare Devices : 0

 

UUID : 1847620f:bf98bd66:712efa94:2e51574a

Events : 0.4626

 

Number Major Minor RaidDevice State

0 8 1 0 active sync /dev/sda1

1 8 17 1 active sync /dev/sdb1

 

 

cat /proc/mdstat

Personalities : [raid1]

md2 : active raid1 sdb2[1] sda2[0]

122881088 blocks [2/2] [uU]

 

md1 : active raid1 sdb3[1] sda3[0]

1020032 blocks [2/2] [uU]

 

md0 : active raid1 sdb1[1] sda1[0]

363518720 blocks [2/2] [uU]

Endret av megda
Lenke til kommentar
Videoannonse
Annonse

Husk at software-raid tidligst blir aktivert når initrd som ligger i "grub-root" blir lastet. Før det så er du avhengig av at bios booter en disk hvor grub finnes i mbr/sektor 1 (stage 1/1.5), som igjen må kunne finne sin tilhørende stage 2 (som ligger i "grub-root") som den er konfigurert med (det ligger "hardkodet" i sektorene der grub ligger siden stage 1/1.5 ikke klarer så mye annet enn å laste stage 2). Først da klarer grub å laste initrd og etter det kernel.

 

Håper du skjønte noe av dette og fikk litt mer å gå på i feilsøkinga :)

 

NB: Dette gjelder for "legacy Grub" (aka. Grub 1), ikke sikker på om Grub 2 fungerer tilsvarende.

Endret av HawP
Lenke til kommentar

Jeg har nå deaktivert alle partisjonene fra problemdisken og kan fint boote fra RAID-arrayet med kun arrayet med friske disken aktiv. Så da bør ikke noen andre disker være involvert i boot. Men blir spennende å ta ut disken i morgen... Teoretisk burde det da ikke være noe problem å bytte ut disken og systemet skal boote som før?

 

Det er disk /sdb som har feil på seg og grub nevner ikke noe som helst om sdb, kun /md0. Med den deaktiverte disken inaktiv, så kan jeg se /boot partisjonen på md0.

 

Så jeg begynner helle mot at grunnen til ikke-boot her om dagen var rett og slett at mdadm krevde at ene disken ble deaktivert manuelt (event. at jeg ikke var tolmodig nok).. For ved oppstart fra den ene disken kom den jo faktisk inn i linux, men fryste. Det må ha vært den korrekte/virkende disken sda, for grub ser helt riktig ut. Videre antar jeg da at grub-meldingen kom fra sdb, som er den disken med feil.

 

Er det event. mulig å reparere boot-recorden på den friske disken fra installasjonscd'n, eller betyr dette full reinstall?

Endret av megda
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...