Gå til innhold

Paritets-problem på et raid5


Anbefalte innlegg

Hei

 

Har akkurat oppgradert mitt raid5 med nye disker, på en litt eldre Promise S150 SX4 4port kontroller.

 

Planen først var å erstatte én og én disk (fra 200gb til 500gb) i arrayet, for så å gjøre en "online raid expantion", men siden kontrolleren kun støtter "Online Array Expantion" var jeg nødt til å kopiere alle data over på 1 ny disk, starte et nytt array med 3 nye disker, kopiere data tilbake til det nye arrayet fra den 1. disken og så ekspandere raidet fra 3 til 4 disker.

 

Det fungerte fint å lage nytt array med 3x 500gb (bortsett fra de 29 timene det tok å migrere inn den 4. disken etter å ha kopiert over alle dataene), men når jeg gjør en synkronisering av paritetsinformasjonen får jeg følgende feilmelding i systemloggen:

 

Controller #1: Synchronization Comparison Error on Array 1 at LBA 0x3a3857ff

Det ligger over 37.000 slike feilmeldinger i systemloggen i løpet av en 90 minutters periode, alle med nærmest løpende hexa-adresser.

 

Kan dette bety at paritetsinformasjonen ikke er komplett for alle dataene, og at jeg risikerer å miste data hvis en av diskene i arrayet skulle ryke? Eller er det en av de 4 diskene som ikke henger helt med, til tross for at Promise-programvaren rapporterer alle diskene til å være "Functional" i S.M.A.R.T status?

 

Jeg har tatt vare på systemloggen med alle disse feilmeldingene, hvis det skulle være behov for å se på disse.

Lenke til kommentar
Videoannonse
Annonse
Data inconsistent during synchronization. Normally this

is due to parity error for RAID 5 or mis-compare for RAID

1

Så manualen til kortet var ikkje noe mer å bli klok på! Er det mulig å resynkronisere arrayet? Og har du dei gamle 200GB diskane - så du ikkje trenger å bekymre deg for dataene? Og hvilket OS bruker du, og har du noen ledige on-board S-ATA kontakter?

Lenke til kommentar
Data inconsistent during synchronization. Normally this

is due to parity error for RAID 5 or mis-compare for RAID

1

Så manualen til kortet var ikkje noe mer å bli klok på! Er det mulig å resynkronisere arrayet? Og har du dei gamle 200GB diskane - så du ikkje trenger å bekymre deg for dataene? Og hvilket OS bruker du, og har du noen ledige on-board S-ATA kontakter?

 

Jeg har de gamle diskene, så dataene har jeg "backup" av der uansett. (Nummererte hvilken disk som var til hvilken port på kontrolleren, så jeg regner da med at det er bare å sette dem inn igjen og så vil det gamle raidet være oppe å gå igjen).

 

Dette er andre gang jeg foretok en slik synkronisering etter at jeg satte opp det nye arrayet, men fikk samme feilmeldinger første gang også, så programvaren fra Promise har ikke mulighet til å rette opp i problemet slik det ser ut for meg.

Slik det er nå får jeg både lest og skrevet til arrayet, så det "fungerer". Jeg vil bare unngå at jeg mister data hvis en disk skal feile, iom. at det er jo i utgangspunktet hvorfor jeg har satt opp et raid5.

 

Maskinen kjører Windows 2000 Server, så alle partisjonene er jo da NTFS.

 

Det ser faktisk ut til at jeg har en ledig sata-port på hovedkortet (et gammel Asus P4PE) - hadde ikke trodd det, så jeg har brukt en av de andre maskinene mine til å overføre filer til/fra. Dersom jeg ikke finner ut en løsning på dette problemet, kommer jeg til å stikke ut og kjøpe en ny disk jeg kan bruke som midlertidig lagring av dataene på raidet, før jeg sletter og lager et nytt raid fra scratch. Disk kan man aldri få nok av uansett...

Lenke til kommentar

Du kan jo vel enkelt og greit prøve å boote uten en av diskene og se om arrayet er intakt? Det skal jo kunne kjøres degraded mode med en disk ute av drift. (Støtter kontroller/disker hotswap kan du bare plukke ut en disk og se om dataene er intakt, og om de kommer tilbake i synch etter du får satt disken tilbake (den bør bli merket som stale og rekonstruert.

 

Tanken bak os og ledige sata porter var å bruke software raid istedenfor promise kontrolleren, denne har vel ikkje dedikert xor cpu - men bare en sata chip og bios? Og da kunne du jo satt opp nytt raid i software og overført data til det nye arrayet, om du hadde nok sata porter vel å merke. Selv Win2k støtter raid5 i software men usikker på online expansion.

 

så en liten digresjon;

 

Med mindre du har en skikkelig hardware kontroller (i.e. dyyyr), eller veldig svak maskinvare så er linux og software raid helt sjef. Ytelsen er på høyde med dyre kontrollere så lenge du har litt CPU, og uansett kan du alltid flytte diskene over til et annet system, med en annen kontroller og det 'bare virker'. Selv FreeBSD som låg litt etter klarer å fylle en gigabit link med 4 disker og en Amd XP3200+ (så kan du ta kostanden for CPU vs hardware raid, og se hvem som kommer best ut)

 

Og uansett hva som skjer, så har du alle muligheter til å redde dataene dine om du er på et godt dokumentert software raid, hadde eg ikkje hatt full kontroll over rekonstruksjonen kan eg aldri tenke meg at eg hadde klart å redde dataene mine når en nisse av dimensjoner byttet feil harddisk i arrayet mitt. Alstå eg hadde plutselig en stale/gammlel(?) disk og en som var deffekt og gjorde det umulig å rekonstruere den som hadde blitt byttet. Men eg kunne ta ned arrayet, kjøre det opp som read only, og mer eller mindre manuelt overføre det som hadde blitt rekonstruert til den originale disken slik at den var oppdatert og tvinge den tilbake i arrayet og så bytte ut den egentlig defekte harddisken...

Lenke til kommentar
Du kan jo vel enkelt og greit prøve å boote uten en av diskene og se om arrayet er intakt? Det skal jo kunne kjøres degraded mode med en disk ute av drift. (Støtter kontroller/disker hotswap kan du bare plukke ut en disk og se om dataene er intakt, og om de kommer tilbake i synch etter du får satt disken tilbake (den bør bli merket som stale og rekonstruert.

 

Tanken bak os og ledige sata porter var å bruke software raid istedenfor promise kontrolleren, denne har vel ikkje dedikert xor cpu - men bare en sata chip og bios? Og da kunne du jo satt opp nytt raid i software og overført data til det nye arrayet, om du hadde nok sata porter vel å merke. Selv Win2k støtter raid5 i software men usikker på online expansion.

 

Min Promise-kontroller støtter hotswap, og den har faktisk også en XOR-prosessor: PDC 20621 lagd av Promise selv. Promise SX140 TX4 derimot har ikke en XOR-prosessor.

 

Uansett fant jeg ut at det å sitte å feilsøke om en disk er gåen, for så å bruke nye 29 timer på en rebuild av arrayet er rett og slett ikke noe jeg gidder - jeg har bedre ting å drive med på en lørdagskveld :) Så jeg tok meg en kjapp tur til Netshop Oslo og kjøpte meg en ny disk som jeg skal bruke til å midlertidig lagre data fra raidet på, mens jeg lager et nytt array med 4 disker fra start, for så å kopiere data tilbake til arrayet. Dersom det er løsningen på problemet jeg har hatt med arrayet sålangt, så har jeg en Mythtv-boks (Mythdora) stående i stuen som uansett har behov for mer lagringskapasitet. Som jeg sa tidligere: Man kan aldri få nok lagringskapasitet...

 

 

så en liten digresjon;

 

Med mindre du har en skikkelig hardware kontroller (i.e. dyyyr), eller veldig svak maskinvare så er linux og software raid helt sjef. Ytelsen er på høyde med dyre kontrollere så lenge du har litt CPU, og uansett kan du alltid flytte diskene over til et annet system, med en annen kontroller og det 'bare virker'. Selv FreeBSD som låg litt etter klarer å fylle en gigabit link med 4 disker og en Amd XP3200+ (så kan du ta kostanden for CPU vs hardware raid, og se hvem som kommer best ut)

 

Og uansett hva som skjer, så har du alle muligheter til å redde dataene dine om du er på et godt dokumentert software raid, hadde eg ikkje hatt full kontroll over rekonstruksjonen kan eg aldri tenke meg at eg hadde klart å redde dataene mine når en nisse av dimensjoner byttet feil harddisk i arrayet mitt. Alstå eg hadde plutselig en stale/gammlel(?) disk og en som var deffekt og gjorde det umulig å rekonstruere den som hadde blitt byttet. Men eg kunne ta ned arrayet, kjøre det opp som read only, og mer eller mindre manuelt overføre det som hadde blitt rekonstruert til den originale disken slik at den var oppdatert og tvinge den tilbake i arrayet og så bytte ut den egentlig defekte harddisken...

 

Jeg er godt klar over software-raid i Linux (og Windows) har sine fordeler, men jeg er godt fornøyd hvordan jeg har satt opp mine maskiner nå (så lenge de bare virker... ;)). Hadde de forskjellige linux-variantene som eksisterer i dag, eksistert når jeg satt og knotet for å installere RH 5.2 (eller hvilken versjon det var - kastet de cd'ene og manualene for leeenge siden, må ha vært bortimot 10 år siden.) så hadde jeg nok ganske sansynlig brukt en eller annen linux-variant som server i dag.

 

Godt mulig jeg setter opp en linux-server en dag, med enten ny eller gammel hardware. Men slik hverdagen min er i dag er ikke dette jeg kommer til å prioritere så veldig, med mindre jeg tar meg litt ferie og setter i gang et lite prosjekt. Kanskje jeg kan kombinere det med å sette opp en dedikert backend til min Mythdora-installasjon (siden jeg hverken kan eller er interessert i å putte så mange disker inn i den pga plassering og kabinett).

 

Jeg har alltid vært veldig interessert i data, og hvordan alt fungerer. Men jeg kommer aldri til å sette opp et system (hverken hardware eller software) med mindre jeg også samtidig lærer meg det, slik at jeg ikke behøver å slå opp i en manual/faq eller stille spørsmål på et forum for hver minste lille sak. Det er ihvertfall det jeg prøver på :)

Lenke til kommentar

En liten oppdatering:

 

Etter å ha slettet det eksisterende raidet, opprettet det pånytt med 4 disker og kopiert alle data tilbake, får jeg nå ingen feilmeldinger etter å ha synkronisert paritetsdataene. En evt. fremtidig oppgradering av kapasitet kommer mest sansynlig ikke til å bruke denne raid-kontrolleren her... ;)

 

For meg er denne saken avsluttet, selv om problemstillingen egentlig ikke er løst.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...