Gå til innhold
Trenger du hjelp med PCen? Still spørsmål her! ×

Problem med plutselig reboot


Gjest Slettet-Pqy3rC

Anbefalte innlegg

Gjest Slettet-Pqy3rC

NB: Ny maskin (3 uker), all hardware er ny.

 

Hardware:

 

Mobo: Gigabyte GA-MA790FX-DS5

CPU : 9850BE

RAM : 8Gb Mushkin PC8500

GPU : HSI 3870

PSU : Corsair 620w

OS : XP x64

Kab : CM Cosmos S

 

Temps:

 

CPU : 40-45

Mobo: 40-43

GPU : ca 70 on load

 

Problem:

 

Maskinen rebooter plutselig. Windows satt til ikke å reboote ved feil, omstarten etterlater heller ingen memory dump.

Kan kjøre opptil 2 døgn smertefritt før reboot intreffer, andre ganger bare i 10 min.

Reboot kommer selv om maskinen ikke er i aktiv bruk. Det vil si dersom jeg går fra den vil den boote før eller senere selv om kun windows desktop er oppe.

 

Annet:

 

Maskinen var klokka, nå er alt på stock (failsafe defaults) pga problemet.

Maskinen er kobla opp mot en UPS som også gir strøm til en annen maskin som fungerer smertefritt.

Kjører Memtest86+ 1.70 for øyeblikket, ingen feil etter ca 4 timer.

 

 

Noen som har noen innovative forslag til hva jeg kan prøve ?

Lenke til kommentar
Videoannonse
Annonse
Gjest Slettet-Pqy3rC

PC'en kjørte MemTest86+ 1.70 i 20 timer uten feil.

 

På meg virker det som om PC'en mister strømmen et øyeblikk og dermed den rebooter, derfor har jeg nå flytta den vekk fra UPS'en som et første "feilsøkings trinn".

 

Fortsatt ingen som har noe å komme med ?

Lenke til kommentar
Gjest Slettet-Pqy3rC

Power rett i veggen hjalp ikke, rebooter fortsatt.

 

Nå har jeg også lagt merke til at musa (Logitech G5) ikke alltid er med når windows kommer opp. Ingenting lyser på den og peker reagerer ikke. Dette skjer ikke hver gang, men innimellom.

 

Maskinen rebooter ofte under oppstart av windows etter en plutselig reboot. Altså; Dersom maskinen har vært i drift noen timer og plutselig rebooter vil den ofte reboote også under påfølgende oppstart av windows. Dersom jeg lar den være av noen minutter etter en plutselog reboot før jeg slår den på går oppstart bra.

 

Disse rebootene gir altså aldri noen memorydump eller BSOD, virker på meg som om strømmen bare forsvinner.

 

Et annet poeng er at maskinen kun rebooter når windows kjører. Dersom jeg er inne i BIOS eller kjører MemTest86 (altså ikke startet Windows) virker den dønn stabil.

Endret av Slettet-Pqy3rC
Lenke til kommentar
Gjest Slettet-Pqy3rC

Forskning på denne maskinens liv og lagnad har resultert i konklusjonen at skjermkortet (eller drivere) er årsaken til reboot.

 

Jeg avinstallerte alt av drivere til 3870 kortet og kjørte som "Generic VGA card" ei stund og det resulterte stabil drift.

 

Drivere (8.6) på plass igjen (dvs. nesten for Catalyst starter ikke lenger, men driverne funker). Ting som F@H-GPU2 og spill kan ikke kjøre særlig lenge (max 24 timer) før maskina tar en reboot.

 

Og her er en litt underlig ting:

Dersom jeg kjører F@H-GPU2 eller LFS til maskina reboter (2 - 24 timer) vil den reboote flere ganger på rad (1 - 5 min etter hver oppstart) selv om 3D delen av kortet ikke brukes.

 

Det kan virke som det kanskje er tempen i HSI kortet som blir altfor høy ved langvarig bruk og dermed reboot ?

 

Windows Event Viewer gir forresten denne:

0000000001: 2008-06-26 18:54:14:837 Failed to merge manifest file: C:\Program Files (x86)\ATI Technologies\ATI.ACE\Core-Static\Core-Static.xml with exception: Could not find file 'C:\Program Files (x86)\ATI Technologies\ATI.ACE\Core-Static\Core-Static.xml'.

Error Called by: ATI.ACE.CLI.Foundation.XManifestation::ReadManifest processID:02388 threadID:( ) domainName:(ccc.exe ) assemblyName:(CLI.Foundation.XManifest, Version=2.0.3036.28032, Culture=neutral, PublicKeyToken=90ba9c70f846762e)

som muligens er årsaken til at Catalyst ikke vil starte, noen som har vært borti den før ?

Lenke til kommentar
  • 1 måned senere...
Gjest Slettet-Pqy3rC
Forskning på denne maskinens liv og lagnad har resultert i konklusjonen at skjermkortet (eller drivere) er årsaken til reboot.

Er ikke så sikker på den påstanden lenger.

 

Nå tar det opptil 3 uker før den booter, men dersom jeg kjører F@H-GPU2 går det sjelden mer enn et døgn før plutselig re-boot. Maskinen booter altså selv om 3D-delen i 3870 kortet ikke er i drift (men 2D benyttes selvfølgelig hele tiden).

 

Ingenting spesielt i noen event logger. Ingen meldinger fra windows når maskinen kommer opp etter re-boot (ser ut som en vanlig oppstart).

 

Maskinen re-booter uten at jeg gjør noe spesielt. Nå nettop satt jeg to meter unna uten å røre hverken mus eller tastatur da den plutselig restarta, det var ingenting spesielt som kjørte på den (CMD, Mailklient, IE, Notepad ...). Vifter etc. stopper ikke å gå, så det er ikke strømmen som forsvinner selv om det kan virke slik om en kun ser på det som foregår på skjermen.

 

Mysterium. Jeg må vel til å bytte en etter en av komponentene. Svarte!

Lenke til kommentar

Kan være noe som er løst , dårlig kontakt.

Eks på dette er connectorer/pins inne i ATX/P4/P4-8pin/PCI-E/MOLEX strøm kontakter som har sklidd litt ut , sjekk alle.

Annet du må sjekke er at du ikke har noen spacere for mye mellom kab og hk , samt at kortet ikke står i spenn (løsne "litt" på skruene).

DDR2 240pin sokler kan noen ganger være tighte/harde å sette memory i , sjekk at modulene er "helt" nedi.

Mistet system/os disk fører til restart , sjekk SATA kabler og at de ike har skarpe bøyer.

Sjekk hendelsesliste/eventlog i windows etter spor

Endret av syar2003
Lenke til kommentar
Gjest Slettet-Pqy3rC
Kan være noe som er løst , dårlig kontakt.

Eks på dette er connectorer/pins inne i ATX/P4/P4-8pin/PCI-E/MOLEX strøm kontakter som har sklidd litt ut , sjekk alle.

Annet du må sjekke er at du ikke har noen spacere for mye mellom kab og hk , samt at kortet ikke står i spenn (løsne "litt" på skruene).

Bestemt meg for å bytte skjermkortet (det skulle byttes til 4870 før ellet senere uansett). Skal gå over alt av kabling i den forbindelse. Det er ikke for mange "Spacere" (hva heter de der skruene egentlig?)

DDR2 240pin sokler kan noen ganger være tighte/harde å sette memory i , sjekk at modulene er "helt" nedi.

Kjørt Memtest86 såpass lenge totalt nå (70+ timer) at jeg tviler sterkt på det er minnet.

Mistet system/os disk fører til restart , sjekk SATA kabler og at de ike har skarpe bøyer.

Sjekk hendelsesliste/eventlog i windows etter spor

Hmm... SATA skal sjekkes nøye (det er 4 disker i 2xRAID0 i maskina). Har faktisk oppleved at 1 av (de 4 fysiske) diskene ikke blir funnet ved boot (må re-boote så er den der igjen) et par ganger på denne maskina. Det kan jo kanskje indikere et eller annet, selv om det altså kun har skjedd et par ganger (under vanlig oppstart og ikke etter "sudden re-boot").

Lenke til kommentar
  • 3 uker senere...
Gjest Slettet-Pqy3rC

Hmm... snodig maskin dette. Tok nettopp en kabelsjekk og bytta samtidig samtlige SATA kabler.

 

Prøvde også å ta ut 4Gb RAM (det er 8Gb totalt), men da boota ikke maskinen i det hele tatt, jeg kom ikke engang inn i BIOS. Orka ikke å resette BIOS pga andre parametre så jeg måtte sette i de 4 gig'sa igjen.

 

Har også skrudd av en del stæsj i Winx64, det er nå ingen "pagefile" eller "System restore" på diskene.

 

Satt igang folding@home igjen på den, så får vi etterhvert se om den restarter etter kabelbyttet.

 

"C:" disken på maskina er et RAID0 bestående av 2 150Gb disker via HK'ets (AMD) RAID kontroller. Jeg lurer på om det er dette som kan skape dritten (dårlig on-board disk kontroller)?

Endret av Slettet-Pqy3rC
Lenke til kommentar
Gjest Slettet-Pqy3rC

Takk for innspill alle sammen.

Denne maskinen har etterhvert blitt til en slags "gåte" jeg må løse og jeg gir meg ikke med det første.

 

Dette hjelper kansje ikke så mye, men det tar 1 minutt å sjekke.

Er PSU varm når den restarter.

Hvis min PSU går varm så restarter maskinen uten forvarsel.

 

Skal holde et øye på den neste gang jeg ser maskinen booter. Dog er jeg tvilende til om det er PSU'en, den er ny, kraftig nok og av bra kvalitet. Dessuten kjører memtest86 uten problemer i flere dager.

 

Sjekk PSUen din. Evt. atx kontakta etter svimerker. Eller skru opp PSUen. Jeg hadde noe lignende problem med min maskin tidligere, og der var en pinne på ATX kontakta sortsvidd. Åpnet da PSU og fant en smeltet kondensator.

 

Jeg sjekka all kabling (alt ut, undersøke og så inn igjen) i går når jeg bytta SATA kablene. Alt så greit ut.

 

Kan være en små defekt på hovedkortet .

Sprekk/krakkelering i pcb lanes , lodde punkter eller liknende .

 

Kan være. Jeg tror mest på at problemet ligger i hardware siden det ikke kommer hverken BSOD eller memorydump når maskinen re-booter. Maskinen kjører imidlertid memtest86 uten problemer i flere dager så svakheten må da i tilfelle ligge på et litt underlig sted.

 

Jeg mistenker diskene / diskkontroller nå fordi all bruk av BIOS (sto inne i BIOS menyene i 4 dager i strekk) og memtest86 (100+ timer tilsammen over 3 økter) går helt smertefritt. Ingen feil, ingen reboot. Tror derfor at problemet ligger et sted i hardware som ikke er i bruk ved kjøring av BIOS/memtest.

 

Kjøring av BIOS menyene og memtest86 benytter ikke diskene og/eller diskkontroller, men rimelig mye av den sentrale maskinvaren ellers (Skjermkort (2D), RAM, cpu etc).

Endret av Slettet-Pqy3rC
Lenke til kommentar

Ser at Syar kommer med flere gode forslag.

 

At du har problemer med å starte pcen når du fjerner minne får meg til å tenke på at det er muligens noen problemer der, du bruker også memtest86+ v1.70, kanskje lurt å prøve med 2.01 da denne inneholder en del bugfixes?

 

Maskinen har også vært overklokket og det ser ut som problemene kommer ved intensive kalkyler ved bruk av gpu folding, kan jo være at du må sjekke at Chipsett fortsatt får riktig kjøling, dvs demonter kjøleløsninga og sjekk at det var / er god kontakt mellom denne og chipsett. Tenker litt på at Goopen muligens kan ha blitt varmet opp og kontakten blitt litt dårligere pga at denne har flytet litt ut.

 

Jeg har selv greid å ta knekken på PCIe1x sporene på pcen min når jeg monterte kjøleren min, ripet desverre opp hovedkortet når jeg brukte skrujern som brekkjern noe som fungerte dårlig. Hovedkortet mitt fungerer ellers veldig bra og stabilt (dog uten pci-e porter).

 

Andre ting som kan prøves er å få oppdatert Bios med ny firmware, dog du bør nok være 100% sikker (med ny memtest 2.01) at det ikke er problemer med minnet ditt. Sjekk også at Backup bios ikke laster seg selv inn (I tilfelle hoved er korrupt) da dette kan gi deg litt pekepinner på hva som er problemet.

 

 

Ellers så er jo det ting som tyder på at det kan være rester av ati driverne som gjør ugang, noe som bør fikses ved bruk av Drivercleaner som er et verktøy som kan fjerne det meste av eldre drivere riktig. http://www.drivercleaner.net/

Om du bruker xp så kan du jo laste ned freeware versionen.

Lenke til kommentar
Gjest Slettet-Pqy3rC
At du har problemer med å starte pcen når du fjerner minne får meg til å tenke på at det er muligens noen problemer der, du bruker også memtest86+ v1.70, kanskje lurt å prøve med 2.01 da denne inneholder en del bugfixes?

Jeg skal få tak i 2.01 og kjøre den ved neste test.

Maskinen har også vært overklokket og det ser ut som problemene kommer ved intensive kalkyler ved bruk av gpu folding, kan jo være at du må sjekke at Chipsett fortsatt får riktig kjøling, dvs demonter kjøleløsninga og sjekk at det var / er god kontakt mellom denne og chipsett. Tenker litt på at Goopen muligens kan ha blitt varmet opp og kontakten blitt litt dårligere pga at denne har flytet litt ut.

 

Ellers så er jo det ting som tyder på at det kan være rester av ati driverne som gjør ugang, noe som bør fikses ved bruk av Drivercleaner som er et verktøy som kan fjerne det meste av eldre drivere riktig. http://www.drivercleaner.net/

Maskina ver litt overklokket i noen få dager før jeg ble klar over problemet (i mai). Etter det har den kjørt på stock.

Reboot kommer ikke bare ved folding, men det virker som det skjer oftere når folding kjøres. Maskinen kan også reboote uten forvasel selv om den ikke gjør noen verdens ting.

Dersom temp var årsaken ville jeg anta at den var stabil så lenge tempen var lav, noe den ikke er. Jeg har forresten aldri sett at temp har vært høyere enn 50 grader (chipset/cpu) uansett hva maskinen holdt på med.

 

Maskinen kan altså reboote når den står med tomt skrivebord uten å utføre noen oppgaver. Dette tyder egentlig ikke på noen drivere, bortsett kanskje fra diskkontrollere. Skjermkort drivere skal vel ikke finne på noen sprell når maskinen står helt passiv. Slik "instant reboot" som er problemet her tyder heller ikke på software fordi programfeil bør gi BSOD eller ihvertfall en memorydump. Jeg er etterhvert blitt mer og mer overbevist at det er hardware.

Andre ting som kan prøves er å få oppdatert Bios med ny firmware, dog du bør nok være 100% sikker (med ny memtest 2.01) at det ikke er problemer med minnet ditt. Sjekk også at Backup bios ikke laster seg selv inn (I tilfelle hoved er korrupt) da dette kan gi deg litt pekepinner på hva som er problemet.

Hadde ikke kommet noen firmware oppdateringer sist jeg sjekket, men jeg skal sjekke igjen i helga. Dersom dette problemet er forårsaket av firmware er jeg neppe den eneste som sliter...

Lenke til kommentar

Tja, sjekk hvor sensoren til hovedkortet sitter, det kan godt være at chipsett ikke har egen temp sensor og at det som måles er "ambient" eller fra nærligende sensorer plasert på strategiske plasser på hk.

 

En annen ting jeg kom på å tenke på er at om du har logging oppført og du ikke kan se i loggene en feilmelding så betyr det rett og slett at det har vært en øyeblikkelig omstart, noe jeg tviler på at Diskkontrollerne eller minnet kan forårsake (da bør man ha i det minste bsod).

 

Da tror jeg vi kan tenke :

 

*Power.

*HK.

*Cpu.

 

Men uansett greit å få testet 2.01 av memtest også bare for å være på den sikkre siden.

Lenke til kommentar
Gjest Slettet-Pqy3rC
Tja, sjekk hvor sensoren til hovedkortet sitter, det kan godt være at chipsett ikke har egen temp sensor og at det som måles er "ambient" eller fra nærligende sensorer plasert på strategiske plasser på hk.

Ja, jeg skal sjekke sensorplassering. Det skader ikke å vite hvor disse sitter uansett.

En annen ting jeg kom på å tenke på er at om du har logging oppført og du ikke kan se i loggene en feilmelding så betyr det rett og slett at det har vært en øyeblikkelig omstart, noe jeg tviler på at Diskkontrollerne eller minnet kan forårsake (da bør man ha i det minste bsod).

Egentlig, ja. Det er mengelen på memorydumpp og BSOD (øyeblikkelig omstart) som får meg til å være rimelig sikker på at dette skyldes hardwarefeil.

 

Da tror jeg vi kan tenke :

*Power.

*HK.

*Cpu.

Enig. Skjønt jeg testa PSU'en på en annen maskin uten at den oppførte seg unormalt. CPU feil burde muligens ha sammenheng med en eller annen bestemt operasjon, mens omstartene på denne maskina virker å være helt tilfeldige.

Derfor trekker jeg den forløpige konklusjon at det er et eller annet sted/kontaktpunkt på HK'et som er synderen.

 

Merknad:

Maskinen har gått uten feil siden mandag (08.09.08) kveld med GPU folding. Den har før aldri overlevd mer enn 3 døgn med folding aktivt. Hva jeg gjorde på mandag:

- Ut og inn med alle kabler.

- Bytta SATA kabler

- Ut og inn med RAM.

- Deaktiverte XP's "Systemgjenoppretting"

 

... så vi får håpe...

Endret av Slettet-Pqy3rC
Lenke til kommentar

Tror det kan være så enkelt at den ene ram brikken ikke stod helt nede i det ene sporet sitt.

Da får man kontakt men ikke fullstendig , men burde jo strengt tatt fått en del feilmeldinger på minnet da.

 

Får du denne feilen igjen så tror jeg nok vi kan utelukke Sata og muligens diskkontrolleren, av erfaring så vet jeg at vista og xp er flink til å klage når det er feil på denne, feil Id er vel som regel 51 - 55 om jeg ikke husker helt feil og som regel et par klager på ntfs i samme slengen.

 

Det jeg personlig tenker på er at psu muligens er ustabil og gir til tider høye "rippler" disse blir da så kraftige at pcen slår seg av øyeblikkelig. Det kan også være tegn til at en eller annen sikkring i psu er på vippepunktet og du mister power øyeblikkelig innimellom noe som fører til pcen slår seg av øyeblikkelig. En høy rippel kan jo teoretisk slå ut hvilken som helst komponent så det var vel derfor jeg la den inn i lista.

 

Håper at det har løst seg nå i alle fall fordi å feilsøke på kontaktpunkter eller power er ganske så håpløst uten Multimeter og god teknisk innsikt på hva man skal lete etter.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...