Gå til innhold
Trenger du hjelp med PCen? Still spørsmål her! ×

Serveren slår seg av sporadisk


Gjest Slettet+9018234

Anbefalte innlegg

Gjest Slettet+9018234

Ok gutter og jenter, herrer og fruer; Dette er et problem jeg ikke har vært borti før - iallefall ikke av slik karakter. Klarer du denne er du ikke bare god, men det venter også en liten pølse i rosinen...

 

Hovedessensen ligger i følgende:

 

Serveren min som driver www.bakkelun.net har nå begynt å vise merkelige tegn iform av å slå seg av når jeg minst ønsker det. Fra kaldstart av bruker den å slå seg av gjerne etter ca. 1 minutt. Etter at den blir påslått igjen kan den finne på å være på i en uviss mengde tid (10minutter, 1time, 1dag eller kanskje en hel uke om jeg er heldig. Under denne tiden fungerer alt helt utmerket.). Disse sporadiske "avslåingene" har fått meg til å lure hva i all verden det er som feiler boksen.

 

Av ovenfornevnte grunn tok jeg boksen inn til nærmere sjekk. Det viste seg at det oppstod en "blåskjerm" med en brutal melding "Fatal Error" samt noen feilmeldings-koder. Itillegg til dette en tikkende timer med teksten "Dumping memory to disk:".

 

Operativsystemet på serveren vår har ikke vært re-installert på en rekke år (tenker 2-3), og jeg tok derfor beslutningen om å installere hele greia på nytt. (På en helt ny disk). Under testing av den nye installasjonen viste ingen problemer seg gjeldende, og i god formaning om at alt var i skjønneste orden plasserte jeg boksen tilbake på det rommet den stod i fra før. Dagen etter viser samme symptomene seg -igjen!

 

Det var tydelig at feilen ikke lå i OS'et, men i en eller annen hardware. Første tanke gikk mot strømforsyningen og hvorvidt denne kunne være hardt belastet. Serveren består av 3 disker samt det normale av hovedkort, ram og lignende. For ordens skyld:

 

Hovedkort: Abit kx7-333 Socket A (northbridge kjøleren nylig byttet ut til fordel for en ribbe) Lenke

CPU: AMD XP1800+ Socket A

RAM: Apacher 512mb (PC2100) 6ns

CPU-vifte: Artic Cooling Socket A "Copper Silent 3 alias Copper Lite" *Lenke

PSU: Sweex 350W * Lenke (nr.3 fra toppen i skrivende stund på denne siden)

Kabinett: Thermaltake Soprano * Lenke

 

* betyr at denne komponenten er mindre enn 3 måneder gammel, ergo betraktes som ny (og har evnt. garantier i behold)

 

Bare for å være sikker koblet jeg vekk alle diskene unntatt den OS'et er installert på - uten at saken forandret seg det spor. Inspeksjonen gikk videre til RAM-brikkene. Byttet ut minnet med en identisk brikke fra samme leverandør (Apacher 512mb pc2100) som skal være problemfri i et annet minnespor. Heller ikke dette gjorde utfallet noe annerledes.

Til sist sjekket jeg batteriet på hovedkortet (det som tar vare på bios-instillingene dine) via et voltmeter. Spenningen var det ingenting å si på; batteriet levde i sitt beste velgående.

 

Så..da står jeg igjen med hovedsakelig ingen feilkilder som kan være "åpenbare" eller "selvfølgelige". Av denne grunn trenger jeg hjelp av noen som kanskje har tips eller andre råd på hva jeg bør sjekke ut neste. Strømforsyningen skal forøvrig byttes ut med en ny, for å redegjøre hvorvidt vi kan stryke dette punktet fra listen. Serveren har installert Trend SMB Antivirus, Anti-adware og backupløsninger slik at boksen _er_ virus og søppelfri.

 

Det er svært sjeldent jeg opplever pc-trøbbel av slik karakter at jeg trenger "utvendig hjelp", men denne gangen har jeg rett og slett ingen aning (med stor I) på hva eller hvor feilkilden kan være. Jeg vil personlig belønne den som gir tips/råd som leder til "oppklaring" med et par poser twist, bare for å spe på litt om interessen. :)

 

Mvh

Sobient (admin @ bakkelun.net)

Endret av Slettet+9018234
Lenke til kommentar
Videoannonse
Annonse
Gjest Slettet+9018234

Event Viewer i Win2003 tilsier ingen spesielle hendelser under systemkritiske betingelser. Det eneste jeg klarer å se umiddelbart er logger av at boksen har slått seg av samt en lettere uforståelig error-kode.

 

CPU-viften er skiftet ut med noe langt bedre enn hva som tidligere stod i. Temperaturer på system og cpu ligger normalt på:

 

cpu: 49*c

system: alt fra 45-49/50*c.

 

Dette er langt under de temperaturer vi opplevde før. Boksen har tidligere (i 2003 og utover) stått forskjellige steder, bla. i skap hvor temperaturen kunne komme opp i smertefulle 70+.

 

Prosessoren har fulgt oss ganske lenge, dog vi byttet denne ut tidlig i 2005 uten at dette skapte problemer. Problemene var også tilstede før vi skiftet kabinett, noe som ble gjort for mindre enn 3mnd'er siden.

 

Forøvrig takker så mye for svar. Blir sittende en stund til her for å samle inn en del tips og deretter teste dem på boksen.

 

mvh

Sobient

Endret av Slettet+9018234
Lenke til kommentar
Gjest Slettet+9018234

Vel, tingen er det at boksen fungerer helt fint i skrivende stund. Et godt tegn på om serveren er oppe eller ei, er hvorvidt undertegnedes avatar vises eller ikke (den ligger og hostes på serveren).

 

Skal sjekke cpu'en hvorvidt denne har "kjernen i behold" og psu senere idag. Hvilke tegn er verdt å bemerke seg hvis hovedkortet har takket for seg?

 

Forøvrig er det meget besynderlig hvordan alt kan fungere fint (i skrivende stund vel og merke!) hvis noen av disse delene er defekt?

 

edit: Leser forøvrig

 

NB! Socket-A prosessorer er veldig ømtålelige, og lette å skade. Les derfor monteringsbeskrivelsen nøye!

 

Det kan være noe i det du sier her. Men igjen, en skadet cpu "skal" vel ikke fungere?

 

Igjen, takker for svar, det er uendelig hjelpsomt!

 

mvh

Sobient

Endret av Slettet+9018234
Lenke til kommentar

det kommer helt ann på mengden av kjernen som har kippet seg av, er det bare en ørliten del så kan den fungere helt fint helt til du skal bruke noe av det som lå på delen som ble kippet av.

 

en maskin kan fungere fint selv om noen deler er defekte, har selv sett maskiner med ødelagt hk som kjører fint når de først har klart å starte,men pga av hket så er det nesten umulig å starte dem

Lenke til kommentar
Gjest Slettet+9018234

Greit, dette skal etterforskes. Poster bilder av "funnene" (CPU, HK m.m) senere idag/ettermiddag.

 

Takk igjen for svar.

 

mvh

Lenke til kommentar
Gjest Slettet+9018234

Har nå sjekket Ram, CPU og strømforsyning. Resultatene er ikke akkurat overveldende:

 

CPU:

file01871nj.th.jpg

 

RAM

(forside)

file01880wn.th.jpg

(bakside)

file01893cc.th.jpg

 

Ingen av bildene indikerer noen skade på komponentene ved første øyekast. Bildene er scannet slik at det er mulig å forstørre enkelte deler av bildet for nøyere inspeksjon.

 

Har nå forøvrig testet med en annen strømforsyning, uten at jeg ble klokere av dette. Har nå boksen hvor jeg sitter nå, og den har ikke slått seg av en eneste gang (dette gjaldt for begge strømforsyningene når jeg har boksen hvor jeg sitter nå).

 

mvh

Lenke til kommentar
Av ovenfornevnte grunn tok jeg boksen inn til nærmere sjekk. Det viste seg at det oppstod en "blåskjerm" med en brutal melding "Fatal Error" samt noen feilmeldings-koder. Itillegg til dette en tikkende timer med teksten "Dumping memory to disk:".

et lite tips er å sjekke ut feilmeldingskodene her. blir muligens en litt enklere jobb å feilsøke hardware på den måten. :)

Lenke til kommentar
Gjest Slettet+9018234

Boksen har nå stått på i 5 timer her ved siden av hvor jeg sitter uten et eneste problem. Skal forøvrig kjøpe inn et demo-hkkort fra komplett for å være på den sikre siden.

 

Genial lenke forresten el_cash, den er bokmerket og sjekkes ut nå!

 

Bukker og takker for hjelpen sålangt.

 

edit: Nytt hovedkort er underveis. (av denne typen)

 

mvh

Endret av Slettet+9018234
Lenke til kommentar
Gjest Slettet+9018234
Prøv flg.:

 

Kontrollpanel >Administrative verktøy >Hendelsesliste

(evt. Ytelse og Vedlikehold >Adm. verktøy osv)

Se om du finner noen feilrapporter her.

 

Eller bruk 'Dr Watson' og opprett Crashdumpfil.

(Gå inn i hjelp, og skriv Dr Watson)

4994042[/snapback]

 

Hendelsesliste er "Event Viewer" ikke sant? (Har engelsk Windows 2003 server). For denne har jeg sjekket og den tilsier ingenting annet enn at boksen har avsluttet uforutsett med hendelseskode 6008. Kan ta å poste noen slike når jeg kobler til servern igjen.

 

Som alltid - bøttevis med takk, det er til stor hjelp.

 

edit: Her er noen utsnitt fra Hendelsesloggen under System (Ingen av de andre kategoriene har noe bemerkelsesverdig å melde om)

 

Vennligst merk at noen av disse meldingene er i forbindelse med utvikling på serveren og kan ikke taes som grunnlag for "hva som er galt". Jeg har nummerert loggene for å enklere kunne referere til dem. Vennligst merk at her er det mye uforståelig informasjon for det utrente øye!

 

Formateringen på disse loggene følger CSV og er følgende:

 

[DATO, TIDSPUNKT, KILDE, KATEGORI, FEILKODE, SYSTEM, BESKRIVELSE]

 

Hendelser som skjer like før restarten er markert med orange. Hendelsesbeskrivelsen like etter at boksen blir restartet igjen er markert med rødt.

 

Logentry #0

 

12.10.2005,21:28:36,EventLog,Error,None,6008,N/A,-SERVER-,The previous system shutdown at 11:43:01 AM on 10/12/2005 was unexpected.

 

12.10.2005,07:00:30,Service Control Manager,Information,None,7036,N/A,-SERVER-,The MySQL service entered the running state.

 

12.10.2005,07:00:30,Service Control Manager,Information,None,7035,-SERVER-\Administrator,-SERVER-,The MySQL service was successfully sent a start control.

 

12.10.2005,05:53:01,Service Control Manager,Information,None,7036,N/A,-SERVER-,The Application Layer Gateway Service service entered the running state.

 

12.10.2005,05:53:01,Service Control Manager,Information,None,7035,NT AUTHORITY\SYSTEM,-SERVER-,The Application Layer Gateway Service service was successfully sent a start control.

 

12.10.2005,05:53:01,Service Control Manager,Information,None,7036,N/A,-SERVER-,The Windows Firewall/Internet Connection Sharing (ICS) service entered the running state.

 

 

Logentry #1

Denne loggen viser kanskje noe som er mer representativt hvor serverens oppførsel. Her kan vi tydelig se 2 restarter med ganske korte mellomrom. Vennligst merk at datoene er ikke korrekte ihenhold til den faktiske datoen denne loggen ble utført. Vi sjekket bios-batteriet (les tidligere tråd), og alt av datoinstillinger ble derfor tilbakestilt! Datostemplingen for denne loggen mener jeg er 11/10-05. Tidspunktene er likevel representative.

 

02.01.2002,04:23:56,EventLog,Error,None,6008,N/A,-SERVER-,The previous system shutdown at 3:20:18 AM on 1/2/2002 was unexpected.

 

02.01.2002,04:20:26,IPSec,Information,None,4294,N/A,-SERVER-,"The IPSec driver has entered Secure mode. IPSec policies, if they have been configured, are now being applied to this computer."

 

02.01.2002,04:20:02,IPSec,Information,None,4295,N/A,-SERVER-,"The IPSec Driver is starting in Bypass mode. No IPSec security is being applied while this computer starts up. IPSec policies, if they have been assigned, will be applied to this computer after the IPSec services start."

 

02.01.2002,04:20:22,AeLookupSvc,Information,None,3,N/A,-SERVER-,The Application Experience Lookup service started successfully.

 

02.01.2002,04:20:18,DCOM,Information,None,10026,N/A,-SERVER-,The COM sub system is suppressing duplicate event log entries for a duration of 86400 seconds. The suppression timeout can be controlled by a REG_DWORD value named SuppressDuplicateDuration under the following registry key: HKLM\Software\Microsoft\Ole\EventLog.

 

02.01.2002,04:20:18,EventLog,Information,None,6005,N/A,-SERVER-,The Event log service was started.

 

02.01.2002,04:20:18,EventLog,Information,None,6009,N/A,-SERVER-,Microsoft ® Windows ® 5.02. 3790 Service Pack 1 Uniprocessor Free.

 

Logentry #1-2

 

02.01.2002,04:20:18,EventLog,Error,None,6008,N/A,-SERVER-,The previous system shutdown at 12:21:45 AM on 10/11/2005 was unexpected.

 

11.10.2005,00:06:18,Service Control Manager,Information,None,7036,N/A,-SERVER-,The WinHTTP Web Proxy Auto-Discovery Service service entered the running state.

 

11.10.2005,00:06:18,Service Control Manager,Information,None,7035,NT AUTHORITY\SYSTEM,-SERVER-,The WinHTTP Web Proxy Auto-Discovery Service service was successfully sent a start control.

 

-----

 

 

Konklusjon: Det er vanskelig å si hva som er årsaken fordi det er forskjellige hendelser som skjer like før serveren slår seg av. Likevel viser mange av loggene at "IPSec" er det siste som blir registrert før alt slåes av.

 

 

mvh

Endret av Slettet+9018234
Lenke til kommentar
Gjest Slettet+9018234

Her er forresten forklaringen på ERRORCODE: 6008

 

Detaljer

Produkt: Windows Operating System

ID: 6008

Kilde: EventLog

Versjon: 5.0

Komponent: System Event Log

Symbolsk navn: EVENT_EventlogAbnormalShutdown

Melding: The previous system shutdown at %1 on %2 was unexpected.

 

Forklaring

This event indicates that an inconsistency exists between the Browser service and the server service.

 

Brukerhandling

Contact the person with administrative rights on your computer if this message is in the Event Log in Event Viewer more than six times. Otherwise, stopping and restarting the server will eliminate the error.

 

 

Versjon: 5.2

Symbolsk navn: EVENT_EventlogAbnormalShutdown

Melding: The previous system shutdown at %1 on %2 was unexpected.

 

Forklaring

This event is written during startup following an unexpected restart or shutdown. An unexpected restart or shutdown is one that the system cannot anticipate, such as when the user pushes the computer's reset button or unplugs the power cord.

 

If the Persistent Time Stamp group policy setting is either enabled or not configured, system information is written to the data section of this event. This information includes a timestamp that indicates the computer's uptime in seconds before the unexpected shutdown occurred.

 

 

Brukerhandling

One or more of the following actions might help to determine the cause of the unexpected shutdown:

 

Check the system event log for other events that occurred around the same time as the unexpected shutdown.

Find out whether the computer's reset button was pressed, the power cord was unplugged, or a general power failure occurred.

Configure Windows to perform a memory dump of system failures and submit that data to Microsoft for debugging through Windows Error Reporting. For more information about Windows Error Reporting, see Help and Support.

 

mvh

Endret av Slettet+9018234
Lenke til kommentar
Gjest Slettet+9018234

Lufen: Sant nok. Merkelige er likevel at boksen ser ut til å fungere smertefritt nå, og det har den gjort nå i ca. 1 1/2 dag (!). Vet neimen ikke hva som har skjedd, har simpelthen bare testet med en annen psu, sjekket cpu og kablet tilbake slik ting var før. Uansett, skal bytte hovedkort når det kommer i posten.

 

Serveren kan Dere sjekke her: www.bakkelun.net

 

Mvh

Sobient

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...