3.3GHz Athlon 64 FX Med ny verdensrekord i SuperPI

pskard · 12. oktober 2003

Det nye i Prescott er (om jeg husker alt):
-Mer cache (dobbelt så mye L1 og L2 som NW) - bra

-Mer tracecache - bra

-Bedre branch prediction - meget bra

-PNI - tja (må implementeres i software ergo ikke noe poeng ennå)

-Lengre pipelines - "dårlig" (22 steg mot 20 i Northwood)

Kommer det ikke 10-15 nye instruksjonsett og da?

Du kan ikke utdype dette med pipelines?

Er litt mørkt ang dette. Det eneste jeg veit om de er at desto lengere, desto verre. :oops:

PNI er de nye intruksjonssettene. Det tar mange år før det i praksis blir noe poeng derimot. Selv SSE2 er ikke støttet av så mye i dag... PNI er også mye vanskeligere å optimere for da det har mye med HyperThreading å gjøre. SMT er vanskelig og ressurskrevende å optimere for.

Pipelines:

-Desto lengre desto flere MHz kan en oppnå (veldig forenklet)

-Desto lengre desto dårligere ytelse pr MHz (veldig forenklet)

Hva ligger i en pipeline? En får inn en intruksjon så går den til SCAN/ALIGN som deler opp i operasjoner som CPUen skal gjøre. Så legges det inn i pipelinen for å bli utført. VELDIG FORENKLET. Noen som kan mer om dette (ufo?) kan sikkert gi en langt bedre forklaring på det.

LoS · 13. oktober 2003

Pipelines:
-Desto lengre desto flere MHz kan en oppnå (veldig forenklet)

-Desto lengre desto dårligere ytelse pr MHz (veldig forenklet)

Vil det da si at hvis Intel beholder 3,2 ghz med prescott og heller gjør pipelines kortere og kortere for være nye cpu så vil disse yte bedre.

Slik som AMD gjør. Athlon har vel en del kortere pipelines enn Pentium, slik at det er det som gir AMD pr-ratingen sin.

Slik at 1,833Ghz tilsvarer omtrent 2,5Ghz?

Noen som kan mer om dette (ufo?) kan sikkert gi en langt bedre forklaring på det.

Håper han ser denne posten, en person med mye peiling ang slikt trenger jeg/vi

Manuel · 13. oktober 2003

Pipelines:
-Desto lengre desto flere MHz kan en oppnå (veldig forenklet)

-Desto lengre desto dårligere ytelse pr MHz (veldig forenklet)

Vil det da si at hvis Intel beholder 3,2 ghz med prescott og heller gjør pipelines kortere og kortere for være nye cpu så vil disse yte bedre.

Slik som AMD gjør. Athlon har vel en del kortere pipelines enn Pentium, slik at det er det som gir AMD pr-ratingen sin.

Slik at 1,833Ghz tilsvarer omtrent 2,5Ghz?

Det er høy klokkefrkvens Intel hadde i tankene når de designet P4, og da er en lang pipeline nødvendig (hvertfall med dagens teknologi og med den klokkefrekvensen P4 kjører på). Siden AMD64 har en "generell" pipelinedybde på 11 steg i motsetning til p4 med sine 25 steg og Prescott som har 30, så tar det mye lengre tid å "flushe" pipelinen. Men det er ikke bare piplinen som avgjør ytelsesforskjellen pr. Mhz, og da blir diskusjonen mye mer komplisert. Heldigvis, for Intel, så er ikke multimediaprogrammer så veldig "branch" intensive, så P4 vil her yte godt av sin høye klokkefrekvens. Forresten så kommer nok ikke Prescott til å yte mindre enn P4 pr. Mhz fordi større trace cache, cache og mer komplisert branch prediction vil veie opp for dette

pskard · 13. oktober 2003

Vil det da si at hvis Intel beholder 3,2 ghz med prescott og heller gjør pipelines kortere og kortere for være nye cpu så vil disse yte bedre.

Slik som AMD gjør. Athlon har vel en del kortere pipelines enn Pentium, slik at det er det som gir AMD pr-ratingen sin.

Slik at 1,833Ghz tilsvarer omtrent 2,5Ghz?

I teorien har du nok rett i det, men i praksis vil det trolig føre til at de ikke får til like mange MHz. Det er en avveing. Sier ikke at det ene er bedre enn det andre, da det er fordeler og ulemper med det.

Athlon XP har en 10 stage pipeline

Athlon 64 har 12 stage

P4 Northwood har 20

P4 Prescott får 22 (sies det)

Lange pipelines er "dårlig" fordi (som det blir skrevet over) de, til tider, må tømmes og fylles opp på nytt.

Dette skjer: Du skriver en mail i Outlook. Så trykker du, ved en feiltakelse, på "lukk vinduet". Før du får svart om du virkelig vil lukke mailen eller ikke har CPU-en gjettet at du kommer til å svare "Ja" eller "Nei". La oss si at CPU-en tipper "Ja, du vil lukke den". Så fylles pipelinene opp med informasjon om hva CPU-en skal gjøre for å lukke mailen. Dette valget/gjettet utføres branch prediction enheten på CPU-en.

Du derimot velger "Nei" (eller Cancel) og fortsetter å skrive på mailen. Da må CPU-en tømme alt den har i pipelinen og fylle det opp på nytt med annen data. Dette tar tid og desto lengre pipeline, desto mer tid tar det.

Håper det forklarte litt mer om ulempene og fordelene med lange pipelines.

Manuel · 13. oktober 2003

Athlon XP har en 10 stage pipeline

Athlon 64 har 12 stage

P4 Northwood har 20

P4 Prescott får 22 (sies det)

Jeg trodde de "offisielle" tallene for den "generelle" pipelinedybden var som følger:

Athlon XP - 10 steg

Athlon 64 - 11 steg

P4 - 25 steg

Prescott - ~30+ steg

:shrug:

I alle de nevne tilfellene så gjelder bare dette i "best case". Hvis p4 får en "branch miss" eller "cache miss" så vil antall steg bli opp mot 30, og hvis instruksjonen skal gjennom FPUen så øker den ytterligere (hvertfall på Athlon). Det som er interessant her er at typiske RISC-CPUer som G4 har en pipelinedybde på 4 steg, mens G4e har 7 steg...

Logg inn

3.3GHz Athlon 64 FX Med ny verdensrekord i SuperPI

Anbefalte innlegg

pskard

Lenke til kommentar

Videoannonse

LoS

Lenke til kommentar

Manuel

Lenke til kommentar

pskard

Lenke til kommentar

Manuel

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Opprett konto

Logg inn

Hvem er aktive 0 medlemmer