Gå til innhold

Itanium 2 vinner terreng


Anbefalte innlegg

likevel, er no satans mange transistorer. spørsmålet er om hvor mange kjerner man kunne stappet inn på tilsvarende og sett på hva ytelsen ville blitt da.

Enkelttrådet ytelse ville nok blitt rasert hvis du reduserte alle cache til f.eks 1MB. (Se knick knakk's begrunnelse for cache-mengden lengre opp på denne siden.)

Lenke til kommentar
Videoannonse
Annonse
likevel, er no satans mange transistorer. spørsmålet er om hvor mange kjerner man kunne stappet inn på tilsvarende og sett på hva ytelsen ville blitt da.

Vel hvis vi halverer L3 cache (og sparer dermed 2.1W fra den reduserte cachen) så får vi vel plass til 4 eller 8 Montecito kjerner med egen L1 og L2 cache, tenker jeg. De vil da måtte kjøre ved svært redusert hastighet for å kunne holde seg innen 100W TDP. Det er ikke ønskelig. ytelse/watt vil kanskje kunne økes noe, men ytelsen per tråd blir helt ellendig og ytelse/tråd er langt mer viktig enn mange tror.

 

Ved 45nm vil en kanskje se 16 kjerner per chip eller modul siden effektforbruket per kjerne da vil ha sunket mye. Poenget er å ha så få kjerner som mulig sammtidig som en bruker hele effektbudsjettet uten å tyne kjernene opp i frekvenser hvor en begynner å få alvorlig "diminishing returns" på ytelse/watt. geddit? ;)

 

P3 1.13GHz er et av de best kjente eksemplene på hva som skjer når en tyner en kjerne for langt. En får alvorlig "diminishing returns" på ytelse/watt.

 

simen1 husker sikkert effektforbruket til P3 1GHz og 1.13GHz?

Endret av Knick Knack
Lenke til kommentar
33.9 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA2)

37.5 W (0.18 µm @ 1133EB MHz Pentium III FC-PGA2)

 

http://www.sandpile.org/impl/p3.htm

hm var det virkelig så høyt på 1GHz versjonen også...

 

Når jeg tenker meg om så kan det vel stemme at effektforbruket gikk i taket allerede før 1GHz versjonen av P3 og at 1.13 var cherry picked så det smallt. Det ville forklart den relativt lave forskjellen i effektforbruk, men en kan jo ta PPC970fx som et godt eksempel. 40W ved 2GHz og 100W ved 2.5GHz sier jo sitt. dual core 2GHz vil altså bruke 20W mindre enn en 2.5GHz singel core. Det er hele poenget.

 

Watt = Konstant x frekvens x Volt^2 + e er vel den vanlige måten å regne ut effekttap på. Så må en se det opp mot økning i ytelse som ikke nødvendigvis er lik som økningen i MHz.

Det er korrekt, men en må huske at volt er en funksjon av frekvensen. Det gjør det hele litt vanskelig hvis en ikke kjenner shmoo kurven til prosessoren.

 

IBM PowerPC 970FX power envelope and power management

article7_2.jpg

Den nederste linja i diagrammet er resultatet av shmoo kurven. shmoo kurven er frekvens/volt sammenhengen. Dette er frekvens/watt sammenhengen. Øverste kurve er hva en får om en kun reduserer frekvensen uten å redusere spenningen. Ikke mye effektivt som en ser.

Endret av Knick Knack
Lenke til kommentar
simen1 husker sikkert effektforbruket til P3 1GHz og 1.13GHz?

Det var ganske mye høyere enn modellene under. Bla. på grunn av en ekstremt høy Vcc på hele 1,8V på 1,133GHz'en. (Alle tidligere modeller med samme kjerne hadde 1,5-1,7V) Max effekt lå på ca 40-50% over det som var normalt på den tiden.

 

(PIII var svært strømgjerrig i forhold til dagens CPU'er så økningen fra rundt 25 til 37,5W max høres kanskje ikke så mye ut nå lengre, men det viser i hvertfall at watt/ytelse-kurven skyter i været hvis man tyner en kjerne for langt)

 

Forøvrig et par hete artikler om PIII-1,133GHz for de som vil sette seg videre inn i begivenheten:

Intel's Next Paper Release: The Pentium III at 1133 MHz

Revisiting Intel's New Pentium III at 1.13 GHz

Lenke til kommentar
hm var det virkelig så høyt på 1GHz versjonen også...

 

Jepp PIII brukte en del Watt da, men det gjorde den hele tiden:

 

29.5 W (0.18 µm @ 866EB MHz Pentium III FC-PGA2)

31.5 W (0.18 µm @ 933EB MHz Pentium III FC-PGA2)

33.9 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA2)

37.5 W (0.18 µm @ 1133EB MHz Pentium III FC-PGA2)

 

Husk at de leverte en low voltage versjon oggå for mobile og de som taklet lavest volt gikk dit.

 

Når jeg tenker meg om så kan det vel stemme at effektforbruket gikk i taket allerede før 1GHz versjonen av P3 og at 1.13 var cherry picked så det smallt.

 

Trolig. Det er opp 27% i Watt og opp 30% i MHz fra 866-versjonen om jeg regnet riktig.

 

Det ville forklart den relativt lave forskjellen i effektforbruk, men en kan jo ta PPC970fx som et godt eksempel. 40W ved 2GHz og 100W ved 2.5GHz sier jo sitt. dual core 2GHz vil altså bruke 20W mindre enn en 2.5GHz singel core. Det er hele poenget.

 

Er det så stor forskjell!! Jesus.. Det var jeg ikke klar over. Poenget ditt er jeg helt med på i det tilfellet (og i forhold til multicore vs singel thread ytelse).

 

 

Det er korrekt, men en må huske at volt er en funksjon av frekvensen. Det gjør det hele litt vanskelig hvis en ikke kjenner shmoo kurven til prosessoren.

 

Enig, men innenfor samme volt kan en kjøre flere hastigheter. Slik sett vil jeg si at effekttap er sterkest korrelert med frekvens, men at en økning i volt medfører en sterk økning i effekttap.

 

I P3-tilfellet var det kun frekvens som hadde endret seg så langt jeg kunne se fra Sandpile.

 

Mvh,

 

Per Øivind

Lenke til kommentar
IBM PowerPC 970FX power envelope and power management

http://www-03.ibm.com/technology/power/new.../article7_2.jpg

 

Den nederste linja i diagrammet er resultatet av shmoo kurven. shmoo kurven er frekvens/volt sammenhengen. Dette er frekvens/watt sammenhengen. Øverste kurve er hva en får om en kun reduserer frekvensen uten å redusere spenningen. Ikke mye effektivt som en ser.

Takk for den flotte shmoo-kurven. Vet du hvor man kan finne tilsvarende kurver for nyere x86 CPU'er?

 

Jeg har selv laget slike empiriske kurver for mange av de CPU'ene jeg har kjøpt for overklokking, men de er kun her i mine egne regneark og for et svært begrenset utvalg CPU'er: PentiumMMX 166, Celeron 300A, K6-2 350, Duron 600, Duron 700, Athlon 1GHz, Athlon XP 1800+ Palomino, Athlon XP 1700+ Tbred-B, AthlonXP 2500+. (Huff her var det veldig ensidig med produsenter, men jeg har ikke laget noen kurver for Intel-CPU'ene mine).

Endret av Simen1
Lenke til kommentar
IBM PowerPC 970FX power envelope and power management

http://www-03.ibm.com/technology/power/new.../article7_2.jpg

 

Den nederste linja i diagrammet er resultatet av shmoo kurven. shmoo kurven er frekvens/volt sammenhengen. Dette er frekvens/watt sammenhengen. Øverste kurve er hva en får om en kun reduserer frekvensen uten å redusere spenningen. Ikke mye effektivt som en ser.

Takk for den flotte shmoo-kurven. Vet du hvor man kan finne tilsvarende kurver for nyere x86 CPU'er?

Vel dette var ikke egentlig en shmoo kurve da, men det ser du sikkert.

 

Jeg vet ikke av andre slike, men det hender seg at et eller annet universitet har liggende noe ute så en kan jo google. Produsentene er naturlig nok svært forsiktige med å legge ut slike kurver da det er en ekstremt god kilde til hvordan de ligger ann i løypa. Jeg er faktisk veldig (positivt) overrasket over at IBM tørr å legge ut en slik kurve over et så nytt produkt.

 

Edit: Jeg endret den ene siterte linken siden den ødela layouten på siden.

Endret av Simen1
Lenke til kommentar
Knick Knack:

 

Kurven din ser ut som en enkel eksponensiell funksjon. Nettopp det som formelen tilsier (etersom volt øker øker effekttapet eksponensielt).

hmm ja nå vet jeg ikke helt hva du sikter til. kurven er fullt i overenstemmelse med "Watt = Konstant x frekvens x Volt^2 + e"

 

Men som du ser så øker Volt fra 0.8 til 1.3 når frekvensen øker fra 1.25GHz til 2.5GHz

 

Altså er spenningen en funksjon av frekvensen.

 

Som det sies i IBM notatet så er egentlig W=1/2CV^2f, men kapasitansen C er rimelig konstant for kretsene i enhver CPU arkitektur produsert på samme prosess så en kan se bort fra den. Ved prosesskrymping er det i all hovedsak C som reduseres og dermed reduseres effektforbruket også. (Det er mange som tror at det er enn eller annen resistans som endres inne i prosessoren... vet ikke helt hvorfor. Tror de roter inn noe Thevenin/Norton ekvivalent kretser som ikke egner seg over hodet til dette)

Endret av Knick Knack
Lenke til kommentar
Det er korrekt, men en må huske at volt er en funksjon av frekvensen. Det gjør det hele litt vanskelig hvis en ikke kjenner shmoo kurven til prosessoren.

 

Enig, men innenfor samme volt kan en kjøre flere hastigheter. Slik sett vil jeg si at effekttap er sterkest korrelert med frekvens, men at en økning i volt medfører en sterk økning i effekttap.

 

I P3-tilfellet var det kun frekvens som hadde endret seg så langt jeg kunne se fra Sandpile.

Spenning ble først rekordhøye 1,8V for 1,0GHz'en deretter satt ned til 1,75V og 1,7V ettersom de lagde nye steppinger. 1,133GHz'en startet på 1,8V og ble trukket fra markedet pga ustabilitet og lav til gjengelighet. Den første 1,0GHz'en var forsåvidt oppe i 35,5W og ikke bare 33,9W som du skrev. Tilgjengeligheten var derimot så liten at selv pressen og dell ikke fikk et eneste testeksemplar. Trolig fantes den kun på papiret og i en demo-PC intel hadde overklokket som f og definert den "orginale hastigheten" til det de oppnådde. Altså 1,0GHz ved 1,8V med en ekstremt cherrypicked CPU med en ekstrem luftkjøler for å holde temperaturen mye lavere enn normalt fordi den ble ustabil ved det som tidligere var normale temperaturer.

 

Mer fra Sandpile-org:

 

First Introduction:

Mar 8, 2000 (1000EB MHz Pentium III)

Jul 31, 2000 (1133EB MHz Pentium III)

 

Core Voltage:

1.8 V (0.18 µm 1133 MHz)

1.7 V (0.18 µm)

1.65 V (0.18 µm)

1.6 V (0.18 µm)

1.5 V (0.18 µm)

 

Typical Power:

~22 W (0.18 µm @ 1000EB MHz Pentium III 0683h)

~18 W (0.18 µm @ 1000EB MHz Pentium III 0686h)

~24 W (0.18 µm @ 1000EB MHz Pentium III)

~18 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 0686h 1.7 V)

~20 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 0686h 1.75 V)

~20 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 068Ah)

~22 W (0.18 µm @ 1100EB MHz Pentium III FC-PGA 068Ah)

~23 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA2)

~25 W (0.18 µm @ 1133EB MHz Pentium III FC-PGA2)

 

Maximum Power:

33.0 W (0.18 µm @ 1000EB MHz Pentium III 0683h)

26.1 W (0.18 µm @ 1000EB MHz Pentium III 0686h)

35.5 W (0.18 µm @ 1000EB MHz Pentium III)

26.1 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 0686h 1.7 V)

29.8 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 0686h 1.75 V)

29.0 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA 068Ah)

33.0 W (0.18 µm @ 1100EB MHz Pentium III FC-PGA 068Ah)

33.9 W (0.18 µm @ 1000EB MHz Pentium III FC-PGA2)

37.5 W (0.18 µm @ 1133EB MHz Pentium III FC-PGA2)

Endret av Simen1
Lenke til kommentar

Simen1:

 

Intel laget så mange steppings av PIII og versjon at jeg tok de to som stod ved siden av hverandre på lista.

 

Poenget vare å finne effekttapet som PIII 1,13 som Knick Knack ville ha, ikke å liste opp alle ulike versjonene. Uansett er det greit å få med hele lista.

 

At PIII 1,13 hadde 1,8 Volt burde bety at den hadde en annen stepping i forhold til effekttap i og med at økningen ikke var så stor fra 1 GHz til 1,13 GHz?

 

BTW: Jeg ser kun på max power da typical ikke sier noe om noe...

Lenke til kommentar
IBM PowerPC 970FX power envelope and power management

http://www-03.ibm.com/technology/power/new.../article7_2.jpg

 

Den nederste linja i diagrammet er resultatet av shmoo kurven. shmoo kurven er frekvens/volt sammenhengen. Dette er frekvens/watt sammenhengen. Øverste kurve er hva en får om en kun reduserer frekvensen uten å redusere spenningen. Ikke mye effektivt som en ser.

Takk for den flotte shmoo-kurven. Vet du hvor man kan finne tilsvarende kurver for nyere x86 CPU'er?

Vel dette var ikke egentlig en shmoo kurve da, men det ser du sikkert.

 

Jeg vet ikke av andre slike, men det hender seg at et eller annet universitet har liggende noe ute så en kan jo google. Produsentene er naturlig nok svært forsiktige med å legge ut slike kurver da det er en ekstremt god kilde til hvordan de ligger ann i løypa. Jeg er faktisk veldig (positivt) overrasket over at IBM tørr å legge ut en slik kurve over et så nytt produkt.

Ehh.. Jeg vet egentlig ikke hva en shmoo-korve er for noe, men antok at det var en MHz vs spenning-kurve. Det er i hvertfall det jeg har laget. Den du postet er jo ikke helt det samme nei, men du skjønner poenget.

 

Det at det ikke finnes slike kurver offentligjort er vel en sak for overklokking.no ;) (Må jo få litt liv i den siden igjen). Det er ikke så vanskelig å lage det, men tar selvfølgelig en ettermiddag å teste ut alle kombinasjonene av hastigheter og spenninger. (Jeg bruker 5 minutter Prime som stabilitetsmål, og legger meg litt innenfor stabilitetskurven)

Endret av Simen1
Lenke til kommentar

ja, og som utgangspunktet var: Fyll opp chipen med så få kjerner som mulig uten at en begynner å dra seg for langt inn i den eksponentielle delen av Watt/frekvens kurven, men likevell utnytter hele effektbudsjettet. Da får du den beste ytelse/watt uten å få unødvendig dårlig ytelse/tråd og uten å drive arealet for mye oppover. Cache er tross alt mye lettere å produsere enn core logic og den er mye mindre følsom mot feil. Derfor har Montecito bare to kjerner selv om det hadde vært plass til flere.

 

Areal ryktene for Montecito er forøvrig på vei nedover. 500mm^2 til 550mm^2 er det siste. selv har jeg vel lagt meg på 450mm^2 til nesten opp i 600mm^2 litt ettersom humør... ;)

Endret av Knick Knack
Lenke til kommentar
At PIII 1,13 hadde 1,8 Volt burde bety at den hadde en annen stepping i forhold til effekttap i og med at økningen ikke var så stor fra 1 GHz til 1,13 GHz?

Ja, det kan godt hende det var en litt annen kjerne. Trolig så små tweaks og forskjeller at intel valgte å ikke øke stepping-koden.

 

Edit: Beklager at jeg tok med Typical Power og hele lista over senere steppinger. De har jo selvfølgelig lite med saken å gjøre.

Lenke til kommentar

100W effektforbruk på Montecito 24M er en kraftig nedgang fra 130W på dagens Madison 9M, og beviser egentlig hvor dyktige Intel etterhvert har blitt på å lage energieffektiv cache. Det lover isåfall også bra med tanke på redusert effektforbruk til den kommende Prescott 2M, samt for dual-kjerne prosessorene Smithfield og Merom som kommer i 2006. Spørsmålet nå er hvorvidt denne cachen er like rask som den er energieffektiv, det gjenstår å se.

 

Positivt at Intel også fokuserer på å få ned effektforbruket, samt å integrere minnekontroller og punkt-til-punkt busser på sine fremtidige prosessorer:

 

Intel Expected To Follow AMD's CPU Integration

Intel Corp. is expected to follow a path pioneered by rival Advanced Micro Devices Inc. with the integration of the company's memory controller and high-speed interconnect onto its Xeon and Itanium server processors.

 

The integrated processors are expected to help bring the two Intel CPU architectures into price parity and create a relatively streamlined yet powerful all-serial server chip complex. But the shift is not expected to come until 2007, sources said. The move comes as server makers are crunching through cost and power issues with a new serial memory link proposed by Intel.

 

"Intel has been dropping hints in various places" about the plan, said one source with a top computer maker, who asked not to be named. "If you are aware of their intention, you can see what to look for," he added. Intel was not available for comment at press time.

 

In presentations at the Intel Developer Forum in September, the company talked about interconnect becoming "serial everywhere." The company is already shipping chip sets using the PCI Express 2.5-Gbit/second serial I/O technology. It is laying the groundwork for a fast serial interconnect to memory with its concept for fully buffered dual-in-line memory modules (FB-DIMMs), leaving the processor bus as the last link in the chain.

 

The I/O rates of those chip-to-chip interconnects could be hitting data rates of up to 6 Gbits/s by the time Intel launches the processors. The PCI Special Interest Group will meet in December to consider whether to take the next generation of PCI Express to 5 or 6 Gbits/s.

 

To an extent, Intel will be playing catch-up with AMD, which launched its Opteron processor with an integrated memory controller in 2000. However, Opteron uses the parallel HyperTransport interface, whereas Intel will use a serial interconnect.

Endret av snorreh
Lenke til kommentar
100W effektforbruk på Montecito 24M er en kraftig nedgang fra 130W på dagens Madison 9M, og beviser egentlig hvor dyktige Intel etterhvert har blitt på å lage energieffektiv cache. Det lover isåfall også bra med tanke på redusert effektforbruk til den kommende Prescott 2M, samt for dual-kjerne prosessorene Smithfield og Merom som kommer i 2006. Spørsmålet nå er hvorvidt denne cachen er like rask som den er energieffektiv, det gjenstår å se.

Cache er en dråpe i effekt-regnskapet. Reduksjonen i effekt på 23% har altså lite med effektforbruket i cache å gjøre. Tvert i mot så tror jeg at implementasjonen av 24 MB cache bruker en smule mer effekt enn den eldre 9MB-implementasjonen.

 

Det at de har doblet antall kjerner og samtidig klart å øke klokkehastigheten med 25% (?) og redusert effektforbruket med 23% er bevis på det stikk motsatte. Altså at det er selve kjernene som har blitt svært mye mer energieffektive. Et kjapt overslag gir meg ca 3 ganger så høy ytelse per watt, og det må jo sies å være rimelig imponerende.

Endret av Simen1
Lenke til kommentar
Cache er en dråpe i effekt-regnskapet. Reduksjonen i effekt på 23% har altså ingenting med effektforbruket i cache å gjøre. Tvert i mot så tror jeg at implementasjonen av 24 MB cache bruker en smule mer effekt enn den eldre 9MB-implementasjonen.

 

Det at de har doblet antall kjerner og samtidig klart å øke hastigheten med 25% (?) og redusert effektforbruket med 23% er bevis på det stikk motsatte. Altså at det er selve kjernene som har blitt svært mye mer energieffektive.

Vel, mesteparten av Montecito jo rein cache:

http://www.isscc.org/isscc/2005/ap/ISSCC20...anceProgram.pdf

Of the total of 1.72B transistors, 64M are dedicated to logic and the rest to cache. With both cores operating at full speed, the chip consumes 100W.

Mener du at de 64 millioner transistorene forbruker brorparten av de 100W?

Endret av snorreh
Lenke til kommentar
Vel, mesteparten av Montecito jo rein cache:

http://www.isscc.org/isscc/2005/ap/ISSCC20...anceProgram.pdf

 

Mener du at de 64 millioner transistorene forbruker brorparten av de 100W?

Jepp, det stemmer. Cache bruker nesten ingen strøm så lenge de bare står i "dvale". Cache bruker typisk 1-3% av effekten på moderne CPU'er.

 

Edit: Sistat fra nederst på side 73 på linken din:

"The 24MB level-3 cache on a dual-core Itanium processor has more than 1.47G transistors. The cache uses an asynchronous design to reduce latency and power, and it includes other power saving and reliability improvement features. The 5-cycle array operates above 2GHz at 0.8V and 85°C while consuming less than 4.2W."

Endret av Simen1
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...