Gå til innhold

Verdens raskeste linuxcluster når nesten 20Tflops


Anbefalte innlegg

Samt dette PDF-dokumentet:

Closing the gap between peak and achievable performance in HPC

 

Den inneholder en interessant sammenligning av ytelsen til forskjellige typer "interconnects" og en analyse av skalering :)

Meget interessant den der! Cray er definitivt i toppen når det gjelder å lage interconnects. Har egentlig mer tro på Cray enn SGI, men så har SGI en enklere jobb å gjøre også da... Itanium er vel den minst kresne CPU en kan få mht. båndbredde og forsinkelser.

 

Den siste grafen i dokumentet er egentlig hva alt koker ned til. Litt synd at de ikke tok med Quadrics QsNet II og infiniband. Tviler på at de ville komme ut bedre enn Cray sitt interconnect, men det hadde vært interessant å se hvor nært de kom.

Lenke til kommentar
Videoannonse
Annonse
Samt dette PDF-dokumentet:

Closing the gap between peak and achievable performance in HPC

 

Den inneholder en interessant sammenligning av ytelsen til forskjellige typer "interconnects" og en analyse av skalering :)

Meget interessant den der! Cray er definitivt i toppen når det gjelder å lage interconnects. Har egentlig mer tro på Cray enn SGI, men så har SGI en enklere jobb å gjøre også da... Itanium er vel den minst kresne CPU en kan få mht. båndbredde og forsinkelser.

Ja, det ser veldig lovende ut. Dokumentet inneholdt også en interessant sammenligning av minneytelsen til Itanium og Opteron:

 

"The Itanium and Opteron processors use different strategies for improving memory performance. The Opteron embeds memory controllers within the processor core, halving memory latency relative to the Itanium, but eliminating the space available for an L3 cache. The Itanium uses an external controller, increasing latency, but leaving space for a large L3 cache. Commercial applications are likely to have a performance advantage on the Itanium-their datasets tend to be smaller, and the likelihood of a memory reference being resolved from cache is proportionately higher. HPC applications tend to have enormous datasets and more varied memory access patterns, resulting in fewer cache hits. Consequently, memory bandwidth and latency are more important, and HPC applications that are limited by memory bandwidth are likely to perform better on the Opteron."

 

Cray er altså enig med meg her :)

 

Den siste grafen i dokumentet er egentlig hva alt koker ned til. Litt synd at de ikke tok med Quadrics QsNet II og infiniband. Tviler på at de ville komme ut bedre enn Cray sitt interconnect, men det hadde vært interessant å se hvor nært de kom.

Ja, selv om både Quadrics og Infiniband ble nevnt i starten av dokumentet. Forhåpentligvis kommer Cray ut med en mer detaljert sammenligning når de første Red Storm-løsningene blir levert i sommer. Den kommersielle versjonen av Red Storm blir lansert senere i år, og får navnet Cray X1E og vil erstatte dagens Cray X1 såvidt jeg vet. Det er en stor fjær i hatten for AMD at de har fått med seg Cray på laget :)

Endret av snorreh
Lenke til kommentar

Dette er litt rart. De hadde

"As one of the largest cluster supercomputers ever built, Lightning will consist of 2,816 Advanced Micro Devices Inc. Opteron processors and 1,408 dual-processor nodes, all of which will be interconnected by Myricom Inc.'s Myrinet high-speed network.

 

Altså 2816 2Ghz Opteron CPUer, ble slått av 2200 2Ghz G5 CPUer. Muhahahahah :devil:

 

Så G5 er ikke så dårlig som dere på dette forumet skal ha det til.

 

Men tror nok at clustere blir mer aktuelt etter som tråløst netverk blir bedre. Så isteden får å kjøpe 10 maskiner så kjøper de 10 tynklienter og 1 minicluster.

 

Edit:Knick Knack fikk en personlig meling der en på forumet mente at G5 var ca like god som en Duron CPU. Så det finnes de og, mens andre mente den var like god som en Celly per mhz.

Endret av Macfan
Lenke til kommentar
"The Itanium and Opteron processors use different strategies for improving memory performance. The Opteron embeds memory controllers within the processor core, halving memory latency relative to the Itanium, but eliminating the space available for an L3 cache. The Itanium uses an external controller, increasing latency, but leaving space for a large L3 cache. Commercial applications are likely to have a performance advantage on the Itanium-their datasets tend to be smaller, and the likelihood of a memory reference being resolved from cache is proportionately higher. HPC applications tend to have enormous datasets and more varied memory access patterns, resulting in fewer cache hits. Consequently, memory bandwidth and latency are more important, and HPC applications that are limited by memory bandwidth are likely to perform better on the Opteron."

 

Cray er altså enig med meg her :)

Itaniums minnehåndtering er langt mer kompleks enn L3 cache og plassering av minnekontrollere. Husk at dette egentlig er markedspropaganda (Cray-hype for å bruke din terminologi) fra Opteron baserte supercomputer leverandøren Cray. Itanium har mulighet til å holde de riktige instruksjonene i cache, noe som gjør utnyttelsen av cache langt mer effektiv, reduserer båndbreddebehovet til minnet og reduserer den gjennonsnittlige forsinkelsen for å hente en instruksjon. Å ha intern minnekontroller er jo heller ikke så viktig når en bare får direkte tilgang til 1/16000 av alt minnet i supercomputeren...

 

Personlig tror jeg fremtiden er å sammle systemminnet i så få "reservoarer" som mulig. Det gir den beste muligheten til å ha lav forsinkelse fra alle prosessorene til alt minne.

 

Macfan: Er vel ingen her på forumet (med peiling?) som mener at G5 er dårlig, men en gjør det jo ikke vanskelig å ikke bli likt når en proklamerer "verdens beste" i hytt og vær...

 

Uansett er G5 en svært habil CPU og den har det jeg mener er den desidert beste minnearkitekturen som er å oppdrive for dual cpu maskiner i dag.

Endret av Knick Knack
Lenke til kommentar
Edit:Knick Knack fikk en personlig meling der en på forumet mente at G5 var ca like god som en Duron CPU. Så det finnes de og, mens andre mente den var like god som en Celly per mhz.

Morroklumper finner en overalt...

 

Du får bare hilse dem fra meg og si at de der ynkelige x86 prosessorene (nylig innlagt i 64bit respirator, noen har til og med intern pacemaker) ikke har sjans mot de mer moderne arkitekturene. Ref "Big Mac" og "Thunder" maskinene som leverer dagens x86 ytelse før frokost.

 

Ikke akkurat det beste argumentet en kan finne, men mot slik framifrå idioti slik nevnt i quoten så burde det holde lenge. ;)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...