JohndoeMAKT Skrevet 20. mars 2004 Del Skrevet 20. mars 2004 Hva med P4B da? Det er jo den vi griner om. Lenke til kommentar
snorreh Skrevet 20. mars 2004 Del Skrevet 20. mars 2004 (endret) Hva med P4B da?Det er jo den vi griner om. Ja, nå her har jeg oppdatert figuren med P4B også uten at det gjorde saken noe bedre: Jeg foretok min egen lille "reality check" for å se hvor autentisk denne utskjelte PR-ratingen til AMD virkelig er og for å sjekke om det er noe hold i alle disse påstandene om at den er direkte knyttet opp mot P4 sin MHz eller om det bare er en tilfeldighet. For å gjøre det så enkelt som mulig så tok jeg bare utgangspunkt i en eneste benchmark hvor kun prosessorytelsen måles, nemlig Super PI (1M), men også fordi jeg hadde verifiserte data enkelt tilgjengelig for alle disse prosessorene Jeg plottet ytelsen i % relativt til Athlon TB 266FSB 1.4GHz (REF), samt for Athlon XP (AXP), Athlon 64 (A64), P4 NW 800FSB (P4C) og P4 NW 533FSB (P4B) og her er resultatet (alle standard klokket selvsagt): Ser du sammenhengen? Bare Athlon 64 3000+ og Athlon 64 3400+ yter bedre eller likt med REFeransen (Athlon TB 1.4GHz), mens samtlige Athlon XP (og P4) faktisk yter lavere enn hva referansen skulle tilsi. Sammenhengen med MHz på P4 virker også her tilsynelatende, spesielt siden kurvene til både Athlon XP og Athlon 64 sammenfaller med P4-kurven på et sted hver. Likevel så er avviket iforhold til referanse-kurven mindre for både Athlon XP og Athlon 64 enn det er iforhold til P4-kurven så noen klinkende klar sammenheng finnes likevel ikke. Så basert kun på denne enkle testen så virker det altså som PR-ratingen samsvarer rimelig bra for Athlon 64, men ikke så bra for Athlon XP (og P4). Sett i forhold til Athlon XP så burde nok Athlon 64 egentlig hatt en vesentlig høyere PR-rating enn den faktisk har idag, men sett i forhold til referansen så passer PR-ratingen best for Athlon 64 faktisk Endret 20. mars 2004 av snorreh Lenke til kommentar
scoot Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Hvorfor ikke en PEntium 4 M3 i samme slengen ? ... Lenke til kommentar
snorreh Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Hvorfor ikke en PEntium 4 M3 i samme slengen ? ... M3? Jeg har ikke Super PI (1M) data på alle prosessorene som finnes (og som ikke finnes) dessverre Basert på dette finnes det ingen klinkende klar sammenheng mellom P4 sin MHz og AMD sin PR-rating, som så mange hardnakket påstod Lenke til kommentar
ahpadt Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Ble jo bare ENDA mer frustrert nå Lenke til kommentar
Knick Knack Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Super Pi er ikke representativt nok til å gjøre konklusjoner. Benchmarken er også svært sensitiv for minnekonfigurasjonen. Lenke til kommentar
Endre Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Super Pi er ikke representativt nok til å gjøre konklusjoner. Benchmarken er også svært sensitiv for minnekonfigurasjonen. Stemmer. Og det er en benchmark AMD gjerne gjør det bedre på på standard hastighet, det er først med høyere klokkefrekvens og FSB P4 gjør det bra ifh. til AMD. Og påstanden om at PR-ratingen er basert på T-bird må vel sies og ha blitt lagt død en gang for alle etter at AMD justerte ned ratingen på A64 (AXP3200 = A643000, omtrentlig). Lenke til kommentar
pskard Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 (endret) Super Pi er ikke representativt nok til å gjøre konklusjoner. Benchmarken er også svært sensitiv for minnekonfigurasjonen. Følgende tall fikk jeg: Opteron 246 1 GB minne CAS 2 DDR400 Singel minnekanal 1M - 43 sek Singel minnekanal 2M - 101 sek Doble minnekanaler 1M - 40 sek Doble minnekanaler 2M - 96 sek -> En dobling av minnebåndbredden gav 5-7% ytelsesforbedring. Med andre ord er denne ikke veldig minnebåndbreddeavhengig. Jeg gjentok testen 2 ganger for å se at tallene var reproduserbare. Første gangen med 2M singel minnekanel fikk jeg 100 sek. Den testen gjentok jeg 3 ganger og de to andre gangene ble det 101 sek. Trolig ligger den på 100,5 sek eller noe sånt. I singel minnekanal brukte jeg fortsatt 2 DIMMs selv om det ofte kan gi noe lavere ytelse. Dessverre tillater ikke hovedkortet å stille ned minnehastigheten til DDR 266/333. Det er meget mulig at forskjellen mellom doble DDR333- eller DDR400-kanaler ikke er tilstede. EDIT: Forøvrig helt enig i at SuperPi ikke er en applikasjonen kan generalisere ut i fra, men i det minste tester den en del av CPU-en som er forholdsvis løsrevet fra andre komponenter som minne, AGP, OI osv. Endret 21. mars 2004 av pgressum Lenke til kommentar
snorreh Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 (endret) Super Pi er ikke representativt nok til å gjøre konklusjoner. Benchmarken er også svært sensitiv for minnekonfigurasjonen. Kanskje, men så bruker også AMD en rekke forskjellige benchmarks når de fastsetter PR-ratingen på sine prosessorer som bl.a. Sysmark, Winstone, PCMark, AquaMark, 3DMark og diverse spill. Det skulle derfor bare mangle at disse resultatene ikke stemmer 100% Jeg er ikke enig i at Super PI er mer sensitiv for forskjellige minnekonfigurasjoner enn tilsvarende benchmarks, iallefall hvis du tenker på minnebåndbredde. Alle prosessorene jeg har plottet bruker faktisk DDR400-minne, så eneste forskjeller blir da prosessor-arkitektur og systembuss-hastighet. Athlon som jeg tar utgangspunkt har 266MHz FSB (og DDR266 minne), Athlon XP finnes med både 333MHz (2500+ til 3000+) og 400MHz FSB (3000+ og 3200+), Athlon har 800MHz HyperTransport-buss, P4B har 533MHz FSB og P4C har 800MHz FSB. For å gjøre det lettere å forstå så snakker man ofte isteden om total systembåndbredde, eller total tilgjengelig båndbredde for systemet fordelt mellom minne og systembuss, og der er det betydelige forskjeller mellom disse prosessorene. Total systembåndbredde er opptil 3.2GB/s for Athlon XP, opptil 9.6GB/s (!) for Athlon 64, opptil 4.3GB/s for P4B og opptil 6.4GB/s for P4C. Slik jeg kan forstå så er det nettopp denne toltale systembåndbredden som Super PI er sensitiv for, noe som gjør den svært relevant for å sammenligne forskjellige prosessor-arkitekturer (både nye og gamle) etter min mening Hvis minnebåndbredde alene skulle vært så avgjørende på Super PI-resultatene, hvordan forklarer du at P4B 3.06GHz (533FSB) med PC1066 RDRAM yter dårligere enn P4C 3.0GHz (800FSB) med DDR400 mens Athlon XP 3000+ (333FSB) med DDR400 yter identisk som Athlon XP 3000+ (400FSB) med DDR400 da (jf. her og her) ? Les bare hva Anandtech skriver om Super PI: http://www.anandtech.com/memory/showdoc.html?i=1853&p=2 "Pure number crunching benchmarks are very useful for measuring system bandwidth. Some of the more popular number-crunchers are the MPEG/DIVX encoding tests, such as we used in our standard motherboard testing, and Super PI." "Super PI [...] is very simple to use and has been shown to be less sensitive to the operating system environment. In other words, we don’t have to reinstall the operating system on a clean hard drive each time we run a benchmark just to get reliable numbers." "Super PI is measuring total system bandwidth, and memory is only part of that bandwidth, since the CPU has a very significant impact on results. We therefore would expect to see smaller changes in Super PI relative to larger changes in memory-only benchmark tests like Sandra." Endret 21. mars 2004 av snorreh Lenke til kommentar
snorreh Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Og påstanden om at PR-ratingen er basert på T-bird må vel sies og ha blitt lagt død en gang for alle etter at AMD justerte ned ratingen på A64 (AXP3200 = A643000, omtrentlig). Nei, det er vel heller slik at AMD satt en altfor høy PR-rating på sine siste Athlon XP-prosessorer etter min mening. Athlon XP 3200+ burde heller vært 3000+, mens PR-ratingene for Athlon 64 stemmer tålig bra sammenlignet med referansen (Athlon TB 1.4GHz) synes jeg. Lenke til kommentar
pskard Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Jeg tror mange blander sammen hvorfor og hva her.. AMD introduserte TPI på grunn av hvordan P4 ble designet, men den tok utgangspunkt i sin egen CPU. Hvorfor ratingen endrer seg? En grunn kan være at AMD hele tiden oppdatere applikasjonene som danner grunnlaget for ratingen. Lenke til kommentar
Simen1 Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 "Super PI is measuring total system bandwidth, and memory is only part of that bandwidth, since the CPU has a very significant impact on results. We therefore would expect to see smaller changes in Super PI relative to larger changes in memory-only benchmark tests like Sandra."[/i] Det jeg tror de mener med "total system bandwith" er regnekraften til visse deler av CPU'en (båndbredde i instruksjoner per sekund i stedet for MB/s). Hovedsaklig tror jeg dette er x86-FPU'en siden SuperPI er et meget gammelt program (laget i 486/Pentium-tiden og har derfor ingen form for SIMD-aksellerasjon). Så vidt meg bekjent har det ikke vært rekompilert for nyere arkitekturer. "System bandwith" er altså intern regnehastighet og har ikke noe spesiellt å gjøre med minnebåndbredden eller FSB-båndbredden. Lenke til kommentar
Endre Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Hvorfor ratingen endrer seg? En grunn kan være at AMD hele tiden oppdatere applikasjonene som danner grunnlaget for ratingen. For meg er det ganske åpenbart at det er fordi Intel har kommet med CPU-er som er raskere per klokkeslag. Lenke til kommentar
Knick Knack Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 TPI ble innført fordi AMD ønsket å markedsføre sine prosessorer bedre i forhold til konkurrenten, Intel P4. Grunnen til at ratingen ble endret for A64 er opplagt fordi AMD fikk pes for at ratingen var for høy i forhold fil Intels frekvens merking av sine produkter. Grunnen til at AMD valgte å benytte Athlon 1.4GHz som referanse er fordi den viste seg å ha tilsvarende IPC som P4B i en rekke applikasjoner og at AMD ikke ønsker å nevne Intel i sin markedsføring. Dette siste punktet er basic markedsføringsstrategi som benyttes av ALLE og er også grunnen til at Intel er svært sparsom med å nevne AMD i forbindelse med x86-64. Lenke til kommentar
Knick Knack Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Super Pi er ikke representativt nok til å gjøre konklusjoner. Benchmarken er også svært sensitiv for minnekonfigurasjonen. Følgende tall fikk jeg: Opteron 246 1 GB minne CAS 2 DDR400 Singel minnekanal 1M - 43 sek Singel minnekanal 2M - 101 sek Doble minnekanaler 1M - 40 sek Doble minnekanaler 2M - 96 sek -> En dobling av minnebåndbredden gav 5-7% ytelsesforbedring. Med andre ord er denne ikke veldig minnebåndbreddeavhengig. Jeg gjentok testen 2 ganger for å se at tallene var reproduserbare. Første gangen med 2M singel minnekanel fikk jeg 100 sek. Den testen gjentok jeg 3 ganger og de to andre gangene ble det 101 sek. Trolig ligger den på 100,5 sek eller noe sånt. I singel minnekanal brukte jeg fortsatt 2 DIMMs selv om det ofte kan gi noe lavere ytelse. Dessverre tillater ikke hovedkortet å stille ned minnehastigheten til DDR 266/333. Det er meget mulig at forskjellen mellom doble DDR333- eller DDR400-kanaler ikke er tilstede. EDIT: Forøvrig helt enig i at SuperPi ikke er en applikasjonen kan generalisere ut i fra, men i det minste tester den en del av CPU-en som er forholdsvis løsrevet fra andre komponenter som minne, AGP, OI osv. Jeg synes det var mye tatt i betraktning at en kun endret båndbredde. jeg hadde ikke forventet at båndbredden skulle ha særlig mye å si. Det er først og fremst minneforsinkelser som ser ut til å være den avgjørende faktoren. f.eks er DDR mye dårligere i Super Pi enn RDRAM. Lenke til kommentar
snorreh Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 (endret) Det jeg tror de mener med "total system bandwith" er regnekraften til visse deler av CPU'en (båndbredde i instruksjoner per sekund i stedet for MB/s). Hovedsaklig tror jeg dette er x86-FPU'en siden SuperPI er et meget gammelt program (laget i 486/Pentium-tiden og har derfor ingen form for SIMD-aksellerasjon). Så vidt meg bekjent har det ikke vært rekompilert for nyere arkitekturer. "System bandwith" er altså intern regnehastighet og har ikke noe spesiellt å gjøre med minnebåndbredden eller FSB-båndbredden. Ja, Super PI V1.1e kom ut allerede i august 1995 (lenge før både MMX, 3DNow!, SSE, etc.) og er langt ifra det raskeste programmet for å beregne Pi i dag (for en topp 10-liste se her). Når det er sagt så er det ikke pga. manglende støtte for SSE(2/3) o.l., for selv dagens raskeste program for beregning av Pi, PiFast, benytter seg heller ikke av slikt. Dette er trolig fordi disse utvidelsene ikke har noen særlig fordelaktig effekt på ytelsen til de algoritmene (Gauss-Legendre (Super PI) og Chudnovsky (PiFast)) som tross alt benyttes ved beregning av Pi. PiFast V4.3 som kom ut senest i oktober 2003, finnes forøvrig også til andre plattformer enn Windows og har bl.a. en opsjon som lar deg velge om å bruke virtuelt minne (harddisk) eller ikke Og for øyeblikket er faktisk Athlon 64-FX den raskeste prosessoren på dette ifølge Hexus.net sin "PiFast Challenge": http://pifast.hexus.net/pifast.php Det er først og fremst minneforsinkelser som ser ut til å være den avgjørende faktoren. f.eks er DDR mye dårligere i Super Pi enn RDRAM. Hvis det stemmer, som jeg tviler på, hvordan forklarer du at P4B 3.06GHz (533FSB) med PC1066 RDRAM faktisk yter dårligere enn P4C 3.0GHz (800FSB) med dual DDR400 på Super PI da (jf. dette) ? Endret 21. mars 2004 av snorreh Lenke til kommentar
Knick Knack Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Det er først og fremst minneforsinkelser som ser ut til å være den avgjørende faktoren. f.eks er DDR mye dårligere i Super Pi enn RDRAM. Hvis det stemmer, som jeg tviler på, hvordan forklarer du at P4B 3.06GHz (533FSB) med PC1066 RDRAM faktisk yter dårligere enn P4C 3.0GHz (800FSB) med dual DDR400 på Super PI da (jf. dette ) ? Sorry, jeg blandet sammen med en annen SPEC test, men påstanden er antagelig korrekt likevel. 3.06GHz med 533FSB yter antagelig bedre i Super PI med RDRAM enn DDR, men det er klart at når en øker til 800FSB så reduseres forsinkelsen i både Northbridge busskontroller og minne en god del. Dermed er dette nok et godt eksempel på at Super Pi er avhengig av minnekonfigurasjon. Lenke til kommentar
pskard Skrevet 21. mars 2004 Del Skrevet 21. mars 2004 Det er først og fremst minneforsinkelser som ser ut til å være den avgjørende faktoren. f.eks er DDR mye dårligere i Super Pi enn RDRAM. Hvis det stemmer, som jeg tviler på, hvordan forklarer du at P4B 3.06GHz (533FSB) med PC1066 RDRAM faktisk yter dårligere enn P4C 3.0GHz (800FSB) med dual DDR400 på Super PI da (jf. dette) ? Jeg sier IKKE at det Knick Knack sier er korrekt, men det du skriver underbygger det han hevder. P4 3.06 med RDRAM har velsentlig høyere minnelatency enn P4C DDR. Det tyder på at SuperPi er mer avhengig av latency enn av minnebåndbredde. Min lille test av singel vs dual DDR viser også at rå minnebåndbredde ikke har så mye å si. Dessverre tillater ikke (det idiotiske) VIA-hovedkortet mitt å stille minnehastigheten ned til PC2100 og PC2700 eller å sette manuell CAS så jeg får ikke prøvd det for å underbygge teorien til Knick Knack. Lenke til kommentar
Knick Knack Skrevet 22. mars 2004 Del Skrevet 22. mars 2004 Det er først og fremst minneforsinkelser som ser ut til å være den avgjørende faktoren. f.eks er DDR mye dårligere i Super Pi enn RDRAM. Hvis det stemmer, som jeg tviler på, hvordan forklarer du at P4B 3.06GHz (533FSB) med PC1066 RDRAM faktisk yter dårligere enn P4C 3.0GHz (800FSB) med dual DDR400 på Super PI da (jf. dette) ? Jeg sier IKKE at det Knick Knack sier er korrekt, men det du skriver underbygger det han hevder. P4 3.06 med RDRAM har velsentlig høyere minnelatency enn P4C DDR. Det tyder på at SuperPi er mer avhengig av latency enn av minnebåndbredde. Min lille test av singel vs dual DDR viser også at rå minnebåndbredde ikke har så mye å si. Dessverre tillater ikke (det idiotiske) VIA-hovedkortet mitt å stille minnehastigheten ned til PC2100 og PC2700 eller å sette manuell CAS så jeg får ikke prøvd det for å underbygge teorien til Knick Knack. Vel, det var bra at du ikke støtter mine uttalelser. Da hadde jeg blitt usikker. Nå har jeg aldri lagd programmer som beregner Pi, men jeg har lagd en del som finner primtall, og likheten er nok ganske stor. Det er en relativt liten indre løkke som gjør 99.99..% av jobben og den får garantert plass i L1 I-cache. Det er heller ingen eksterne data en jobber med, slik som i audio/video håndtering, kun de tallene programmet selv produserer. Av og til må en nok likevel til RAM for å hente tidligere produserte data som er blitt kastet ut av L2 cache. Når en venter på disse data så står CPU å venter. Dagens prosessorer har minst 3.2GB/s og dette er mye mer enn de har kapasitet til å gjøre avanserte beregninger på. (det er likevel greit å ha mer da andre programmer gjerne flytter mer data og gjør mindre prosessering på de.) Siden A64 har langt lavere forsinkelse mot minnet så vil det gå mindre prosesseringskraft (IPC x C) til spille. For de forskjellige P4 konfigurasjonene vil en selvsagt også få endringer. Det vises godt i forskjellen på P4C og P4B. HT har neppe noen positiv effekt på dette programmet så gevinsten kommer nok fra redusert forsinkelse som et resultat av at båndbredden ble økt ved å øke frekvensen. (alternativet kunne vært å øke bussbredden, men det ville ikke redusert forsinkelsene) Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå