Gå til innhold

Geforce 6600GT endelig testet!


Revox

Anbefalte innlegg

Jeg følger deg ikke her. Poenget med MSAA er at det ikke gir et fillrate hit og det blir unngått med at sub-pixlene bruker samme farge data som orginal pixelen. Og uansett gir det et båndbredde hit.

Jeg tror vi snakker forbi hverandre (jeg er dessverre elendig til å forklare hva jeg mener). Multisampling reduserer, som du sier, i teorien ikke fillraten, siden brikken fortsatt kan skrive ut fire endelige pixler per klokke til framebufferet, men den interne samplingen av sub-pikselne tar tid. Det ser ut til at 4 stk. 4xAA-piksler i 6600 tar to klokkesykluser. I de testene jeg har sett ser 4xAA ut til å ganske nøyaktig halvere den effektive fillraten. (Edit: Jeg tipper at begrensningen her ligger i hvor mange Z/Stensil-tester som kan gjøres per klokke. Om jeg skjønner ting riktig så har NV43 mye bedre effektivitet på de overdraw-reduserende funksjonene tidlig i pipelinen, så jeg gjetter på at vVidia derfor mente at dette ikke ville utgjøre noen stor begrensning i praksis.) Det *kan* være at de rett og slett ikke har båndbredde nok, men om dette er tilfellet så ville det jo være direkte dumt å 'kaste bort transistorer' på å beholde muligheten for 4 stk 4AA-piksler om de aldri vil nå så høyt i praksis grunnet andre flaskehalser?

 

I en stadig mere kompleks 3d-verden hvor operasjonene a/b/c alle tar lengere tid enn en klokke og alle tar forskjellig tiid, tenker jeg (forenklet) nVidia har hatt ett rationale som dette.

 

Vi skal lage noe raskt og billig. 256bits minnebuss koster mye, så bort med den. Nå har vi ikke båndbredde nok til 8 piksler per klokke, så bort med fire av dem. Nye spill trenger shaderkraft, så vi beholder masse av dette. Folkens, shadere tar fortsatt masse tid., så vi kan kaste ut muligheten for to ekstra AA-samples per pipline per klokke og det vil ikke gjøre noen forskjell siden shaderene skjuler denne kostnaden... Osv... Målet må være at så lite som mulig av brikken sitter og tvinner tomler (stalls) mens andre deler jobber. Konklusjonen blir en brikke med 'smartere' kraft på et gitt transistorbudsjett. Har noen publisert transistortall for 6600? Det skulle ikke forundre meg om dette var lavere enn for NV30 (mens ytelsen er mye høyere i 95% av situasjonene), og følgelig mener jeg at designet er 'balansert'.

Endret av qwert
Lenke til kommentar
Videoannonse
Annonse
Jeg følger deg ikke her. Poenget med MSAA er at det ikke gir et fillrate hit og det blir unngått med at sub-pixlene bruker samme farge data som orginal pixelen. Og uansett gir det et båndbredde hit.

Jeg tror vi snakker forbi hverandre (jeg er dessverre elendig til å forklare hva jeg mener). Multisampling reduserer, som du sier, i teorien ikke fillraten, siden brikken fortsatt kan skrive ut fire endelige pixler per klokke til framebufferet, men den interne samplingen av sub-pikselne tar tid. Det ser ut til at 4 stk. 4xAA-piksler i 6600 tar to klokkesykluser. I de testene jeg har sett ser 4xAA ut til å ganske nøyaktig halvere den effektive fillraten. (Edit: Jeg tipper at begrensningen her ligger i hvor mange Z/Stensil-tester som kan gjøres per klokke. Om jeg skjønner ting riktig så har NV43 mye bedre effektivitet på de overdraw-reduserende funksjonene tidlig i pipelinen, så jeg gjetter på at vVidia derfor mente at dette ikke ville utgjøre noen stor begrensning i praksis.) Det *kan* være at de rett og slett ikke har båndbredde nok, men om dette er tilfellet så ville det jo være direkte dumt å 'kaste bort transistorer' på å beholde muligheten for 4 stk 4AA-piksler om de aldri vil nå så høyt i praksis grunnet andre flaskehalser?.

Ok, da tror jeg at jeg er med :)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...