Gå til innhold

GeForce Gtx 10**/Titan og Pascal tråden


Anbefalte innlegg

Nå er det rundt et halvt års tid til det begynner å bli dags for en ny GPU-arkitektur fra Nvidia. Pascal ble offisielt annonsert på GPU Technology Conference i 2014, og ble satt inn mellom Maxwell og Volta.
 
NV-RM-2015.png
 
Så hva kan vi egentlig si om Pascal, og hvorfor dukket brikken plutselig opp i Nvidia sitt roadmap. Vel, som flere har kanskje vet var den opprinnelige planen at 2. gen Maxwell skulle på 20nm. Problemet var bare at 20nm prosessen ikke er egnet for store high-performance brikker som GPU'er. Kort fortalt så er problemet lekkasje. TSMC. Samsung og GloFo sin 20nm prosess er det "planar", plutselig var det ganske logisk hvorfor Intel valgte å introdusere 3D transistorer (FinFET) på 22nm. Hovedfokuset for 2. gen Maxwell ble da effektivitet, siden den måtte produseres på samme 28nm prosess som tidligere. Selve SM-arkitekturen (prosesseringsarkitekturen) ble endret ganske mye sammenlignet med Kepler. På 2. gen Maxwell ble det også prioritert å få inn full støtte for DX12.
 
Pascal kommer derfor ikke til å få veldig store endringer i SM-arkitekturen (med unntak av mixed precision), noen mindre tweaks både med hensyn på ytelse og strømforbruk kommer, men ikke like store endringer som fra Kepler til Maxwell. Der det kommer store endringer er minne og cache hierarkiet samt kommunikasjonsbussen inn og ut av brikken. Disse endringene er ganske store, og dette er en av grunnene til at Pascal ble satt inn i roadmap før Volta. 
 
Kort beskrivelse på at par av "nyhetene" i Pascal som Nvidia har avslørt:
 
Mixed Precision: Mixed precision vil si at ALU'ene i bunn og grunn får større fleksibilitet, slik at en 64-bit ALU lett kan konfigureres til å prosessere to 32-bit variable eller fire 16-bit variable. Det er en myte at "double precision" er alt hva man bryr seg om i GPGPU-verden. I mange tilfeller er også 16-bit (half precision) mer en nok, og spesielt i "deep learning nettverk" som er et veldig populært forskningsområde nå. Maxwell GPU'en som er i Tegra X1 har allerede delvis støtte for dette, da denne kan jobbe både med 32 og 16-bit, men dette er ikke på noen av de andre GMxxx brikkene. 
 
3D Memory: Her blir AMD første fabrikant til å ta dette i bruk, Nvidia valgte ikke å gi ut noen produkter med 2. gen HBM (HBM1), først og fremst fordi 28nm (selv uten DP) ikke tillater nok ALU'er til at man får en flaskehals på grafikk med 384-bit GDDR5 minne. På GPGPU-bruk med rett workloads kan man få en flaske hals, men da vil uansett begrensningen på 4GB være en show-stopper. 2. gen HBM (HBM2) vil støtte minnestørrelser på opp til 32GB. HBM kommer til å komme på flere av Pascal brikkene, ikke kun på high-end.
 
NVLink: Pascal kommer til å støtte 1. generasjon NVLink, Volta kommer med 2. generasjon. NVLink baserer seg på en utvidelse av PCI Express (større båndbredde). I første generasjon kommer NVLink primært til å bli brukt til å koble GPU'er sammen på dual-GPU kort samt i servere. Når og hvordan NVLink vil erstatte dagens SLI-bus vet vi enda ikke noe om. Nye generasjoner med ARM-prosessorer fra Nvidia og også Power 9 fra IBM vil etterhvert støtte NVLink.
 
 
Så hva er status på Pascal i skrivende stund? Første brikken i Pascal-familien hadde tap-out for et par uker siden hos TSMC. Brikkene produseres på 16nm FinFET+. Ting bør da ligge i rute til å lansere kort i slutten av Q1 2016. Mars/april er et godt tips! :)
 
La oss prøve å holde denne tråden oppdatert med rykter etc. etterhvert som vi nærmer oss release så skal jeg også se hva jeg kan komme med etterhvert. Pascal kommer uansett til å bli en spennende arkitektur, og hvis indikasjonene jeg har fått stemmer så vil ytelseshoppet være større denne gangen en hva det har vært ved de forrige generasjonene...
 

Edit: Typo

Endret av HKS
  • Liker 8
Lenke til kommentar
Videoannonse
Annonse

Gleder meg til Pascal. nVidia har hatt mye bra på gang de siste årene, Shadowplay, GFExperience, GSync, Shield mm, og det kommer nok ytterlige forbedringer. Et kraftmonster Pascal på 250w med dobbel ytelse av 980TI i 4K hadde vært noe :thumbup:

Lenke til kommentar

Da kommer nok GP304 først, så GP306 og til slutt GP300 da HKS? Hvis det stemmer at Pascal kommer i Q1 2016 og Volta kommer ca Q1 2018, så har nVidia 2 år de skal fylle med GPU'er. Vi kan anta at at Pascal kommer først på 16nm i 2016, og så 14nm eller lavere refresh verson i 2017? Bare for å spekulere litt her :p

Lenke til kommentar

Bertoz: mulig jeg har misforstått, men blir ikke dette da GP104, GP106 og GP100?

 

Spørsmålet skjønner jeg!

 

Men hva har tidligere vært normen? Litt tic/tock som hos Intel? GP20x i 2017? Fremdeles på 16nm, men refresh? Volta på 14nm?

Lenke til kommentar

Gleder meg til Pascal. nVidia har hatt mye bra på gang de siste årene, Shadowplay, GFExperience, GSync, Shield mm, og det kommer nok ytterlige forbedringer. Et kraftmonster Pascal på 250w med dobbel ytelse av 980TI i 4K hadde vært noe :thumbup:

Ikke glem hairworks/gameworks ;)

Lenke til kommentar

 

Bertoz: mulig jeg har misforstått, men blir ikke dette da GP104, GP106 og GP100?

 

100 serien var Kepler, 200 Maxwell og 300 da Pascal. Eller blingser jeg her?

 

 

Du blingser. ;)

 

100 eller 200 serien angir om det er "Tick" eller "Tock" innen samme arkitektur. Grunnen til at vi for det meste har sett 200 serie brikker i Maxwell serien er vel på grunn av produksjonsproblemer (om jeg husker riktig) som gjorde at bare litt av 100 serien ble rullet ut til desktop (GM107 i GTX750(ti) pluss et par OEM kort). Det som kom til laptop var GTX860M og ned til 830M. GTX860M kom også i en Kepler basert versjon, og resten oppover til GTX880M ble videre Kepler. 

 

Du har rett og slett glemt GT100/200 (Tesla) Som var Geforce 200 og 300 serien. Så kommer GF100/200 (Fermi) i form av 400 og 500 serien, GK100/200 (Kepler) i form av 600 700 og til dels 800M serien. Og så videre altså..

 

Edit: Prøvde å rydde opp litt, første "utkast" ble fryktelig rotete. Vanskelig å holde tunga rett i munnen når Fermi f.eks. strekker seg fra Desktop 400 serie til laptop 800 serie..

Endret av Gabri3L
Lenke til kommentar

Er ikke dette evt gtx 10**? Såfall er det en tråd

 

Tror grunnen til at denne ble startet var litt for mye ot i 9xx-tråden.

 

Er det ikke greit å ha en ny tråd for nytt kort? Er jo et hav av sider i 10xx-tråden. Og handler i hovedsak om Titan X og 980TI-rykter.

 

Det kommer vel ikke en overflod av Pascal-rykter med det første heller :)

 

100 serien var Kepler, 200 Maxwell og 300 da Pascal. Eller blingser jeg her?

Som Gabriel sa ja... Er vel litt sånn Tic Toc  - greier. Gx1xx - ny produksjonsteknikk. Gx2xx - ny arkitektur. Men dette er vel ikke garantert. GMxxx, GKxxx og GPxxx er vel Maxwell Kepler og Pascal

 

Men til syvende og sist er det vel opp til Nvidia hva de vil kalle chippene sine :)

Lenke til kommentar

 

 

Bertoz: mulig jeg har misforstått, men blir ikke dette da GP104, GP106 og GP100?

 

100 serien var Kepler, 200 Maxwell og 300 da Pascal. Eller blingser jeg her?

 

 

Du blingser. ;)

 

100 eller 200 serien angir om det er "Tick" eller "Tock" innen samme arkitektur. Grunnen til at vi for det meste har sett 200 serie brikker i Maxwell serien er vel på grunn av produksjonsproblemer (om jeg husker riktig) som gjorde at bare litt av 100 serien ble rullet ut til desktop (GM107 i GTX750(ti) pluss et par OEM kort). Det som kom til laptop var GTX860M og ned til 830M. GTX860M kom også i en Kepler basert versjon, og resten oppover til GTX880M ble videre Kepler. 

 

Du har rett og slett glemt GT100/200 (Tesla) Som var Geforce 200 og 300 serien. Så kommer GF100/200 (Fermi) i form av 400 og 500 serien, GK100/200 (Kepler) i form av 600 700 og til dels 800M serien. Og så videre altså..

 

Edit: Prøvde å rydde opp litt, første "utkast" ble fryktelig rotete. Vanskelig å holde tunga rett i munnen når Fermi f.eks. strekker seg fra Desktop 400 serie til laptop 800 serie..

 

Dette stemmer heller ikke. Fermi for desktop het GF10x for 400-serien og GF11x for 500-serien. Kepler het GK1xx, GK2xx er kun i Tesla og mobile. Eneste grunnen til at Maxwell fikk GM2xx er vel at det ble rullet ut noen kort i 700-serien ja.

 

Har gitt opp noen som helst logikk bak noe nVidia gjør med navn på chipper og kort når de kalte 980Ti for nettopp det, så det blir bare gjetting uansett.

Lenke til kommentar

Det som er spennende for meg iallefall er hvor godt Pascal kommer til å yte til 4K gaming, samt også ytelse i folding@home. Mener jeg leste at bare selve krympingen ned til 16nm gir ~40% bedre ytelse over dagens 28nm. 

Endret av Betroz
Lenke til kommentar

Krymping i seg selv gir ikke bedre ytelse. Men du får plass til mer når "ting" tar mindre plass :)

 

Vil tro dette blir det største hoppet siden vi hoppet til 28nm med 7970/680. Daska jo rundt med GTX580 noe fælt, og spesielt 680 var jo egentlig en midrange chip. Om du sammenligner 580 med 780 vil du få et bilde av mulighetene :)

Lenke til kommentar

Hvis det er noe system i navngivingen av brikkene så har det med hvor store endringene er mellom revisjonene. Noen eksempler:

Tesla: GT200, GT218 (hvor ble det av "GT100", ble designet forkastet?)

Fermi: GF100, GF110

Kepler: GK104, GK208, GK110

Maxwell: GM107, GM200

 

 

Lenke til kommentar

Krymping i seg selv gir ikke bedre ytelse. Men du får plass til mer når "ting" tar mindre plass :)

 

Jau, men er noe med at transistorene har mindre lekasje på den nye 14nm prosessen, slik at de er mer effektive. Herav 40% mer ytelse. Om det stemmer det jeg leste er en annen sak.

 

Edit : TSMC teases that 16nm FinFET will deliver 40% performance improvement.

Endret av Betroz
Lenke til kommentar

 

Krymping i seg selv gir ikke bedre ytelse. Men du får plass til mer når "ting" tar mindre plass :)

 

Jau, men er noe med at transistorene har mindre lekasje på den nye 14nm prosessen, slik at de er mer effektive. Herav 40% mer ytelse. Om det stemmer det jeg leste er en annen sak.

 

Edit : TSMC teases that 16nm FinFET will deliver 40% performance improvement.

 

Tja,

Alternatively, for the same power, they would be able to cram in a huge 40% performance gain.

Så det handler om at krympingen vil øke energieffektiviteten slik at prosessorer kan øke antall transistorer og/eller klokkefrekvens og få opptil 40% bedre ytelse for samme energiforbruk.
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...