Hirdetés

Betekintés az NVIDIA Turing architektúra rejtelmeibe

Sok szempontból a Volta köszön vissza, amely rendszerből nem is készült GeForce.

A multiprocesszorokon túli felépítés

A Turing architektúra a strukturális felépítést tekintve túlságosan nem változott a setup területén, így az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből három található a TU106-ban, és hat-hat a TU104-ben és TU102-ben. Egy raszter motor egyébként maximum hat darab Texture Processor Cluster (TPC) ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami a TU102 esetében a teljes lapkára nézve 96 pixelt jelent, amely adat egyensúlyban vannak a 96 blending egységgel is, azaz a friss fejlesztés ezen a ponton kiegyensúlyozott. A TU104 esetében is 96 pixellel kell számolni, de ehhez csak 64 blending egység tartozik, vagyis a rendszer ezeket túleteti. Mondjuk ez még mindig jobb opció a TU106-hoz képest, ahol viszont már 48 pixel jut 64 blendingre, azaz ez a konfiguráció kvázi éhezni fog. Mindezek mellett a TU102, a TU104 és a TU106 órajelenként rendre hat, hat és három háromszöget képes feldolgozni.

TU102
TU102 [+]

A TPC-kben található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, és a korábbi rendszerekhez képest semmit sem változott a működése. Mivel a TU102-ben, a TU104-ben és a TU106-ban rendre 36, 24 és 18 TPC található, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez.

TU104
TU104 [+]

A megosztott L2 gyorsítótár szempontjából a TU102 6, míg a TU104 és TU106 4-4 MB-nyi kapacitást kap. Emellett a GDDR6-os szabványú memóriákat támogató memóriavezérlő szempontjából az NVIDIA maradt a crossbarnál. A TU102 384, míg a TU104 és a TU106 256 bites szélességű buszt használ, ami 32 bites csatornákra van szétosztva. Egy ilyenhez egy ROP-blokk tartozik, amelyen belül 8 bleding és 32 Z mintavételező egység található.

TU106
TU106 [+]

Ezek így leírva bonyolultnak tűnhetnek, így az új lapkák elméleti kiépítését az alábbi táblázatban vázoljuk fel:

NVIDIA Turing architektúrára épülő GPU-k
Típus TU102
TU104 TU106
GPC-k száma
6
6
3
TPC-k száma
36
24 18
PolyMorph motorok száma
36 24 18
Rasztermotorok száma
6 6 3
Blending egységek száma
96 64 64
Z mintavételező egységek száma
384 256 256
FP32 magok száma
4608 3072 2304
INT32 magok száma
4608 3072 2304
Tensor magok száma
576
384 288
Textúrázók száma 288 192 144
RT részelemek száma
72 48 36
Memóriabusz szélessége
384 bit
256 bit
256 bit

A friss lapkák közül a TU102 és a TU104 rendelkezik még NVLINK interfésszel is, míg a TU106-ból ez kimaradt. Mivel a korábbi SLI csatlakozót az NVIDIA kivégezte, így két TU106 már nem is köthető össze SLI-be. Ettől még lehet használni két ilyen GPU-t, de ahhoz DirectX 12 és Vulkan API-n futó alkalmazás kell, amelyeknél a több GPU-s támogatása alkalmazásfüggő, így nincs igény a gyártók zárt interfészeinek alkalmazására, hiszen a kommunikáció aszinkron DMA-n keresztül valósulhat meg.

Az NVLINK-et egyébként az NVIDIA nem használja olyan formában, amilyenre egyébként eredetileg fejlesztették, szimplán a korábbi, SLI-hez írt szoftverkörnyezetet portolták rá, vagyis effektíve ez az összeköttetés nem igazán több a korábbi megoldásnál. Lehetőség amúgy lenne benne, elvégre memóriakoherens interfészről beszélünk, de valószínűleg az NVIDIA nem különösebben akar erre pénzt áldozni, hiszen a DirectX 12 és Vulkan API-n belül az aszinkron DMA-n keresztüli kommunikáció van definiálva, ami úgyis a PCI Express interfészen keresztül zajlik.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés