Hirdetés

CES 2016: az AMD bemutatta a Polaris architektúrát

Még az előző év legvégén írtunk arról, hogy Polaris lesz az AMD új GPU-architektúrájának a kódneve, amely most hivatalosan is megerősítést nyert. Ezzel egyetemben persze már nem csak magáról a kódnévről lehet tudni, hanem pár apró részletről is. A bonyodalmak elkerülése végett rögtön az elején érdemes tisztázni, hogy az új rendszer a GCN alaparchitektúra negyedik generációs verziójára épül. Belsőleg ez GCN4-ként van aposztrofálva, míg a Polaris kódnév az egész csomagra vonatkozik, amelybe a GCN4-es alap mellett beletartozik a multimédiára és a kijelzőkre vonatkozó rendszer is.

A kijelzőkezelésre vonatkozó adatokat az AMD már az előző évben leleplezte, így erről a linkelt hír mindent leír. Röviden összefoglalva lesz DisplayPort 1.3 és HDMI 2.0a, illetve működni fognak a HDR-es kijelzők is.

A multimédia sem lesz bonyolult. Az új UVD motor támogatni fogja a 4K-s HEVC videókat, beleértve a 10 bites tartalmakat is, míg az új VCE motor 4K-ban és 60 képkocka/másodperces sebességgel képes majd rögzíteni a HEVC formátumba.


[+]

Az igazi meglepetéseket a GCN4-es alap szolgáltatja. Ez nagyrészt ismerős lesz az előző GCN verziókból, de lesz számos újítás. Többek között javul a GCN3-ban bemutatott Delta Color Compression technika, így még hatékonyabb lesz a színadatokra vonatkozó tömörítés, ami a memória hatékonyabb kihasználáshoz vezet. Mindemellett javul a shaderek végrehajtásának hatékonysága is, de arról még nincs adat, hogy miképpen. Újítás lesz, hogy a GCN4-ben a compute parancsmotorok már csak a fejlettebb ACE verziót kapják meg, ami tulajdonképpen a HWS (Hardware Scheduler) nevű egység. Ez a GCN 3-ban már elérhető, de ott a HWS mellé még pár ACE egység is került. Egy HWS egyébként két ACE egység képességeinek megfelelő tudással rendelkezik, és az alapvető előnye a finomszemcsés preempció és a QoS (Quality of Service) támogatása. Előbbi felel azért, hogy a kritikus fontosságú feladatok előnyt élvezzenek, míg utóbbi a többfelhasználós környezet hatékony kezelését teszi lehetővé. Tekintve, hogy a HWS egység jól vizsgázik a mostani lapkákban (Fiji, Tonga, Antigua és Carrizo), várható volt, hogy nem csak részlegesen, hanem teljesen kiváltja az ACE egységeket.

A GCN4 további újításának tekinthető az új L2 gyorsítótár, az új memóriavezérlő, illetve az új multiprocesszor, de ez eleve következik a GCN4-ből. Nyilván ezek a hatékonyság növelését célozzák meg. Érdekes azonban, hogy megújul a fő parancsprocesszor. Ez az egyik dolog, amire az AMD nagyon figyelt, és ezt okkal tették. Az új generációs explicit grafikus API-k (Microsoft DirectX 12, Khronos Group Vulkan és AMD Mantle) ugyanis teljesen áthelyezik a feldolgozás során keletkező szűk keresztmetszeteket. Eddig a legfőbb limitációnak a központi processzor számított a rajzolási parancsok szempontjából, de az új rendszerekkel akár egymilliószor is gyorsabb lehet egy rajzolási parancs beírása a parancspufferbe, ami azt is jelenti, hogy a processzor oldali limitáció nagyságrendekkel csökkent. A legszűkebb keresztmetszet mostantól a grafikus vezérlőkbe épített a fő parancsprocesszor lesz. Ezt az AMD ugyan folyamatosan fejlesztette annak ellenére, hogy az aktuálisan elterjedt, de elavult DirectX 11-es API-ban ennek semmi előnye nem volt. Ugyanakkor a vállalat már a Mantle tesztelésénél is láthatta, hogy a mostani opciónál is gyorsabb megoldás kell, ami a GCN4-ben be is mutatkozik. Ez az egyik nagyon érdekes lépés az AMD-től, ugyanis megszokhattuk, hogy az egyes problémákra általában akkor érkezik a megoldás, amikor már a probléma a gyakorlati alkalmazásokban is felütötte a fejét, de az AMD ezt a szűk keresztmetszetet nagyon gyorsan akarta kezelni, mert az összes explicit API-ra írt alkalmazást érinteni fogja, és egy megfelelő hardveres alap lényeges előnyöket jelent a sebesség tekintetében.

A fő parancsprocesszor kigyúrása azonban csak egy problémát old meg, ugyanakkor a Mantle tesztelésénél számos limitáció került még elő. Az egyik legnagyobb gond ahhoz köthető, hogy a több kiadható rajzolási parancs jóval komplexebb jelenetek megtervezésére ad lehetőséget, amivel növekszik a jelenetekben használt primitívek száma. Ezek a primitívek azonban csak részben hasznosak, mert nem mindegyik kiszámolt elem látszik. Bár a grafika számításánál ma számos algoritmus törekszik arra, hogy a nem látható részletek még a feldolgozás előtt ki legyenek vágva, teljes megoldás erre nem igazán van, így valamennyi alapvetően haszontalan primitív átcsusszan a szűrőn és ezekről sajnos csak akkor derül ki, hogy nem látszanak, ha a számítások jó része már el lett végezve rajtuk. Ekkor persze ki lesznek vágva, de az erőforrások egy részét már elvitték. A komplexitás növekedésével sajnos növekszik a végeredmény szempontjából haszontalan számítások mennyisége is, amire a GCN4-es dizájn bevezeti a nem hasznos primitívek eldobásának gyorsítását. Ez nagyrészt fixfunkciós hardveres blokként működik, és az a dolga, hogy az egyes primitívekről a lehető leghamarabb megmondja, hogy nem fognak látszani a végső képen, így a hardver ezek számításával nem is törődik tovább. Ilyen formában a GCN4-es dizájn ugyanannak a képkockának a kiszámításához kevesebb primitívet dolgoz fel. Ez nagyrészt akkor fog jelentős előnyt biztosítani, ha az adott jelenet nagyon komplex, viszont az előny megéri, mert ezek a helyzetek azok, ahol a legrosszabb a sebesség, vagyis a primitívek eldobásának gyorsítása elsődlegesen a minimum teljesítmény komolyabb növelésére törekszik.

A GCN4-es dizájn harmadik nagy újítása a compute-hoz kapcsolódik, ugyanis bevezetésre kerül a utasítás előbetöltés. Ez nagyban növeli majd az architektúra egyszálú teljesítményét, amely egy grafikus vezérlő esetében nem annyira kritikus, de egyre több lesz a kritikus fontosságú feladatok elvégzésére az igény, ahol a program a lehető leghamarabb vár majd eredményt. Ebből az újításból például a virtuális valóság sokat profitálhat, hiszen ott nagyon fontos, hogy timewarpnak a lehető leghamarabb legyen eredménye.

Az AMD a Polaris architektúrát már a FinFET gyártástechnológiákra tervezte, de a cég még mindig nem nevezte meg, hogy ki lesz a bérgyártó. Információink szerint az alapdizájn a Samsung és a GlobalFoundries által használ 14 nm-es LPP node-ra készült el, de erre vonatkozóan megerősítést még nem kaptunk. Annyi viszont kiderült, hogy a fogyasztás jelentősen csökken, így a hatékonyság is nő. Erre vonatkozóan az AMD egy tesztet végzett, és egy meg nem nevezett új generációs, Polaris architektúrára épülő Radeon 86 wattos, teljes PC-re vonatkozó fogyasztással volt képes futtatni a Star Wars Battlefront című játékot közepes beállítással, Full HD-ben, 60 képkocka/másodperce sebességgel. Ugyanerre például egy GeForce GTX 950, ugyanazzal a PC-vel 140 wattos fogyasztás mellett volt képes.


[+]

A Polaris architektúrára épülő első Radeonokat az AMD az év közepén szeretné piacra dobni. A vállalat hozzátette, hogy a termékmintákat már szállítják az OEM partnereknek.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés