Színre lépett a Radeon HD 6800

A Barts felépítése


[+]

A HD 6000-esek bejelentését nagy ködösítés előzte meg. Gyakorlatilag az utolsó napig találgatott mindenki, ami a paraméterek alapján nem is csoda. Az új termékcsalád a Northern Islands kódnévre hallgat, és ez ellentmond a korábbi pletykákban szereplő Southern Islands jelzésnek, ami alátámasztja, hogy az AMD nem hivatalos csatornái mesteri módon félrevezették az érdeklődőket. A Northern Islands egy érdekes generáció lett. Mindenképp érdemes megjegyezni, hogy a termékek a TSMC 32 nm-es eljárását használta volna, ám a tajvani bérgyártó törölte az ominózus gyártástechnológiát, így minden partner a 40 nm-es csíkszélességen rekedt. Ez azt eredményezte, hogy még termékcsaládon belül is lesznek jelentősnek mondható eltérések, ami eddig messze nem volt megszokott.

Hirdetés

A Northern Islands első képviselője a Barts kódnevű GPU, ami a Radeon HD 6850 és 6870 alapját képzi. A lapka 1,7 milliárd tranzisztort tartalmaz, alapterülete pedig 255 mm². Az AMD tehát továbbra is a Sweet Spot stratégiát folytatja, ennek megfelelően a termék négyzetmilliméterenkénti teljesítményét próbálják maximalizálni. A korábbi generációval való összehasonlítás tehát most kiemelten érdekes lehet, ugyanis az azonos gyártástechnológiának hála tökéletes képet lehet kapni arról, hogy az AMD mérnökei mennyire végeztek jó munkát a Sweet Spot irányelveket követve. A Barts architektúrája sok helyen megújult, de sok helyen változatlan maradt. A lapkában összesen 14 darab 80 utas shader tömb kapott helyet egy-egy textúrázó blokk társaságában. A shader tömbök felépítése az előző generációhoz mérve változatlan, azaz továbbra is 16 darab szuperskalár shader processzor teljesít bennük szolgálatot. A Local Data Share természetesen megmaradt, és kapacitása sem változott, azaz szabványos 32 kB-os tárolók vannak egy-egy shader tömbhöz kötve. Szokás szerint nemcsak a helyi, hanem a globális adatmegosztás is része a rendszernek, így a két shader blokk közé ékelődő, nagy sebességű, 64 kB-os (Global Data Share) tárterület most sem hiányzik. A shader tömbönként található textúrázó blokk négy darab Gather4-kompatibilis csatornát alkalmaz, melyek csak szűrt mintákkal térnek vissza. Az interpoláció a HD 5000-es sorozathoz hasonlóan emulált, ám az AMD számos optimalizálást hajtott végre ezzel kapcsolatban, így ez a funkció az előző generációhoz viszonyítva jelentősen kevesebb általános erőforrást emészt fel.


[+]

A szuperskalár shader processzorok képességei nem javultak, vagyis egy az egyben a HD 5000-es generáció megoldásai köszönnek vissza, ami azonban változás, hogy a két darab shader blokk különálló Ultra-Threading Dispatch Processzorra támaszkodik, ami jelentősen javít a rendszer belső vezérlésén. A feldolgozó motor képességei is erősödtek. Az AMD továbbra is két raszterizálót rajzol a logikai vázlatba, ám ez csak az egység felépítésére utal. A Barts esetében is egy háromszög lesz órajelenként feldolgozva, de a scan conversion egységek ez idő alatt 32 pixellel birkóznak meg. A blending egységek száma is ennyi, tehát a rendszerben ezzel kapcsolatban nem keletkezik szűk keresztmetszet a felbontás növelése esetén. Csakhogy valami változás is legyen, megújult tesszellátort köszönthetünk, mely már a hetedik generációs megoldás az AMD történelmében. A vállalat a felső-középkategóriában érthetően nem ragaszkodik a szétbontott feldolgozó motor aránytalanul magas tranzisztorigényéhez, így inkább optimalizálták a tesszellációs képességeket. Az új egység átlagosan 75%-kal nagyobb teljesítményt kínál egészen húszszoros felbontásig. Ez valószínűleg elég lesz a legtöbb játék esetén, figyelembe véve azt, hogy a tesszellálás alkalmazása messze nem problémamentes.

A cég egyébként úgy látja, hogy a manapság elterjedt Full HD-s felbontás mellett már hatékonynak mondható, ha egy háromszög minimum 16 pixel, de semmiképpen se legyen kisebb négy képpontnál. Ez az elgondolás érthető, hiszen a mai hardverek a raszterizálást négyes pixelblokkokon hajtják végre a hatékony párhuzamos feldolgozás érdekében. A probléma akkor merül fel, ha egy háromszög kisebb, mint négy pixel, mivel ilyen esetben a négyes blokk nem azonos háromszögön dolgozik, vagyis a másik háromszögre is ki kell számolni a teljes blokkot, ami több mint erőforrás-pazarlás. Gyakorlati példával élve legyen egy háromszög egy pixel nagyságú. A számítás az egyik háromszöggel kezdődik az egyik pixelen, ami mellé további három képpont tartozik a blokkosított feldolgozás miatt. Ez már önmagában azt jelenti, hogy egyetlen apró háromszögért négy pixelt kell ellenőrizni, ám a poligon kicsi, így jó eséllyel mellette lesz a társa, ami további ellenőrzéseket jelent. Különösen kritikus eset a tényleges gyakorlat, ott ugyanis a háromszögek nem fedik tökéletesen a pixelt, vagyis legrosszabb esetben 12 pixel ellenőrzését is végre kell hajtani, ami lehangolóan sok felesleges munkát eredményez. Ez az a pont, amin a következő generációs DirectX platformoknak javítani kell, mert a jelenlegi rendszeren a feldolgozómotor kapacitásának nagy része, extrém mértékű tesszellálásnál csak az ellenőrzésre menne el. Szemléltetésnek az alábbi képet érdemes elővenni, ami a sárgára színezett képpontokkal jól szemlélteti, hogy mennyi munka megy kárba egyetlen apró háromszöggel.

A 775 MHz-es magórajelen ketyegő Radeon HD 6850 esetében a chip 12 aktív tömbbel dolgozik, ami 960 shader processzort és 48 darab Gather4-kompatibilis textúrázó csatornát eredményez. A Radeon HD 6870 már 14 darab tömbbel rendelkezik, ennek megfelelően az 1120 darab shader processzorhoz 56 textúrázó csatorna tartozik, míg az órajelfrekvencia 900 MHz-re módosul. Ebből az következik, hogy az előbbi modell 1,5, míg az utóbbi 2 TFLOPS-os számítási teljesítményre képes. Mindkét új Radeon 8 darab ROP blokkal rendelkezik, ami összesen 32 blending és 128 Z mintavételező egységet tartalmaz. Ezek a megszokott HUB központú memóriavezérlőre kapcsolódnak, ami négy darab 64 bites csatornára oszlik. A memóriakonfiguráció 1 GB lehet, és a memórialapkák a GDDR5 szabványra épülnek. Ezek a HD 6850-en 4 GHz-es, a HD 6870-en pedig 4,2 GHz-es effektív órajelen üzemelnek, ami 128 és 134,4 GB/másodperces adatátviteli sebességet garantál.

Mivel elmaradt a gyártástechnológiai váltás, így a fogyasztás szempontjából nem történt komoly fejlődés, de a HD 5000 sorozat igen magasra, vagyis alacsonyra tette a lécet ebből a szempontból. A Radeon HD 6850 és 6870 rendre 127, illetve 151 wattos maximális energiaigénnyel rendelkezik, a terhelésmentes időszak alatt azonban aktiválódnak az energiagazdálkodási szolgáltatások, ami nagyon hízelgő, 19 wattos fogyasztást eredményez.


[+]

Képminőség szempontjából tovább javult az anizotropikus szűrés, így a LOD szintek között eltűntek az éles átmenetek. Ennek az éles szemű játékosok örülhetnek, de a többség számára az eddigi megoldásokkal sem volt érzékelhető probléma. Az igazi változás az élsimítás területén következik be, ahol bemutatkozik a morfológiai algoritmus. Ez a megoldás egy DirectCompute alapú post-process effekt, ami az adott pixel végső színének meghatározásához a környező képpontokat is figyelembe veszi. Legnagyobb előnye, hogy minden leképzési eljárással működik, vagyis a deferred render motorokkal is, továbbá az élek mellett a textúrákat és az átlátszó objektumokat is szűri. A képminőség ugyan nem éri el a HD 5000-ben bemutatott úgynevezett AutoLOD funkcióval felvértezett rotated grid supersampling szintjét, ám jelentősen kevesebb erőforrással is beéri, vagyis a gyengébb kártyák mellett is alkalmazható, miközben az új játékokban amúgy is használhatatlan multisampling mintavételnél jobb minőséget eredményez.


[+]

Az új Radeonok az architektúrális változtatásokon felül újabb funkciókkal is bővülnek. Az UVD (Universal Video Decoder) 2 után eljött az idő az UVD 3 megjelenésére, ami az Ultra HD (7680x4320 pixel) videók gyorsítását is támogatja, valamint kezeli a VP8-as kodeket, mely az internetre betörő WebM és HTML5 tartalmak gyorsabb feldolgozását teszi lehetővé. A HD3D az NVIDIA 3D Visionjét másolja, egy erre kitalált szemüvegen keresztül 3D-s megjelenítést tesz lehetővé játékok és filmek alatt. Végül az új kártyákon a HDMI-kimenetet felfrissítették az utolsó, 1.4a verzióra, ami további két 3D-s formátum megjelenítését teszi lehetővé (side by side horizontal és top and bottom).

Amint az összegző táblázatunkból kitűnik első ránézésre, a HD 6800-asok jóval gyengébbnek látszanak elődeiknél, a HD 5800-asoknál. A GPU órajelek ugyan emelkedtek, de ha az 50-es és a 70-es párosításokat vesszük alapul, akkor azt látjuk, hogy a számolók és a textúrázók száma is közel 30%-kal csökkent, de még a memória órajele is visszafelé "fejlődött". Az AMD szempontjából örvendetes, hogy a GPU alapterülete 24%-kal redukálódott, ami alacsonyabb gyártási költségeket tesz lehetővé, de a paraméterek alapján ez inkább visszalépés, mint előrelépés. Szerencsére az ördög ezúttal is a részletekben rejlik. A HD 6800 a GTX 460 alapjául szolgáló GF104-es chiphez hasonlóan egy továbbfejlesztett, optimalizált architektúra, ezesetben ugyanis a két darab shader blokk külön vezérlést kapott, azaz lényegében a GF104-hez hasonlóan az ütemezés hatékonyságát javították. Ez az NVIDIA-nak bevált, hiszen a GTX 460 kevesebb számolóval is van olyan gyors, mint a robosztusabb, de fejletlenebb GTX 465 (igaz ott a textúrázók száma is nőtt), tehát a kérdés már csak az, hogy a HD 6800-asok is képesek-e erre a bravúrra.

A HD 6800-asok a HD 5800-asokat váltják a termékpalettán ezért egyértelmű elvárás a részünkről (és az olvasók részéről is), hogy legyenek legalább olyan gyorsak, mint elődeik. Hogy ez az elvárás megvalósult-e, hamarosan kiderül. Az mindenesetre tény, hogy a Barts 255 mm²-es alapterületével ismét feladja a leckét az NVIDIA-nak. A 200-250 dolláros ársávban a GTX 460 jóval nagyobb, 358 mm²-es chippel versenyez, ami továbbra is azt mutatja, hogy az AMD komoly fölényben van ezen a téren.

VGA megnevezése Radeon HD 6870 Radeon HD 6850 Radeon HD 5870 Radeon HD 5850 GeForce GTX 470 GeForce GTX 460
(1 GB)
GPU kódneve Barts Cypress Fermi GF104
Gyártástechnológia 40 nm (TSMC) 40 nm (TSMC) 40 nm (TSMC)
Tranzisztorok száma 1,7 milliárd 2,15 milliárd ~3 milliárd 1,95 milliárd
Chip mérete 255 mm² 334 mm² 529 mm² 358 mm²
GPU /
shader órajele terhelve
900 MHz 775 MHz 850 MHz 725 MHz 607 MHz
1215 MHz
675 MHz
1350 MHz
GPU /
shader órajele üresjáratban
100 MHz 100 MHz 157 MHz 157 MHz 51 MHz
101 MHz
51 MHz
101 MHz
Számolóegységek száma 224 komplex és 896 darab egyszerű stream processzor 192 komplex és 768 darab egyszerű stream processzor 320 komplex és 1280 darab egyszerű stream processzor 288 komplex és 1152 darab egyszerű stream processzor 448 db skalár stream processzor 336 db skalár stream processzor
Textúrázók száma 56 textúracímző és -szűrő 48 textúracímző és -szűrő 80 textúracímző és -szűrő 72 textúracímző és -szűrő 56 textúracímző és -szűrő 56 textúracímző és -szűrő
ROP egységek száma 8 blokk (32) 8 blokk (32) 8 blokk (32) 8 blokk (32) 10 blokk (40) 8 blokk (32)
Támogatott DirectX verzió 11 11 11
Memóriavezérlő 256 bites hubvezérelt 256 bites hubvezérelt 320 bites crossbar 256 bites crossbar
Memória órajele terhelve 1050 MHz (GDDR5) 1000 MHz (GDDR5) 1200 MHz (GDDR5) 1000 MHz (GDDR5) 837 MHz (GDDR5) 900 MHz (GDDR5)
üresjáratban 300 MHz 300 MHz 300 MHz 300 MHz 67 MHz 67 MHz
Max. memória-sávszélesség 134 400 MB/s 128 000 MB/s 153 600 MB/s 128 000 MB/s 133 900 MB/s 115 200 MB/s
HD filmek lejátszásának hardveres támogatása AVIVO HD (UVD 3) AVIVO HD (UVD 2) Purevideo HD (VP4)
TDP 151 watt 127 watt 188 watt 151 watt 215 watt 160 watt

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés