Mit tudhat majd vajon a Kaveri GPU-ja?

HD 7750-ből Kaveri IGP-t

Az AMD Kaveri kódnevű lapkájáról már jó néhány alkalommal adtunk hírt, így a fejlesztésnek már viszonylag sok részlete ismert. A Trinity/Richland páros leváltására hivatott APU szinte minden téren hoz újításokat. Az összesen négy x86-os magot magában foglaló két modul immáron a Steamroller elnevezésű mikroarchitektúrára épül, mely a Piledriver továbbfejlesztéséből született. Végleges termék nélkül nem egyszerű behatárolni a több elemében módosított architektúra pontos hatását, de az előzetesen kiszivárgott eredmények ismeretében, azonos órajel mellett nagyjából 10-15% gyorsulásra számíthatunk a közvetlen elődhöz képest.

Az integrált grafikus szekció felépítése is változik, ugyanis a korábbi VLIW4 rendszert a GCN váltja, annak is C.I. elnevezésű utasításarchitektúrája. Hasonló rendszerre épül a Kabini és a Temash kódnevű SoC APU-k IGP-je, az új generációs konzolokban található APU-k integrált grafikus vezérlője, illetve a Hawaii kódnevű cGPU is. Ezen felül a lapka megkapja TrueAudio támogatást, frissül a fixfunkciós UVD dekóder és a VCE enkóder egység is, illetve mostmár a PCI Express 3.0 támogatás is megoldott lesz. Az AMD termékpalettáján a Kaveri lesz az első HSA-támogatással rendelkező termék, bár ennek kihasználásához megfelelő szoftverekre is szükség lesz, melyek megjelenésére általában hónapokat, rosszabb esetben akár éveket kell várni.


forrás: pc.watch [+]

A teljes lapka 47%-át fogja kitenni az integrált GPU, ami 5%-os növekedés a Trinity és Richland 42%-ához képest. Már viszonylag régóta ismert adat, hogy mindez 8 darab CU-t (Compute Unit) takar, ami összesen 512 végrehajtóegységet foglal magában. Ez a szám pontosan megegyezik a Radeon HD 7750 Cape Verde Pro kódnevű GPU-jában található egységek számával. Ahogy korábbi tesztünkben elmondtuk, a Cape Verde 10 CU-t, azaz összesen 640 számolóegységet tartalmaz, amiből két darab CU (128 végrehajtó) letiltásra kerül a HD 7750-ek GPU-ja esetében, így 512 végrehajtóegység, illetve 32 textúracímző és -szűrő marad a 16 ROP mellett. A Cape Verde egy 128 bites memóriavezérlőt tartalmaz, ami egyaránt támogatja a GDDR5, illetve a DDR3 memóriákat is, így a gyártók zöme mindkét típusra épít termékeket.


GDDR5 – DDR3 [+]

A GPU specifikációjában a DDR3-as és GDDR5-ös modellek teljesen megegyeznek. A maximálisan elérhető memória-sávszélesség tekintetében ez már egyáltalán nem mondható el, hisz míg a DDR3-as modellek az effektív 1600 MHz-en üzemelő chipekkel 25,6 GB/s-os értéket képesek elérni, addig a GDDR5-ös variánsok ennek majdnem triplájából, 72 GB/s-ból gazdálkodhatnak, ami igen nagy különbséget jelent.


Az A10-6800K IGP-je

A Kaveriről azt is tudjuk, hogy a Richland kódnevű A10-6800K-hoz hasonlóan legfeljebb DDR3-2133 szabványú memóriákat támogat, így az elérhető maximális sávszélesség ezen APU esetében is 33,33 GB/s lehet. A közeljövőben megjelenő modellek GPU órajele is ismert, amit 720 MHz-ben szabott meg az AMD. Ez az érték pontosan 10%-kal, azaz 80 MHz-cel alacsonyabb a HD 7750 GPU-jának üzemi frekvenciájánál.


[+]

Ezen adatok ismeretében próbáltuk meg szimulálni a Kaveri IGP-jének várható teljesítményét egy HD 7750 segítségével. Bár a Cape Verde még a korábbi GCN S.I.-re épül, de a 3D megjelenítés teljesítményét ez az eltérés valószínűleg nem fogja jelentősen befolyásolni. Első körben a DDR3-as HD 7750 memóriáinak órajelét próbáltuk megemelni, de ezzel még 2000 MHz-ig sem jutottunk. Ezután egy GDDR5-ös modell frekvenciáját csökkentettük, de a 33,33 GB/s-hoz szükséges meglehetősen alacsony, 533 Mhz-es órajelet egyik szoftver sem engedte beállítani, pontosabban 670 MHz alatt már automatikusan visszaugrott a gyári 1150 Mhz-re a chipek frekvenciája. Végül kénytelenek voltunk egy kicsit radikálisabb eszközhöz nyúlni, így egy VGA BIOS szerkesztővel átírtuk a kártya gyári értékeit, mely próbálkozásunkat már siker koronázta.


A végeredmény

IGP/VGA megnevezése Radeon
R7 2xxD*
Radeon
HD 7750 (DDR3)
Radeon
HD 7750
Radeon
HD 7770
Radeon
HD 6670
Radeon
HD 8670D
Kódnév Spectre Cape Verde Pro Cape Verde XT Turks Devastator
Gyártástechnológia 28 nm (GF) 28 nm (TSMC) 40 nm (TSMC) 32 nm (GF)
Mikroarchitektúra GCN C.I. GCN S.I. VLIW5 VLIW4
Tranzisztorok száma nem ismert 1,5 milliárd 716 millió 1,3 milliárd
Lapka mérete nem ismert 123 mm2 118 mm2 246 mm2
GPU órajele 720 MHz 800 MHz 1000 MHz 800 MHz 844 MHz
Shader processzorok típusa multiprecíziós vektor szuperskalár
Számolóegységek száma 512 640 480 384
Textúrázók száma 32 textúracímző
és -szűrő
40 textúracímző
és -szűrő
24 textúracímző
és -szűrő
ROP egységek száma 4 blokk (16) 2 blokk (8)
Memória mérete 1024 MB 2048 MB 1024 MB
Memóriavezérlő 128 bites hubvezérelt
Memória órajele terhelve (effektív) 2133 MHz (DDR3) 1600 MHz (DDR3) 4500 MHz (GDDR5) 4000 MHz (GDDR5) 2133 MHz (DDR3)
Max. memória-sávszélesség 34 132 MB/s 25 600 MB/s 72 000 MB/s 64 000 MB/s 34 132 MB/s
Támogatott DirectX 11.2 11
*Az integrált grafikus vezérlő valószínűsíthető elnevezése

Tesztelés

Tesztkörnyezet
FM2 tesztplatform AMD A10-6800K (4,1 GHz) processzor
ASUS F2A85-V PRO alaplap (A85X chipset, BIOS: 6104)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-2133 beállítás, 11-12-11-30-2T időzítések
Videokártyák AMD Radeon HD 7770 GHz Edition 1 GB GDDR5 – Catalyst 13.11 beta
ASUS Radeon HD 7750 1 GB GDDR5 – Catalyst 13.11 beta
Sapphire Radeon HD 7750 2 GB DDR3 – Catalyst 13.11 beta
Sapphire Radeon HD 6670 1 GB GDDR5 – Catalyst 13.11 beta
AMD Radeon HD 8670D (A10-6800K IGP) 1 GB DDR3 – Catalyst 13.11 beta
Háttértárak Intel SSD 510 250 GB SSDSC2MH250A2 (SATA 6 Gbps) SSD
Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache) merevlemez
Processzorhűtő Prolimatech Megahalems Rev.C
Tápegység Seasonic Platinum Fanless 520 – 520 watt
Monitor Samsung Syncmaster 305T Plus (30")
Operációs rendszer

Windows 7 64 bit

Az általunk egyedileg beállított HD 7750 mellett a referencia GDDR5-ös, illetve DDR3-as HD 7750 is bekerült a tesztbe, továbbá a szintén referencia HD 7700 és HD 6670 is részt vett az összehasonlításban. A tesztekhez most öt játékot, illetve a LuxMarkot választottunk ki.

Játékok

  • Crysis 3 (DirectX 11) – motor: CryEngine 3 / műfaj: FPS
  • DiRT Showdown (DirectX 11) – motor: EGO Engine / műfaj: autóverseny
  • Hitman: Absolution (DirectX 11) – motor: Glacier 2 / műfaj: TPS
  • Sleeping Dogs (DirectX 11) – motor: United Front Engine / műfaj: TPS/akció
  • Tomb Raider (DirectX 11) – motor: Crystal Engine / műfaj: TPS/kaland

A méréseket 1680x1050-es és 1920x1200-as felbontásban végeztük el, miközben a részletességet az adott játék erőforrásigényeinek megfelelően próbáltuk még játszható szintre belőni.

Crysis 3 alatt nagyon limitáló volt a szűkös memória-sávszélesség, amit már a két HD 7750 közötti szakadék is jól szemléltet.

A DiRT már nem igényel akkor sávszélességet, így itt az általunk beállított megoldás közelebb tudott férkőzni a GDDR5-ös HD 7750-hez.

Az eredmények alapján a Crysishoz hasonlóan a Hitman is eléggé sávszélesség-igényes játék, így itt szerzeményünk csak a HD 6670 szintjére volt elég.

Sleeping Dogs alatt az iméntihez nagyon hasonló tendenciát láttunk.

És ugyanez igaz Tomb Raiderre is ahol megint csak a HD 6670 szintjét hozta a módosított HD 7750.

A GPGPU teljesítményre kihegyezett, LuxMark névre hallgató félszintetikus ray-tracing benchmark adta a legjobb eredményt. Ennek legfőbb oka, hogy az ilyen jellegű feladatok jóval kevésbé igénylik a nagy sávszélességet, mint a játékok, illetve itt a GCN általános számításokban tapasztalható erőssége is megmutatkozik.

Esélylatolgatás

A megszokás kedvéért összesítettük a néhány játékban kapott eredményeket.

Egyszerű szimulációnk alapján a januárban megjelenő A10-7850K APU-ban található grafikus processzor körülbelül 20%-kal múlhatja majd felül az A10-6800K IGP-jét, mellyel nagyjából a HD 6670 vonalába kerülhet. A két HD 7750 közötti űr jól mutatja, hogy ezért az eredményért a szűkös memória-sávszélesség a felelős, mely sok esetben limitálja az 512 számolóegység által elérhető maximális megjelenítési tempót. Ezzel minden bizonnyal a tervezők is tisztában vannak, így érdekes lesz látni, hogy a végleges termék esetleg tartalmazni fog-e bármilyen, a DDR3-as rendszermemória sávszélességégének limitációját enyhítő vagy kompenzáló megoldást.


[+]

Nincs könnyű dolga az AMD-nek, hisz a DDR4 szélesebb körű elterjedéséhez még legalább két év szükséges. A vállalat kacérkodott a GDDR5 bevetésével is, de ez a terv végül piacképtelennek bizonyult, így elvetették. Egy potenciális megoldás lehet a lapkába (vagy mellé) integrált buffer (cache), bár ez további szilíciumot vagy egy plusz lapkát, illetve utóbbi esetében valamivel bonyolultabb tokozást jelentene, ami az előállítási költségekre kedvezőtlen hatással lenne, akárcsak a 3 vagy 4 csatornás memóriavezérlő lehetősége. A tervezőknek a megfelelő haszonkulcs fenntartása mellett azt is szem előtt kell tartaniuk, hogy ezeknek a 140-150 dollár körüli csúcsmodelleknek rendszerszinten kell jó ár/teljesítménnyel mutatóval rendelkezniük, ergo hasonló összegből ne érje meg jobban megvásárolni a különálló processzor és videokártya kettősét, mint az APU-t. Minden bizonnyal nagy segítség lehet majd egyes játékoknál a Mantle API, de ez "csak" a konkurenciával szemben jelenthet előnyt, hisz példának okáért a HD 7750 ugyanúgy képes lesz (gyorsabban) futtatni az API-t támogató játékokat, mint az új APU.

A Kaveri rajtja után szokásunkhoz híven majd részletes teszttel jelentkezünk, mely már jóval pontosabb információkkal fog szolgálni az APU számítási teljesítményét és képességeit illetően.

Oliverda

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés