AMD Trinity: szintet lép a vállalat fúziója

A Piledriver modul újításai

Az AMD az elmúlt év elején kezdte meg fúzióját, méghozzá a Brazos platformmal. A rendszer mára a vállalat történelmének legkelendőbb megoldásává lépett elő, ám a nagyobb verziónak felfogható Llano APU a kezdeti ellátási problémák miatt már nem teljesített ilyen jól. Az ellátás normalizálása mellett a termékre az elmúlt két negyedévben nagyon fellendült a kereslet, de ez már nem sokat számít, hiszen elérkezett az idő az utód bemutatására.

Az új generációs Trinity APU az AMD második nekifutása a fúzió projekten belül, és a cég útiterve szerint az optimalizált integrációt valósítja meg. Mint ismeretes, az első lépcsőben még csak a fizikai integráció jelentette a célt, ami meg is valósult, míg a második lépcsőfok tulajdonképpen a teljesítmény növelésére, illetve a fogyasztás csökkentésére figyel. Elöljáróban annyit, hogy ezek szintén megvalósultak, sőt, némi extrára is futotta.

A Trinity APU kiterjedése 246 mm², a lapka pedig 1,303 milliárd tranzisztorból épül fel. Rögtön észrevehető, hogy a tranzisztorszám csökkent a Llano APU-hoz képest, de ez a valóságban nem ilyen egyszerű. Úgy néz ki, hogy az AMD áttért a sematikus adatokra, azaz nem valós tranzisztorszámot ad meg a cég. Ennek megfelelően átszámították a Llano APU korábbi tranzisztorszámát is, mely így 1,178 milliárd lett. Ugyanez okozta a Zambezi kódnevű processzor esetében a félreértéseket, amikor az AMD 1,2 milliárd tranzisztorra módosította az eredetileg 2 milliárd tranzisztoros értéket. Technikailag mindkettő helyes, ugyanis itt arról van szó, hogy a sematikus dizájn tervezésénél adott egy tranzisztorszám, de a konkrét fizikai implementáció során előfordulhat, hogy hatékonyabb az adott áramkört több tranzisztorból építeni. Az eltérés mértéke nagyban függ az adott chipdizájntól, illetve a mérnökök döntésétől, így erre nincs konkrét szabály, de biztos, hogy a sematikus tranzisztorszám nem lehet nagyobb a valósnál. Mindez persze lényegtelen, mivel a lapkák tényleges működésén nem változtat, a vásárlókat pedig jellemzően nem érdekli a gyártástechnológia és a tranzisztorszám.

Az AMD Trinity APU
Az AMD Trinity APU

A Trinity a Llano APU-hoz hasonlóan 32 nm-es SHP gyártástechnológiával készül, ám a lapka processzor része, valamint az IGP már gyökeresen eltér. Stílszerűen kezdjük az elemzést a processzormagok, pontosabban modulok oldaláról. A Llano ebből a szempontból viszonylag régi architektúrára épült, de a Trinity már a Bulldozer továbbfejlesztésének tekinthető Piledriver modult veti be. Korábban már leírtuk, hogy az egész fejlesztés koncepciója az egyszerűsítés, és ez most sem változott. A kiindulási pont két teljes értékű mag volt, melyet az AMD egy modullá vont össze. Ez két darab integer magból, és egy megosztott lebegőpontos egységből áll.

Az elgondolás alapján a modulon egy-egy szál fut az integer magokon, és a Flex FP névre keresztelt lebegőpontos végrehajtó közös. Utóbbi működésében van a csavar, ugyanis az integer magok megfelezhetik a megosztott erőforrást, vagy az egyik mag teljesen ki is sajátíthatja azt, esetlegesen az is előfordulhat, hogy a munkafolyamathoz nem szükséges a Flex FP használata, így a teljes erőforrás lekapcsolható, ezzel pedig növelhető az integer magok órajele. A Flex FP lényegi előnye tehát a flexibilis működés, ugyanis ezzel a koncepcióval az AVX használata nélkül is kihasználható a feldolgozómotor 256 bites szélessége. Tudniillik a lebegőpontos feldolgozók egyszeres (32 bites) és dupla (64 bites) pontosságú utasításokkal dolgoznak. Lehetőség szerint annyit hajtanak végre, amennyi belefér a megadott hosszúságú egységbe. Ebbe sajnos beleszól az utasításkészlet is, ugyanis csak az AVX támogatja a 256 bites feldolgozást, ami azt jelenti, hogy egy AVX-et nem támogató programnál a 256 bites lebegőpontos végrehajtó 128 bitesként működik. Az AMD moduláris megvalósítása erre a problémára megoldást jelent, és az architektúra az alkalmazás újrafordítása nélkül képes kamatoztatni a két darab 128 bites FMAC egységet. Ez a gyakorlatban azt jelenti, hogy a 128 bites feldolgozást támogató SSE utasításkészlet maximálisan ki tudja használni az adott processzormodul hardveres képességeit. Ez a dedikált ütemezőnek hála, akkor is él, ha a modulon belül az egyik integer mag teljesen kisajátítja a lebegőpontos feldolgozót. A modulban a magok természetesen megosztják az információkat, és a rendszer még végrehajtás előtt képes elemezni a feladatot, vagyis előre el tudja dönteni, hogy a 256 bites lebegőpontos feldolgozót megossza, vagy hozzárendelje az egyik integer maghoz.

Rögtön látható, hogy a Llano APU-hoz képest a Trinity már modernebb lebegőpontos motorokkal és integer magokkal rendelkezik, így az új utasításkészletek támogatása is megoldható. Ez olyannyira igaz, hogy a Trinity előlépett a piac legokosabb x86 kompatibilis termékévé, hiszen az AMD64-es kiterjesztés és az MMX, SSE, SSE2, SSE3, illetve SSE4A mellett a rendszer kezeli az SSSE3, az SSE4.1, az SSE4.2, az AVX, az AES, az FMA4, az XOP és a PCLMULQDQ utasításkészleteket. Itt még fontos adalék, hogy a sűrűn használt PREFETCH és PREFETCHW utasítások – a 3DNow! támogatás megszüntetése után – továbbra is elérhetők egy 3DNowPrefetch csoportban.

Kiemelendő a Piledriver modulok esetében a BMI (Bit Manipulation Instructions) és a TBM (Trailing Bit Manipulation) utasítások támogatása, melyekkel az AMD már készül a GCN architektúra beköltöztetésére. Emellett az új processzormodul két új utasítást (VCVTPH2PS és VCVTPS2PH) kínál a 16 bites félpontosságú és a 32 bites egyszeres pontosságú lebegőpontos számok közti konvertáláshoz, melyek a nemrég megjelent Ivy Bridge-ben mutatkoztak be. A nagy újdonság azonban az FMA3 utasítás támogatása, mely kompatibilis lesz az Intel későbbi termékeiben bevetésre kerülő verzióval.

A helyzet itt érdekes, ugyanis az AMD az FMA3 mellett az FMA4-et is megtartja. A különbség a regiszterek kezelésére van hatással. Az FMA4 az összes operandushoz külön regisztert használhat, míg azt FMA3 esetén az eredmény a három operandushoz használt regiszterek közül az egyikbe kerül. Apró eltérésről van szó, de ez már elég ahhoz, hogy a két utasítás ne legyen kompatibilis egymással. Ez a fejlesztők számára komoly probléma. Az FMA4 a programozás kényelmessége szempontjából sokkal előnyösebb, mivel nem ritka, hogy egy programon belül többször is szükség van ugyanazokra az értékekre, ám az FMA3 esetében ez alapvetően nem lehetséges, hacsak a felülírandó regiszter tartalmát a programozó nem másolja másik regiszterbe, vagy ha nincs már szabad kapacitás, akkor újra be kell olvasni a memóriából vagy a gyorsítótárból, ami jelentősen lassítja a munkavégzést. A kompatibilitás viszont az FMA3-ra lesz megoldva, így a fejlesztőknek meg kell barátkozni ezzel a helyzettel.

A Piledriver modul egyébként több részen is változik a Bulldozerhez képest. Az AMD rengeteg helyen optimalizálta az architektúrát, így az új processzormodul integer magjainak L1 adat TLB mérete 32-ről 64 bejegyzésre nő, emellett javul a Flex FP motor és az integer magok ütemezése, 44 eleműre nő a magonkénti olvasási sor, pár utasítás feldolgozása gyorsul. Hatékonyabb lesz az elágazásbecslés, az adatok előbetöltése, illetve az L2 gyorsítótár működése is. Összességében az AMD ezzel növelte az IPC-t, vagyis az egy órajel alatt végrehajtható utasítások számát. A Piledriver modul számottevő újítása még, hogy beveti a Cyclos Semiconductor Resonant Clock Mesh (RCM) nevű eljárását, mellyel a fogyasztás csökkenthető, amellett, hogy a beállított órajel igen magas lehet.

A Trinity APU felépítése

A Piledriver modul rövid ismertetése után érdemes elővenni magát a lapkát. A Trinity APU-ban két darab processzormodul lesz, melyet az AMD négy magnak tekint. A modulokon belül 64 kB-os L1 utasítás gyorsítótár található, míg az integer magok egy-egy 16 kB-os L1 adat gyorsítótárat kapnak, továbbá a modulok egy-egy 2 MB-os másodszintű gyorsítótárral is rendelkeznek. Megújul az integrált északi vezérlőhíd is, mely mostantól támogatja az IOMMU v2 szolgáltatást. Az IO virtualizáció alapvetően újdonság egy APU-ban, de az IOMMU funkció régóta létezik. Az új egység azonban újabb megoldás, és fő újításai között szerepel a kétszintű laptábla, továbbá az IOMMU laphibák helyreállításának lehetősége. Az egyes funkciók eléréséhez az adott bővítőkártyának, vagy más eszköznek is támogatnia kell az Address Translation Services (ATS), illetve a Peripheral Page Service Request (PPR) szolgáltatást.

Az IOMMU v2 beépítése egyébként abból a szempontból is fontos volt, hogy az integrált grafikus vezérlő, illetve az MMU egységgel rendelkező dedikált grafikus processzorok (gondolva itt a Cape Verde, a Pitcairn és a Tahiti kódnevű cGPU-ra) képesek legyenek elérni a processzor memóriáját. Ezzel számos felesleges másolástól kímélhető meg a rendszer, mivel így az IGP és az adott GPU eléri a CPU virtuális címterét, így a kívánt adat azonnal a IGP által lefoglalt memóriába, vagy dedikált GPU esetén a VRAM-ba tölthető be.


[+]

A Trinity kétcsatornás memóriavezérlőt kapott, ami hivatalosan támogatja az 1866 MHz-es órajelen üzemelő DDR3 memóriákat, a JEDEC szabvány szerinti 1,25, 1,35 és 1,5 voltos üzemfeszültségek mellett. Szokás szerint lehet gyorsabb memóriát is használni, de az tuningnak számít majd. A mobil termékek esetében a memória órajele maximum 1600 MHz lehet. A lapkában található még PCI Express vezérlő is, mely 24 darab 2.0-s szabványú csatornát kínál.

Ideje rátérni a szintén nagy változásokon átment IGP-re, mely alapvetően a Northern Islands termékcsalád része. Az AMD a Llano APU-hoz képest az IGP bekötésén némileg változtatott. Az egység a memóriavezérlőt az RMB-n (Radeon Memory Bus) keresztül éri el, mely memóriacsatornánként 256 bites szélességet biztosít egy-egy irányba. Az IGP és a processzormodulok összeköttetéséért a Fusion Control Link felel, mely egy-egy irányba 128 bites szélességet jelent. Az integrált grafikus vezérlő ezzel eléri a processzormodulokhoz kapcsolódó L2 gyorsítótárat is, így gyors kommunikáció valósítható meg a CPU és az IGP között. A Fusion Control Link arra is alkalmas, hogy az IGP elérje a processzor memóriáját, míg ezt a CPU is képes megtenni az IGP által lefoglalt területtel.

A IGP-n belül vizsgálódva tovább látható, hogy az architektúra a Cayman kódnevű megoldás alapjaira épít, melynek működését korábban részletesen elemeztük. Nem írjuk le újra azt a temérdek változást, amit ez jelent, hiszen ezek az előbbi cikkben olvashatók, de röviden taglaljuk az új grafikus vezérlő felépítését.

A fő különbség a Llano APU IGP-jéhez képest, hogy a szuperskalár shader processzorok úgynevezett VLIW5 felépítését VLIW4-re váltották a mérnökök. Ez összességében jobb kihasználást jelent, illetve a Cayman örökségeként számos értékes technológia is bevetésre kerül. Egy shader tömb 16 darab szuperskalár shader processzort rejt el, melyhez 32 kB-os Local Data Share, valamint egy 8 kB-os, csak olvasható gyorsítótárral rendelkező textúrázó blokk tartozik. Utóbbi négy darab Gather4-kompatibilis csatornát alkalmaz, melyek csak szűrt mintákkal térnek vissza. Az interpoláció a DirectX 11-es Radeonokhoz hasonlóan emulált, ám a rendszer itt sok optimalizációt kapott, így relatíve kevés erőforrás szükséges az interpolálás végrehajtásához. Az új Trinity APU IGP-jében összesen 6 darab shader tömb van, amelyek egy blokkra vannak fűzve. Ez a blokk természetesen egységes Ultra-Threading Dispatch Processzorra támaszkodik. A tömbök közötti adatmegosztást továbbra is egy nagysebességű, 64 kB-os (Global Data Share) tárterület biztosítja.

A Trinity IGP-je
A Trinity IGP-je

Az IGP setup motort is a Caymantől örökölte, annak minden előnyével együtt. A tesszellátor az AMD Gen8-as megoldása lesz, míg a raszter motor órajelenként 16 képpontot dolgoz fel. Az igazán értékes újítás azonban a tile-based load balancing, ami a hierarchikus Z algoritmus túlterhelését akadályozza meg. A rendszer a raszterizálást hierarchikus Z nélkül hajtja végre a teljes képkockát több egyenlő méretű, viszonylag kicsi mozaikra osztva. Természetesen itt számos szabályt be kell tartani biztosítva a renderelés sorrendjét. A hierarchikus Z algoritmus a mozaikokon lesz lefuttatva, amelyeket tovább lehet küldeni, vagy éppen el lehet dobni, ha nem tartalmaznak látható információt. Ez az elgondolás tesszellálásnál lehet hasznos, mivel a hierarchikus Z motor könnyen túlterhelhető, ami esetenként elég sok problémát jelenthet.

A memóriavezérlőhöz egy 128 kB kapacitású, csak olvasható másodlagos gyorsítótár és két ROP blokk kapcsolódik. Ez így összesen 8 blending és 32 Z mintavételező egységet eredményez. Itt a Caymantől megörökölt újítás, hogy a blokkok jelentős fejlődésen mentek keresztül, így a Llano IGP-jéhez képest kétszer gyorsabban végzik a 16 bites unorm és snorm operációkat, valamint a 32 bites lebegőpontos utasítások feldolgozása akár négyszer gyorsabb is lehet. Némi egyenetlenség azért maradt a rendszerben, mivel a raszter motor órajelenként 16 képpontot dolgoz fel, ami sok 8 blending egységhez, de utóbbi inkább legyen túletetve, minthogy adatra várjon.

A Trinity IGP-je abból a szempontból érdekes a Llano megoldásához viszonyítva, hogy a shader processzorok száma 400-ról 384-re csökkent, míg a textúrázó csatornák száma 20-ról 24-re nőtt. Alapvetően azonban a változás minden szempontból előnyös, ugyanis a Trinity szuperskalár shader processzorainak felépítése kedvezőbb, mivel hatékonyabban etethetők.

Nagyon fontos adalék még, hogy a Trinity APU IGP-je a világon elsőként támogat dupla pontosságot. Ebben a módban a rendszer teljesítménye az elméleti számítási tempó tizenhatod részével egyezik meg.

A multimédia és az extrák

A Trinity APU mélylélektana után érdemes figyelmet szentelni a dedikált egységeknek, illetve az extráknak. Talán túl nagy meglepetést nem okoz, hogy az UVD motor továbbra is a jól bevált 3.0-s verzióra épít, mely kezeli az AVC/H.264, az MVC, a VC-1, a DivX/Xvid, valamint az MPEG-2/4 videók gyorsítását, ám megjelenik a GCN-es Radeonokban bemutatkozó VCE is, amit az AMD végül Accelerated Video Converternek nevezett el. Ennek most már ez lesz a végső neve is, ám ennél fontosabb lenne látni a Radeon HD 7900-as sorozatot bemutató cikkünkben részletezett egység képességeit, amire még várni kell. Az AMD elmondta, hogy a fejlesztés működik, de amíg nincs tökéletesen kitesztelve a szoftveres oldal szempontjából, addig nem aktiválják. Konkrét időpont egyelőre nincs, de nagyon valószínű, hogy a következő driverek valamelyikében már feltűnik a támogatás. Az IGP további extrákat is tartogat, így a Cayman GPU-ban bemutatkozó EQAA mód is elérhető majd a driverből, mellyel 24x-es szűrés is kérhető. Persze ez az eljárás az MSAA-ra épít, amit sok játék nem támogat, de ilyenkor aktiválható az MLAA 2.0.


[+]

Tekintve, hogy Vision platformról van szó, a rendszer szinte mindent támogat. Az IGP a DirectX 11-es, a DirectCompute 5.0-s, az OpenGL 4.2-es és az OpenGL ES 2.0-s API-t, illetve C++ AMP-s és az OpenCL 1.1-es felületet kezeli, emellett a különböző webes felületek gyorsítása sem jelent akadályt, beleértve a Flash 11.2-t is. Szokásos extraként megmaradnak a videók esetében alkalmazható post-process szűrők, illetve a Steady Video szolgáltatás is fejlődött. Utóbbi már nem csak a böngészőkben, illetve a Windows Media Player esetében használható ki, mivel az AMD a népszerű VLC lejátszóhoz is készített egy implementációt. A Steady Video támogatása persze általános, így amelyik rendszerben ez a szolgáltatás elérhető volt, annál működni fog a VLC-s megoldás is.

Quick Stream Technology
Quick Stream Technology [+]

Teljesen új dolog azonban a Quick Stream Technology. Ez nem az AMD saját fejlesztése, csupán egy licencelt technológia, de a terméktámogatást az AMD intézi a partnerek felé, és a Trinity APU ezt megkaphatja. Az eljárás alapvetően a streamelt videók gyorsabb betöltésére szolgál, amit úgy ér el, hogy a hálózati forgalmat priorizálja, így a streamelt tartalom elsőbbséget élvez a feldolgozás során. Tulajdonképpen itt nem beszélhetünk hardveres bravúrról, sőt, alapvetően a technológia inkább szoftveres alapokon nyugszik, de tény, hogy időnként nagyon hasznos tud lenni. Gondoljunk csak arra az esetre, amikor egy fájl letöltésén dolgozik a gép, de emellett egy internetes videót is szeretnénk megnézni. Ezt minden további nélkül meg lehet tenni, hiszen a fájl háttérben való letöltése ettől még folytatódik, de elveheti a sávszélességet a webes videótól. A Quick Stream Technology tulajdonképpen nem tesz mást, mint elsőbbséget ad a streamelt videóhoz kapcsolódó csomagoknak, így a letöltés és minden egyéb hálózati tevékenység ideiglenesen a háttérbe szorul.


[+]

Látható, hogy az AMD nem fukarkodott a felhasználói élmény javításával, de a Trinity még ennél is többet nyújt, ugyanis az IGP-je támogatja az Eyefinity technológiát. Ez az első olyan APU a piacon, mely képes négy darab független kijelzőt meghajtani, ráadásul az Eyefinity szolgáltatástól megszokott színvonalon, vagyis jól felépített, sok beállítást kínáló vezérlőpulttal. Ha ez még nem lenne elég, akkor megemlítjük, hogy az AMD a 2.0-s verziót implementálta, vagyis elérhető a Discrete Digital Multi-Point (DDM) Audio szolgáltatás is, amivel a rendszer a csatlakoztatott kijelzőkhöz külön nyolccsatornás hangfolyamot képes rendelni.


[+]

A kimenetek tekintetében itt a DisplayPort 1.2-es portnak lesz szerepe, hiszen ez az interfész tud elég sávszélességet biztosítani több kijelző felfűzésére, de a lapka támogatja a DVI és a HDMI 1.4a-s portokat is. Természetesen a HD3D szolgáltatás is elérhető, bár ez nem mindegyik termékre lesz igaz, ám ez inkább az AMD döntésének eredménye, és nem technikai limitáció.

Magok szintjén felturbózva

Egyetlen fontos újítás maradt csak hátra, mégpedig a Turbo Core 3.0, mely egy új kétirányú megoldás lesz. A Bulldozer modul esetében már látható volt, hogy az AMD a turbónak komoly figyelmet szentel. Ez a Piledriver esetében sincs másképp, sőt az újabb modulok talán még jobbak is, ám az IGP esetében már újításról beszélhetünk. A Turbo Core 3.0 ugyanis nemcsak a processzormagok, illetve -modulok, hanem az IGP magórajelét is emelheti. A kétirányú energiamenedzsment itt abból ered, hogy az alkalmazás által kifejtett terhelés dönti el, hogy mely egység kapja meg az órajeltöbbletet. Természetesen kitalálható, hogy egy szálon futó program esetében az egyik processzormag megkapja a maximális turbót, míg több szálon terhelő alkalmazás mellett a turbó mértéke alacsonyabb, de még mindig bevethető lehet. A grafikus számításokban nyilvánvalóan az IGP lehet a kedvezményezett, hiszen ilyenkor a processzormagok sebessége kevésbé számít. Túlzottan általános szabály erre nincs, mivel a rendszer hardveresen dönt arról, hogy a kétirányú turbó milyen formában lesz aktiválva, természetesen az alkalmazás igényének megfelelően.

Dióhéjban ennyit lehet elmondani a Trinity APU-ról, így ezek után végre át lehet térni konkrétan a termékekre is. Az AMD két platformot kínál majd. A Comal platform lesz a mobil megoldás, és a Llano APU-hoz is használt A70M-es vezérlőhíd kerül a lapka mellé. Az asztali piacon a Virgo platform kerül bevetésre, de erről még nem adott tájékoztatást a vállalat. Ez alapvetően a stratégia miatt alakult így, ugyanis az AMD a mobil megoldások startját tartja elsődlegesnek, így az asztali Trinity APU várhatóan majd csak a nyár vége felé érkezik. Ebből kifolyólag a cikkünk további részében csak a mobil termékek kerülnek középpontba.

Az AMD két részre szeli a Comal platform termékskáláját, így lesznek termékek a hagyományos méretű notebookokba, illetve az ultravékony megoldásokba, melyeket a cég Ultrathin kategóriaként aposztrofál. A hagyományos notebookok esetében az összes termék 35 wattos TDP osztályba tartozik, míg az ULV megoldások a 17 és a 25 wattos osztályba kerülnek. A legfontosabb különbség ezek között a fogyasztáson kívül a memória támogatásában rejlik. A 35 wattos modellek az 1600 MHz-es effektív órajelű modulokkal is megbirkóznak, míg az ULV termékek esetében ez az érték maximum 1333 MHz lehet.

Az első körben érkező mobil termékek paramétereit az alábbi táblázat részletezi:

AMD Trinity - mobil Vision generáció (Comal platform)
Típus Órajel / Turbó órajel
L2 cache Radeon HD típusa
Radeon magok száma
IGP magórajel / Turbó órajel
Fogyasztás (TDP)
A10-4600M (4 mag) 2,3/3,2 GHz
2 x 2 MB
7660G 384 497/686 MHz 35 W
A8-4500M (4 mag) 1,9/2,8 GHz 2 x 2 MB 7640G 256 497/655 MHz 35 W
A6-4400M (2 mag) 2,7/3,2 GHz 1 MB 7520G 192 497/686 MHz 35 W

AMD Trinity ULV - mobil Vision generáció (Comal platform)
Típus Órajel / Turbó órajel
L2 cache Radeon HD típusa
Radeon magok száma
IGP magórajel / Turbó órajel
Fogyasztás (TDP)
A10-4655M (4 mag) 2/2,8 GHz
2 x 2 MB
7620G 384 360/497 MHz 25 W
A6-4455M (2 mag) 2,1/2,6 GHz 2 MB 7500G 256 327/424 MHz 17 W

Szokás szerint a Trinity APU esetében is lehetőség lesz Dual Graphics konfigurációt alkalmazni. Az IGP-k szempontjából egyedül az A6-4455M jelzésű termék Radeon HD 7500G jelzésű integrált grafikus vezérlője nem képes erre a szolgáltatásra, míg a többi igen. A hivatalos társ-GPU szerepét a Seymour és a Thames kódnevű fejlesztések tölthetik be. Lényegében elmondható, hogy a Radeon HD 7660G, 7640G, 7620G és 7520G jelzésű IGP-k bármelyike társítható a Radeon HD 7670M, 7650M, 7550M, 7510M és 7450M jelzésű MXM modulokkal. Ezzel a gyártók variációs lehetősége elképesztően magas, ráadásul az AMD a Dual Graphics támogatását kiterjeszti a népszerű DirectX 9-es játékokra, így a szolgáltatás már nem csak DirectX 10 és 11 módban működik. Az AMD külön kiemelte, hogy a Dual Graphics opció még ultravékony notebookok esetében is alkalmazható, és a cég utalt rá, hogy fejlesztés alatt áll pár ilyen masina.

A második generációs A szériás Vision APU-k esetében az AMD fontosnak tartotta, hogy a vásárló könnyen eligazodjon a sok tulajdonság között. Erre a notebookokon egyszerű matricás rendszer fog szolgálni, mely négy részre osztja a 35 wattos és az ULV modellek kategóriáját. Az A4-es szint lesz a belépő, ahol kétmagos, vagy másképp fogalmazva egymodulos APU-k lesznek, emellett már ezen a szinten elérhető lesz az Eyefinity szolgáltatás, illetve a Steady Video 2.0. Az A6-os lépcső továbbra is kétmagos termékeket jelent, de aktiválva lesz az Accelerated Video Converter. Az A8-as szint már négymagos, vagy kétmodulos APU-kat jelent és elérhető lesz a Dual Graphics, míg az A10-es lépcső lesz a csúcs, ahol a HD3D elérhetősége jelenti az extrát. A 35 wattos és az ULV modelleket tartalmazó notebookokat is könnyű lesz megkülönböztetni, mivel az előbbi színes, vörös matricát kap, míg az utóbbi fényes, enyhén szürkés beütésűt.


[+]

Az AMD a Vision termékcsalád esetében továbbra is alkalmazza az AllDay Power és a Cool to the Touch direktívákat. Előbbi megkövetel egy bizonyos minimális üzemidőt, míg utóbbi az adott masina maximális hőmérsékletét szabja meg. Az AMD mérései szerint a Pumori referenciadizájn a legerősebb A10-4600M-es APU-val, 14 colos kijelzővel, 4 GB memóriával, 250 GB-os merevlemezzel és Windows 7 operációs rendszerrel 12 óráig bírja a strapát terhelés nélkül, mindezt egy 62,16 wattos hatcellás lítium-ionos akkumulátorral. Ugyanez a rendszer a 3DMark 06-os tesztprogramot 2,5 óráig képes újra és újra futtatni egyetlen feltöltéssel.

Érdekes kérdéskör még a mobil Trinity APU-k tokozása. Az ULV verziók a 827 tűs FP2 jelzésű µBGA tokozást használjak, azaz lényegében az alaplapra kerülnek, ám a 35 wattos modellek esetében az AMD az FS1r2 tokozásra épít. Utóbbi lényegében Llano APU-hoz használt FS1 módosított változata, így mindkét µPGA típusú tokozás 722 tűt használ. Elméletben a Trinity APU használható lehet az FS1 tokozásban is, de úgy tudjuk, hogy az FS1r2 jóval gyorsabb kommunikációs linket tart fenn a VID információknak, így az energiagazdálkodás szempontjából az FS1 foglalat nem teljesít olyan jól. Ezenkívül a Trinity APU támogatása az aktuális FS1 foglalattal rendelkező notebookok esetében a gyártón is múlik, hiszen új BIOS-t kell a termékhez készíteni. Az FS1r2 és az FS1 közötti korlátozott mértékű kompatibilitás tehát csak elméletben áll fent, így a majdnem biztosra vehető, hogy a mobil Llano APU nem cserélhető mobil Trinity-re.

Támogatás a programok oldalán

Az AMD-nek a fúzió kapcsán erőteljesen építenie kell a programok támogatására is. 2011-ben 26 alkalmazást támogatott hivatalosan az AMD, míg 2012-ben ez a szám 60-ra nőtt. Hogy ez mit jelent azt az AMD le is mérte, így az A10-4600M ellen a közvetlen vetélytársnak tartott Intel Core i5-2520M állt fel.


[+]

Az OpenCL láthatóan terjed, hiszen nemrég jelent meg a WinZip 16.5, mely a GPU erejét használja a tömörítés gyorsítására, de elérhető a GIMP új verziója is, ahol a GEGL kihasználja az OpenCL API-t. Szintén fejlesztés érte a VLC-t, melyben a beépített de-noise algoritmus OpenCL-en keresztül kerül számításra.

Az AMD az Adobe Photoshop CS6 esetében is rábeszélte a fejlesztőket a támogatásra, így több, mint 30 effekt gyorsítható GPU-val, míg a számításigényes blur OpenCL-en keresztül kihasználhatja a grafikus vezérlő erejét, ami jelen esetben nagyságrendi előnyt jelent.


[+]

Természetesen érdemes megjegyezni, hogy az Intel Ivy Bridge is támogatja az OpenCL-t, de ennek a fejlesztésnek is csak most szállingóznak a mobil verziói, így a tényleges csatára csak később kerül sor. A Sandy Bridge IGP-je ezekre a „bravúrokra” nem képes, hiszen ezen a téren már akkor is elavultnak számított, amikor megjelent a termék. Éppen ezért az AMD összehasonlítása nem teljesen sportszerű, hiszen a Vision családba tartozó termékek az általános számítások GPU-val való gyorsításának területén nagyságrendekkel fejlettebb megoldások.

Az AMD végül kitért az érkező Windows 8-ra is. A cég elmondta, hogy a Trinity APU az új operációs rendszer WDDM 1.2 felületének összes szolgáltatását támogatja, de ezt már az aktuális Vision termékek is teljesítik, így túlzottan nem volt meglepő ez az információ. Érdekes lehet azonban a Hyper-V szolgáltatás, melyet az IOMMU v2 beépítésével tényleg a Trinity APU fogja a legjobb feltételek mellett támogatni az AMD korábbi APU-jaihoz képest.

Mikor lesz a start?

A mobil piacra szánt 35 wattos Trinity APU-k forgalmazását tulajdonképpen a mai napon megkezdhetik a gyártók, míg az alacsonyabb fogyasztású ULV verziók június folyamán futnak be. Szintén a nyár első hónapjában érkezhetnek a mobil Trinity-re alapozó egybegépek és mini PC-k.

Abu85

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés