Teljes mobil letámadás az AMD-től

Nagyot harap a Jaguar?

Az AMD még a Computex előtt bemutatta új generációs mobil lapkáit, melyek szállítása már hetekkel korábban megkezdődött, de a boltokba kerülő termékekben majd júniusban tűnhetnek fel. Addig is lényegében kiderült, hogy a Kabini és a Temash SoC APU mit is tud valójában, illetve a Richland APU-k esetében is bemutatkozott pár új megoldás. De ennyire azért ne rohanjunk előre, hiszen a legnagyobb durranásnak az előbbi két termék ígérkezik, melyek gyakorlatilag PC-s funkciókat zsúfolnak igen apró méretű eszközökbe.

A Kabini és a Temash SoC esetében fontos megjegyezni, hogy bár két termékről van szó, valójában ugyanarra a 107 mm² kiterjedésű, 28 nm-es gyártástechnológiával készülő lapkára épülnek. A különbség abban rejlik, hogy némileg más piacokat céloznak meg, mivel a Temash konkrétan tabletekbe készült, míg a Kabini inkább az apróbb notebookoktól kezdve a HTPC-ken és nettopokon át az egybegépekbe és a kisebb asztali PC-kbe építhető be. Nyilvánvaló, hogy a tabletekbe szánt fejlesztésnek nincs szüksége az összes USB és SATA portra, sem a PCI Express interfészre, így ebből a szempontból a Temash rendszerchipek korlátozottabbak. Itt alapvetően a fogyasztással való spórolásról van szó, hiszen azokra a részekre a lapkán nincs szükség, amelyeket nem használnak úgysem, ugyanakkor a letiltásokkal nyert apró fogyasztáscsökkentés nagyon is értékes.

A Kabini/Temash SoC APU
A Kabini/Temash SoC APU [+]

Mivel a Kabini és a Temash lapkája zömében megegyezik, így a főbb részegységeket egyben is lehet tárgyalni. Ide tartozik az új Jaguar processzormag, mely a Bobcat kódnevű fejlesztést váltja. Az AMD a fejlesztés során igen nehéz helyzetben volt, hiszen amellett, hogy mobil eszközökbe optimalizált processzormagot kellett fejleszteni, még a Microsoft és a Sony igényeit is ki kellett elégíteni, hiszen az új generációs PlayStation 4 és Xbox One konzolokban is Jaguar dolgozik. Gyakorlatilag alapvető követelmény volt, hogy a mag kiterjedése kicsi legyen, ugyanakkor kategóriájában gyors, illetve tudása se maradjon el a modern PC-s processzoroktól. Nem lehetetlen mindhárom igényt teljesíteni, de arra is figyelni kellett, hogy a fogyasztás alacsony maradjon, ami nagymértékben megnehezítette a mérnökök dolgát.

A végleges megoldás azonban igen jól sikerült. Egy Jaguar mag kiterjedése 28 nm-en 3,1 mm², vagyis a Bobcat 40 nm-es, 4,9 mm²-es területéhez képest jó irányba fejlődött a rendszer. Persze a méretcsökkenést főleg a kisebb csíkszélesség hozta, de nagyon fontos volt spórolni a hellyel. A konzolokhoz való igazodást az AMD moduláris skálázással oldotta meg. A Jaguar magból összesen négy darab lehet egy úgynevezett modulban, és két modul építhető egy lapkába. Pontosan ilyen konfigurációt használnak az új generációs konzolba szánt APU-k, így az elképzelés működik. Persze a Kabini és a Temash egy modult használ, és ezen belül is lesz két- és négymagos verzió (előbbi esetében szimplán a magok letiltásáról beszélünk).

A Bobcathez képest komoly változás, hogy a Jaguar magok dedikált L2 gyorsítótár helyett egy közöset használnak, melynek mérete két mag mellett 1 MB, míg négy maggal 2 MB lesz, azaz magonként 512 kB-os szeletről van szó. Az AMD szerint az L2 gyorsítótár esetében mindig kérdés a tervezésnél, hogy magonként legyen dedikálva vagy esetleg legyen megosztott, mert mindkettőnek megvannak az előnyei és a hátrányai. A megosztott gyorsítótár növeli az elérési időt, mégis a mai programok többségében jellemzően előnyösebb ez a megoldás.

A funkcionális változások tekintetében szintén nem aprózta el az AMD. A Jaguar mag természetesen a Bobcat által támogatott összes szolgáltatást és utasításkészletet kezeli, amit még kiegészítenek az SSE4.1, SSE4.2, AES, BMI és AVX utasításkészletek. Ezek többsége nem meglepő, de az AVX például nagyon is az, és ez főleg a konzoloknak köszönhető. A Jaguar ennek támogatását egy 128 bites FADD és egy szintén 128 bites FMUL egység segítségével oldja meg, vagyis a 256 bites AVX utasításokat két 128 bites részre osztva hajtja végre a rendszer. Gyorsnak nem nevezhető, de egy alacsony fogyasztású processzormag esetében ez is jóval több a vártnál. Természetesen a 128-128 bites FADD és FMUL egység a 128 bites SSE utasításokra pozitív hatással lesz, hiszen azokat a Bobcattel ellentétben a Jaguar már nem osztja két részre.

A Jaguar processzormag
A Jaguar processzormag [+]

A magon belül az L1 gyorsítótárak mérete nem változott, így az új rendszer továbbra is 32-32 kB-os adat és utasítás cache-sel dolgozik. A Jaguar azonban magonként alkalmaz egy-egy 32 bájtos loop buffert, ami időt és energiát takaríthat meg, ha a kódban hosszú ciklus van. Az integer rész nem sokat változott a Bobcathez képest, de feltűnhet a Div, azaz az osztómotor mint extra, amit az AMD a Llano processzormagjából emelt át. A Jaguar az osztást kétszer gyorsabban végzi, mint az előd, továbbá a komplex operációk – az optimalizálásoknak hála – szintén kétszer gyorsabban futnak majd a felújított architektúrán. Az AMD természetesen megtartotta az out of order elvű feldolgozást az új processzormagon is, így az utasítások sorrendtől független végrehajtására megoldott.

Az AMD mérései szerint az IPC (órajelenként végrehajtható utasítás) nagyjából 15%-kal nőtt a Bobcathez viszonyítva, ami jótékony hatással lesz a teljesítményre. Elmondható, hogy a Jaguar azonos órajelen 20%-kal is gyorsabb lehet a Bobcat magnál a jellemző munkafolyamatokban, de akár kétszeres különbség is mérhető a modernebb utasításkészleteket kihasználó kódokban.

Tekintve, hogy alacsony fogyasztású rendszerről van szó, az energiagazdálkodás is sokat fejlődött. A Jaguar mag terhelés nélküli kapuzása 98,8%-os hatékonysággal működik, ami a Bobcat 91,8%-os értékéhez képest előrelépés, továbbá terhelés mellett a megosztott másodlagos gyorsítótár üzemelhet az alapórajel felén is, ha az nem jelent érzékelhető lassulást az adott feladatra nézve.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés