Szép touché, AMD: bemutatkoznak a Zen 2-es processzorok

A Ryzen sikerét továbbvíve az AMD most megmutatta az Intelnek, hogy mitől döglik a légy!

A Zen 2 mélylélektana

A Zen 2 mag az eredeti Zen komolyabb továbbfejlesztésének tekinthető. Az egyik legnagyobb változás, hogy a rendszer kapott egy új, TAGE (Tagged Geometry) elágazásbecslőt, ami kiegészíti a hash perceptront a feltételes elágazások esetében. A működés annyiban módosult az eredeti dizájnhoz képest, hogy a hash perceptron ellenőrzi az L1, míg a TAGE az L2 branch target buffert (BTB). Ezek mérete is növekedett, így előbbi 512, míg utóbbi 7168 bejegyzést tud tárolni, illetve van még egy 16 bejegyzéses L0 BTB is. A közvetett elágazás detektálását továbbra is az ITA, vagyis az Indirect Target Array végzi, amelynek az immáron 1024 bejegyzési helyének egyikére kerül az elágazás, ami után a 32 bejegyzés tárolására alkalmas return stack itt kerül követésre.


[+]

Az utasításbetöltés és dekódolás tekintetében a Zen 2 egy 32 kB-os, nyolcutas, csoportasszociatív utasítás gyorsítótárat kapott, szemben a Zen 64 kB-os négyutas megoldásával. Az AMD szerint itt ugyan a kapacitást megfelezték, de sokkal többet ér az az optimalizálás, amit elvégeztek benne, így végeredményben hatékonyabb lett a működés. A dekódertömb kissé módosult, javult az utasítások összefűzése, illetve a µop cache-t megnövelték a tervezők, így már 4096 utasítást képes tárolni.


[+]

A Zen 2 mag a valós végrehajtás tekintetében továbbra is egy integer és egy lebegőpontos blokkra oszlik. Az integer részen belül négy ALU (aritmetikai-logikai egység) és három AGU (címgeneráló egység) található. Utóbbiból tehát eggyel több egység van az eredeti Zenhez képest, a hatékonyabb működtetés érdekében pedig minden ALU 16 bejegyzéses ütemezőt kapott, a három AGU pedig egy 28 bejegyzéses egység kezeli. Emellett a re-order buffer (ROB) és a fizikai regiszterek esetében is rendre 224 és 180 bejegyzéssel lehet számolni, vagyis ebből a szempontból is erősödött az új mag, továbbá az SMT (simultaneous multi-threading) rendszer integer blokkon belüli hatékonysága is javult.


[+]

A lebegőpontos részt érte talán a legnagyobb változás, ugyanis a két darab 128 bites FMAC egységet két darab 256 bites váltja fel, amelyek egy-egy 256 bites FMA operációt, vagy egységenként egy 256 bites ADD és egy 256 bites MUL operációt tudnak elvégezni. Ezzel az AMD nagymértékben növelte a 256 bites YMM regisztereket használó utasítások teljesítményét, továbbá sikerült elérni, hogy a MUL operáció késleltetése négyről három ciklusra mérséklődjön.


[+]

A load/store képességek tekintetében a nagy változás az, hogy a sávszélesség órajelenként 16 bájtról 32 bájtra nőtt. Itt nyilván ki kell szolgálni az erősödő végrehajtóblokkokat. A store 44-ről 48 bejegyzésre hízott, míg az L2 DTLB nagyobb lett, kisebb késleltetéssel. Az L1 adat gyorsítótár maradt 32 kB-os nyolcutas, csoportasszociatív.


[+]

A Zenhez képest a Zen 2 három új utasítást, illetve funkciót vezet be. Ezek közül a CLWB és a QOS általánosnak tekinthető. Előbbi visszaír a memóriába egy gyorsítótársort akármelyik szintről, méghozzá anélkül, hogy azt érvénytelenítené, míg utóbbi a gyorsítótár és a memória kontrollját és monitorozását biztosítja. A WBNOINVD már egy gyártóspecifikus utasítás, amely minden módosított gyorsítótársort vissza tud írni a memóriába érvénytelenítés nélkül.


[+]

A biztonságot szem előtt tartó felhasználók számára jó hír, hogy az AMD korábban már közölte, a Zen 2 minden ismert sebezhetőséggel szemben hardveresen védekezik, amiről már beszámoltunk az alábbi hírben.

Végül érdemes kiemelni a Precision Boost 2 és a Precision Boost Overdrive lehetőségeit, amelyek esetében az AMD megjegyezte, hogy a Ryzen 3000-es processzorgeneráció elvi szinten úgy működik, ahogy a Ryzen 2000-es. Ugyanakkor a modernebb gyártástechnológia még a meglévő algoritmusok alkalmazása mellett is jelentősen növeli a hatékonyságot. A vállalat itt közölt egy példát a Ryzen 9 3900X processzorral, amelyet 32 °C-os szobahőmérsékleten egy 95 wattos hőmennyiség elvezetésére alkalmas hűtővel támogattak meg. Ezután a cég a szobát 20 °C-osra hűtötte, a CPU-ra pedig felszereltek egy Noctua NH-D15S hűtőt, és mindenféle BIOS-ban végzett módosítás nélkül, ugyanaz a processzor 13%-kal volt gyorsabb a Cinebench R20 programban. Konkrétan annyi történt, hogy a jobb hűtés, illetve a hűvösebb körülmények miatt a hardver több ideig tud magasabb órajelszintet beállítani magának, ha van rá TDP-keret, akár az összes maggal, és mindez extra teljesítményben mutatkozik meg.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés