Láthatáron az AMD Zen: demózták a Summit Ridge processzort

Megmutatták, mire képes egy játékban a Radeon Fury X-szel 4K-n, és 3 GHz-re fixált órajellel versenyeztették renderelésben az Intel Core i7-6900K-val.

Még javában zajlott az idei IDF, amikor az AMD egy prezentációban új információkat közölt az érkező Zen x86-os CPU mikroarchitektúrájáról. Emellett az asztali gépekbe szánt, ezt alkalmazó nyolcmagos Summit Ridge központi egységet néhány alkalmazás futtatásával is bemutatták. Valószínűleg nem véletlenül, hanem szimbolikus jelentéssel időzítették az AMD előadását a konkurencia rendezvényének idejére.

Az AMD elnöke, Dr. Lisa Su a Zen-ről beszél
Az AMD elnöke, Dr. Lisa Su a Zen-ről beszél

Egy kis visszatekintés

Nem feltétlenül alakult minden az AMD számításai szerint a processzorpiacon. Az FX-ek tekintetében köhécselt a Bulldozer, nem hozta a kívánt előrelépést a Piledriver és a Kaveri-beli Steamroller, de a kései Carrizo APU-ban helyet kapott Excavator magok/modulok is inkább csak az energiahatékonyságon tudtak javítani. Az Intel IGP-k is lassan beérik az APU-k grafikus részét, így valamit fel kell az AMD-nek mutatnia, ha versenyben akar maradni.

Bőven hozzátett az AMD az x86-os piachoz
Bőven hozzátett az AMD az x86-os piachoz [+]

A fenti összefoglalót a kétmagos CPU és az APU között azért kiegészítenénk azzal, hogy a négymagos Phenom ugyan később került piacra az Intel négymagos megoldásánál, de utóbbi csak két kétmagos chipet huzalozott össze egy nyomtatott áramkörön. Az FX-re, mint leggyorsabbra utalás pedig leginkább csak az 5 GHz-es Turbo Core órajelre értendő.

A Summit Ridge belseje

Meglepően sok információról lerántották a leplet, így közeli és alapos képet kaphatunk a főbb újításokról, illetőleg változtatásokról. A Zen szakít az elsőként a Bulldozerben kipróbált modulos felépítéssel, így ismét egy hagyományos többmagos központi egységet kapunk, amihez visszatér a vállalat, hiszen a korábbi processzorai is ilyen tervezési filozófiával készültek. Emellett az Intel Hyper-Threading működéséhez hasonló megoldást is alkalmaz, ami régóta fellelhető a konkurencia lapkáiban, tehát a Summit Ridge kódnevű nyolcmagos asztali lapka esetében 16 szálat (logikai processzort) érzékel majd az operációs rendszer.

Visszajön a klasszikus SMT a Zenben
Visszajön a klasszikus SMT a Zenben [+]

A magonkénti egy integer és egy lebegőpontos egység tehát ismét megtalálható lesz az AMD processzoraiban. Az egyszálú teljesítmény, ami a közvetlen elődök egyik gyenge pontja volt, már önmagában emiatt jelentősen növekszik, azonban a mérnökök más megoldásokat is bevetettek a cél érdekében. Az L2 cache nyolcutas, 512 kB-os. Mérete csökkent a Bulldozerhez (modulonként 2 MB, azaz 1 MB/mag) képest, de duplája lett az Intel megoldásainak, amit egy mag órajel-ciklusonként 32 bájtos szélességben elérhet.

Az eddigi write-through megoldás helyett write-back-re módosult az L2 elérése: így a cache írásokkal hamarabb végezhet a rendszer, nem kell a következő szint írását a rendszernek egyidejűleg elvégeznie, amíg nem nyúl az adott gyorsítótár-tartalomhoz. A megosztott 16 utas L3-as gyorsítótár mérete Core Complexenként maximum 8 MB, amin az egyes fizikai magok osztoznak, órajelenként 32 bájtot továbbító buszon kapcsolódva. A tényleges magszám függvényében ez 1 MB, illetve 2 MB magonkénti méretet eredményezhet. Összességében bizonyos esetekben a korábbi AMD CPU-khoz képest akár ötszörös gyorsítótár-sávszélességbeli növekedés is tapasztalható.

Fejlesztettek és változtattak az eddigi cache kialakításon Fejlesztettek és változtattak az eddigi cache kialakításon
Fejlesztettek és változtattak az eddigi cache kialakításon [+]

Javítottak az adatokat spekulatívan előbetöltő hardveres elemek (prefetch-erek) működésén, az elágazásbecslési (branch prediction) képességek fejlesztése mellett. Az így feldolgozott adatok és utasítások az átstrukturált és megnövelt kapacitású L1 adat és utasítás gyorsítótárba kerülnek. Az előbbi egy nyolcutas, 32 kB-os, míg az utóbbi kétszeres, 64 kB-os méretet és négyutas szervezést kapott. A magok Load/Store egységét egyszerre két 16 bájtos load és egy 16 bájtos store memóriaművelettel dolgoztathatja az L1 adatgyorsítótár. 32 bájt lehet egy-egy dekódolt utasításszelet, amit egyidőben továbbíthat.

Az integer és lebegőpontos egységek bővültek és az energiahatékonyság javult. Az integer és lebegőpontos egységek bővültek és az energiahatékonyság javult.
Az integer és lebegőpontos egységek bővültek és az energiahatékonyság javult. [+]

Mindennek a fejlesztésnek köszönhetően javítható az energiahatékonyság: a jobb egyszálú teljesítmény miatt hamarabb végezhet az adott mag, és a modulos felépítés megszüntetésével hatékonyabb lehet az órajelkapuzás is, mert külön és finomabban kapcsolhatók takarékra, vagy akár teljesen ki a nem működő részegységek. A nagyobb gyorsítótár-méretek, az átszervezett működés, javuló elágazásbecslés és előbetöltés csökkenti a felesleges írási műveletek számát, amivel szintén energia takarítható meg.

Javul a teljesítmény/fogyasztás mutató Javul a teljesítmény/fogyasztás mutató
Javul a teljesítmény/fogyasztás mutató, segít a 14 nm-es FinFET [+]

Az eredmény egy nagyobb számítási teljesítmény leadása mellett is fejlettebb energiahatékonysággal rendelkező architektúra lett. Ebben sokat segített a GlobalFoundries 14 nm-es FinFET gyártástechnológiája, amelyet az AMD-nél a Polarisok esetében is alkalmaznak. Mindez az AMD mérései szerint akár 40%-os javulást is eredményezhet ilyen téren, de realistán gondolkodva, valamint a Polarisok tényleges fogyasztása alapján spekulálva a 30% is korrektnek lenne mondható. Az Intel a 40%-kal sem fogható még be, de a 30% is szép előrelépés lenne az eddigi AMD chipekhez képest.

A tényleges teljesítményről

Az adott órajel alatt végrehajtott utasítások (instructions per clock – IPC) számának növelésével viszont megközelíthetők az Intel processzorok, az eddigi hatalmas órajeltöbblet alkalmazását szükségtelenné téve.

Növelték az IPC-t is
Növelték az IPC-t is [+]

Hogy némi kézzelfoghatót is kapjunk, összemérték a 8 magos asztali Summit Ridge-et a szintén nyolcmagos Intel konkurensével, az i7-6900K-val, és ezt videóra vették. Mindkét CPU 16 szálon dolgozik, és az órajeleket is egységesre, 3 GH-re lőtték be. A Blender renderelővel egy hajszállal hamarabb számolta ki a képet az AMD. Ennél többet a tesztrendszerről nem árultak el, így a fogyasztáson túl egy sereg egyéb paraméter nem ismert még, ahogy a Zen végleges órajele sem. Az őszinte verziónk az, hogy nem várjuk el, hogy gyorsabb legyen, csak azt, hogy ne legyen nagy a lemaradása a 2017-es első negyedévi várható megjelenésekor az aktuális Intelek mögött.

A videón egyébként a játékok alatti 4K UHD teljesítményről is képet lehet kapni, ezt is megmutatták (sajnos a konkrét FPS azonban nem látszik), a gépben egy Fury X videokártyát alkalmazva. Mindebből sok következtetést több alkalmazásra nézve még nem lehet levonni, de a bizakodásra elegendő. A CPU-kat fogadó univerzális AM4 platform végre a modern technológiákat is megkapja: NVMe, SATA Express és M.2 támogatás, natív USB 3.1 (Type-A és Type-C is), valamint a CPU oldaláról már DDR4-es lesz az IMC, valamint PCIe 3.0 szabványú a PCI Express vezérlő.

Az AM4 is vele érkezik
Az AM4 is vele érkezik [+]

A Zen egyébiránt szerverekben is helyet kap, amivel az AMD nagyobb erővel visszatérhet az x86-os kiszolgálók piacára, amit korábban egy kicsit visszaszorítani látszottak az ARM-es tervek. 32 magos is lehet a Naples kódnevű szerverchip, amit egy kétfoglalatos alaplapban memóriával alaposan megpakolva látni is a fenti videó vége felé.


[+]

Összességében várjuk a Zent, mert a mai csúcsprocesszorok terén az Intel már olyan mértékben egyeduralkodó, hogy a CPU-k ára szinte hihetetlen. Egy, a mostaninál egészségesebb verseny a vásárlóknak lehet a hasznára a kedvezőbb árak generálásával, illetve alternatívákat is teremthet.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés