Még javában zajlott az idei IDF, amikor az AMD egy prezentációban új információkat közölt az érkező Zen x86-os CPU mikroarchitektúrájáról. Emellett az asztali gépekbe szánt, ezt alkalmazó nyolcmagos Summit Ridge központi egységet néhány alkalmazás futtatásával is bemutatták. Valószínűleg nem véletlenül, hanem szimbolikus jelentéssel időzítették az AMD előadását a konkurencia rendezvényének idejére.
Az AMD elnöke, Dr. Lisa Su a Zen-ről beszél
Egy kis visszatekintés
Nem feltétlenül alakult minden az AMD számításai szerint a processzorpiacon. Az FX-ek tekintetében köhécselt a Bulldozer, nem hozta a kívánt előrelépést a Piledriver és a Kaveri-beli Steamroller, de a kései Carrizo APU-ban helyet kapott Excavator magok/modulok is inkább csak az energiahatékonyságon tudtak javítani. Az Intel IGP-k is lassan beérik az APU-k grafikus részét, így valamit fel kell az AMD-nek mutatnia, ha versenyben akar maradni.
Bőven hozzátett az AMD az x86-os piachoz [+]
A fenti összefoglalót a kétmagos CPU és az APU között azért kiegészítenénk azzal, hogy a négymagos Phenom ugyan később került piacra az Intel négymagos megoldásánál, de utóbbi csak két kétmagos chipet huzalozott össze egy nyomtatott áramkörön. Az FX-re, mint leggyorsabbra utalás pedig leginkább csak az 5 GHz-es Turbo Core órajelre értendő.
A Summit Ridge belseje
Meglepően sok információról lerántották a leplet, így közeli és alapos képet kaphatunk a főbb újításokról, illetőleg változtatásokról. A Zen szakít az elsőként a Bulldozerben kipróbált modulos felépítéssel, így ismét egy hagyományos többmagos központi egységet kapunk, amihez visszatér a vállalat, hiszen a korábbi processzorai is ilyen tervezési filozófiával készültek. Emellett az Intel Hyper-Threading működéséhez hasonló megoldást is alkalmaz, ami régóta fellelhető a konkurencia lapkáiban, tehát a Summit Ridge kódnevű nyolcmagos asztali lapka esetében 16 szálat (logikai processzort) érzékel majd az operációs rendszer.
Visszajön a klasszikus SMT a Zenben [+]
A magonkénti egy integer és egy lebegőpontos egység tehát ismét megtalálható lesz az AMD processzoraiban. Az egyszálú teljesítmény, ami a közvetlen elődök egyik gyenge pontja volt, már önmagában emiatt jelentősen növekszik, azonban a mérnökök más megoldásokat is bevetettek a cél érdekében. Az L2 cache nyolcutas, 512 kB-os. Mérete csökkent a Bulldozerhez (modulonként 2 MB, azaz 1 MB/mag) képest, de duplája lett az Intel megoldásainak, amit egy mag órajel-ciklusonként 32 bájtos szélességben elérhet.
Az eddigi write-through megoldás helyett write-back-re módosult az L2 elérése: így a cache írásokkal hamarabb végezhet a rendszer, nem kell a következő szint írását a rendszernek egyidejűleg elvégeznie, amíg nem nyúl az adott gyorsítótár-tartalomhoz. A megosztott 16 utas L3-as gyorsítótár mérete Core Complexenként maximum 8 MB, amin az egyes fizikai magok osztoznak, órajelenként 32 bájtot továbbító buszon kapcsolódva. A tényleges magszám függvényében ez 1 MB, illetve 2 MB magonkénti méretet eredményezhet. Összességében bizonyos esetekben a korábbi AMD CPU-khoz képest akár ötszörös gyorsítótár-sávszélességbeli növekedés is tapasztalható.
Fejlesztettek és változtattak az eddigi cache kialakításon [+]
Javítottak az adatokat spekulatívan előbetöltő hardveres elemek (prefetch-erek) működésén, az elágazásbecslési (branch prediction) képességek fejlesztése mellett. Az így feldolgozott adatok és utasítások az átstrukturált és megnövelt kapacitású L1 adat és utasítás gyorsítótárba kerülnek. Az előbbi egy nyolcutas, 32 kB-os, míg az utóbbi kétszeres, 64 kB-os méretet és négyutas szervezést kapott. A magok Load/Store egységét egyszerre két 16 bájtos load és egy 16 bájtos store memóriaművelettel dolgoztathatja az L1 adatgyorsítótár. 32 bájt lehet egy-egy dekódolt utasításszelet, amit egyidőben továbbíthat.
Az integer és lebegőpontos egységek bővültek és az energiahatékonyság javult. [+]
Mindennek a fejlesztésnek köszönhetően javítható az energiahatékonyság: a jobb egyszálú teljesítmény miatt hamarabb végezhet az adott mag, és a modulos felépítés megszüntetésével hatékonyabb lehet az órajelkapuzás is, mert külön és finomabban kapcsolhatók takarékra, vagy akár teljesen ki a nem működő részegységek. A nagyobb gyorsítótár-méretek, az átszervezett működés, javuló elágazásbecslés és előbetöltés csökkenti a felesleges írási műveletek számát, amivel szintén energia takarítható meg.
Javul a teljesítmény/fogyasztás mutató, segít a 14 nm-es FinFET [+]
Az eredmény egy nagyobb számítási teljesítmény leadása mellett is fejlettebb energiahatékonysággal rendelkező architektúra lett. Ebben sokat segített a GlobalFoundries 14 nm-es FinFET gyártástechnológiája, amelyet az AMD-nél a Polarisok esetében is alkalmaznak. Mindez az AMD mérései szerint akár 40%-os javulást is eredményezhet ilyen téren, de realistán gondolkodva, valamint a Polarisok tényleges fogyasztása alapján spekulálva a 30% is korrektnek lenne mondható. Az Intel a 40%-kal sem fogható még be, de a 30% is szép előrelépés lenne az eddigi AMD chipekhez képest.
A tényleges teljesítményről
Az adott órajel alatt végrehajtott utasítások (instructions per clock – IPC) számának növelésével viszont megközelíthetők az Intel processzorok, az eddigi hatalmas órajeltöbblet alkalmazását szükségtelenné téve.
Hogy némi kézzelfoghatót is kapjunk, összemérték a 8 magos asztali Summit Ridge-et a szintén nyolcmagos Intel konkurensével, az i7-6900K-val, és ezt videóra vették. Mindkét CPU 16 szálon dolgozik, és az órajeleket is egységesre, 3 GH-re lőtték be. A Blender renderelővel egy hajszállal hamarabb számolta ki a képet az AMD. Ennél többet a tesztrendszerről nem árultak el, így a fogyasztáson túl egy sereg egyéb paraméter nem ismert még, ahogy a Zen végleges órajele sem. Az őszinte verziónk az, hogy nem várjuk el, hogy gyorsabb legyen, csak azt, hogy ne legyen nagy a lemaradása a 2017-es első negyedévi várható megjelenésekor az aktuális Intelek mögött.
A videón egyébként a játékok alatti 4K UHD teljesítményről is képet lehet kapni, ezt is megmutatták (sajnos a konkrét FPS azonban nem látszik), a gépben egy Fury X videokártyát alkalmazva. Mindebből sok következtetést több alkalmazásra nézve még nem lehet levonni, de a bizakodásra elegendő. A CPU-kat fogadó univerzális AM4 platform végre a modern technológiákat is megkapja: NVMe, SATA Express és M.2 támogatás, natív USB 3.1 (Type-A és Type-C is), valamint a CPU oldaláról már DDR4-es lesz az IMC, valamint PCIe 3.0 szabványú a PCI Express vezérlő.
A Zen egyébiránt szerverekben is helyet kap, amivel az AMD nagyobb erővel visszatérhet az x86-os kiszolgálók piacára, amit korábban egy kicsit visszaszorítani látszottak az ARM-es tervek. 32 magos is lehet a Naples kódnevű szerverchip, amit egy kétfoglalatos alaplapban memóriával alaposan megpakolva látni is a fenti videó vége felé.
Összességében várjuk a Zent, mert a mai csúcsprocesszorok terén az Intel már olyan mértékben egyeduralkodó, hogy a CPU-k ára szinte hihetetlen. Egy, a mostaninál egészségesebb verseny a vásárlóknak lehet a hasznára a kedvezőbb árak generálásával, illetve alternatívákat is teremthet.