AMD Ryzen CPU teszt: egy új korszak kezdete?

Újra a P6-ot másolja mindenki

Eljött az a pillanat, amire viszonylag sokan vártak. Az AMD és velük párhuzamosan mi is már régóta csepegtettük az információkat az új Zen architektúráról, de minden részletet csak most, ettől a pillanattól fogva lehet megosztani róla. Mielőtt azonban nagyon belemerülnénk a végül Ryzen névre keresztelt új processzorcsalád vizsgálatába, érdemes egy kicsit visszautazni a múltba, hogy maga az x86/AMD64-es processzorokat fejlesztő cégek milyen döntéseket hoztak régebben, és miért is tartunk ma ott, ahol.

Ha a részletesebb történelmet nézzük, akkor az elmúlt húsz évben az Intel és az AMD is megjárta a trónt. Utóbbi cégnek főleg az Athlon 64-es időszak volt kiemelkedő, majd az elmúlt pár évben nem sikerült maradandót alkotni a processzorpiacon. Egy dolgot viszont észre lehet venni a két cég közötti versenyben: az Intel és az AMD mindig akkor maradt le, amikor az éppen megtervezett dizájn jelentősen eltért az Intel Pentium Pro CPU-ban bemutatkozó P6 mikroarchitektúrától. Mint ismeretes, az Intel a Pentium 4-hez fejlesztett Netburst architektúrával próbált alternatív utat keresni, míg az AMD az FX processzorok alapját képző Bulldozer architektúrával.


[+]

Végeredményben az Intel Netburst és az AMD Bulldozer is bukás lett, ugyanakkor nem feltétlenül azért, mert olyan rossz ötlet elszakadni a P6 dizájn alapjaiban történő másolásától. Valójában az érintett cégeknek jó indoka volt az adott időszakban új irányt keresni, ugyanis a P6 mikroarchitektúra dizájnjának másolása a valóságban nem sok olyan fejlesztési lehetőséggel kecsegtet, amivel az x86/AMD64-es processzorok ideálisan tudnák tartani a lépést az alternatív processzorarchitektúrákkal. Persze ez nem jelenti azt, hogy a Netburst vagy a Bulldozer lenne a megoldás a gondokra, csupán azt érdemes látni, hogy az Intel és az AMD is látta, illetve látja a potenciális problémákat, és megpróbálták kezelni azokat. A sikerhez azonban az is kell, hogy az alkalmazásokat az újszerű dizájnokra optimalizálják, amire nem igazán került sor a Netburst és a Bulldozer esetében sem.


[+]

Az Intel korábban már visszatért a P6 mikroarchitektúra dizájnjának másolásához a Pentium M családdal, ebből született a Core sorozat. Ezzel a vállalat feladta a reformra vonatkozó tervét, és mára az AMD is így tett az új Zen architektúrával, amin szintén a P6 alapvető vonásai köszönnek vissza. A P6 mikroarchitektúra másolásához való visszatérés persze nem azért történt, mert a korábban kialakított alapok olyan jók lennének, hanem azért, mert a programok jelentős részét ennek megfelelően optimalizálják, és ez nagyon megnehezíti mindkét félnek a reformokat. Az esetleges új dizájnok ugyanis akármennyire is jó ötleteket vonultatnak fel, ezeket nem lehet optimálisan kihasználni, ha az alkalmazásfejlesztők nem az újszerű alapokat célozzák meg. Ilyen formában pedig a piac nem tud jelentős innovációkat bevetni, hiszen már csak a programok igényei miatt is maradni kell a hagyományos dizájnelemeknél, és végeredményben ezeket kell jobbá tenni.


[+]

A Zen architektúra a fentiek miatt távolról sem olyan innovatív, mint volt anno a Netburst vagy a Bulldozer volt, ugyanakkor nagyon jól működik akár az aktuális alkalmazásokkal is, ami nyilván nem elhanyagolható szempont. Az AMD ugyanakkor a Zennel próbált egészséges kompromisszumokat kötni, ugyanis ma már nem kifizetődő minden részegységből a legjobb lehetőségeket szem előtt tartani, aminek főleg az az oka, hogy az adott processzornak a fogyasztását is értelmes kereteken belül kell tartani. Emiatt a mai processzorok tervezésénél a nehézség annak az ideális egyensúlynak a megtalálása, ami a teljesítményt a meglévő programokban alapvetően maximalizálja, miközben a fogyasztásnak ésszerű határokat szab. A Zen ennek a feltételnek felel meg igazán, és az sem véletlen, hogy az architektúra neve magyarra lefordítva egyensúlyt jelent.

Summit Ridge: az első Zen

A Zen magot, illetve magokat első körben a Summit Ridge kódnevű lapka kapta meg. Ez egy 14 nm-es LPP node-on készült lapka, amelyet a GlobalFoundries gyárt, és 4,8 milliárd tranzisztor található benne, amit sikerült 195 mm²-es területre besűríteni.

Az 1331 tűs AM4 foglalat
Az 1331 tűs AM4 foglalat [+]

A processzor új, Socket AM4-es tokozást kapott, ami 1331 tűvel kapcsolódik az alaplaphoz. Ebbe persze azt is bele kell számítani, hogy a Summit Ridge integrált déli hidat is tartalmaz, így a működéshez nem szükséges külső vezérlőhíd alkalmazása sem, de a DIY-piacon jellemző lesz az alaplapgyártókra, hogy élnek a kiegészítő hidakkal.

A Zen CCX
A Zen CCX [+]

A kialakított dizájn szempontjából a Summit Ridge két darab úgynevezett CCX-et, azaz Core Complexet tartalmaz. Egy ilyenben négy darab Zen mag található, és ezekhez maximum 8 MB megosztott L3 gyorsítótár kapcsolódhat 32 bájtot továbbító buszon. Ez ráadásul úgynevezett victim cache, vagyis ha az L2 gyorsítótár megtelik, akkor kerülnek az L3 gyorsítótárba az adatok. Annak érdekében, hogy ez előnyös legyen a rendszerre nézve, az L3 gyorsítótár elérésének késleltetése nem csak az adott maghoz tartozó 2 MB-os szeletre levetítve alacsony, hanem konkrétan az egész CCX-en belül az, vagyis nem sokkal nagyobb késleltetéssel lehet elérni az egyik magnak a másik maghoz kapcsolódó, 2 MB-os szeletét.


[+]

Tovább vizsgálva a dizájnt, a Zen az első magja az AMD-nek, ami SMT (simultaneous multi-threading) rendszert használ a komplex processzormag jobb kihasználása érdekében. Hasonló koncepciót több gyártó választott már az elmúlt évek során, többek között az Intel Hyper-Threading is ilyen. Az AMD megoldása időosztásos rendszer, hogy minden szál megfelelő erőforráshoz jusson. Ezzel persze jellemzően lehetnek bizonyos problémák, amennyiben egy szál a teljesítmény szempontjából domináns, vagy esetleg az adott feladathoz fontos az alacsony késleltetés biztosítása. Az AMD ezekre felkészült a Zen magban, így a jellegzetes gondokat a rendszer kezelni fogja. Többek között az integer és a lebegőpontos részen belül lesz algoritmusprioritás, vagyis ha egy szál több erőforrást igényel, akkor a lehetőségekhez mérten megkapja, emellett a magasabb prioritású folyamatokat futtató szálak kiemelten kezelhetők, így ez sem lesz gond. A mag egyes részei statikusan vannak particionálva, amit az AMD azzal magyaráz, hogy ezek nem kritikusak az SMT hatékony működése szempontjából, és eleve spórolni kell az energiával, de a Zen továbbfejlesztéseknél kiértékelik a nagyobb teljesítményt biztosító lehetőségeket.

A Zen SMT-je
A Zen SMT-je [+]

Mélyebben elmerülve a Core Complexben, illetve magában a Zenben, elmondható, hogy egy maghoz 512 kB-os, nyolcutas L2 cache tartozik, amit ciklusonként 32 bájtos szélességgel lehet elérni. Ráadásul a Bulldozernél alkalmazott write-through megoldásról write-backre módosult az elérése is, tehát a cache írásokkal hamarabb végezhet, nem kell a következő szint írását a rendszernek egyidejűleg elvégeznie, amíg nem nyúl az adott gyorsítótár-tartalomhoz. Az AMD szerint az egész gyorsítótár-architektúra radikálisan javult, többek között korábbi processzoraikhoz viszonyítva akár ötszörös sávszélességbeli növekedés is tapasztalható az L3 cache tekintetében, de az L2 cache is legalább kétszer gyorsabb.

A Zen mélylélektana

Magába a Zen magba beférkőzve rögtön megemlíthető a rendkívül kigyúrt front-end rész, amelyben felfedezhető a µop cache. Az AMD-nek ez az első processzora, amelyben ezt beveti. A µop cache egyébként legelőször az Intel Sandy Bridge magban jelent meg, és a legfőbb célja a teljesítmény növelése, illetve a fogyasztás csökkentése.

A Zen magon belül az utasításablak 64, míg az utasításbetöltés 32 bájtos, az elágazásbecslés pedig teljesen dinamikus. Ezen a ponton erős az AMD újdonsága, amit a cég szimplán Neural Net Prediction néven emleget. A működés során a feltételes elágazásoknál a hash perceptron, illetve újabban már a Neural Network nevű egység ellenőrzi a kétszintű, azaz L1 és L2 branch target buffert (BTB). Ezek a Jaguar magból ismerősek lehetnek, és ezúttal is gyorsítótársoronként két elágazás tárolható, a Neural Network egység így órajelenként két elágazásról tud dönteni. Bár az L1 és L2 BTB-k méretét az AMD nem adta meg, az biztos, arra vonatkozóan van utalás, hogy ezek nagy kapacitásúak.


[+]

A Zen mag egy közvetett elágazás detektálása után beveti az ITA-t, vagyis az Indirect Target Array egységet, aminek az 512 bejegyzési helyének egyikére kerül az elágazás, ami után a 32 bejegyzés tárolására alkalmas return stack lesz követve. A rendszer a hatékonyság növelése érdekében képes arra, hogy egy téves elágazás után a megfelelő elágazást tartalmazó szálnak prioritást adjon, így hamarabb lesz eredmény.

Jó hír, hogy a Zen magban már az utasítás translation lookaside buffer (iTLB) része az elágazásbecslésért felelős blokknak, ami szintén növeli a hatékonyságot. A háromszintű iTLB L0, L1 és L2 pufferrel rendelkezik, az első 8, a második 64, míg a harmadik 512 bejegyzést képes tárolni.

Rátérve az utasításbetöltésre és dekódolásra, a Zen 64 kB-os, négyutas, csoport asszociatív utasításgyorsítótárt kapott, míg a dekódertömb négy darab x86-os utasítást képes beolvasni egyszerre, és a dekódolás után maximum 8 µop állítható elő. Ezek a 72 bejegyzéses, szálak között statikusan particionált µop parancslistába kerülnek.

AMD Zen mag
AMD Zen mag [+]

A Zen mag a valós végrehajtás tekintetében egy integer és egy lebegőpontos részre oszlik. Az integer részen belül négy ALU (aritmetikai-logikai egység) és két AGU (címgeneráló egység) található. Az ALU-k mindegyike képes alapvető integer operációkra, illetve a shift, valamint a kétoperandusos LEA (load effective address) utasításra. Két ALU tud branchet futtatni, míg egy-egy ALU képes szorozni és osztani. A háromoperandusos LEA már az AGU-kon futtatható. A lebegőpontos részen két darab 128 bites FMAC egység található, amelyek egy-egy 128 bites FMA operációt, vagy egységenként egy 128 bites ADD és egy 128 bites MUL operációt tudnak elvégezni. Az L1 gyorsítótár 32 kB-os nyolcutas, csoport asszociatív.

A Zen az utasításkészletek szempontjából tulajdonképpen mindent támogatni fog, amit ma egy processzor támogathat. Ebbe beletartoznak az elterjedt, szabványosnak tekinthető utasításkészletek, illetve a viszonylag sűrűn használt utasítások is. Két újítást kínál azonban az AMD, amelyek közül az egyik a CLZERO. Ennek segítségével kitörölhető egy 64 byte-os gyorsítótársor (cache line), ami különösen hasznos lehet az adatközpontokban és a HPC szerverekben. A másik újítás a PTE (Page Table Entry) Coalescing, ami igazából nem is utasítás, hanem sokkal inkább egy funkció, és nem szükséges speciális szoftvertámogatás a működéséhez. Ez annyit tesz, hogy a 4 kB-os laptáblákat összeállítja 32 kB-osokká, ezzel hatékonyabban használhatók fel a címfordítási eredményeket tároló TLB (Translation Lookaside Buffer) slotok. Ugyanakkor a PTE Coalescing működéséhez számos feltételnek kell teljesülni, de ha ez megvan, akkor a rendszer beveti a technikát.

Csúcs fölé járatott órajellel

Az előbbi oldalakon leírtak azonban nem sokat érnek, ha nincs megfelelő dinamikus feszültségskálázás, hiszen erre szükség van az optimális órajelek eléréséhez. Az AMD a Summit Ridge esetében is a Bristol és Stoney Ridge APU-nál bemutatott AVFS-t (adaptive voltage and frequency scaling) kapták meg, de kibővített formában.

Az AVFS a ma ismert leghatékonyabb technológia a teljesítmény/fogyasztás mutató megfelelő optimalizálására. Az AMD régebben alkalmazott pillanatnyi fogyasztás- és hőmérséklet-szenzorokat kiegészítette feszültség- és frekvencia-érzékelőkkel is. A konstrukció a hagyományos DVFS (dynamic voltage and frequency scaling) megoldásokkal szemben annyi előnyt kínál, hogy valós idejű monitorozást biztosít, így a hardver az egyes helyzetekre jóval hatékonyabban reagálhat. Ez abból adódik, hogy a rendszer nem egy előre betáplált táblázatból dolgozik, hanem maga számol egy ideális skálázási modellt az adott környezet jellemzőihez igazodva.


[+]

A Summit Ridge a megfelelő működés érdekében rengeteg, ezernél is jóval több szenzort tartalmaz, amelyek valós időben monitorozzák a lapkát, és reagálnak a különböző eseményekre. Ez teszi lehetővé, hogy az egyes magok mindig az optimális órajelen üzemelhessenek. A precíz órajel beállításához azonban az AMD bevezette a finomszemcsés P-State modellt, amely a Windows 10 P-State megoldását váltja. Ennek köszönhető az, hogy a lapka nagyon apró, 25 MHz-es léptékenként tud órajelet váltani, ráadásul magonként függetlenül, így mindig tökéletesen lehet igazodni a környezethez.

A frissített AVFS teszi lehetővé azt is, hogy maga a Summit Ridge processzor akár a hivatalosan megadott turbó órajel fölé állítsa a magok órajelét. Ez az úgynevezett XFR mód, amely az Extended Frequency Range rövidítése, és tulajdonképpen egy automatikus tuningnak fogható fel. Vagyis, ha az adott lapka az adott környezetben az adott hűtés mellett még képes lenne a maximális turbó órajel fölé menni, akkor megteheti.


[+]

Az XFR-nek elvileg nincs felső korlátja, a gyakorlatban azonban az AMD a biztonság kedvéért mégis megfogja, így az X-re végződő Ryzen processzorok 100, míg az X nélküli verziók 50 MHz-cel tudnak a maximális turbó órajel fölé menni. A korlátozásnak valószínűleg biztonsági okai vannak, ugyanis az XFR egy alapértelmezett funkció, és ennek megfelelően garantálni kell, hogy a processzor nem fog lefagyni működése során. Később, ahogy több tapasztalatot gyűjt az AMD a kialakított automatikus tuningról, valószínűleg emelni fogják a tétet.

Tesztkonfig és specifikáció

A 2013 őszén debütált Windows 8-as tesztrendszerünk volt az egyik főszereplő, mely többek között az általunk korábban használt alkalmazások akkor legújabb verzióit tartalmazza. Különösebb akadálya nem volna, hogy a videokártyás tesztrendszerünkhöz hasonlóan itt is Windows 10-re frissítsünk, azonban nem is áll fenn olyan kényszerítő körülmény, mint ott a DirectX 12 kizárólagossága. Természetesen előbb-utóbb meg fog történni a tesztrendszer frissítése, ennek kidolgozása a háttérben már folyamatban van. Az Ryzen tesztjére jutó idő rövidsége miatt amúgy sem lett volna szerencsés új platformmal indítani, nem mellesleg az eredmények így közvetlenül összevethetőek maradnak korábbi processzortesztjeink értékeivel.


[+]

Ennek tudatában ismerősek lesznek az alábbi tesztprogramok, amelyeknél szokásunkhoz híven háttérbe szorítottuk a szintetikus benchmarkokat, és inkább a valós felhasználásra fókuszáltunk. Mindez összesen 18 különféle alkalmazást takar, melyek listája a következőképpen alakul:

  • WinRAR 5.00 b8 (64-bit)
  • 7-Zip 9.25 (64-bit)
  • Cinebench R11.5 (64-bit)
  • Autodesk 3ds Max 2014 (64-bit)
  • Indigo Renderer v3.4.16 (64-bit)
  • Adobe After Effects CC (64-bit)
  • Adobe Premiere Pro CC (64-bit)
  • Adobe Photoshop CC (64 Bit)
  • Sony Vegas Pro 12 (64-bit)
  • CyberLink PowerDirector 11 (64-bit)
  • Sorenson Squeeze 9 (32-bit)
  • DivX Encoder 6.9.2 (32-bit)
  • XviD Encoder 1.3.2 (64-bit)
  • x264 build 2334 (64-bit)
  • LameXP 4.07 b1286 (32-bit)
  • Cockos Reaper v4.402 (64-bit)
  • Apache 2.2.25 (32-bit)
  • AVG AntiVirus Free 2013.0.3392 (64-bit)

A szoftverek döntő többsége már képes 4-8 vagy akár még több magot/szálat is kihasználni, ugyanakkor továbbra is akad néhány kivétel. Ezeket szándékosan hagytuk benne a tesztcsokorban, hiszen egy többmagos processzort megvásárolva sem kizárólag teljes többszálas támogatással ellátott programokat fogunk futtatni. A következő két játékkal most is leteszteltük azt, hogy egy – az adott játék szempontjából kellően erős – különálló videokártya alkalmazásával hogyan alakul a központi egységek teljesítménye VGA- és CPU-limites beállításokkal.

  • Tomb Raider
  • Grid 2
Tesztkörnyezet
LGA2011-v3 tesztplatform Intel Core i7-6950X (3,0 GHz) processzor
Intel Core i7-6900K (3,2 GHz) processzor
Intel Core i7-5960X (3,0 GHz) processzor
ASUS X99-Pro alaplap (X99 chipset, BIOS: 2101/3101)
4 x 8 GB HyperX Fury DDR4-2666 HX426C15FBK4/32 memória
DDR4-2133 beállítás, 14-15-15-36-2T időzítések,
DDR4-2400 beállítás, 14-16-16-36-2T időzítések
LGA2011 tesztplatform Intel Core i7-4960X (3,6 GHz) processzor
Intel Core i7-3960X (3,3 GHz) processzor
ASUS P9X79 PRO alaplap (X79 chipset, BIOS: 4210)
4 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1866 beállítás, 9-10-9-28-1T időzítések,
DDR3-1600 beállítás, 9-10-9-28-1T időzítések
LGA1151 tesztplatform Intel Core i7-7700K (4,2 GHz) processzor
Intel Core i5-7600K (3,8 GHz) processzor
Intel Core i7-6700K (4,0 GHz) processzor
Intel Core i5-6600K (3,5 GHz) processzor
ASUS Maximus IX Formula - (Z270 chipset, BIOS: 0701)
Gigabyte Z270X-Gaming 7 - (Z270 chipset, BIOS: F4k)
ASUS Z170-Deluxe alaplap (Z170 chipset, BIOS: 0504)
2 x 8 GB HyperX Fury DDR4-2666 HX426C15FBK4/32 memória
DDR4-2133 beállítás, 14-15-15-36-2T időzítések
DDR4-2400 beállítás, 15-17-17-35-2T időzítések
LGA1150 tesztplatform Intel Core i7-5775C (3,3 GHz) processzor
Intel Core i7-4790K (4,0 GHz) processzor
Intel Core i7-4770K (3,5 GHz) processzor
Intel Core i5-4670K (3,4 GHz) processzor
Gigabyte Z97X-UD5H-BK alaplap (Z97 chipset, BIOS: F8a)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1600 beállítás, 9-10-9-28-1T időzítések
LGA1155 tesztplatform Intel Core i7-3770K (3,5 GHz) processzor
Intel Core i5-3470 (3,2 GHz) processzor
Intel Core i7-2600K (3,4 GHz) processzor
MSI Z77 MPOWER alaplap (Z77 chipset, BIOS: V17.10)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1600 beállítás, 9-10-9-28-1T időzítések,
DDR3-1333 beállítás, 9-9-9-28-1T időzítések
LGA1156 tesztplatform Intel Core i7-870 (2,93 GHz) processzor
MSI P55-GD80 alaplap (P55 chipset, BIOS: 1.C)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1333 beállítás, 9-9-9-28-1T időzítések
LGA1366 tesztplatform Intel Core i7-920 (2,66 GHz) processzor
ASUS P6T Deluxe alaplap (X58 chipset, BIOS: 2209)
3 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1066 beállítás, 7-7-7-21-1T időzítések
AM3/AM3+ tesztplatform AMD FX-9590 (4,7 GHz) processzor
AMD FX-8350 (4,0 GHz) processzor
AMD Phenom II X6 1100T (3,3 GHz) processzor
ASUS Crosshair V Formula-Z alaplap (990FX chipset, BIOS: 2201)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1866 beállítás, 9-10-9-28-1T időzítések,
DDR3-1333 beállítás, 9-9-9-28-1T időzítések
AM4 tesztplatform AMD Ryzen 7 1800X (3,6 GHz) processzor
ASUS ROG Crosshair VI Hero (X370 chipset, BIOS: 5704)
4 x 8 GB HyperX Fury DDR4-2666 HX426C15FBK4/32 memória

DDR4-2666 beállítás, 16-17-17-35-1T időzítések
Videokártya AMD Radeon HD 7970 GHz Edition 3 GB GDDR5 – AMD Catalyst 14.4 WHQL
Háttértárak Intel SSD 510 250 GB SSDSC2MH250A2 (SATA 6 Gbps) SSD
Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache) merevlemez
Processzorhűtő Noctua NH-U12S SE-AM4
EK-XLC Predator 240
Tápegység Seasonic Platinum Fanless 520 – 520 watt
Monitor Acer BX320HK FreeSync 4K (32")
Operációs rendszer Windows 8 Pro 64 bit

ASUS ROG Crosshair VI Hero - a tesztplatform alapja
ASUS ROG Crosshair VI Hero - a tesztplatform alapja [+]

[+]

A bevett procedúrának megfelelően most is mindent a gyári specifikációk alapján állítottunk be, nem variáltunk a Turbo órajelekkel, és az energiagazdálkodással kapcsolatos beállításokat sem bántottuk, mivel a legtöbb felhasználó is ennek megfelelően használja PC-jét. Egyedül a ROG alaplap, egészen pontosan az AI Tweaker funkció által felkínált minimális tuningot kapcsoltuk ki, mivel alapból megemelt RAM- és CPU-órajelekkel indította a rendszert.


A legcombosabb modellt, a Ryzen 7 1800X-et kaptuk [+]

Processzorok specifikációi
Processzor típusa AMD Ryzen 7 1800X AMD FX-9590 Intel
Core i7-6950X
Intel
Core i7-5960X
Intel
Core i7-4960X
Intel
Core i7-7700K
Kódnév Summit Ridge Vishera Broadwell-E Haswell-E Ivy Bridge-E Kaby Lake
Tokozás Socket AM4 Socket AM3+ LGA2011-v3 LGA2011 LGA1151
Alap magórajel 3600 MHz 4700 MHz 3000 MHz 3000 MHz 3600 MHz 4200 MHz
Magok / szálak 8/16 8/8 10 / 20 8 / 16 6 / 12 4 / 8
Max. gyári memória-órajel DDR4-2666 (DC) DDR3-1866 (DC) DDR4-2400 (QC) DDR4-2133 (QC) DDR3-1866 (QC) DDR3-1600L /
DDR4-2400 (DC)
Turbo Boost v. Turbo Core 4,0 GHz (8 magra) 5,0 GHz (4 magra) 3,3-3,5 GHz
(10-től 1 magig)
3,3-3,5 GHz
(8-tól 1 magig)
3,7-4,0 GHz
(6-tól 1 magig)
4,4-4,5 GHz
(4-től 1 magig)
L1D/L1I cache mérete 8 x 32 kB / 8 x 64 kB 8 x 16 kB / 4 x 64 kB 10x 32/32 kB 8 x 32/32 kB 6 x 32/32 kB 4 x 32/32 kB
L2 cache mérete 8 x 512 kB 4 x 2 MB 10 x 256 kB 8 x 256 kB 6 x 256 kB 4 x 256 kB
L3 cache mérete 2 x 8 MB 8 MB 25 MB 20 MB 15 MB 8 MB
L3/IMC órajele (uncore/NB) n. a. 2200 MHz 2800 MHz 3000 MHz magórajel 4000 MHz
Kommunikáció a chipsettel x4 PCI Express 3.0 (opcionális) HyperTransport
(2600 MHz – 5,2 GT/s)
DMI 2.0 (5 GT/s) DMI 3.0 (8 GT/s)
Integrált PCIe vezérlő 20 sáv (3.0) nincs 40 sáv (3.0) 16 sáv (3.0)
Utasításkészletek MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, SSE4A, AVX, AVX2,
FMA(3), AES, SHA, CLZERO
MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, SSE4A, AES,
AVX, XOP, FMA4, FMA(3)
F16C, BMI, TBM
MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1,
SSE4.2, AES-NI, AVX, AVX2, FMA(3)
MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, AES-NI, AVX
MMX, SSE, SSE2, SSE3, SSSE3,
SSE4.1, SSE4.2, AES-NI
AVX, AVX2, FMA(3)
Egyéb technológiák AMD-V, PTE Coalescing,
IOMMU 2.5, Sense Mi Technology
APM, HTC, C1E, C6, EVP,
AMD-V, IOMMU
EIST, C1E, C-states, TSX-NI,
Execute Disable Bit,
VT-x,VT-d, Hyper-Threading
EIST, C1E, C-states, VT-x, VT-d,
Execute Disable Bit, Hyper-Threading
EIST, C1E, C-states, VT-x, VT-d,
Execute Disable Bit
Hyper-Threading, TSX-NI
Gyártástechnológia /
feszültség (stepping)

14 nm LPP FinFet
0,456 V (rev. 08F/1)

32 nm HKMG SOI
1,488 V (rev. C0)
14 nm Tri-Gate
0,967 V (r. B0/M0/R0)
22 nm Tri-Gate
1,02 V (rev. M0)
22 nm Tri-Gate
1,125 V (rev. S0/S1)
14 nm Tri-Gate
1,284 V (rev. B0)
TDP max. 95 watt max. 220 watt max. 140 watt max. 130 watt max. 91 watt
Tranzisztorok száma
Mag mérete
4,8 milliárd
195 mm2
1,2 milliárd
315 mm2
3,2 milliárd
246,3 mm2
2,6 milliárd
356 mm2
1,86 milliárd
257 mm2
n. a.
Integrált GPU (IGP) Nincs Intel HD Graphics 630

A fenti táblázat megjelenítését egyes adblokkerek akadályozhatják

A Ryzenből az AMD a legerősebb modellt küldte, ezt vetettük össze a korábbi tesztekből már jól ismert Intel és korábbi AMD processzorokkal.

Fogyasztás

Szokás szerint először a fogyasztást vettük górcső alá. Ennek mérését egy konnektorba dugható, digitális VOLTCRAFT Energy Logger 4000 készülékkel végeztük, és minden esetben a monitor nélküli teljes konfiguráció értékeit vizsgáltuk. A platformokon engedélyezve voltak az egyes energiagazdálkodási funkciók.

Az 1800X aktív energiagazdálkodás, teljes nyolcmagos és teljes egymagos terhelés mellett Az 1800X aktív energiagazdálkodás, teljes nyolcmagos és teljes egymagos terhelés mellett Az 1800X aktív energiagazdálkodás, teljes nyolcmagos és teljes egymagos terhelés mellett
Az 1800X aktív energiagazdálkodása, teljes nyolcmagos és teljes egymagos terhelés mellett [+]

Viszonylag agresszív energiagazdálkodást használ a Ryzen, hiszen a magfeszültséget visszaveszi, ehhez képest a 2,2 GHz-es órajel viszont nem annyira alacsony. A visszajelzett 0,371 volt valószínűleg a még nem végleges BIOS, illetve a CPU-Z kiolvasási pontatlansága miatt szerepel. Több magot megterhelve az órajel 3,7 GHz-re ugrott, amihez 37-szeres szorzót és 1,2 voltot állított be magának. Ez pontosan 100 megahertzcel magasabb, mint a 3,6 GHz-es alapórajel, ami azt jelenti, hogy az XFR működésbe lépett, viszont úgy tűnik, a fogyasztási keretből a magasabb Turbo frekvenciára már nem futotta. Ezt erősíti meg az egymagos terhelés is, ahol az órajel majdnem 4,1 GHz-re kúszott fel, tehát sikerült elérni a kereken 4 GHz-es Turbo frekvenciát, és erre közel 100 megahertzet pakolt rá az XFR. Ez esetben a magórajel is magasabb lett, 5 ezred híján elérte az 1,4 voltot.

Üresjárati fogyasztásban a Ryzen nem teljesít számottevően rosszabbul, mint a kevesebb maggal rendelkező friss konkurensek (Kaby Lake), de a szintén 8 magos és 14 nm-es i7-6900K-ra köröket ver, az FX-es AMD-kről nem is beszélve. Az enyhe terhelés alatt mutatott teljesítményfelvétel már valamivel nagyobb, és ugyan a 10 watt nem eget rengető, de a mezőny kiegyensúlyozottságát nézve azért nem lehet figyelmen kívül hagyni. Persze ha azt nézzük, hogy az X-es Intelek és a korábbi AMD-k hol állnak a sorban, a fejlődés igencsak dicséretes.

Renderelés, tömörítés

Az AMD-nek nagyon jól feküdt a Cinebench és a 3ds Max 2014 is, mondhatni jelentős, mindenképp hibahatáron kívül mozgó előnyt szedett össze még az eddig legcombosabbnak tartott i7-6950X-hez képest is.

Az Indigo Renderer alatt a Broadwell-E mindig jól szerepelt, és most is letaszíthatatlannak bizonyult, de a Ryzen szorosan a nyomában van, és értelemszerűen a Kaby Lake sem tudta tartani a versenyt.

A fájltömörítők a renderelő alkalmazásokkal ellentétben kedvelik a minél nagyobb memória-sávszélességet és az alacsony késleltetést, illetve a minél nagyobb, illetve gyorsabb L2 és L3 cache-t. Ennek ellenére a Ryzen nem tudta átmenteni előnyét a WinRAR-ba, és az eddig pariban lévő Broadwell-E nyomába sem ért, sőt még a 7700K is lenyomta. Ugyanakkor élünk a gyanúperrel, hogy itt vagy optimalizálással kapcsolatos, vagy BIOS-probléma lehet, ugyanis, mint azt később látni fogjuk, pont a RAR az egyik, ami alig gyorsult tuning hatására. Ezzel szemben a 7-Zip igen szépen skálázódott, és úgy tűnik, eddigi tesztjeinkkel ellentétben az AMD sok magját igencsak szerette, nem pedig az órajel dominált. Ezt támasztja majd alá a tuningolt eredmény is.

Videóvágás, szerkesztés

A különféle videóvágó és -konvertáló alkalmazások egyaránt profitálnak a gyorsabb memóriából és a minél több magból/szálból, illetve természetesen a magasabb órajelből is. Az persze változó, hogy melyik programnál épp melyik az az imént felsorolt háromból, ami nagyobb súllyal esik latba.

Az After Effects CC esetében fej fej mellett ment a Ryzen és a Broadwell-E, noha a Ryzen kevesebb maggal rendelkezik, de úgy tűnik, a magasabb órajelre jól reagál ez a program. Nem így a Premiere Pro CC, ahol a több maggal már sikerült elhúznia az Intelnek, és kevésbé volt órajel-orientált, de a Ryzen 7 1800X-hez közelálló paraméterekkel bíró i7-6900K éppen csak meg tudta előzni, tehát nagyjából a papírforma szerint alakult a végeredmény.

A Vegasban viszont már kevésbé szerepelt jól az AMD újdonsága, a mezőny közepére szorult vissza; a 43 másodperc nem valami fényes eredmény, az i5-7600K-val van egy szinten. Persze nem kizárt, hogy egy frissebb Vegas esetében már jobb lenne a skálázódás, vagy valami más probléma lehet a háttérben, mivel – és most itt megint előreutalnánk a tuningos eredményekre – az órajel masszív emelésére sem reagált a program.

A PowerDirector rendkívül kedveli a minél alacsonyabb memória-késleltetést, de a sok magot/szálat sem veti meg. Ellenben a Sorenson Squeeze-t általában leginkább az IPC és az órajel érdekli, ennek ellenére a Ryzen architektúra nagyon fekszik a programnak, hiszen messze nem a legmagasabb órajelet tudhatja magáénak, mégis szép előnyre tett szert, akárcsak a Cockos Reaper esetében.

Videókódolás, egyéb

A DivX képes több szálon dolgozni, bár négy felett már egyiket sem terheli maximumra, míg az XviD csupán egyet képes kihasználni. Ezekkel ellentétben az x264 jóval fejlettebb, hisz a tizenkét vagy több szálat felvonultató processzorokon is képes 100%-os CPU-kihasználtságot mutatni, miközben még a legújabb utasításkészleteket is kihasználja. Utóbbinál a Ryzen szépen szerepelt, hiszen a hatékony többszálú feldolgozás és a konkurensénél magasabb órajel elegendő volt, hogy az i7-6900K-t maga mögé utasítsa, a tíz mag előnyével ellenben nem tudott mit kezdeni. Ugyanakkor DivX kódolásnál a kettő kombinációja elég volt az első helyezéshez, hiszen a program skálázódási sajátosságai miatt a legerősebb Intel nem tudta teljes tudását kamatoztatni.

A LameXP ezt a CPU-t annyira nem szerette, míg a Photoshop mesébe illően gyorsult, itt azonban akár egy bug is állhat a háttérben. Jó eséllyel valamilyen más, a CPU-n kívülálló tényező is közbeszólt ezeknél az értékeknél. A víruskeresés sebessége a friss és az előző generációs csúcs Intelek, valamint a legerősebb Enthusiast-kategóriás i7-7700K közé sorolta be a Ryzen 7 1800X-et.

Az Apache webszerver esetén a Hyper-Threading miatt már korábban is tapasztaltunk gyengébb értékeket, most is ez tűnik a lassabb futás kiváltó okának.

Játékok

Két játékkal vizsgáltuk meg ezúttal is, CPU-, vegyes- és GPU-limites környezetben mit mutat a tesztalany, ahol előre leszögezzük, hogy a mai teszt nem a játékokra és nem is a videokártyára fókuszál, csupán a CPU-ról igyekszik az eddigi képet valamelyest kibővíteni.

Míg a Tomb Raider Full HD-ben, azaz GPU-limites környezetben kifejezetten jó helyen, addig processzorlimites beállításokkal a fő mezőny alatt végzett picivel, de az eltérések szinte csak mérési hibán belüliek. Grid 2 futtatásakor a várakozásnak megfelelően viselkedett a Ryzen, de a felbontást és a részletességet csökkentve valamiért nem sokat nőtt a tempó; ez az anomália egyrészt a korai BIOS verzióra is visszavezethető, de a játék kódja meglehetősen érzékeny az optimalizálásokra, valamint azok hiányára. A problémát jeleztük a fejlesztők felé is, akik megígérték, hogy utána fognak járni ennek, de javítást már biztosan nem fognak kiadni.

A processzorok teljesítményének alternatív rendezése a Full HD-s minimum teljesítmény alapján:

Tuning

Nem hagyhattuk ki, hogy megvizsgáljuk, mekkora erőtartalék lapul a központi egységben. Azt azonban meg kell említenünk, hogy tuning szempontjából a Ryzent még egyáltalán nem ismerjük, ráadásul a vezérlőhidak, alaplapok is újak, arról nem is beszélve, hogy a hozzájuk tartozó BIOS-okon is biztos lehet még csiszolni. Könnyen lehet tehát, hogy a későbbiekben ennél sokkal jobb eredmények is születnek majd.

A tuningolt Ryzen 7 1800X CPU- és memóriafrekvenciái A tuningolt Ryzen 7 1800X CPU- és memóriafrekvenciái
A tuningolt Ryzen 7 1800X CPU- és memóriafrekvenciái [+]

Mint azt korábban leírtuk, az 1800X alapórajele 3,6 GHz, ezt Turbo+XFR módban 4,1-ig lehet kitolni egymagos terhelés mellett, míg a többmagos terhelésnél gyakorlatilag nem láttunk 3,7 GHz-nél magasabb értéket. A kitűzött alapcélunk tehát az volt, hogy az ominózus 4,1 GHz-et elérjük az összes magot terhelve. Az AMD a tuninghoz biztosított egy windowsos tuningprogramot, az egyelőre béta állapotú Ryzen Mastert, és bár nem kedveljük a hasonló eszközöket, ezúttal adtunk neki egy esélyt. Lényegében pár perc alatt sikerült a áhított 4,1 GHz-es frekvenciát elérni úgy, hogy a magfeszültséget 1,4875 voltra, a CPU SOC feszültségét pedig 0,9-re emeltük.

AMD Ryzen Master
AMD Ryzen Master [+]

Igen ám, de az AMD pakkban található Corsair memóriák ekkor csak 2133 MHz-es frekvencián pörögtek, ami roppant alacsony, pláne ahhoz képest, hogy ezek a Vengeance LPX modulok 3 GHz-es tesztelt maximumot kínálnak 1,35 volt mellett. Itt már jobbnak láttuk, ha átváltunk a BIOS-ba, ahol mindössze egyetlen klikkelésbe került a megfelelő frekvencia-feszültség-késleltetés trió beállítása, így már csak a processzor beállításaira kellett koncentrálni. Tekintettel a központi egység szorzózármentes mivoltára, mindössze a szorzót állítottuk 41-re, a 100 MHz-es BCLK órajelet nem bántottuk, mellé pedig a korábban említett mag- és CPU SOC feszültséget állítottuk be.

Sajnos a memóriatuninggal együtt ez kevésnek bizonyult: a Windows elindult, de a tesztprogramok nem voltak stabilak. A stabil állapot eléréséhez 1,5 voltos magfeszültségig kellett mennünk, de ez önmagában nem volt elég, a CPU SOC-ot is 0,9125 voltra állítottuk, de emeltünk a déli híd és a memóriák feszültségén is egytized volttal, így végül minden teszt gond nélkül lefutott 4,1 GHz-es magórajel és 3 GHz-es effektív DDR4 órajel páros mellett. Sajnos az órajel további emelése már instabil állapothoz vezetett, és idő hiányában nem próbálkoztunk tovább.

Az órajelek és a feszültségek együttes emelésének hatására most is jelentősen nőtt az üresjárati (+39%) és DXVA lejátszás (+14%) közbeni étvágya a processzoroknak. Terhelés alatt ennél sokkal durvább eltéréseket kaptunk: CineBench alatt 47 százalékot nőtt a teljesítményfelvétel, míg Prime95 alatt 58 százalékkal többet vett fel a teljes rendszer.

Néhány alkalmazásban most is ellenőriztük, mekkora növekedést tapasztalhatunk az emelt értékek hatására, ezeket az alábbi grafikonokon szerepeltetjük.

Cinebench-ben a teljes terhelt alapállapothoz képest az órajel többet nőtt a tuning hatására, így az eredmény is hízott egy nagyobbat.

A tömörítőkben csak kisebb előrelépést lehetett elkönyvelni, valószínűleg ezek már az alapórajeles tesztekben is a tuninghoz közelebb skálázott Turbo frekvencián futottak, lévén nem teljesen terhelték le processzorunkat.

A fenti hármas, azaz a hang- és videókódolás is kisebb mértékű növekedést tudhatott magáénak, ahogyan a szerkesztőprogramokban sem történt ez az előbbiektől túlságosan eltérően.

Ezúttal is igaz, hogy egyetlen processzor kipróbálásából nem lehet megtudni, hogy mennyire tuningolható átlagosan a Ryzen, már csak az említett kezdetleges BIOS-ok miatt sem. Aki arra keres Ryzent, hogy majd jól megrántja az órajeleit, annak egyelőre érdemes megvárnia az első "hivatásos" tuningos próbálkozásokat, hogy kirajzolódjon a teljes kép, hányadán is áll a tuninggal az AMD új üdvöskéje. Mindenesetre úgy tűnik, az Intelnél jobban kihasználták a rendkívül friss architektúra, és a kisebb processzorgyártó számára korábban ismeretlen, 14 nm-es gyártástechnológia lehetőségeit, arányaiban kevesebb tartalékot hagyva.

Összegzés

Tapasztalatainkat ugyan már részletesen átadtuk az eddigiek során, de az összesített grafikon és a konklúzió ezúttal sem maradhat el. Érezhető volt számunkra a tesztelések során, hogy még nem mindent optimalizáltak teljessé, például az alaplapgyártók a Ryzen processzorokhoz kreált BIOS-aikat, ehhez azonban az AMD közreműködésére is alapos szükség van.

A Ryzennek nyolc magjával, magasabb alapórajelével és hatékonynak tűnő többszálas feldolgozási képességével összesített eredményeink alapján sikerült kicsivel megelőznie az Intel legfrissebb nyolcmagosát. Minden, frekvencia tekintetében fennálló előny ellenére azonban a jelenlegi királyt, a tízmagos Core i7-6950X-et nem tudta trónjáról letaszítani. Az árban – jelenleg – leginkább konkurenciának tekinthető i7-7700K hiába ketyeg igen magas értékeken, nyolc fizikai mag ellen ez nem volt elég.

Teljesítmény/fogyasztás terén már alulmaradt az új AMD jó néhány konkurenssel szemben, legyen az korábbi vagy újabb generációs, kevesebb vagy több CPU-magot tartalmazó. Itt nem szabad elfelejteni, hogy az Intel már jó néhány éve használja 14 nm-es architektúráját, amire a nemrég debütált Kaby Lake már a harmadik kiadott processzorgeneráció. Bár a sokat késett Broadwell persze itt épp az AMD előtt van, de a fogyasztásparás RX 480-ak után a most tapasztaltak egészen ígéretesek. További gyártástechnológiai optimalizálással biztosan tapasztalunk javulást a jövőben.

Mindent egybevéve, jó látni, hogy végre nem egy gyártó egyeduralkodó a felsőházban, még akkor sem, ha van létjogosultsága további optimalizálásnak az AMD részéről. Ellenben abban biztosak vagyunk, hogy az árazás igen agresszív, így a két gyártó hatással lesz egymásra a közeljövőben, ami végeredményben a vásárlóknak jó. A versenyképes teljesítménnyel mára ismét az a helyzet állt elő, hogy mindkét "tábor" hívei tudnak számukra szimpatikus központi egységet vásárolni, immáron nem csak szimpátia, hanem a teljesítményt firtató objektív szempontok alapján is.

Tény, hogy igen sok apró fejlesztés áll még a Ryzen processzorok, illetve a hozzájuk kapcsolódó alaplapok előtt, így a jövőben is számíthatunk mozgolódásra a piacon, továbbá idővel érkeznek a kisebb modellek. A téma hirtelen annyira szerteágazó lett, hogy napestig tesztelhetnénk az AMD Zen architektúrájának jövevényeit, amire jelen cikk nem bizonyulna elégnek, így biztosíthatjuk az olvasókat, hogy Ryzen témában további elemzésekkel jelentkezünk még, köztük külön egy játékokra kihegyezett teszttel is.


[+]

Az eddigiek alapján összességében ajánljuk az AMD Ryzen processzorokat, azon belül is az AMD Ryzen 7 1800X központi egységet, noha még bőven tapasztaltunk gyermekbetegségeket az alaplapok irányából. Ugyanakkor az eredmények láttán mindenképpen bizakodóak lehetünk, és ne felejtsük el a kedvezőbb árat sem: az 1800X "mindössze" 499 dollárba kerül, amihez legközelebb árban az i7-6800K van a maga 440 dolláros árával; ugyanakkor jóval magasabb, az 1100 dollárba kerülő i7-6900K-val összemérhető, pontosabban azt meghaladó teljesítményt kapunk, ez pedig komoly fegyver lehet az AMD kezében.


AMD Ryzen 7 1800X processzor

Az AMD Ryzen 7 1800X processzort, az ASUS ROG Crosshair VI Hero alaplapot, a Corsair Vengeance LPX 2 x 8 GB DDR4 3000 MHz RAM-modulokat, valamint az egyedi Noctua léghűtést és EK WB Predator 240 vízhűtést az AMD bocsátotta rendelkezésünkre.

04ahgy, abu85, Daywalker, Wombath

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés