IDF 2012: az Intel bemutatta a Haswell APU-t

Az Intel a tegnapi napon megnyitotta az idei IDF rendezvényt, melyen a langyosra sikerült felvezető előadás után rögtön a Haswell APU-t mutatták be. Mindent persze nem árultak el róla, de a rendszer már kezd körvonalazódni, ugyanakkor meglepetések senkit sem érhettek. A felépítés lényegében marad ugyanaz, amit a Sandy és az Ivy Bridge esetében alkalmaztak, vagyis a méretes utolsó szintű gyorsítótárra egy gyűrűs buszon keresztül van felfűzve a négy processzormag, az IGP és az integrált kétcsatornás DDR3-as memóriavezérlő, valamint a többi komponenssel együtt az úgynevezett System Agent. Sok dolog tehát az eddig alkalmazott elvekhez képest nem változott, így a hír további részében csak a változásokra összpontosítanánk.


[+]

A processzormagok esetében zömében össze lehet foglalni a változásokat: hatékonyabb lesz az elágazásbecslés, nagyobb lesz az L2 TLB (Translation Lookaside Buffer) mérete és jobb lesz az out of order logika. Az ütemező mögött immáron két extra port is található, azaz a Haswell mag kapott egy extra integer ALU-t és egy extra store address egységet. A legfontosabb változás mégis az AVX2 utasításkészlet bevezetése, mely új 256 bites lebegőpontos feldolgozókat is kapott.

A Haswell az Intel első architektúrája, mely támogatja az FMA-t, azon belül is az FMA3 implementációt. Ennek használatával a kritikus számítások eredményei pontosabbak lehetnek, és nem mellékesen a feldolgozás is gyorsabb a hagyományos összeadás és szorzás művelethez képest. A korábbi probléma az AMD és az Intel eltérő FMA implementációjáról már a múlté. Az AMD ugyanis a Trinity APU-ban megjelent Piledriver modullal már támogatja a Haswellbe kerülő FMA3-at is, és megmaradt az FMA4 is, ha esetleg a fejlesztő ezt ki szeretné használni.

Egy Haswell processzormag két darab 256 bites vektorfeldolgozót alkalmaz, amelyek összesen 16 darab FMA operációt végezhetnek egy órajel alatt (az FMA késleltetése öt ciklus). Ezzel a throughput tempó megduplázódik, de ez etetésért is kiált, így az elsődleges és a másodlagos gyorsítótárak adatátviteli sebességét is meg kellett duplázni. Az AVX2 egyébként számos új, illetve 256 bitesre bővített SSE utasítást vezet be, emellett fixpontos adatokkal is működik, és végre megjelenik a GPU-knál használatos gather, mely az adatpárhuzamos processzorok esetében egy hatékony rendszer a memória kezelésére, mivel egyszerre több memóriacímről olvas. A szintén hasznos scatter sajnos kimaradt. Lesz azonban tranzakcionális memóriakezelés, mely az AVX2-höz van kötve, és a működéséről az alábbi hír végén írtunk.

A processzormagok vizsgálata után az IGP-re érdemes rátérni. Az alapokat adó architektúra lényegében az Ivy Bridge esetében bemutatott Gen7 továbbfejlesztése. Az Intel Gen7.5 kódnéven utal rá, vagyis radikális változások nem lesznek, de azért történtek érdemi fejlesztések az egészen jó tempónövelés mellett. A legfontosabb, hogy az Intel most már kihasználja a Gen7 architektúra skálázhatóságát, így nem csak kettő, hanem három kiépítése is lesz a rendszernek. A GT1, a GT2 és a GT3 konfiguráció rendre 1, 2 és 4 shader tömböt használ. Ezeken belül a feldolgozók, vagyis az Execution Unitok száma nem ismert, de nagyon valószínű, hogy nem 16 darab lesz, ahogy az Ivy Bridge esetében. Ezt egyrészt az indokolja, hogy kevesebb egységgel is lehet operálni, hiszen egynél több shader tömb is építhető a rendszerbe. Ráadásul a Haswell jövőre a Kaveri APU-t kapja a nyakába az AMD-től, melynek IGP-je már az új generációs GCN architektúrára épül. Ennek a rendszernek a compute hatékonysága félelmetesen jó, vagyis az Intelnek mindenképpen növelni kell a lebegőpontos operációnkénti helyi adatmegosztás tempóját. Architekturális változás nélkül ennek a legegyszerűbb módja az egy tömbben található feldolgozók számának csökkentése, hiszen így egy operációra nagyobb tempó jut. A pontos számot persze nem közölte az Intel, a pletykák pedig eléggé eltérőek, így nem érdemes találgatni.

A Haswell IGP-je többféle konfigurációban
A Haswell IGP-je többféle konfigurációban [+]

Az Intel bevallása szerint a setup motort teljesítménye kétszeresére nő, de többet erről nem árult el a cég, a stream output azonban továbbra is az utolsó szintű gyorsítótárba menti az információkat, ami továbbra sem kedvező. Fontos változás, hogy a textúrázó blokkok mostantól nem csak formálisan, hanem valóban Gather4-kompatibilisek, mivel egy csatornához egy helyett már négy mintavételező tartozik, így a Haswell IGP-je képes gyorsulni az új játékok legelterjedtebb mintavételezési formája mellett. A render tömböt nem érte lényegi változás, de mostantól egy ilyen egység két shader tömböt szolgál ki, vagyis a GT3-as konfiguráció két render tömböt használ. Nyilvánvalóan a setup motor teljesítményét is ezért duplázták meg a tervezők. A Gen7.5-ös architektúra fontos újítása még, hogy már támogatja a legújabb API-kat, így a DirectX 11.1-et, az OpenCL 1.2-t, illetve az OpenGL 4.0-t. Utóbbit az Ivy Bridge Gen7 IGP-je is kezeli, csak az Intel ezt anno nem említette.

Multimédiás szempontból is érdekes újításokat vezetett be az Intel. A Haswell IGP-jében megjelent a VQE (Video Quality Engine), mely számos extra utómunkát végezhet a videón az eddigi lehetőségek mellett. Mivel fixfunkciós egységről van szó, így nem kell programozni, de valószínű, hogy igény esetén kikapcsolhatók az így nyerhető effektek, mint például a képstabilizáció. Az Intel láthatóan nagy hangsúlyt fektet a videók képminőségére, hogy behozzák az AMD – jelentősnek mondható – előnyét ezen a területen. A rendszer dekódoló motorja is fejlődött, így újításként említhető meg az MJPEG formátum fixfunkciós egységgel történő dekódolása. Ez lehetővé teszi, hogy a webkamera által közvetített adat dekódolása a korábbinál energiahatékonyabb legyen. Végül az Intel megemlítette, hogy a 4K-s videók dekódolása is lehetséges. Technikailag ez már az Ivy Bridge-nél is működött, csak a DisplayPort 1.1 miatt nem volt lehetőség kihasználni. A Haswell azonban már DisplayPort 1.2-es interfészt támogat, így képes meghajtani egy 4K-s kijelzőt.

Végül változás érte az energiamenedzsmentet is. Az Intel a készenléti módban bekapcsoló energiagazdálkodási állapotok mellett bevezet egy hasonlóan takarékos aktív állapotot. Ez lényegében arra jó, hogy az adott notebook készenlét helyett aktív állapotban maradjon, vagyis függetlenül attól, hogy nem használja a felhasználó, képes legyen fogadni az üzeneteket például. Az Intel szerint ez a jól megírt programok számára transzparens, vagyis elméletben nem lehet gond, ha a készenlét helyett a felhasználó az új aktív állapotnak szavaz bizalmat. Persze amint használatba lesz véve a mobil termék, azonnal bekapcsol a szokásos aktív idle állapot.

Nagyjából ennyit lehet tudni a Haswell APU-ról, de később nyilván több is kiderül. Az biztos, hogy IDF-en mélyebb elemzéseket is tart majd az Intel a változásokról. Talán lesz még pár érdekes adat, amiről be lehet számolni.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés