AVX kompatibilitást ígér az új generációs AMD processzor

Az AMD bejelentette, hogy a 2011-ben megjelenő Bulldozer architektúrára épülő processzorai kompatibilisak lesznek az Intel AVX (Advanced Vector eXtensions) utasításkészletével. A közlemény hatására a legtöbb fejlesztő jelezte, hogy nagyon örülnek az AMD döntésének, mivel az eredeti elképzelések alapján az AMD által fejlesztett SSE5 az eltérő kódolási sémának köszönhetően nem lett volna binárisan kompatibilis az AVX-szel.

Az SSE5 utasításkészlet felépítésére való elképzelését az AMD még 2007 közepén hozta nyilvánosságra. A kiterjesztés az eddig megjelent adatok alapján főleg három-, illetve pár négyoperandusos, 128 és 256 bites utasításokat kezelő rendszer, ami jól kidolgozott permutáló instrukciókkal és FMA (fused multiply-add) támogatással rendelkezik. Az Intel azonban 2008-ban az AVX utasításkészlet leleplezésével komoly aggodalmat keltett, ugyanis a rendszer más kódolási sémát használt az SSE5-höz képest. Érdemes azonban azt is megjegyezni, hogy az AVX elképzelései a jövőbeli bővítések szempontjából megalapozottak lehetnek. Természetesen az iparág érdeke a megfelelő kompatibilitás a processzorok között, így az AMD úgy döntött, hogy megreformálja az SSE5 eredeti elképzeléseit, ennek megfelelően a rendszer kódolása kompatibilis lesz az AVX utasításkészlet által használt sémával.

Ezzel egyetemben az SSE5 elnevezés tulajdonképpen három kiterjesztésre lesz bontva: XOP, FMA4 és CVT16. Az XOP (eXtended OPerations) elsősorban az egész adattípushoz használható utasításokat tartalmazza, a CVT16 pedig az egyszeres és a félpontosságú lebegőpontos vektorok konverziójáért felel. A fejlesztők szerint azonban az FMA4 kiterjesztés számít jelenleg az SSE5 legnagyobb előnyének, melynek segítésével egy utasításban egyesíthető a szorzás és a műveletet követő összeadás, így a szükséges végrehajtási idő sem nagyobb a szorzáshoz viszonyítva és az eredmény is pontosabb. Fontos megemlíteni, hogy az FMA4 valódi négyoperandusos művelet, míg az Intel jövőbeli FMA megvalósítása – a jelenlegi terveik szerint – csak virtuálisan négyoperandusos, mivel az eredmény az egyik operandus által használt regiszterbe kerül. Ebből természetesen rögtön látszik, hogy a két megoldás egyelőre nem kompatibilis egymással.

Az AMD-nek mindenképpen előny, hogy már a Bulldozerben támogatja a fused multiply-add utasítást, amit a fejlesztők már nagyon hiányolnak a processzorokból. Az Intel a jelenlegi ütemtervek szerint a Sandy Bridge után megjelenő Ivy Bridge architektúrában fog előállni a saját FMA kiterjesztésével.

Előzmények

Hirdetés