Hirdetés

Rögös utat vázolt fel a Zettascale szuperszámítógépek felé az AMD

Még ki sem pihentük az első exascale rendszereket, máris célkeresztbe került az ezerszeres gyorsulás.

Érdekes előadást tartott az ISSCC 2023 konferencián Lisa Su, az AMD elnök-vezérigazgatója, aki felvázolta, hogy a következő évtized milyen komoly problémákat rejt a szuperszámítógépekkel kapcsolatos előrelépéseket tekintve.

Az elmúlt pár év teljesítménytrendjeit tekintve számos dolog kirajzolódik. Többek között megfigyelhető volt, hogy a kétutas szerverek SpecIntRate alatti tempója 2,4 évente ugrik a kétszeresére, és ugyanekkora mértékű gyorsulás a GPU-k szimpla pontosságú számítási kapacitását tekintve 2,2 évente történik meg. Ezekkel szemben a szuperszámítógépek piaca sokkal dinamikusabb, mivel 1,2 évente kétszereződik meg a nyers számítási teljesítményük. Ha feltételezzük, hogy minden így folytatódik tovább, akkor a Zettascale, azaz az 1000 EFLOPS-ot biztosító rendszerek nagyjából 10 év múlva lesznek hozzáférhetők.

[+]

Ez eddig jól is hangzik, de az energiahatékonyság tekintetében a trendek kevésbé szívderítőek. A szerverek teljesítmény/fogyasztás aránya visszafogott mértékben javul, és ugyanez igaz a GPU-kra is. A szuperszámítógépek piacát tekintve ez nem túl jó előjel, ugyanis jelenleg a leghatékonyabb exascale rendszer a Frontier, amely 21 megawattot fogyaszt, vagyis 52 GFLOPS/watt hatékonysági mutatóval bír. Ha a jövőben a fejlődés a megfigyelhető trendek szerint folytatódik, akkor az első Zettascale konfiguráció 2140 GFLOPS/wattos mutatóval fog bírni, ami még hízelgő is, de 1 ZFLOPS-hoz így is 500 megawatt energiára lesz szükség, és ez lényegében egy tipikus atomerőmű reaktora által előállított energia fele.

[+]

Tekintve a szuperszámítógépek piacának prioritásait, az még elfogadható, hogy ha ezerszeres teljesítményért nő valamennyire a teljes rendszerre levetített fogyasztás, de erősen megakasztaná a lehetőségeket, ha tíz év múlva a leggyorsabb szuperszámítógépek fél gigawattnyi energiát nyelnének be, utóbbi egyszerűen túl sok, hogy reálisan megengedhető legyen. A következő tíz év nagy dilemmája tehát az, hogy miképpen lehetne a rendszerek hatékonyságát nagymértékben megnövelni.

A gyártástechnológia fejlődése adja magát, de a mértéke lassul, vagyis csak erre nem lehet majd támaszkodni. Ami a legnagyobb gondot jelenti az a memóriaelérések energiaigénye, mivel ez masszívan nő.

[+]

Az AMD szerint a megoldáshoz nem szabad csak egy-egy oldalról megközelíteni a kérdést, az egész rendszer szintjén változások kellenek. Az egyik kritikus irány az integráció, méghozzá modern tokozási technológiák alkalmazásával. A kommunikációs költségek csökkentésével masszív előrelépést lehet elérni, 3D-s tokozással akár 50-szereset is – a tokozásról kivezetett rézalapú összeköttetésekhez viszonyítva. Jelentős lehetőségek vannak a megfelelő precizitás alkalmazásában, hiszen nem minden munkafolyamathoz szükséges nagy pontosság. További előrelépéssel kecsegtet az egyes gyorsítók, például a GPU-k CPU-val egy tokozásba költöztetése, ami lehetőséget ad a redundáns memóriamásolások eliminálására, így az ebből eredő energiaigény is teljesen eltűnik.

[+]

A fentieken túl még van pár megfontolandó irány, többek között a memória esetében is az az optimális, ha a lehető legközelebb van a számításokat végző lapkákhoz, lényegében tokozáson belül. Itt is minél modernebb az alkalmazott tokozási technológia, annál hatékonyabb a működés. Innen lehet egy speciális irányt is nyitni, ugyanis még jobb, ha bizonyos számításokat már maga a memória elvégez. Van azonban olyan kommunikáció, ami egyszerűen nem tartható tokozáson belül, és erre érdemes optikai összeköttetést használni.

[+]

Nem elhanyagolható tényező az AI sem, ugyanis a kevert pontosságú feldolgozásnak hála az úgynevezett AI teljesítmény növekszik most a legjobban. Ezeket különböző módokon akár be is lehet szúrni a munkafolyamatokba, és megfelelően használva a lehetőségeket szintén hatékonyabb működés érhető el.

[+]

Az AMD felvázolta azt is, hogy nagyjából miképpen nézne ki egy Zettascale konfigurációhoz tervezett alaprendszer, ami lényegében a fenti lehetőségek kihasználásáról szólna, és így lehetővé válna a 10 000 GLOPS/wattnál jobb energiahatékonyság, vagyis úgy lenne megépíthető egy Zettascale szuperszámítógép, hogy annak fogyasztása 100 megawatt alatt maradna. Nyilván ez sem kevés, de még elfogadható szintnek számít, elvégre mégsem enné meg egy nukleáris erőmű reaktora által termelt energia felét.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés