Hozzáférhető a Frontier nevű szuperszámítógép tesztrendszere

A készülő, exascale rendszerre írt alkalmazások már ellenőrizhetők a Crusheren.

Már nincs messze az Oak Ridge Nemzeti Laboratórium központjában épülő, Frontier nevű szuperszámítógép véglegesítése, amelyet a Cray épít, és egyedi AMD EPYC processzorok, illetve szintén egyedi AMD Instinct gyorsítókat használ. A rendszert még a 2019-es esztendőben jelentették be, most pedig hozzáférhetővé vált a Crusher, amely a szóban forgó nagyvas tesztrendszere.

Itt arról van szó, hogy az efféle szuperszámítógépek viszonylag lassan készülnek el, hiszen ha működik is az alapul szolgáló kabinet, ezekből elég sokat kell telepíteni, ami időigényes lehet. Addig is létre szoktak hozni egy olyan tesztrendszert, amely a hardver- és a szoftverkörnyezet tekintetében ugyanaz, vagy minimum nagyon hasonlít a végleges gépre, és ezen addig ki lehet próbálni a szuperszámítógépre szánt programok működését. A Frontier tesztrendszere a Crusher, amely két kabinetet alkalmaz egyet 128, egyet pedig 64 compute node-dal.

A Crusher-féle compute node-ban egy darab 64-magos EPYC 7A53-as processzor található, amely 512 GB-os DDR4 rendszermemóriát használ. A szóban forgó CPU-dizájn pontos paraméterei nem ismertek, de a Trento platformról van szó, amelyről korábban már írtunk. Az említett processzorhoz négy darab, gyári opciónál nagyobb órajelen üzemelő Instinct MI250X kapcsolódik, méghozzá Infinity Fabric 3.0-n keresztül. Ez összességében nyolc darab GPU chipletet jelent, és chipletenként 64 GB-nyi HBM2E memória érhető el.


(forrás: OLCF) [+]

A fenti képen látható egy compute node logikai vázlata. Nyilván a fő elem a processzormag, amely négy NUMA tartományra van osztva. Mindegyik tartományon belül két L3 gyorsítótár régió különböztethető meg, és egy ilyen régióhoz csatlakozik az Infinity Fabric 3.0-n keresztül egy GPU chiplet, utóbbiak pedig még egymással is össze vannak kapcsolva, miközben az így összekötött rendszer teljesen memóriakoherens.

Az NVMe-s adattárolók a processzor PCI Express 4.0-s vezérlőjére telepíthetők, míg a hálózati vezérlők egy-egy GPU chipletpárhoz kapcsolódnak. Utóbbi egy compute node esetében összesen négy darab HPE Slingshot 200 Gbps-os kapcsolatot jelent.

A Crusher végeredményben 192 darab EPYC 7A53-as processzort és 768 darab Instinct MI250X gyorsítót alkalmaz.

Azóta történt

Előzmények

Hirdetés