Hirdetés

Keresés

Hirdetés

Új hozzászólás Aktív témák

  • shabbarulez

    őstag

    Végre most már hivatalosan is kiadták hogy mennyit tud double precisionba a gpu. Fél éve a korábbi verziónál erről mélyen hallgattak, mindig csak a single precision értékkel tetszelegtek, márpedig HPC környezetben annak azért kevés jelentősége van. A sajtóhír szerint ebben már egy második generációs double precision egység van, és így ötöde a teljesítménye a single precisionnak, lehet az előző generációnál még ennyi sem volt, azért hallgattak róla mélyen. Pedig a korábbi találgatások felére-negyedére tippeltek, ezek szerint igen messze jártak az igazságtól, alaposan felülbecsülve.

    Végülis nem rossz ez, IBM-nél egy 2 procis új generációs Cell blade rendelkezik hasonló 200 Gflopsos teljesítménnyel, de annak az ára ennek 10x-e. Viszont továbbra is kérdéses a programozhatósága. Vajon mikor jutnak el odáig a GPU fejlesztők, hogy általános célú tesztprogramokat is le tudjanak futtatni a hardwarükön. Monjuk egy spec-et vagy linpackot. Mert ahhoz hogy top500-ba kerülő hybrid superszámítógépbe illeszthesség a GPGPU hardwareiket, ahhoz ez lenne a minimum elvárás, mert ha nem lehet lemérni a double precision standard tesztprogramokkal mire képesek, akkor a top500-as listára sem kerülnek fel.

    Olyat már olvastam hogy a Bull épít egy hybrid superszámítéget 2009-re. Intel Nehalem 2 utas szerve bladekből és Nvidia GPGPU-kból fog állni, ami gyanítom GT200 alapú lesz. Mivel az Nvidiánál úgy tudom a jelenlegi GPU-nak nincs double precision támogatása, így nagy valószínűséggel a GT200-nak már kell lennie, ha ilyen ambíciói vanak Nvidiának. Viszont AMD FireStreamen alapuló hybrid szuperszámítógép projectről még nem olvastam. Esetleg olvasott már valaki ilyen fejlesztésről, ki építi és mikorra várható?

  • shabbarulez

    őstag

    válasz shabbarulez #25 üzenetére

    AMD Stream Processor First to Break 1 Teraflop Barrier [link]

    "AMD is also working closely with world class application and solution providers to ensure customers can achieve optimum performance results. Stream computing application and solution providers include CAPS entreprise, Mercury Computer Systems, RapidMind, RogueWave and VizExperts. Mercury Computer Systems provides high-performance computing systems and software designed for complex image, sensor, and signal processing applications. Its algorithm team reports that it has achieved 174 GFLOPS performance for large 1D complex single-precision floating point FFTs on the AMD FireStream 9250.3

    3. Mercury benchmark system details: Intel Core2 6820 @ 2.13 GHz w/ 3GB of RAM, FireStream 9250 stream processor "

    Na azért ez érdekes a elméleti 1 Teraflopsból, gyakorlati alkalmazásban 174 Gflopsot tudtak kihozni singel precision mellett. Kérdés akkor az elméleti 200 gigaflops double precisionból mennyit sikerülne. Nagyon jó lenne már ha ott tartanának hogy képesek lennének iparágilag elfogatott benchmarkokat futtatni, akkor jobban össze lehetne vetni mire képesek ezek a hardwarek. Hasonló arányú double precision eredmény esetén nem igazán lenne gyorsabb egy ilyen kártya mint egy 4 magos core2-es. Ahhoz hogy jóval gyorsabb legyen sokkal közelebb kellene lennie a gyakorlati értékeknek a teoretikus maximumhoz.

  • shabbarulez

    őstag

    válasz shabbarulez #28 üzenetére

    Másik probléma ez a memória csökkenés a felére, ez nem igazán fexik a HPC alkalmazásokhoz. Gyanítom ez a kártya még csak egy belépő modell, lesz ennél még táposabb is több memóriával, persze jóval drágábban. A kevés memória a Cell bladeknél is gond volt, meg a double precision esetén drasztikusan lecsökkenő teljesítmény. Nem véletlenül fejlesztette tovább az IBM és csinált egy olyan Cell variáns ami jóval több memóriát tud kezelni és double pricision mellett sem vérzik el annyi mint az elődje.

  • shabbarulez

    őstag

    Overclocked and 4GB of GDDR3 per Card: Tesla 10P [link]

    Konkurens termék is bemutatkozott. Úgy tűnik ott 1/8-ad részére esik vissza a double precision számítási teljesítmény a single precisionhoz képest. Ez úgy 110-125 Gflops elméleti maximumra elég, egy T10P kártya esetén. Persze a kérdés itt is az, gyakorlati felhasználás során mennyire tudják megközelíteni a teoretikus maximum értéket.

    Viszont a memóriára itt jobban odafigyeltek, 4 GB-ot pakoltak egy kártyára ami több mint duplája a korábbinak 1.5GB-nak.

    [ Szerkesztve ]

Új hozzászólás Aktív témák