Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz gyuribácsi88 #1 üzenetére

    Igazából annyira sokat ezzel nem nyernek, de valóban van előnye annak, ha a speckó tömbbe az utasításfolyam soron kívül befuthat. Ha jól vettem ki a fejlesztők igényeiről szóló részt, akkor a legnagyobb érdeklődés azt övezte, hogy hogyan lehetne a mai fix CPU->GPU futószalagot mellőzni, és azt kiegészíteni úgy, hogy a GPU-nak átadott feladatott a grafikus feldolgozó a CPU-nak visszaadja, majd megint megkapja a GPU és megint vissza a CPU-nak, és így tovább, ameddig a fejlesztő jónak látja. Ilyen helyzetben számít, hogy a GPU CU-ja az utasításfolyamot gyorsan dolgozza fel, hogy az mehessen vissza a CPU-nak.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz havasa #62 üzenetére

    Pedig ez kvázi ugyanaz, mint a Cell. A PPE-t leváltották a Jaguar magok, míg az SPE-ket a GCN CU-k. Az elvi működésben abszolút nincs különbség. Valószínű, hogy erre Linux azért nem lesz. De ha ilyen koncepció kell a PC-s vásárlóknak, akkor erre készül a Kaveri APU, ami a funkcionális működésében azt nyújtja amit, a PlayStation 4 APU-ja, csak más teljesítményszinttel.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz havasa #65 üzenetére

    Attól függ mennyit vártál. De a számok elég jók szerintem:
    Cell - 1 PPE (központi processzormag) és 6+1 SPE (vektormag). Ennek az összteljesítménye a PS3-ban 204,8 GFLOPS.
    PS4 APU - 8 Jaguar mag (központi processzormag) és 14+4 GCN CU (vektormag). Ennek az összteljesítménye a PS4 előzetes specifikációja szerint 1894,4 GFLOPS.
    Annyira azért nem rossz a több mint kilencszeres gyorsulás.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz havasa #68 üzenetére

    A Cell pontosan ugyanolyan heterogén processzor, mint a PS4 APU-ja. Van benne központi mag és vektormag különböző elosztásban. Innen eredhet a tévhit, hogy az emberek rosszul hasonlítsák össze. De akkor leírom, hogy mi mire szolgál.
    A központi processzormag a Cellben a PPE, ami 3,2 GHz-es órajelen 25,6 GFLOPS-os tempóra képes a 128 bites AltiVec SIMD motorról. Ezt egészíti ki a hét vektormag ugyanekkora tempóval szintén 3,2 GHz-es 128 bites AltiVec SIMD motorról. Így jön ki a 204,8 GFLOPS. Ha az PowerXCellhez hasonlítunk, akkor ugye 8 vektromag van, vagyis 230,4 GFLOPS-ról beszélünk. Mágikus 1 TFLOPS-ok nincsenek a Cellben. Nincs benne annyi feldolgozó.
    A PS4 APU-jában a PPE szerepén nyolc Jaguar mag tölti be várhatóan 1,6 GHz-es órajellel és 128 bites AVX SIMD motorral. Egy mag tehát 6,4 GFLOPS-ot tud, míg nyolc mag 51,2 GFLOPS-ot. Vektormagból 18 lesz, amelyek négyszer 512 bites vektorral dolgoznak. Egy GCN CU a várható 800 MHz-en 102,4 GFLOPS-ra képes, 18 pedig 1,84 TFLOPS-ra.

    Ez a komplett chip-to-chip összehasonlítás.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz kovsol #71 üzenetére

    A grafikát azt most vegyük ki a képből. A PS4 APU vektormagjai csak hatékonyan tudnak grafikát is számolni, de pont úgy befoghatók AI, fizika és minden más számításra, mint a PS3 Cell SPE magjai.
    Kevesen tudják, hogy a PS3 eredeti koncepciója csak a Cell volt, és az számolta volna a grafikai munkát is. Később került mellé az RSX, mikor a Sony rájött, hogy ez azért mégsem járható út. Az elmúlt években azonban fejlődött annyit a technika, hogy a Cell eredeti koncepciójára megépíthető a PS4.

    (#72) havasa: Az RSX számítási teljesítménye ennyire jól nem meghatározható. Gyakorlatilag semmi GPGPU tudása sincs. De ha nagyon akarunk számolni, akkor 112 GFLOPS vertex és pixel shader teljesítménye van.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz havasa #74 üzenetére

    A másik forrás számolása alapvetően jó, csak nem 10 FLOPS-ot kell számolni, hanem 8-at és 4-et, mert a pixel shader az Vec3+1 és Vec2+2, míg a vertex az Vec4. Ergo a számolás az ez: 24 * 8 FLOPS * órajel + 8 * 4 FLOPS * órajel. Én 500 MHz-cel számoltam, de rég volt már. Lehet, hogy valóban 550 MHz-en jár.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák