Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Enszuke #17 üzenetére

    Nem a gyártástechnológia az integrálás gátja, hanem a licenc. Az NV-nek nincs x86, vagy AMD64 licence. Egyszerűen képtelenek x86/AMD64-es processzormagokhoz olyan IGP-t tervezni, amire szükség lenne. Ezért mennek az ARM irányába, mert onnan kapnak licencet.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Zeratul #21 üzenetére

    Egy GPU-ba mindig sokkal sűrűbben lehet helyezni a tranzisztorokat. Ebből adódik a tranzisztorsűrűségnél a kevés különbség.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz fatallerror #24 üzenetére

    Csak a Cape Verde, Pitcairn és Tahiti van 28 nm-en. A többit 40 nm-en gyártják. Ide tartozik a ma is gyártott Cedar, Caicos, Turks és Cayman. A Barts és a Juniper gyártása leállt.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz fatallerror #27 üzenetére

    Csak ez a hír nem specifikus problémáról szól, hanem arról, hogy egyre drágább a gyártás.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz schwartz #55 üzenetére

    Így is szarrá van optimalizálva a kód. Egyszerűen ott keletkezik a probléma, hogy a kikódolt textúraadatok 1 TB-ot foglalnak. Ahhoz, hogy ez felkerüljön két korongra 12 GB-ra van tömörítve. Na most ez a formátum nem értelmezhető a GPU-k számára, vagyis a megatextúra szeleteit a processzornak át kell konvertálnia a GPU számára is értelmezhető formátumra. Ezek az adatok bekerülnek a rendszermemóriába és a GPU pedig elsétál értük. Itt látható, hogy a PCI Express oldalán kapja a rendszer a büntit, na meg persze nagyon gyors többmagos processzor kell. Érdemes 4 magossal nekimenni, mert annyi szükséges a gyors kikódoláshoz, és így még a többi feladatra is marad erőforrás.
    A Carmack megatextúrázásának másik problémája az AF hiánya. Sajnos szeleteken szoftveres shader alapú megoldást kell futtatni. Ezért megy csak az anizó 4x-ig a motorban, mert annyira írta meg Carmack. Mivel ezt a shaderek számolják, így a 16x eléggé erőforrás-igényes lenne. A driverből nyilván hardveres AF nem lehetséges. Ez persze minden szoftveres implementáció esetében igaz a virtuális textúrázásra. Ez nem Carmack hibája. Már mondta is, hogy a Doom 4 itt jobb lesz, mert az a játék az AMD PRT-jét használja megatextúrázáshoz, ami támogatja a hardveres AF-et is.
    Sok még a megoldandó kérdés a megatextúrázásnál. Az AMD PRT-je sem jelent mindenre megoldást. Például a PCI Express busz késleltetése itt is probléma. A hardveres menedzsment miatt előnyösebb a helyzet, de a késleltetés fizikailag ott marad.

    (#56) FireKeeper: Nagyjából így van. Carmack mikor ezt elkezdte fejleszteni, akkor úgy gondolta, hogy 2011 környékére eltűnnek a dGPU-k. Sweeney is nyilatkozott már sokszor hasonlót. 2000-ben például azt állította, hogy 2008-ra nem lesz szükség VGA-ra. Nem egyedi meglátások ezek. Alapvetően nem is tévednek, csak az időpontot lövik be rosszul. A nagy koponyák mindig próbálnak nagyot alkotni. Carmacknek ez most sikerült, csak túl hamar tette le az asztalra. De nem kérdés, hogy az öreg jól látja a jövő játékfejlesztési problémáit. Sweeney-nek sem voltak annyira jó évei. Ő beleszeretett a Larrabee-be. Talán még ma is siratja. Gondolom fejlesztett is rá, amit még jobban sirat, mert annak egyelőre lőttek.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz schwartz #58 üzenetére

    Gondolom 2007-ben még úgy gondolta, hogy minden frankó lesz a megjelenésre az integrálással. Hát rosszul gondolta. :)
    A késleltetés nem 10x nagyobb, hanem nagyjából 200-300x.
    A GPU nyers számítási teljesítménye a Rage esetében nem nagy kunszt. Gyakorlatilag egy 20k-s VGA-n is elfut maxon, ha raksz alá egy kellően erős procit és egy gyors rendszermemóriát.
    Nyilvánvalóan túlzott, hogy keveset kell polírozni rajta. Eleve 10000x tovább tart egy pixel update a PC-n, mint a konzolon. Ez a Rage nagy problémája. A PCPer-nek nyilatkozta Carmack, hogy az AMD csinált egy algoritmust, amivel 50 pixel update megy le egyszerre PC-n. Ezek párhuzamosan már használható eredményt adnak, így PC-n nem kellett a grafikát butítani. [link] - itt elolvashatod.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Male #60 üzenetére

    Van a CUDA-ra egy ilyen megoldás, de lassú és elveszi az erőforrást a grafika számításától. Egy GF110-es GPU-ra épülő kártya olyan gyorsan kódolja ki az adatokat, mint egy 4 magos Sandy, vagy 4 modulos (8 magos) Bulldozer. És ehhez elhasználja az összes shader egységet. Ha még grafikát is számol, akkor már lassabb a kitömörítés, mint ha egy erős CPU-val csinálnád. Emellett sajnos az alapproblémát nem oldja meg a GPU-s modell, mert az adatok a rendszermemóriába lesznek visszaírva. Szóval csak annyi történt, hogy elvetted a grafika elől a számítási kapacitást. Kétmagos prociknál persze előnyös a dolog, de négymagos (vagy hat-nyolcmagos) procik esetében már nem.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz schwartz #62 üzenetére

    Nem a VRAM-tól függ, a rendszermemóriába lesz visszaírva az adat. A program nem engedélyezi az opciót a kisebb GeForce-okra, mert úgyis csak lassítana. Elméletben minden CUDA-kompatibilis GeForce tudná, csak ha lassít, akkor nincs értelme. Ez egy logikus limitáció.
    Ez az egész akkor előnyös, ha kétmagos procit kap a Rage (és ezt mondjuk egy GeForce GTX 570 mellett lehet ellensúlyozni). Esetleg a hárommagosok is ide sorolhatók, azok annyira nem gyorsak. Egyébként hátrányos.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz schwartz #64 üzenetére

    Elképzelhető, hogy egyes GPU-kra engedélyezve van, amelyek esetében a VRAM lehet korlátozó. A feldolgozás alatt álló adatokat természetesen el kell tárolni a VRAM-ban, de nem ez a rendszer működésének legfőbb gátja.
    Nagyjából így működik ez a megatextúrázás:

    Ez most az AMD PRT rajza, ami Sean Barrett megoldására épül. De a lényeget mutatja. Van az egész textúra, és az szeletekre bomlik. A PRT 64 kB-os szeletekkel dolgozik, de a Rage például 32 kB-ossal. Ezért nem tud Carmack erre implementációt. Na de ez mellékes. Látható, hogy a page table-be bekerül az adat (pontosabban csak a címe) és onnan a VRAM-ba. Na most erről a CPU-nak kell lennie egy képnek, így ezért szükséges az információkat a rendszermemóriában tárolni. Azokat aztán a GPU VRAM-ja megkapja, ha az adott szeletre szükség van a játékos pozíciójától függően. Ez a szoftveres implementációja a megatextúrázásnak. Az mindegy, hogy a textúrákat hol kódolod ki, de az már nem, hogy az információt hol tárolod. Ebből a szempontból a GTX 295-tel nem buksz semmit. Ha van legalább négymagos procid, akkor előnyösebb azon számolni. A PRT a menedzsment szempontjából különbözik. Ez jelenti lényegében a hardveres implementációt (néhány egyéb extra mellett ... egyszerűbb mipmap kezelés és teljes értékű textúraszűrés) a GCN architektúrában.

    Eléggé bonyolult rendszer ez szoftveres implementáció szintjén. Nem csoda, hogy PC-n nem működik tökéletesen. Ez még a PS3-ra is elmondható, bár ott jobb. Az látszik, hogy Xbox 360-on a legjobb..

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Male #67 üzenetére

    A dedikált dekódolók nem jók erre. DXT formátumú adatokat kell kreálni, mert azt eszi meg a GPU. De már a bemenetként szolgáló JPEG-et sem eszik meg. Csak általános számolókkal lehet dolgozni.
    Azt érdemes még mérlegelni, hogy a procikban az IGP részt erre fel lehet használni. De kérdés, hogy erre a számításra a VLIW4/5 (vagy akár az Ivy-k HD Graphics része) mennyire hatékony. Nem vagyok benne biztos, hogy gyorsabb lenne a procimagoknál. A GCN az jelentősen gyorsabb lenne, az az architektúra a Larrabee-re hajaz, vagyis ilyen feladatokra készült. Ott megéri áttenni IGP-re a számítást, de ilyen IGP meg még nincs.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Male #72 üzenetére

    JPEG-ből kell DXT3-ba kódolni a Rage esetében. Ezt a dedikált kódolók nem támogatják. Azok DXT1-be tudnak kódolni, de az nem jó.
    A PCI Expressen a dGPU-val való átkódolás során is át kell nyomni a textúrákat. Mint írtam az adatot vissza kell írni a rendszermemóriába. Ez sem segít a procis kódhoz képest. Ezért írtam, hogy csak akkor van értelme, ha nincs meg a procierő a rendszerben. Ezért jobb opció az IGP, mert ezzel viszont a dGPU-t a számítások szempontjából felszabadítod, s emellett a procit is. Egyelőre a szoftveres implementálása a megatextúrázásnak eléggé nehézkes. A hardveres implementációk felé kell haladni, ezt Carmack meg is lépte azzal, hogy jelezte a Twitteren, hogy a Doom 4-et a PRT-re építi.
    Később ez még jobb lesz az NV és az AMD platformterveivel (akkorra talán lesz egy szabványosan elfogadott hardveres implementáció is erre). Mindkét cég APU-ra építi a rendszereket, és a dGPU-k az APU-k kiegészítései lesznek. A VRAM szimplán egy gyorsítótárként szolgál. Persze ennek a hátránya, hogy a GeForce csak NV, míg a Radeon csak AMD APU-val fog így működni. Ettől függetlenül az a tudás, amit így kap a teljes rendszer megéri.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Male #75 üzenetére

    Értem. Általánosságban attól függ, hogy mennyire gyorsan kódol a dedikált hardver. Ha most ezek korlátozott tudását nem számítjuk.
    Az lenne valóban a legegyszerűbb, ha eleve megenné a textúrát. Bár nem feltétlen a JPEG kellene, annak vannak kellemetlen mellékhatásai. De egy jóval jobb textúratömörítési formátum már tényleg elkélne.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák