- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- Projektor topic
- Modern monitorokra köthető 3dfx Voodoo kártya a fészerből
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Sony MILC fényképezőgépcsalád
- HiFi műszaki szemmel - sztereó hangrendszerek
- Raspberry Pi
- Kormányok / autós szimulátorok topicja
- Milyen videókártyát?
- Melyik tápegységet vegyem?
Hirdetés
-
Steet Fighter 6 - Így harcol Akuma
gp A sorozat legútóbbi részének DLC karaktere alig több mint egy hét múlva érkezik a játékba.
-
Bocsánatot kért az Apple, mert nagyon mellélőtt a legutóbbi reklámjával
it A kreativitás szimbólumait zúzták be egy iPad-reklámban, ez pedig hatalmas felháborodást okozott.
-
AMD Radeon undervolt/overclock
lo Minden egy hideg, téli estén kezdődött, mikor rájöttem, hogy már kicsit kevés az RTX2060...
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Tehát alapvetően azzal a ténnyel van gondod, hogy a Corel és a VideoLan nem készített támogatást az Intel termékekhez, mert nem értékelték megfelelő minőségűre az OpenCL meghajtójukat. Már bocs, de ez legkevésbé az én hibám. Az Intelnek kell írni, hogy vegyenek fel több rendszerprogramozót, adjanak nagyobb anyagi támogatást a szoftverfejlesztőknek, illetve fejlesszék gyorsabban az OpenCL SDK-jukat. Ha ezeket megteszik, akkor nem lesz a jövőben olyan dolog, hogy ez meg az a funkció csak AMD hardverrel üzemképes.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
deja vu
addikt
Itt meg az amd Érzésem szerint Abu minden csak nem pártatlan, én még embert nem láttam aki ennyire nyomatja az amd-t.
Iphone 7 Plus | Sony A7R+Zeiss FE 35mm F2.8+Zeiss FE 55mm F1.8 | Eizo CX271+Eizo CS270+Eizo SX2262W+Eizo S2233W | Z170 Ext4+I7-6700K+Noctua U14S | GTX1070 Gaming | 16gb 3600MHz | 850PRO 768GB | Seasonic Platinum | Define R5+3xNoctua | Razer Taipan
-
Abu85
HÁZIGAZDA
Miért nem hoztok ellenpéldát az állításaimra, vagy valami kézzel fogható cáfolatot? Mindenkinek adott a lehetőség, de állandóan csak a sértődés és a levegőbe beszélés megy. Egyszerű a helyzet, ha nem tetszenek a tények, akkor ne olvasd el azokat.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
pakriksz
őstag
biztos szokatlan, mert az oldalak 90%-án az intelt tolják orrba szájba, hát tényleg nagy a kontraszt ha nem az intelt
Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
-
Egon
nagyúr
Nah, ma utoljára.
Ahhoz képest, hogy pár hónapja (ismét) vérig sértődtél, és azt mondtad, hogy soha többet nem lépsz be ide, szépen osztod ismét az oldalt.
Mese habbal. Linket plíz, mert nem emlékszem hogy ilyet írtam volna. Szerintem Löncsivel keversz.
Ha ennyire nem bírsz elviselni minket és a munkánkat, akkor tényleg nem kell belépni és fikázni, mert lépten-nyomon csak a flame és az OFF lesz belőle.
Hadd döntsem már el, hogy mikor miket írok be ide. Ha nem tetszik, moderáld vagy moderáltasd. Az nagyon megy amúgy is (mint múltkor az nV-s topicban, ahol egy tucat hsz-en keresztül offoltál, és amikor erre felhívtam a figyelmet, még én lettem kitiltva). Saját szemedben a gerenda megtalálása meg nagyon nem.
#52) Abu85 :
Tehát alapvetően azzal a ténnyel van gondod, hogy a Corel és a VideoLan nem készített támogatást az Intel termékekhez, mert nem értékelték megfelelő minőségűre az OpenCL meghajtójukat.LOL. Na igen, a csúsztatás nagymestere vagy nem is vitás. Benned legalább fél tucat politikus veszett el, ha nem több.
Nem ez a baj, ezt te is pontosan olyan jól tudod, mint én. Ezt a "nagggyonfontos" (gy.k. azért az idézőjel, mert irónia, mielőtt ezt is szándékosan félreérted) fícsört, az emberek 99,99999999999%-a lesz*rja. Mert baromira nem fontos. Még csak nem is lényeges. Mivel nem tömörít senki sem (max. kitömörít, amit letorrentezett; az meg általában csak darabolt, így a szűk keresztmetszet a háttértár, már évek óta, egy a maiaknál jóval gyengébb procin is), pláne nem WinZip-pel. A VLC haználata pedig a júzerek közel 100%-ánál kimerül abban, hogy lejátszik vele valamilyen tartalmat, ami OpenCL támogatás nélkül is remekül megy. Osztán mégis annyit emlegeted, mintha ez lenne a Szent Grál, a számítógépes felhasználás Mekkája, alfája és omegája meg ilyenek. Holott egy olyannyira lényegtelen fícsör, hogy - a híren kívül, amiben megjelent - kb. szót sem érdemelne. Ennyi.
Persze valahogy oldani kell a frusztrációt, amit az okoz, hogy tisztán CPU-fronton már évek óta labdába sem tud rúgni az AMD az Intel mellett (és ezen a loldozer megjelenése sem változtatott), ezt nem vitatom...[ Szerkesztve ]
"Bonyolult kérdésre egyszerű választ keresni helyénvaló, de ritkán célravezető megoldás" (Wayne Chapman)
-
Abu85
HÁZIGAZDA
Ha egy program feldolgozása valamitől gyorsul, jelen esetben a GPU-s feldolgozástól, és az számodra nem fontos, attól még másnak nem lehet az? Valaki szeretne gyorsabban betömöríteni egy fájlt ... például.
Elfogadható, hogy nem veszel új gépet, mert nem akarsz gyorsabbat, de ezt nem biztos, hogy érdemes általánosítani.A VLC AMD-exkluzív implementációja nem a sebességre hat, hanem a képminőségre. A sebességre az OpenCL scaling szolgáltatás hat, de az univerzális, vagyis nincs az AMD driveréhez kötve. Az OpenCL open platform, vagyis mindenki támogatja. Ha az Intel és az NVIDIA driverein is megfelelő az adott funkció működése, akkor természetesen nincs oka a fejlesztőnek letiltani azt. Éppen ezért a VLC a gyorsított scalingot nem is korlátozza az AMD OpenCL driverére.
A Corel is megmondta, hogy amint sikerül megoldani az Intel és NVIDIA termékeken tapasztalt gondokat engedélyezik. Ehhez egyrészt a fejlesztőknek kell tovább optimalizálni, másrészt a drivereket is hozzá kell igazítani ehhez. Ergo a WinZip gyorsított tömörítése sem marad örökre AMD-exkluzív.Állítottam valaha, hogy CPU-ban erősebb az AMD? Itt most tudtommal APU-król beszélünk. Legalábbis az OpenCL igazi célja a heterogén módon történő programfuttatás.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Oliverda
félisten
Tessék: [link]
Mi adjuk meg annak a lehetőségét, hogy ide írhass, amit ennek fényében bármikor meg is vonhatunk, ha azt ellenünk használod fel. A normális hangnemben megfogalmazott konstruktív kritikát ellenben bármikor szívesen vesszük!
[ Szerkesztve ]
"Minden negyedik-ötödik magyar funkcionális analfabéta – derült ki a nemzetközi felmérésekből."
-
i-sti
senior tag
-
Pikari
őstag
A legfontosabb változás mégis az AVX2 utasításkészlet bevezetése, mely új 256 bites lebegőpontos feldolgozókat is kapott.
micsoda előrelépés!
(nem, nem az, életemben kb 1x láttam 80 bites lebegőpontos számokat forráskódban, az is inkább csak elírás lehetett, mint valódi szűkséglet. a 64 bit bőven elég.)Egy Haswell processzormag két darab 256 bites vektorfeldolgozót alkalmaz, amelyek összesen 16 darab FMA operációt végezhetnek egy órajel alatt
ennek nincs értelme, ennyit nem lehet kötegelni. egy szoftverben tipikusan különböző típusú műveletek jönnek egymás után, és nem ennyi ugyanolyan. talán a mátrixszorzáson (oda a 16 kevés, ezért kettőt kell indítani, ami önmagában már 2x5 órajeles késleltetés lesz, plusz amíg összekotorja magát) és az egymás után pakolt interpolálásokon (oda a 16 sok) segíthet.(az FMA késleltetése öt ciklus).
pont 5 ciklussal több, mint amekkorának lennie kéne az effektív felhasználhatósághoz.
és akkor ezzel a jelentősen gyorsabb mátrixtranszformáció szerű felhasználást pont ki is nyírtuk szépen.imho ezt az egységet szét kellett volna szedni kétfelé, és úgy megcsinálni, hogy ne legyen késleltetése (vagy ha igen, akkor 1 órajelnél semmiképp se több)
ez így önmagában értelmetlen, de talán majd egyszer, ha jelentősen gyorsítják, több értelme lesz.
mely az adatpárhuzamos processzorok esetében egy hatékony rendszer a memória kezelésére, mivel egyszerre több memóriacímről olvas
a különböző típusú műveletekhez mind különböző, egymással távoli rokonságban sem álló gather szerű műveletek kellenének, egy TMU algot fog is vagy 5%-ban fog gyorsítani.
erre is kár volt a tranyókat pazarolni.Az Intel bevallása szerint a setup motort teljesítménye kétszeresére nő
akkor talán a terrain kirajzolás mostantól akár a radeon 8500 szintjének a felét is elérheti.Ez lehetővé teszi, hogy a webkamera által közvetített adat dekódolása a korábbinál energiahatékonyabb legyen
az jó, mert a linuxos drivereket elnézve minden webkamera saját formátumban adja a képet, amit aztán már algoritmikusan kell ide-oda kódolgatni. a beérkező kamerakép dekódolása meg annyi féle, ahány csevegőszolgáltatás van...Az Intel szerint ez a jól megírt programok számára transzparens
legyünk őszinték: szarul van megtervezve, és a programok egy része el fog tőle durranni.A Dunning−Kruger-hatás az a pszichológiai jelenség, amikor korlátozott tudású, kompetenciájú vagy képességű emberek rendkívül hozzáértőnek tartják magukat valamiben, amiben nyilvánvalóan nem azok.
-
jbush
tag
Én nem bánom, hogy ilyesmiket írogatnak tagok, amikről jelen esetben szó van. Nem bánom, mert Ti erre reagáltok; olyan tényeket, apróságokat is leírva, amelyek a cikkekben nem vagy nem ebben a formában kerültek be. Szóval én ezeket a hozzászólásokat szeretem olvasni - azaz a Tieiteket ebből főként -, mert elég sokat lehet belőle tanulni :-)
-
mrhitoshi
veterán
Ez most a Tik vagy a Tak ? Gondolom Tak.
Más: Ennyire fejlődnének a váltások között az architektúrák, vagy pár módosítás miatt tényleg egy egész új rendszert alkotnak ?
PS4
-
FireKeeper
nagyúr
válasz mrhitoshi #66 üzenetére
hát az ivy biztos toc volt, de mivel se CPU se IGP fronton nem lesz nagyon radikális változás, ezt is toc-nak mondanám. bár új foglalat lesz hozzá, meg mintha úgy rémlene, hogy a VRM egyes részei be lesznek építve, de lehet rosszul emlékszem, és most óriási hülyeséget mondtam
steam, GOG, uPlay: @petermadach || HotS: PeterMadach#2675 || Xperia 10 V || Ultrawide & SFF masterrace || Unofficial and unpaid VXE R1 shill
-
MCBASSTION
aktív tag
"Ráadásul a Haswell jövőre a Kaveri APU-t kapja a nyakába az AMD-től, melynek IGP-je már az új generációs GCN architektúrára épül."
lolwut? végre intel prociban is lesz normális igp
windows7sins.org
-
Kérdés - amire egyelőre gondolom nincs válasz:
Tudni fogja az új igp a 1080p120Hz-et? (szemenkénti 60Hz 3D-ben) Azért kérdem, mert ez kéne az nvidia 3D vision használatához optimus rendszeren. (no meg persze megfelelő driverek nvidia ÉS intel részről)#hogyha a kép/számítási minőségen is javítanak (=driver) akkor 1etértek, az intel igp végre utoléri a jelenkort. (elég nonszensz volt már, h a SB igp-k sem tudják a standard 23,976Hz-es blurayt lejátszani)
[ Szerkesztve ]
30€ Meta store bónusz Quest headset aktiváláshoz, keress priviben :)
-
HookR
addikt
Újabb tockos az Inteltől. Bár ez nem csattant akkorát.
▌www.thunderbolts.info | youtube.com/ThunderboltsProject ▌16personalities.com▐
-
Abu85
HÁZIGAZDA
válasz t72killer #72 üzenetére
Már most is van 120 Hz támogatás a driverekben. A Sandy Bridge óta. A 3D Vision viszont zárt rendszer, vagyis optimussal nem üzemképes. Csak olyan noti lehet 3D Visionös, ahol az IGP inaktív és a dedikált GPU-ra van kötve a kijelző.
Bármelyik optimusos noti kiesik ebből, mert kijelzőt nem köthetsz közvetlenül a dedikált GPU-ra. Vagy optimus, vagy 3D Vision. A kettő együtt nem lehetséges.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Igen, az nvidiának kéne lépnie egy megfelelő driverrel... Gyakorlatilag az összes nvidiás laptop optimussal jön (ami nem, azt meg csillagászati árakon árulják)
[ Szerkesztve ]
30€ Meta store bónusz Quest headset aktiváláshoz, keress priviben :)
-
" Azon csak az segít, ha az Intel kifizeti a licencet az NV-nek." ujjajaj, attól tartok, ez nem ebben az évezredben fog bekövetkezni (ill. ha az nvidiának esze lenne, és menteni akarná a diszkrét noti-bizniszét, akkor vmi apróságért cserébe/ingyen odaadják az intelnek a licenszet)
[ Szerkesztve ]
30€ Meta store bónusz Quest headset aktiváláshoz, keress priviben :)
-
dezz
nagyúr
"a hardver elméleti képességeit figyelembe véve az Ivy Bridge is beérte az AMD-t"
Hááát, ebből számomra egyátalán nem ez derül ki...
(#42) Egon: Valójában nem sokat változott a meglévő működési állapotok fogyasztása (kvázi u.a. uarch és gyártástech), csak bejött egy új, amiről az itteni cikk is említést tett. Mint a HWSW-s cikk is írja (kissé körmönfontan), az üzemidő kitolása az új, félig alvó állapot bevezetése mellett annak is köszönhető, hogy bekerült a tokba a déli híd is, miáltal jóval kisebb lehet az alaplap és nagyobb az akksi... (Megjegyzem, az AMD már korábban beszélt arról, hogy integrálni akarja a déli hidat.)
(#47): Ezzel csak azt mondtad el, hogy a tizedét sem érted az "agymenéseinek"...
Azt mondjuk én sem tudom, hogy miért pont a WinZIP-pel és a VLC-vel példálózott, amikor vannak náluk sokkal fontosabb és jelentősebb gyorsulásokat elérő GPGPU-sított programok. [link]
(#63) Pikari: Nos, régóta tudjuk, hogy az Intelnél a prociarchitekrúra fejlesztésében a marketing is igen fontos szempont...
-
Abu85
HÁZIGAZDA
A hardver elméleti képességeiről beszéltem. Szoftverben még mindig fényévekre vannak. Amiről 'Geri' ír az az OpenGL driver, ami tényleg rém gyenge az Intelnél.
A hardver tempóját tekintve persze jóval lassabb a HD Graphics 4000, mint a leggyorsabb Trinity-s Radeon IGP (akár mobil, akár asztali), és ez főleg akkor jön elő, ha magas részletességet állít be a user a programnak, ahol a HD 4000 elfogy. Jellemzően médium szintig bírja. Ezek nyilván abból erednek, hogy az AMD jóval erősebb setup részt használ, hiszen órajelenként feldolgoz egy háromszöget, ami az Intelnek négy órajel, vagy a textúrázóblokk az valóban képes Gather4-et használni, ami pokoli előny DX10./11 alatt, hiszen minden ilyen játék támogatja. Az Intel tök logikátlanul csinálja, mert egy csatornán csak egy mintavételező van, míg az AMD-nél egy csatornához négy tartozik. A Gather4 utasítás az logikus. Egy helyet egyszerre négy mintavétel legyen, ehhez négy mintavételező kell, ahogy az AMD csinálja. Az Intel megoldása formálisan képes támogatni, de úgy, hogy négy órajelig csak a mintavételezéssel törődik az adott textúrázó csatorna. Ez a megoldás még lassabb is lehet, mint Gather4 nélkül, hiszen 3 kötelező üres ciklust fut a szűrő és a címző. Bárki találta ezt ki az Intelnél, az remélhetőleg már nem dolgozik ott (a jövőre való tekintettel persze, semmi személyes ). Szerencsére a Haswell IGP-je már valós Gather4 támogatást kap. A kisebb-nagyobb gyenge pontok mellett azért a Gen7 architektúra már elég jó. Gyakorlatilag a Gather4 para az egyetlen, ami komoly gond. Persze az LLC-be mentő stream out sem a legjobb, de az még benne van az elfogadható kategóriában. Ami viszont elég jó az a compute hatékonyság, és ez első nekifutásra dicséretes. Ha igazak a feldolgozók számáról érkező pletykák, akkor ez a Haswellben is javulni fog valamennyit. Persze a GCN ellen kell is.
Összességében a Gen7 architektúra tényleg nem rossz. Ami jelentősen visszafogja bizonyos szituációkban az a driver, és erre az Intel még mindig nem fordít kellő figyelmet.A WinZip és a VLC egy vitában merült fel. Nem azért, mert a legjobb példák az elérhető gyorsulásra, hanem azért, mert csak AMD-s OpenCL driverrel működő funkciókat tartalmaznak. Ez úgy jön le, hogy az AMD kisajátít egy szabványt, de valójában csak a fejlesztők nem engedik, hogy fusson a funkció Intel és NV driveren, amíg nem tudják garantálni a sebességelőnyt, vagy a megfelelő működést.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
#31342592
törölt tag
Emberek nem tudom mire vártok még skylake-ra. Ez még kb 4 év:
-
Chriss745
tag
Egyet mondjatok mar meg nekem legyszives. Evek ota hallgatjuk, hogy igy GPU-s altalanos gyorsitas, meg ugy GPU altalanos gyorsitas. Aztan mi van? Semmi. Mondjon mar valaki egy valos eletben is hasznalt, ismetlem, valos eletben is hasznalt alkalmasazt, ahol erezhetoen gyorsabb a program mert egy integralt vagy dedikalt videokartyaval van gyorsitva es nem csak CPU-n fut.
Az egyetlen egy dolog ahol en latom az ertelmet az a DXVA, de azt mar manapsag minden integralt GPU is tudja. Azon kivul mi?!
Megmondom oszinten van egy GTX680-asom, megvan jo par honapja mar, de en jatekon kivul masra meg nem tudtam hasznalni. Jott az nVidia is a NVENC-el, de 3 honapja nem kepes senki kiadni egy NVENC-el gyorsitott videokodolot, nevetseges.
Tegye fel a kezet akinek pl. ketszeresere gyorsult egy program, mert bekapcsolta a GPU gyorsitast (es itt nem beszelek a CUDA alapu video kodolasrol, mert az egy szep nagy csalas, azon a minsoegen ahogy a CUDA encodol a proci is tudja azt a sebesseget). En valahogy nagyon marketing bullshitnek erzem ezt az egeszet. Benchmark-ban uber jo, de igaazabol semmire sem lehet kihasznalni az uj featureokat. Csak belerakjak, azt mondjak huu, ez kell neked. Kulonben miert cserelne az ember procit?! Masik jo pelda az AVX. Hogy jott az intel az SB kiadasanal, hogy AVX, woow, aztan mi hasznalja ki az AVX-et majdnem ket evvel a kiadasa utan? Benchmark, oszt csokolom!
[ Szerkesztve ]
-
Abu85
HÁZIGAZDA
válasz Chriss745 #87 üzenetére
A GPGPU az sokat gyorsít a specializált feladatokon. Ezért használják. Az általánosabb feladatokhoz közelebb kell vinni a CPU-hoz a GPU-t, vagyis integrálni kell. Ezért születnek olyan OpenCL programok, mint a WinZip (GPU-s gyorsításra), mert az integráció lehetővé teszi, hogy valamennyire eltávolodjunk a specializált feladatoktól. Itt is gond azonban az adatmásolás, mert a CPU és a GPU hiába van fizikailag egy lapkán, attól még különálló memóriaterületet használnak, ahogy a CPU és a dedikált GPU. És az adatmásolás problémája jelentős, mert amit megnyert a GPU-s gyorsítással, azt az adatok másolásán elvesztheted. A következő lépcső tehát az, hogy a CPU és az integrált GPU közös címteret és megosztott memóriát használjon. Ilyenkor adatmásolásra nincs szükség.
A másik gond, hogy ha a hardver adott lesz, akkor felmerül a programozok szemszögéből az a probléma, hogy van egy rakás eltérő rendszer, teljesen különböző fizikai ISA-kkal, és ezeket nehéz programozni. Erre kell majd egy teljes infrastruktúra, mely bevezet egy mindenki által támogatható virtuális ISA-t. Például HSA.Az új dolgok mindig lassan terjedtek, ezen nincs semmi meglepő.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
dezz
nagyúr
válasz Chriss745 #87 üzenetére
Itt tesztelnek egy párat (pár hozzászólással ezelőtt már linkeltem):
Can OpenGL And OpenCL Overhaul Your Photo Editing Experience?
Esetenként nem hogy 2x, hanem 10-20-30x gyorsulások vannak...
-
i-sti
senior tag
válasz #31342592 #86 üzenetére
Pontosan.
Ebben a forum reszben is 2 Q9550 tulaj (koztuk en is), jeleztuk, hogy arra szeretnenk cserelni.
Ez azert van, mert a mi Q9550-unk, addig meg siman "versenyben" marad.
Meg egy fontos ok, hogy a Skylake fogja elsonek tamogatni a DDR4-et. (ugy tudom, hogy a Broadwell sem fogja meg).Novum Forum Siculorum
-
Pikari
őstag
nem igazán lehet megoldani másolás nélkül.
ahhoz, hogy a memóriaterületeket átpasszold a gpunak:
-át kell copyzni a szűkséges memóriacímen lévő adatokat user módból (copy_from_user). ehhez a kernel segítsége kell, ugyanis:
-az user módban futó program - az egy user módban futó program. hogy mit csinál, az az ő dolga. a kernel segítségével kezeli a memóriát, ő önmagában nem rendelkezik hardveres szempontból memóriakezelő funkciókkal. szépen mallocol, reallocol, freeli a memóriaterületeket, ahogy ő akarja. hogy az ő memóriaterületei hol vannak, azt igazából senki se tudja (persze azt tudni, hogy mi van hozzá rendelve a programhoz, de hogy azon belül mi/hogy van kialakítva, az a rendszer számára már homály)
-a kernel sem tudja, maga az opreációs rendszer sem, nemhogy a gpu drivere.
-tehát ahhoz, hogy megkaphassa a driver ezeket, úgy a kliens driveren keresztül át kell passzolni a szűkséges memóriaterületet a kernel módú drivernek (amihez vissza kell kapcsolni a processzort valós módba), aztán a driver a kernel segítségével (természetesen az adott szoftver utasítására, az adott szoftver közreműködésével) a megadott pointeren keresztül kihúzza az adott hosszúságú memóriaterületet, átmásolva a driver egy SAJÁT, máshogyan címzett memóriarekeszébe (amihez előtte kell egy kernel módú memóriafoglalás, majd a legvégén persze egy törlés).
-ha ott van, akkor kezelni kell magát a hardvert, egy kvázi gépikód szerű adattömegről van szó, amelyet a gpun akarunk futtatni, ahhoz több száz- ezer-tízezer órajeles latencyvel bíró ormótlan hívásokat kell benyalatni a hardverrel. ilyen nyalánkságról nem is beszélve, hogy memóriát kell neki foglalni a grafikus hardveren belül, be kell bootolni egy pár százezer kódsoros mini operációs rendszert (!) a grafikus kártyában, azon belül az ütemezőre fel kell fűzni a futtatni kívánt gpgpu kódot a gpu ütemezőjére, törölni kell az összes regisztert, meg kell öntözni a virágokat, etc etc etc
-a gpu külön memóriájába való belemásolás már jobbára megspórolható innentől már, ha egy ramon vannak, persze, csak innentől meg remélem érzi mindenki, hogy ez igazából már rég mindegy...
-az eszköz elvégezte a feladatát. ki kell transferelni az előbb betöltött memóriamennyiséget valós módból user módba, megint csak a kernel segítségével
-felszabadítani a memóriát, aztán return
a teljesítménynek olyan 80%-a megy a pocsékba, mint overhead.
nem, nem lehet vele mit csinálni, kivéve ha teljesen új processzort tervezünk a nulláról, se az arm-al nem lehet máshogy, se az x86-aé, se a mips-el, se semmi mással, ami user módban futtatja a programokat. Na jó, DOS 6.22-ből meg lehetne csinálni
vélemény: nem kell gpgpu. egy erős, sok magos, jó processzor kell, ami el tudja látni a gpu feladatát is.
[ Szerkesztve ]
A Dunning−Kruger-hatás az a pszichológiai jelenség, amikor korlátozott tudású, kompetenciájú vagy képességű emberek rendkívül hozzáértőnek tartják magukat valamiben, amiben nyilvánvalóan nem azok.
-
dezz
nagyúr
A HSA részben éppen arról szól, hogy az egészet megreformálják és a GPU-t beemelik a CPU(+FPU)+MMU kis közösségébe. Légy üdvözölve egy új galaxisban (itt még FSA-ként hivatkoztak rá):
The Programmer's Guide to the APU Galaxy
Plusz vess 1-2 pillantást ennek a cikknek a végén lévő két slide-ra.
"vélemény: nem kell gpgpu. egy erős, sok magos, jó processzor kell, ami el tudja látni a gpu feladatát is."
Na persze, 10x akkora szilícium területtel és 100x akkora fogyasztással... (Már ha egy chipen megvalósítható lenne, de nem lehet a hőtermelés miatt.)
-
ddekany
veterán
Én úgy értettem az itt a cél (hosszú távon), hogy a GPU-s kód is ugyan abban a címtér + privilegitási szint fusson, mint az alkalmazás CPU-s kódja. Te meg lényegében azt mondod, hogy na ja, csak ezt büdös életben meg nem oldják, csak hülyítik a népet ezzel az ígérettel? Én ezt végül is nem tudhatom, mert a GPU-k lelki világát nem ismerem. De konkrétan miért lenne ezt lehetetlen megoldani, hogy a GPU is beilleszkedjen ebbe a rendszerbe? (Ettől persze még lehet, hogy mondjuk a mostani DirectX/OpenGL cuccok külön címtérben futnak, meg főleg, másolgatnak, hogy ne hányják össze egymás adatstruktúráit a hagyományos alkalmazással.)
-
dezz
nagyúr
"Én úgy értettem az itt a cél (hosszú távon), hogy a GPU-s kód is ugyan abban a címtér + privilegitási szint fusson, mint az alkalmazás CPU-s kódja."
Így van. És nagy lépésekkel haladnak is ebbe az irányba.
"Te meg lényegében azt mondod, hogy na ja, csak ezt büdös életben meg nem oldják, csak hülyítik a népet ezzel az ígérettel? Én ezt végül is nem tudhatom, mert a GPU-k lelki világát nem ismerem. De konkrétan miért lenne ezt lehetetlen megoldani, hogy a GPU is beilleszkedjen ebbe a rendszerbe?"
Az általam linkelt anyagokban be van mutatva a mai helyzet és a megoldás is.
-
P.H.
senior tag
A 256 bites lebegőpontos végrehajtók NEM 256 bites számokon dolgoznak, hanem egymást követő 8 db 32 bites vagy 4 db 64 bites számon (=vektor). Ilyenek már a Sandy és Ivy Bridge-ben is vannak, itt most csak átszervezték őket (+FMA), a nagyobb újdonság az, hogy az integer (fixpontos) ALU-k is 256 bitesek lettek; ezek eddig 128 bitesek voltak, így képesek egyszerre 32 byte-on, 16 word-ön, 8 duplaszón vagy 4 db 64 bites értéken dolgozni.
A SIMD nem egymást követő utasítások kötegelésére való, hanem egymást követő adatokéra; ez is a neve: Single Instruction Multiple Data (képes olvasnivaló még az AVX1-ről).A Haswell-ben mind fixpontos, mind lebegőpontos 256 bites végrehajtóból 3-3 van, utóbbiból 2 képes az FMA-műveletekre, továbbá az egyik az osztásra/szorzásra, a másik összeadásra/kivonásra/összehasonlításra, a 3. csak a vektorelemek átrendezésére.
A késleltetés nem valami kényszeredett várakozás, hanem az utasítás végrehajtásának ideje (az angol latency szó tükörfordítása lappangás), ennyi idő alatt van készen egy művelet. Minden utasításnak - a legegyszerűbbnek is, mint két egész szám összeadása - legalább 1 ciklus a késleltetése, a lebegőpontos számok műveletei tovább tartanak:
Core2/Nehalem/Sandy/Ivy/Haswell: az összeadás 3, a szorzás 5 órajel
Bulldozer: összeadás és szorzás is 5-6 órajel
K10: összeadás és szorzás is 4 órajel (példa; L=latency T=throughput)
Az, hogy "pont 5-tel több, mint kellene" olyan, mint számonkérni egy 12 ms elérési idejű HDD-n, hogy ez pont 12-vel több, mint amennyinek kéne lennie; vagy legyen 1 ms, különben semmit se ér Nagyon szakmai...A gather-utasítások memóriaolvasó utasítások, paraméterben kapják meg, hogy milyen címekről olvassanak, majd ezeket az értékeket megfelelően sorba állítva egy vektort képeznek. Semmi közük a műveletekhez, a TMU-hoz, sem "bedrótozva" nincs beléjük a címek távolsága.
Sosem láttam még olyan hozzászólást, ami 100%-ban szakmaian hangzó köntösbe (köntös... bikini) bújtatott halandzsa.
[ Szerkesztve ]
Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙
-
dezz
nagyúr
Hűha, most nézem csak én is, tulajdonképpen miket is írt ott. A #81-est félkómásan írtam éjszaka. A "256-bites FP" részt olvasva (átfutva) arra gondoltam: "az nem lehet, hogy tényleg így érti..." A ciklusokkal kapcsolatban azt hittem, az a gondja, hogy annyi idő alatt hajtódik végre, mintha sima elemi utasítások sorát hajtanánk végre.
-
Pikari
őstag
-
Pikari
őstag
én sem, egészen addig, amíg el nem olvastam a tiedet
,,hanem az utasítás végrehajtásának'' ... ,,ennyi idő alatt van készen egy művelet''
nem, ez nem 5 órajelbe fog kerülni, hanem MINIMUM 5-be. óriási különbség!,,A 256 bites lebegőpontos végrehajtók NEM 256 bites számokon dolgoznak''
hanem 32 biteseken, 64 biteseken, 80 biteseken, 128 biteseken, vagy 256 biteseken...,,A SIMD nem egymást követő utasítások kötegelésére való''
a SIMD egyetlen lényege hogy kevesebb utasításból tudj megcsinálni bizonyos műveleteket. definíció szerint: ,,single instruction, multiple data rövidítése'',,hanem egymást követő adatokéra''
ez makes no sense,,Minden utasításnak - a legegyszerűbbnek is, mint két egész szám összeadása - legalább 1 ciklus a késleltetése''
nem, nem igaz az, hogy minden utasítás szűkségszerűen legalább 1 ciklust elvenne,,szakmai''... ,,szakmaian hangzó köntös''
mi bánt ennyire? szakmaiság, hmm. vajon mi lehet ez? szóval ezzel kapcsolatban vannak neked hiányosságaid, és negatív tapasztalataid múltban. esetleg az érvényesülés tekintetében, és ezt kompenzálod a bizonyos szakmaiságra való törekvéssel. remélem, hamar sikerül megoldanod, és teljes életet élhetsz majd[ Szerkesztve ]
A Dunning−Kruger-hatás az a pszichológiai jelenség, amikor korlátozott tudású, kompetenciájú vagy képességű emberek rendkívül hozzáértőnek tartják magukat valamiben, amiben nyilvánvalóan nem azok.
-
P.H.
senior tag
Tehát minimum 5; (mennyi a maximum? mikor ennyi? amikor előtte össze kell kapnia magát a CPU-nak?) és legyen minimum 0 vagy 1. A Cell FMA-ja minimum 6 órajel, még rosszabb?
Kérlek mondj olyan utasítást, amely 128 vagy 256 bites lebegőpontos számokkal dolgozik; vagy innen olyan adattípust!
Nem, nem ez a SIMD lényege, (az a CISC-be hajló bonyolultabb utasításoké, pl. POPCNT, PCLMULQDQ), hanem hogy n elemű tömb(ök)re ugyanannyi műveletből álló for-jellegű ciklus n helyett - adattípustól függően - csak n/2, n/4, ..., n/32 alkalommal fusson le, vagy ne is kelljen ciklus egyáltalán; így a CPU által végrehajtott utasítások száma feleződik, negyedőlik, ..., 32-edelődik, vagy 1-re csökken (maga a for is jópár utasítás).
Mutatsz ebben az AIDA-mérésben olyan utasítást, amely 0 órajel alatt fut le? Ezt mondja az AMD ugyanerre (Appendix C Instruction Latencies).
Regiszterek ide-oda másolgatásából vagy nullázásából nemigen lehet programot írni.Adhatsz linkeket, hivatkozásokat bőven, gondolom, nem magadtól találod ki ezeket.
[ Szerkesztve ]
Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙
Új hozzászólás Aktív témák
- Luck Dragon: Asszociációs játék. :)
- Politika
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- Samsung Galaxy S23 Ultra - non plus ultra
- Vicces képek
- Kodi és kiegészítői magyar nyelvű online tartalmakhoz (Linux, Windows)
- Apple iPhone 15 Pro Max - Attack on Titan
- Autós topik
- Futás, futópályák
- A fociról könnyedén, egy baráti társaságban
- További aktív témák...
- Intel Core I7 13700K - //Új//6hó garancia//Beszámítás//
- Hibátlan - INTEL Core i5-9400F 6 mag CPU + gyári hűtő - LGA1151v2
- Intel Core i7-7700 processzor (használt)
- Beszámítás! Intel Core i7 4790 4mag 8szál processzor garanciával hibátlan működéssel
- Beszámítás! Intel Core i3 8100 4mag 4szál processzor garanciával hibátlan működéssel
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Promenade Publishing House Kft.
Város: Budapest