- Házi barkács, gányolás, tákolás, megdöbbentő gépek!
- LG C3: egy középkategóriás OLED tévé tesztje
- Milyen asztali médialejátszót?
- Milyen billentyűzetet vegyek?
- Melyik tápegységet vegyem?
- Száguldozáshoz való az új GeForce driver
- NVIDIA GeForce RTX 4060 / 4070 S/Ti/TiS (AD104/103)
- SONY LCD és LED TV-k
- Mini-ITX
- Steam Deck
Hirdetés
-
Féltucat régi Samsung kapott új One UI-t, köztük az A52s
ma A 6.1 olcsó, drága, ütésálló és közönségkedvenc készülékekre is megérkezett.
-
Összemoshatja a Google és a Magic Leap a valódi és a digitális világokat
it Együttműködésbe kezdett a Google és a Magic Leap nevű AR-startup.
-
AMD Radeon undervolt/overclock
lo Minden egy hideg, téli estén kezdődött, mikor rájöttem, hogy már kicsit kevés az RTX2060...
-
PROHARDVER!
OLVASD VÉGIG ALAPOSAN MIELŐTT ÚJ HOZZÁSZÓLÁST ÍRNÁL!!!
Új hozzászólás Aktív témák
-
P.H.
senior tag
válasz #95904256 #1224 üzenetére
Nem, ebben tévedsz, pipeline-on belül minden (és az említett) esetben legfejlebb akkora gyorsulás lehet, mint amekkora a legerősebben szűk keresztmetszet átmérőjének növekedése (amit említettél, ott kétszeres).
Pl. Ha folyamatos 128 bites add-mul-load/store SSE-utasításfolyamról van szó, akkor órajelenként eddig K8-on ''1.5 utasítás'' (1 128 bites utasítás=2 64 bites macro-op, a pack-stage-ek miatt 3 macro-op=''1.5 utasítás'') ment át a decode-fázison; órajelenként 3 64 bites macro-op, tehát 1.5 128 bites utasítás fejeződött be az execution unitokban; viszont órajelenként 1 128 bites utasítás ment át a retirement-fázison, így gyorsan betelt az ICU, mivel a többi fokozat gyorsabb volt, mint a retirement, tehát az ICU nem ürült, ezt akadályozta a szűk retirement. Így igen gyorsan gyakorlatilag órajelenként 1 db 128 bites utasítás ''került ki'' a CPU-ból befejezetten (nesze neked superscalar felépítés).
K10 esetén órajelenként 3 128 bites utasítás dekódolódik, az említett kódfelépítés esetében órajelenként 3 végezhet, és 3 vonulhat vissza (lévén nem Double-ok már, hanem DirectPath utasítások).
''Utasítás'' alatt fent mindenhol a programozói szintű utasításokat értem.
Tehát úgy nem lehet összeadni, hogy ez is 2x-esére gyorsul, az is 2x-esére, akkor összesen négyszeresére, mert ez egy pipeline, amiben csak az ütemezőkben előzhetnek meg bizonyos utasítások más, programsorrendben későbbieket (sehol máshol), és az eleje (decode) és a vége (retirement) is programsorrendbeli.
Mivel az eddigi legszűkebb keresztmetszet 3x-osára szélesedik, ezért ebből legfejlebb háromszoros gyorsulás következhet. Viszont a memory access reorder (a későbbi load-ok a korábbi store-okat megelőzhetik, ha nem azonos címre mennek, illetve nem fednek át; ezek eddig az x86 világban Core2 kivételével MINDIG programsorrendben történtek) által hozott gyorsulás még a fentiekre tevődik rá (és ez az tisztán x86 integer kódokat is érinti).
Még mindig tisztán elméletileg.
[Szerkesztve]Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
Az ide nem illő hozzászólások topikja:[link]
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva.
- A fociról könnyedén, egy baráti társaságban
- Autós topik látogatók beszélgetős, offolós topikja
- Házi barkács, gányolás, tákolás, megdöbbentő gépek!
- Ukrajnai háború
- Filmvilág
- Xbox tulajok OFF topicja
- Futás, futópályák
- Kerékpárosok, bringások ide!
- LG C3: egy középkategóriás OLED tévé tesztje
- Politika
- További aktív témák...
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: Ozeki Kft.
Város: Debrecen