Hirdetés

Új hozzászólás Aktív témák

  • P.H.

    senior tag

    válasz #95904256 #1220 üzenetére

    Elméletileg lehetséges pl. ugyanannál az SSE vagy (akár integer) SSE2 kódnál is, ha azt vesszük, hogy a decode-sávszélesség kétszeres, a retire-sávszélesség háromszoros, a 64->128 megintcsak kétszeres gyorsulást hozhat elméletben K10-nél K8 ellenében, plusz a Core2-ből ismert memory access reordering is jelentősen emelhet mindezen felül nem keveset. Mindez inkább attól függ, mi volt az adott kódban eddig a legmarkánsabb szűk keresztmetszet (pl. felváltott SSE add-mul-load/store utasításoknál, amik teljesen párhuzamosan haladhatnak, a retirement + a memory access, ott lehet több, mint háromszoros gyorsulás. Illetve néhány utasítás, pl. a shuffle utasítások VectorPath-ról DirectPath lettek.) Persze mindez tisztán elméleti számítás.

    [Szerkesztve]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Új hozzászólás Aktív témák