Új hozzászólás Aktív témák

  • P.H.

    senior tag

    válasz hugo chávez #38 üzenetére

    Pedig próbáltam a legegyszerűbben leírni :)

    Amennyiben nem közelítjük meg az ábrázolási mód nagyságrendi határait, ott akár 2x gyorsabb lehet az FMA-kód, mint a sima SIMD megfelelője, mivel (nem törvényszerű, de) Bulldozeren azonos órajelbe telik 1-1 összeadás vagy szorzás, mint egy FMA.
    Ha megközelítjük, vagy egyáltalán felmerül az esélye, hogy megközelítheti a bemeneti adat az elvi határt - mint írtam, 32 bit SP esetén 100000 nagyságrend esetén kb. 0.0001 az alsó határ, ameddig pontos; pixel-adatoknál, amik [0..255] tartományban vannak, ott mindegy ez; de máshol általában itt rezeg a léc, mert a 64 bit már fele akkora sebességű CPU esetében, ez nem mindegy-, akkor bizonyos esetekben +1-2 bit( vagy nagyságrendi szempontból ulp) pontosságot elrejt az FMA.

    A lebegőpontos számok szabványos ábrázolása 32, 64 vagy 80 bites (a 16 bites HP is már csak új jövevény, de nem véletlenül alkalmazzák GPU-kban). A 80 bitnél nagyobb ábrázolás formája nem kötött szabványosan, az AVX is csak több 32 és 64 bites értéket ismer és azokkal tud számolni. 80 bitnél nagyobb ábrázolást már sima integer-kódban szokták megírni (de a DOS-os programok is alapvetően tartalmaztak integer FP-kódot, ha nem lenne a CPU-ban/mellett FPU), ebből a szempontból az FPU még mindig kötött hardware.
    Természetesen 256 bites (8*32 vagy 4*64) méretre is is van FMA.

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Új hozzászólás Aktív témák