Keresés

Új hozzászólás Aktív témák

  • gbors

    nagyúr

    válasz gbors #311 üzenetére

    No akkor most a táblázat még 1x:

    --------------------------------------------
    _________________________|Ideal| 79% |Teszt
    --------------------------------------------
    float MAD _______________|172.8|136.2|136.2
    --------------------------------------------
    5-issue (ha 5 ciklus) ___|172.8|136.2|
    -------------------------------------|
    5-issue (ha 8 ciklus) ___|108.0| 85.1| 56.0
    -------------------------------------|
    5-issue (ha 13 ciklus) __| 66.5| 52.4|
    --------------------------------------------
    float4 MAD (ha 2 ciklus) | 43.2| 34.1|
    -------------------------------------|
    float4 MAD (ha 4 ciklus) | 21.6| 17.0| 28.3
    --------------------------------------------

    Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...

  • dezz

    nagyúr

    válasz gbors #311 üzenetére

    Válaszolnál érdemben a #304-es fennmaradó kérdéseire, a #301 figyelembevételével?
    Azaz, le kellene írnod, hogy jönnek ki neked ezek a számok...
    Pl. hogy lenne az 5-issue 172.8, akár 5 ciklusosan? Amikor az a szám best case float MAD serialnál tud kijönni? Elfelejtetted 5-tel osztani?
    A float4 MAD-os számok meg nagyon-nagyon alacsonyak, főleg a 2 v. 4 cikushoz képest, ami mellesleg 8 ciklus kell legyen.

    ''Cserebere'': kizártnak tartom, hogy minden egyes float2+ operandus miatt +1 ciklusra lenne szükség. CPU thread-váltásnál le kell cserélni a regisztetek tartalmát, azt tuti megoldották, hogy itt utasításonként (float2+) ne legyen erre szükség, tovább rontva a sorosítás miatti helyzetet. Gondolom, a 2.-x. utasítás egy index hozzáadásával hajtódik végre, ami megcímzi a vector megfelelő elemét, vagy ilyesmi.

    ''80%'': ezen számok, és a vertex-shaderes tesztek alapján úgy tűnik, a G80, v. a driver nem utal ki 100% kapacitást semmelyik shader-típusnak, sőt, mintha le lenne fixálva egy 80/20%-os arány a PS és VS között (a GS nem tudom, hogy ékelődik be).

    venember83: szerintem azért annyira nem off, mivel a cikk elsősorban nem a demóról szól, hanem a cirkuszról, ill. hogy indokolt-e, lehet-e valamilyen oka, hogy ilyen lassan fut R600-on.

Új hozzászólás Aktív témák