Új hozzászólás Aktív témák

  • gbors

    nagyúr

    válasz HSM #8370 üzenetére

    Akárhogy is nézem, de egy 7950 vs 960 az pont azokat hozza, amiket írsz - sokat fogyaszt, featurehiányos, és a fizikai erőforrásaihoz képest bizony igencsak lassú.

    A GPU + sávszél fejtegetés természetesen igaz, csak extrém példaként hoztam az R600-at. De akkor már ne egyszerűsítsünk, ne tömbben beszéljünk a GPU-ról, hanem részegységenként. Az aszinkron ALU-kihasználásnak ui. mindenképpen lesz előnye, de jelentős csak ott, ahol a sebességet az ALU throughput limitálja. A jelenlegi játékokban ez sok esetben nem így van, jól lehet látni a teszteken, mennyi a backend limites motor. Ha meg eleve ROP / sávszél limit van, akkor a shader fázist fel tudod gyorsítani, de összességében sokkal több FPS-ed nem lesz.

    Memóriavezérlő (nem csak Neked): sajnos ezt élő ember még nem mérte ki, úgyhogy csak az elméletre tudok támaszkodni. Egy teljes kiépítésű peer-to-peer crossbarnál elméletben nem tudsz gyorsabb általános célű megoldást csinálni (akkor igen, ha ismered előre az egyes adatutak terhelését, de ez egy GPU-nál nemigen jellemző).
    A Maxwell PTP crossbar, viszont nem teljes kiépítésű, egy egység egyszerre nem tudja a teljes sávszélességet elérni. Az a feltételezés, hogy pl. egy SM-nek elég a 128-bites adatbusz a priorizált ROP / MC kombóhoz, és a 64-bites a nem priorizálthoz - tekintve, hogy a GM204-ben 4 SM jut egy backend blokkra, ez reálisnak tűnik. Viszont, mivel PTP, elméletileg egyidőben tetszőleges két fél között mehet az adat, azaz több párhuzamos transzfer is lehet.
    A GCN hub-os vezérlője némileg talányos, mert nagyon kevés infot lehet olvasni róla. Én úgy értelmezem ezeket, hogy ez egy switched crossbar, ami egyidőben nagyon széles adatcsatornákat tud megnyitni két fél között, viszont a párhuzamos transzferek mennyisége limitált (nem merem állítani, hogy 1, de nagyon több nem lehet, mert elveszne a hub fő előnye, a kevés tranzisztor).

    Innentől csak következtetés - nagyon erős cache-eléssel és jó adatroutinggal a switched crossbar megközelítheti a PTP sebességét, speciális esetekben felül is múlhatja, de jellemzően lassabb lesz.

    (#8377) Malibutomi: ez egy kitűnő példa az elmélet és a gyakorlat különbözőségére. Elméletben olcsó VGA + FreeSync / G-Sync = királyság. Gyakorlatban egyik Sync-hez sincs budget árú monitor...

    [ Szerkesztve ]

    Pedro... amigo mio... ma is konzervvért iszunk! Kár lenne ezért a tehetséges gyerekért...

Új hozzászólás Aktív témák