Keresés

Új hozzászólás Aktív témák

  • Ren Hoek

    veterán

    válasz HSM #8370 üzenetére

    Szerintem a FreeSync hiánya eléggé nagy pofon volt a Tahiti tulajoknak... meg a vadizsírúj 370 tulajoknak is...
    Pont a Tahiti az a kategória, ahol igazán van jelentősége. 40-60 FPS tear/ vsync lag nélkül nagyon adná.

    Ja és igen, pont leírtad Te is, amit még a sávszélhez akartam. A Maxwellek cache rendszere... ezért a valódi eredmény majd az AOTS bench lesz, mert számok alapján nem hasonlítható össze jelenleg.

    Bár tudom, a Star Swarm DX12 bench, ami kint van már elavult, de ott a Maxwellek is erősorrendben skálázódtak. Sok egység, animációk és async ott is volt.Látványban nekem tök ugyan az mint az AOTS...

    Szóval nagy meccs lesz, kíváncsi vagyok kinek lesz igaza. Szerintem AOTS-ban 290X, Fury, remekel... de Maxwelleken IS még játszható lesz azért. A többi játékban meg minimális GCN előny. Deus Ex dönt majd számomra. Aztán később lesznek kegyetlen motorok, amiken negyedére lassulnak a Maxik.. de az nem ma lesz. Addigra már filléres használt Fury prot akarok :P

    [ Szerkesztve ]

  • gbors

    nagyúr

    válasz HSM #8370 üzenetére

    Akárhogy is nézem, de egy 7950 vs 960 az pont azokat hozza, amiket írsz - sokat fogyaszt, featurehiányos, és a fizikai erőforrásaihoz képest bizony igencsak lassú.

    A GPU + sávszél fejtegetés természetesen igaz, csak extrém példaként hoztam az R600-at. De akkor már ne egyszerűsítsünk, ne tömbben beszéljünk a GPU-ról, hanem részegységenként. Az aszinkron ALU-kihasználásnak ui. mindenképpen lesz előnye, de jelentős csak ott, ahol a sebességet az ALU throughput limitálja. A jelenlegi játékokban ez sok esetben nem így van, jól lehet látni a teszteken, mennyi a backend limites motor. Ha meg eleve ROP / sávszél limit van, akkor a shader fázist fel tudod gyorsítani, de összességében sokkal több FPS-ed nem lesz.

    Memóriavezérlő (nem csak Neked): sajnos ezt élő ember még nem mérte ki, úgyhogy csak az elméletre tudok támaszkodni. Egy teljes kiépítésű peer-to-peer crossbarnál elméletben nem tudsz gyorsabb általános célű megoldást csinálni (akkor igen, ha ismered előre az egyes adatutak terhelését, de ez egy GPU-nál nemigen jellemző).
    A Maxwell PTP crossbar, viszont nem teljes kiépítésű, egy egység egyszerre nem tudja a teljes sávszélességet elérni. Az a feltételezés, hogy pl. egy SM-nek elég a 128-bites adatbusz a priorizált ROP / MC kombóhoz, és a 64-bites a nem priorizálthoz - tekintve, hogy a GM204-ben 4 SM jut egy backend blokkra, ez reálisnak tűnik. Viszont, mivel PTP, elméletileg egyidőben tetszőleges két fél között mehet az adat, azaz több párhuzamos transzfer is lehet.
    A GCN hub-os vezérlője némileg talányos, mert nagyon kevés infot lehet olvasni róla. Én úgy értelmezem ezeket, hogy ez egy switched crossbar, ami egyidőben nagyon széles adatcsatornákat tud megnyitni két fél között, viszont a párhuzamos transzferek mennyisége limitált (nem merem állítani, hogy 1, de nagyon több nem lehet, mert elveszne a hub fő előnye, a kevés tranzisztor).

    Innentől csak következtetés - nagyon erős cache-eléssel és jó adatroutinggal a switched crossbar megközelítheti a PTP sebességét, speciális esetekben felül is múlhatja, de jellemzően lassabb lesz.

    (#8377) Malibutomi: ez egy kitűnő példa az elmélet és a gyakorlat különbözőségére. Elméletben olcsó VGA + FreeSync / G-Sync = királyság. Gyakorlatban egyik Sync-hez sincs budget árú monitor...

    [ Szerkesztve ]

    "... and with your wicked wishes we will rise again"

Új hozzászólás Aktív témák