Keresés

Új hozzászólás Aktív témák

  • #58682368

    törölt tag

    válasz tjokai #79623 üzenetére

    A GeForce GTX 970-es videokártyáknál meglehetősen szokatlan memóriakezelésre figyeltek fel a szemfüles felhasználók az elmúlt hetek folyamán. A tesztek alapján úgy tűnt, hogy a GeForce GTX 970-es videokártyák nem képesek a teljes, 4 GB-os VRAM egyforma kihasználására, 3,5GB felett problémáik vannak. Ha a videókártya memóriahasználata 3,5GB fölé ment, az aktuális játék belassult, vagy mikrolagoktól szenvedett.

    Tehát ha az összes memóriát megpróbáljuk munkára fogni, a teljesítmény esni fog. A fura jelenségről először csak a különböző weboldalak fórumaiban folyt a diskurzus, ám idővel egyre több helyen felkapták a témát, így a helyzetre már az Nvidiának is reagálnia kellett, hiszen a cég egyre több és több megkeresést kapott.

    A cég szerencsére nem is tétovázott túl sokáig a kérdés megválaszolásával: az illetékesek elismerték, valóban van alapja a fórumtémákban megfogalmazott állításoknak, így elmagyarázták az egész dolog hátterét.

    A válaszban az Nvidia kifejtette, hogy a GeForce GTX 970-es videokártyák ugyan valóban 4 GB-nyi fedélzeti memóriával rendelkeznek, de a letiltott részek miatt egy kicsit máshogy viselkednek, mint a teljes értékű GM204-es GPU-t használó GTX980-as. A letiltott részegységeknek hála, ahogy az a fenti képen is látszik, megváltozik a memória kezelése is, ugyanis a kezdetben kikerült specifikációkkal ellentétben a nyolcadik ROP blokk, és a hozzá tartozó L2 cache le van tiltva, így az összes ROP száma "csak" 56, az elérhető L2 cache mérete pedig 1,75MB. Ez még nem is jelentene problémát, mert a 8 ROP kiesése, ha utánaszámolunk, nem okoz teljesítménycsökkenést, az viszont már gond, hogy normális esetben a memória-hozzáférése a shader tömböknek az L2-gyorsítótár és ROP blokkok duóin keresztül történik, amiből most egy le van tiltva. A memória-vezérlők érintetlenek, de a hetedik és nyolcadik össze lett kapcsolva, ha hozzá akarunk férni a nyolcadik által kezelt memória területhez, akkor az a hetedik csatornáján keresztül tudja csak küldeni az adatokat. Innentől kezdve egyértelműen látszik, hogy szűk keresztmetszet lehet az utolsó adatcsatorna a crossbar vezérlőhöz, hiszen nem tud kétszer annyi kérést kiszolgálni, mint a többi.

    Annak érdekében, hogy a memóriaforgalom kezelése optimális lehessen, a mérnökök szegmentálták a VRAM-ot, azaz a 4 GB-nyi teljes mennyiséget egy 3,5 GB-os és egy 0,5 GB-os részre osztották. Értelemszerűen a nagyobbik, 3,5 GB-nyi résznek van magasabb prioritása, így optimális esetben, amíg nem lépünk át a 3,5GB-os határon, addig nincs probléma (csak ha belegondolunk, az elvi maximális sávszélességet szinte lehetetlen lesz elérni).

    Hogy hogyan teljesít a GeForce GTX 970, ha a 0,5 GB-os VRAM partícióhoz is hozzá kell férnie a GPU-nak? A kérdést játéktesztekkel lehet legjobban megválaszolni. Az Nvidia illetékesei egy GeForce GTX 970-es és 980-as videokártyával is megnézték, hogyan alakul a teljesítmény, ha egy játéknak 3,5 GB-nál kevesebb fedélzeti memória is elegendő. Ezután a beállítások módosításával elérték, hogy az adott játéknak 3,5 GB-nál több fedélzeti memória kelljen, majd megismételték a teszteket. Az eredményeket az alábbi táblázat tárja elénk:

    A fentiek alapján a különbség nem drasztikus, de óriásiak lehetnek az eltérések játék és játék között, a fórumokon is beszámolnak ezeknél sokkal súlyosabb sebességcsökkenésekről. Igazából minden azon múlik, hogy mennyire kritikus adatok kerülnek az utolsó 500MB-ba, hiszen van, amihez ritkán kell hozzányúlnia a GPU-nak, ha sikerül a rendszernek jól elosztania a memóriába préselendő adatokat, akkor nem lesz baj. Ha viszont nem, akkor nem tehetünk mást, mint hogy megpróbáljuk úgy beállítani a játékunkat, hogy az ne menjen 3,5GB fölé. Szerencsére, mint az a fenti beállításokon is látszik, elég extrém szinten kell hajtani a mai játékokat, ha ilyen sok memóriát szeretnénk kihasználni, így valószínűleg keveseket érint majd a probléma.

    Egyes oldalakon feldobták azt is, hogy ez miatt késhet a GTX960 Ti, de szerintünk ez nem valószínű, mert az jó eséllyel olyasmi felépítést fog követni, mint a GTX970M, ami 192 bites memória elérést használ, így le van tiltva benne két memória-vezérlő és a hozzájuk tartozó ROP blokkok, tehát nincsenek osztozkodásos problémák. Valószínűleg a GTX970 esetében is csak a selejtarány javítása érdekében kényszerült az Nvidia arra, hogy letiltson egy részt az L2 gyorsítótárból. Furcsa memória kezelést egyébként nem most láthatunk először az Nvidiától. A GTX550 Ti anno 192 bites memória-adatsín mellé társított 1024MB-nyi memóriát, a GTX660 pedig 2GB-ot, mégis utóbbi a cég egyik legsikeresebb kártyája. Előbbinél valószínűleg nem akarták bevállalni, hogy 768MB-os legyen a kártya, amikor a konkurenciának 1GB-os kártyái voltak, és utóbbinál is ilyesmi állhat a háttérben, csak 1,5GB vs 2GB-tal.

Új hozzászólás Aktív témák