Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Reggie0 #6 üzenetére

    Ez nem arról szól, hogy szarul van implementálva, hanem arról, hogy mennyi adatot tesz a játék host-visible memóriatípusba. Korábban a 256 MB-ba fixen bele kellett férni. Ma már nem nagyon törődnek ezzel, mert egyrészt nem tudnak beleférni (10 éve még nyilván ment, de már 2021-et írunk), másrészt van megoldás a problémára.

    A probléma alapvetően az, hogy ha nem férsz bele a 256 MB-ba, akkor azt kell csinálni, hogy a rendszermemóriában kell allokálni egy akkora szeletet, amelybe belefér a szükséges adat. Mondjuk 500 MB-ot. Ez belekerül egy host-visible flages host-coherent memóriatípusba, amit a CPU tökéletesen tud kezelni, de a GPU-ba el kell juttatni. Ez rögtön nem olyan egyszerű, mert amit tárolsz adatot a rendszermemóriában, az nem kompatibilis a VRAM-on belüli, eszközlokális flages memóriatípussal. Tehát mielőtt másolod ezeket az adatokat a VRAM-ban, át is kell konvertálni, ami extra CPU-időt és memóriát igényel, és csak a maradék mehet a GPU-oldali 256 MB-ba, ami belefér. Tehát az adat mindenképpen ott lesz azoknál a játékoknál is a GPU memóriájában, amelyek nem férnek bele a 256 MB-os limitbe, csak szükség van hozzá egy rakás konvertálásra és adatmásolásra.

    Ha viszont a GPU teljes eszközlokális flages memóriatípusa egyben host-visible és host-coherent, akkor az egész munka teljesen felesleges, mert minden adat befér, így a PCI Express interfész is sokkal kevésbé van megterhelve, ahogy semmiféle adatkonverzió nem szükséges. Utóbbi viszont inkább csak elmélet, azok a cégek meg tudják így csinálni, amelyek egyszerre CPU-t és GPU-t is gyártanak, hiszen a mikrokód szintjén tudják módosítani a CPU működését, hogy az egyszerűen elfogadja a GPU-side adatokat. Ez az, ami az NV implementációjából hiányzik. A GeForce-ok más GPU oldali kódolással dolgoznak, mint a Radeonok, így ezeket nem kezeli direkten egy mikrokód, vagyis a meghajtónak kell egy konverziót elvégezni hozzá, ami sebességvesztést okoz, és ez tényleg nem egyszerű feladat. A megoldás az lenne, hogy az Intel és az AMD is kiadjon egy módosított mikrokódot, de ha eddig nem tették meg, akkor már nem fogják, egyszerűen nincs különösebb hasznuk belőle, ha az NVIDIA is 7-17%-okat gyorsul az új játékokban egy ReBAR implementációból.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Reggie0 #8 üzenetére

    Az okoz gyorsulást, hogy ma már 2021-et írunk, és baromira kevés a 256 MB-os limit. Egyszerűen a játékok bonyolultabbak, mint tíz éve. Vannak még olyan cégek, amelyek elavult motort használnak, de nem ez a jellemző. És ha megnézed mondjuk az új motorokat, például az Unreal Engine 5-öt, akkor ott már nagyon-nagyon szűkös a 256 MB.

    A konverzió elkerülése csak egy implementációs tényező. Az elsődleges gond a 256 MB-os kapacitás szűkössége. A másodlagos az, ha ezt javítod azzal, hogy a teljes VRAM-ra lehozod a BAR-t, de közben a mikorkód nem tudja kezelni a GPU memóriakódolását. Utóbbi kell ahhoz, hogy gyors is legyen a ReBAR implementáció, ne csak sok memóriát adjon. Ezért tartott ennyire sokáig implementálni a rendszert, holott a szükséges alap azért már évek óta létezik.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Reggie0 #10 üzenetére

    Ha beférsz a 256 MB-ba, akkor igazából nincs szükség a ReBAR-ra. A probléma, hogy egy mai modern motornak már ebbe a kapacitásba nem tud beleférni. Ez van, eltelt 10 év, és nem tudunk mit kezdeni a problémával, hacsak nem tesszük az egész VRAM-ot host-visible memóriatípussá. A jelenlegi helyzet ennyire egyszerű. Az más kérdés, hogy ennek a hatékony implementációja platformszintű, tehát csak azok a cégek tudnak igazán mit kezdeni a problémával, amelyek CPU-t és GPU-t is kínálnak.

    Nem ez marad egyébként az egyetlen platformszintű fícsőr a jövőben, az AMD már kettő újon dolgozik, amik Ryzen+Radeon szinten működnek csak, és nyilván az Intel is le tudja ezeket majd másolni Core+Arc szinten. Az NV-nek innentől kell majd egy processzor, tehát ütniük kell a Microsoftot, hogy a Windows licencelését gondolják át az ARM-ra.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák