Keresés

Új hozzászólás Aktív témák

  • TESCO-Zsömle

    félisten

    válasz paprobert #47760 üzenetére

    És mire mész az irdatlan elméleti számítási teljesítménnyel? GCN végig verze a Maxwell-eket FP32-ben, aztán mire ment vele?

    Nem elméleti teljesítmény kell, hanem gyakorlati.

    [ Szerkesztve ]

    Sub-Dungeoneer lvl -57

  • do3om

    addikt

    válasz paprobert #47760 üzenetére

    Már késő variálni amire az általad leírtaknak ha utána mennének az az NV következő karijával kel szembe nézzen, szóval hozna 3090+50%-ot?
    Szóval mi adott? Az elmulasztott lehetőség, ennyi az adott volt.
    Persze bármi lehet még, van mihez nyúlniuk amihez szoktak ilyenkor feszültség, órajel kimaxolása, vízhűtés, kopra járatni, ami eddig jó azt elbaszni, és majd lehet otthon bűvészkedni hogy az legyen aminek kellet volna.

    Ha érdekel valami szerelési anyag írj privátot. Eladó Schneider Mágneskapcsoló 18,5kW/38A

  • Abu85

    HÁZIGAZDA

    válasz paprobert #47760 üzenetére

    Aztán kisebb gyártástechnológia, stb.

    Attól az RDNA2 nem lesz jobb, hogy beleraksz minden SIMD mellé egy plusz SIMD-et, ami mondjuk csak FP32-t tud akkor, és befogható ha éppen nincs függőség kódban. Az NV ezt azért csinálta meg, mert eleve volt egy int32 pipeline-juk, és onnan egyszerű volt az FP32-re való kiegészítés. De az AMD teljesen máshogy tervezte az RDNA2-t, minden SIMD-juk ugyanazt tudja, ugyanazokat az erőforrásokat érik el, ugyanúgy dedikált skalár ALU-juk van, stb. Nem nyernének igazán sokat a SIMD-ek puszta megduplázásával, mert ritkán lenne kihasználható.

    Arról nem is beszélve, hogy sokkal nehezebb programozni azokat a dizájnokat, amelyeknél az egyes feladatoknak eltérő pipeline-juk van a multiprocesszoron belül. Számításba kell venned, hogy mik az utilizációs limitek már a programkód szintjén. Például a GCN-t csak amiatt nehezebb programozni, hogy egy skalár ALU négy SIMD-et táplál. Nem is nagy különbség ez a hardver szintjén, mégis sokkal tovább tart optimalizálni rá egy shadert. A PS5-nél például arról beszélt Cerny, hogy egy hónapon belüli optimalizálás után lehet közel teljes sebességgel lehet működtetni a gépet. Ez nagyrészt annak köszönhető, hogy az RDNA sokkal könnyebben programozható, mint a GCN, sokkal kevesebb limitje van. A PS4-nél két hónapra is szükség volt a megfelelő sebesség eléréséhez. A PS5-nél eléggé tipikus, hogy elsőre megírsz egy shadert és máris marha jól fut, míg a PS4-nél ez elég ritka volt. Persze más architektúrákon lehet, hogy rossz lenne a teljesítmény, de nem érdekes a fejlesztőknek, mert RDNA van a gépben. Ha most ezt megtöröd mondjuk egy 16+16 co-issue-val, amit mondjuk be lehetne egyszerűen építeni, akkor pusztán a függőség problémájának megjelenése miatt a shaderek többsége 3-4 hónapnyi optimalizálást igényelni. Egyrészt hajlandóság nem lenne rá, már csak a konzolra írt kódok miatt sem, másrészt a feladat bizonyos shaderek esetén még megoldhatatlan is lenne.

    És akkor az AMD felteheti még azt a kérdést is, hogy mi van, ha a PC-be áthozzák a konzolos shadereket? Azokat a shadereket, amelyeket az RDNA-ra optimalizáltak, tehát kvázi lehet, hogy marhára szarul vannak megírva egy tipikus GPU-dizájnt tekintve, csak azért futnak jól, mert az RDNA rohadtul toleráns a rossz kódokkal szemben. Mi van akkor, ha a fejlesztők nem lesznek hajlandók 3-4 hónapig shadereket optimalizálni a PC miatt? Akkor egy 16+16 co-issue tök felesleges fícsőr lenne a következő RDNA-ban, mert szökőévente használható csak ki, rosszabb esetben csak akkor, ha a telihold éppen megvilágítja az AMD központjának bejárati ajtajának kulcslyukát.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák