Keresés

Új hozzászólás Aktív témák

  • válasz #45185024 #37361 üzenetére

    Ja, hát a lényeg az, hogy az új Vega 20 alapú Instinct kártyákkal teljes compute piacot célozzák, mert ki***** sokoldalú és univerzális az új ISA. A fő újítás ugye az 4 elemű INT8 illetve a 8 elemű INT4 vektorpátok dot productja (skaláris szorzata), azaz két vektorból csinál egy skalárt.

    De ezek már a P100 utáni Pascaloknál már megvolt az INT4 kivételével, szóval az AMD nem talált fel semmit. :D Ugye P100-nál csak FP16 "dot product" van, de fix funkciós hardverrel, amit Tensornak hívnak. A Turing pedig behozta a Tensor magokba az INT8 és INT4 "dot product" támogatást is.

    A Tensornál azért az idézőjeles "dot product", mivel csak be van égetve, önmagában csak dot productot nem tud, legalábbis nagyon nem hatékony a feladatra. A Tensor annyit csinál, hogy összeszoroz 2 db 4x4-es mátrixot és az eredményül kapott 4x4 mátrixhoz hozzáad egy harmadik 4x4-est, effektíve "mátrixos FMAC".

    Ez mátrixok esetén baromi hatékony. Azonban a fentiből az is következik, hogy ha te 16 pár teljesen független vektorból akarsz csinálni 16 db dot productot, akkor cseszheted, mert 64-et kapsz, azaz az eredmények 3/4 része kuka, felesleges.

    Bár ilyen szituáció nem tudom hol van, azaz amikor a dot productot nem mátrixszorzásra használod, hanem önmagában. Szóval az AMD-s előny valószínűleg nem ér semmit. S fontos adalék, hogy a Vega 20 INT4 dot productja csak 8x8 mátrixon alkalmazható, 4x4-es mátrixon nem, ellentétben a Turinggal.

    Szóval összefoglalva az van, hogy az AMD a vektorfeldolgozásra gyúrt rá, míg az NV a mátrixra. Már megint két külön irányban megy a fejlesztés. :D

    [ Szerkesztve ]

    A RIOS rendkívül felhasználóbarát, csak megválogatja a barátait.

Új hozzászólás Aktív témák