Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz lenox #47 üzenetére

    Az egész Tensor lényege a dot product. Gyakorlatilag 4x4x4-es tömb hardverbe ágyazva, és a feldolgozók ezen a tömbön csinálnak FP16-os FMAC-t. Vektor formában ez ugye több FP16-os dot productnak fogható fel.

    Tőlem odaírhatjuk, csak nem igazán fedi a valóságot, mert utasítás szintjén csak FMAC van és nem mátrix, utóbbi a struktúrából jön, és nem az utasításból.

    A Tensort a fentiek miatt érdemes leválasztani, és az NV is külön közli az FP16-os eredményt és a Tensor eredményeket. Pontosan azért, mert ha a kód nem megfelelő, vagy az API nem is támogatja (ami a legtöbb szabványos API-nál jellemző), akkor a Tensor hardver csak díszítés.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák