Keresés: - AMD GPU-k jövője - amit tudni vélünk

Legfrissebb anyagok

IT café témák

PROHARDVER! témák

Mobilarena témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Téma összefoglaló

Utoljára frissítve: 2017-08-30 10:47

IT café

A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!

Új hozzászólás Aktív témák

#37362 lezso6 HÁZIGAZDA #45185024 #37361

Új Válasz 2018-11-08 17:46:24 #37362
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz #45185024 #37361 üzenetére

Ja, hát a lényeg az, hogy az új Vega 20 alapú Instinct kártyákkal teljes compute piacot célozzák, mert ki***** sokoldalú és univerzális az új ISA. A fő újítás ugye az 4 elemű INT8 illetve a 8 elemű INT4 vektorpátok dot productja (skaláris szorzata), azaz két vektorból csinál egy skalárt.
De ezek már a P100 utáni Pascaloknál már megvolt az INT4 kivételével, szóval az AMD nem talált fel semmit. Ugye P100-nál csak FP16 "dot product" van, de fix funkciós hardverrel, amit Tensornak hívnak. A Turing pedig behozta a Tensor magokba az INT8 és INT4 "dot product" támogatást is.
A Tensornál azért az idézőjeles "dot product", mivel csak be van égetve, önmagában csak dot productot nem tud, legalábbis nagyon nem hatékony a feladatra. A Tensor annyit csinál, hogy összeszoroz 2 db 4x4-es mátrixot és az eredményül kapott 4x4 mátrixhoz hozzáad egy harmadik 4x4-est, effektíve "mátrixos FMAC".
Ez mátrixok esetén baromi hatékony. Azonban a fentiből az is következik, hogy ha te 16 pár teljesen független vektorból akarsz csinálni 16 db dot productot, akkor cseszheted, mert 64-et kapsz, azaz az eredmények 3/4 része kuka, felesleges.
Bár ilyen szituáció nem tudom hol van, azaz amikor a dot productot nem mátrixszorzásra használod, hanem önmagában. Szóval az AMD-s előny valószínűleg nem ér semmit. S fontos adalék, hogy a Vega 20 INT4 dot productja csak 8x8 mátrixon alkalmazható, 4x4-es mátrixon nem, ellentétben a Turinggal.
Szóval összefoglalva az van, hogy az AMD a vektorfeldolgozásra gyúrt rá, míg az NV a mátrixra. Már megint két külön irányban megy a fejlesztés.

[ Szerkesztve ]

A RIOS rendkívül felhasználóbarát, csak megválogatja a barátait.

Új hozzászólás Aktív témák

Téma tudnivalók

A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!

MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!

A topik témája:

Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.

Aktív témák

Hirdetés

Új prémium hirdetések

Új ingyenes hirdetések

IT café - infotech fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

GAMEPOD.hu - játék fórumok

LOGOUT.hu - lépj ki, lépj be!

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Kezdő blokk

Új hozzászólás Aktív témák

Új hozzászólás Aktív témák

IT café - infotech fórumok

Mobilarena - mobil fórumok

PROHARDVER! - hardver fórumok

GAMEPOD.hu - játék fórumok

LOGOUT.hu - lépj ki, lépj be!

FÁRADT GŐZ - közösségi tér szinte bármiről

Blokkméret

Rendezés

Kezdő blokk

Hird﻿etés

Hirdetés