- Gigantikus chipgyárat vihet az Egyesült Arab Emírségekbe a TSMC és a Samsung
- Öt Starship után embereket küldene a Marsra Musk és a SpaceX
- Óriási trösztellenes botrány lenne, ha a Qualcomm megvenné az Intelt
- AI segítségével csábítanák el a nagy cégek szakembereit
- Gondoskodik róla az EU, hogy az Apple felnyissa a rendszereit
- AliExpress tapasztalatok
- Gigantikus chipgyárat vihet az Egyesült Arab Emírségekbe a TSMC és a Samsung
- Gondoskodik róla az EU, hogy az Apple felnyissa a rendszereit
- Asustor NAS
- Otthoni hálózat és internet megosztás
- Öt Starship után embereket küldene a Marsra Musk és a SpaceX
- Netflixesedik a YouTube, AI gyárt rá videót
- Amazon
- Videó stream letöltése
- Óriási trösztellenes botrány lenne, ha a Qualcomm megvenné az Intelt
-
IT café
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
válasz paprobert #47757 üzenetére
Nem hiszem, hogy így lesz. A dizájnoknál nagyon számít, hogy miképpen tervezed meg a multiprocesszort. Az AMD esetében az RDNA-val a nagyon magas utilizációra ment, tehát mindegy, hogy milyen kódot adsz neki, mindig magas hatékonysággal fog futni a multiprocesszoron. Ezt teljesen értelmetlen lenne trükközésbe elvinni, mert kódfuttatás hatékonysága eleve kiemelkedően magas.
A Turing például eléggé olyan dizájn volt, ahol nem volt mindegy, hogy milyen kódot adsz a multiprocesszornak. Ha csak FP32 operációt tartalmazott, akkor csak a feldolgozók egy kisebb részé működött, csak Int32-vel egy másik kis része, csak Tensorral egy harmadik kis része. Tehát ahhoz, hogy elérj egy nagy hatékonyságot, rendkívül specifikus kódokat kellett neki adni. Arról nem is beszélve, hogy a Turing közel sem kezeli annyira jól a késleltetésre optimalizált kódokat, mint az RDNA.
Az Ampere ezen a dizájnon nem igazán változtat, de hoz be némi trükközést. Az R600 az egyik legjobb példa erre még ma is az 1+1+1+1+1 co-issue móddal. Ezzel öt teljesítményszint volt megkülönböztetve papíron, és a kódok tipikusan 40-80% közötti utilizációval mentek. Tehát bizony volt olyan kód, ami a rendelkezésre álló 320 FP32-ből 80-at használt csak, és volt olyan is, ami mindent bevetett. És a nagy átlagban köptek egy 2/3-os kihasználást, némelyik program ez alattit, némelyik fölöttit. A trükközésnél tehát nem is az a lényeg, hogy jó legyen az utilizáció, mert azt már feladtad magával a dizájnnal. Az a fontos, hogy minél több olyan kódot találj, ahol a dizájn hátrányos részein elvesztett teljesítményt visszahozod.A fentiek miatt az RDNA nem igazán tud elmenni ilyen irányba, mert nincs mit visszahozni. Arra épül fel az egész architektúra, hogy még a számára legrosszabb kódokat is gyorsan feldolgozza.
Ezek akkor eredményeznek egyébként nagy különbségeket, ha csak valami szintetikus mérést nézel, de egy gyakorlati programban azért van nagyon-nagyon sok shader, vagyis a kódok jellege is rendkívül eltérő, tehát a kódok egy része ugyan lassan fog futni az Ampere-en, de egy másik részük meg nagyon gyorsan, és hasonlóan, ahogy az R600 vs. G80 esetében a különbségek kiegyenlítik egymást. Mert ugye a G80 ott volt az R600-on közel harmadannyi feldolgozóval is.(#47758) Petykemano: A GCN-nek nem volt semmi ilyen probléma. Ott a konkurens wavefrontokkal kellett sokat játszani. Az RDNA erre vezetett be kétféle módot.
Hát nagyon sokban, de ezt pont ebben a hsz-ben leírtam. Az RDNA tipikusan egy olyan dizájn, ami arra készült, hogy bármilyen kóddal magas legyen az utilizáció, míg az Ampere pont az ellentétes irányba mozdul, de cserébe sok az ALU, illetve hát ebből következnek az utilizációs limitek is.
Az egy csomagolási technika. Nincs igazán köze az FP32-es trükkökhöz.
A CDNA az compute dizájn.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Samsung Galaxy S23 és S23+ - ami belül van, az számít igazán
- Milyen videókártyát?
- Azonnali informatikai kérdések órája
- Kompakt vízhűtés
- Lexus, Toyota topik
- A Xiaomi 14T-k már töltő nélkül érkezhetnek
- AliExpress tapasztalatok
- Azonnali notebookos kérdések órája
- Gigantikus chipgyárat vihet az Egyesült Arab Emírségekbe a TSMC és a Samsung
- Milyen okostelefont vegyek?
- További aktív témák...
- ZOTAC RTX 3070 8GB GDDR6 AMP HOLO Eladó! 107.000.-
- Nvidia Quadro P400/ P600/ P620/ P1000/ T1000 - Low profile (LP) + P2000 5Gb, RTX 4000 8Gb
- Pcie 5.0 ATX 3.0 12Pin - 16Pin Moduláris Tápkábelek És Adapterek 12VHPWR Egyedi Harisnya Nvidia
- Geforce GT 520 1GB Videokártya
- nVidia GIGABYTE GeForce RTX 3080 OC 10GB VISION videókártya
Állásajánlatok
Cég: Ozeki Kft
Város: Debrecen
Cég: Ozeki Kft
Város: Debrecen