- Sokat fogyaszt az AI, egyre több az adatközpont, kell az atomenergia
- Windows 10
- SkyShowtime
- Crypto Trade
- A franciáknak elege van abból, hogy minden gyerek mobilozik
- Letartóztatták a bitcoin-Jézust
- Milyen routert?
- Súlyos adatvédelmi botrányba kerülhet a ChatGPT az EU-ban
- Kínai cégek segítik ezentúl a Teslát, a Renault-t, a Hyundait és a Toyotát
- Zyxel NAS326
Új hozzászólás Aktív témák
-
dezz
nagyúr
válasz VaniliásRönk #19 üzenetére
Amíg nem közös címtérben dolgoznak (ez majd a köv. generációban valósul meg), addig a RAM-on belül is másolgatni kell a CPU és az IGP memóriaterülete között. Lehet, erre gondoltál, mindenesetre ez a Trinity esetén 18 GB/s-os tempóban valósul meg (1866-os memóriával), ami kicsivel több, mint 2x a PCIe 8 GB/s-éhez képest, de azért villámgyorsnak nem nevezhető. Bár kisebb csomagok másolgatásánál jól jön a jóval kisebb késleltetés, azért van hova fejlődni.
Nem tudom, hol van az előírva, hogy a SETI@home terhelését nem lehet felülmúlni, de számoljunk akkor 60%-kal. A Trinity CPU-s SP peakje (FMA-s kóddal) azt hiszem 121 GFLOPS. Az IGP-jéé pedig úgy 600 körül van, ennek 60%-a 360, ami így is 3x annyi, mint amit CPU-ból tud...
De ez még nem is mutat meg mindent! Ebben a tesztben pl. 20-75x gyorsulásokat mértek, még a Llanóval:
Can OpenGL And OpenCL Overhaul Your Photo Editing Experience?
(#20) Mögle: Elkerülhetetlen, hogy alaposan ráfeküdjenek a fejlesztők erre a témára, mert az elkövetkező pár évben a CPU oldalon csak ilyen 10-20%-os gyorsulások lesznek (AMD-nél több, de az arra kell hogy felzárkózzon az Intelhez)... Márpedig az eladások fenntarthatóságát meg kell alapozni valamivel. Ez most az IGP fejlesztése, így annak kihasználását a procigyártók (még az Intel is) külön támogatni fogják (ill. AMD már most is). De ez a fejlesztők jelentős részének a saját elemi érdeke is.
És nekem úgy tűnik, hogy a lassú felvezetés után éppen most indul be egyre jobban a GPGPU-sítás. Az exponenciális függvény is így szuperál...
[ Szerkesztve ]
-
dezz
nagyúr
válasz VaniliásRönk #24 üzenetére
Egyébként most lehetséges olyan, hogy fut egy kernel és közben ki-be másolgatunk a memóriaterületéről? Csak mert ugye jelenleg a másik probléma a kernelek inditási késleltetése, amin a HSA fog segíteni (többek között).
Mondjuk ezek már azért igen összetett algoritmusok és programok, ahol ennyire összedolgozik a CPU és az IGP. A legtöbb mai kódban egy nagyobb blokkban megkapja az IGP az összes adatot és nekiállhat a melónak. Aztán amikor kész, visszaadja az eredményeket szintén egy kisebb-nagyobb blokkban.
Szerintem ezeknél a nagy gyorsulásoknál csak a belső cache-ekben dolgozik... (Csak a művelet elején olvassa be az aktuális képrészletet és írja ki a végén az eredményt a RAM-ba.)
Azért a fontosabb programok többségében, ahol kvázi létkérdés a többszálúsítás, ez már megtörtént.
Új hozzászólás Aktív témák
- Autós topik látogatók beszélgetős, offolós topikja
- Gitáros topic
- A fociról könnyedén, egy baráti társaságban
- ASZTALI GÉP / ALKATRÉSZ beárazás
- Milyen belső merevlemezt vegyek?
- Moderátort keresek a fórumhoz!
- nVidia tulajok OFF topikja
- Autóápolás, karbantartás, fényezés
- Kerékpárosok, bringások ide!
- Sokat fogyaszt az AI, egyre több az adatközpont, kell az atomenergia
- További aktív témák...
- Újszerű - POWERCOLOR Radeon RX 5500 XT 8GB GDDR6 VGA videókártya
- Geforce GT 730 -4 gb videokártya
- Hibátlan - PALIT GTX 1650 StormX 4GB GDDR5 VGA videókártya - tápcsatlakozó nélküli !!!
- ELADÓ 32 DB Nvidia RTX 3060 Ti és 8 DB Zotac Gaming Geforce RTX 3080 Trinity / KOMPLETT BÁNYAGÉP
- 10x R5 430 2GB DDR5 egybe (zörgő ventis)