- Az MSI RadiX AXE6600 tesztje – router, játékosoknak
- Windows 11
- Otthoni hálózat és internet megosztás
- YouTube
- Mikrotik routerek
- Telekom otthoni szolgáltatások (TV, internet, telefon)
- Sweet.tv - internetes TV
- Synology NAS
- Kodi és kiegészítői magyar nyelvű online tartalmakhoz (Linux, Windows)
- Facebook és Messenger
Új hozzászólás Aktív témák
-
Psych0
őstag
szimpi.
"As an online discussion grows longer, the probability of a comparison involving Nazis or Hitler approaches 1."
-
félisten
Ha a hasonló megoldások komolyabb mértékben is elterjednek, akkor az az AMD-nek jó kis lendületet adhat.
Már csak az a kérdés, hogy tudnának-e élni vele.
Ha jól tudom az tablet platformjukat sem tudják rendesen eladni, holott veri az atomot elég szépen.[ Szerkesztve ]
Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
-
félisten
De attól még a lefordított proginak lehet szüksége x86-ra.
Nem arról van szó, hogy teljes egészében OpenCL progi jön létre."a kód kijelölt, jól párhuzamosítható részeit áthelyezi a grafikus vezérlőn való feldolgozásra"
Ettől még lehetséges az is, hogy az egész a GPU-n fut, vagy támogatják az ARM-et is, de ezt nem tudjuk biztosan, vagyis 50% - vagy megy, vagy nem.
[ Szerkesztve ]
Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
-
Psych0
őstag
"De attól még a lefordított proginak lehet szüksége x86-ra."
A cikkben nem volt szó arról, hogy a nem GPU-n futó kód milyen architektúrájú CPU-ra fordul. Az az alátett c fordító dolga.
"As an online discussion grows longer, the probability of a comparison involving Nazis or Hitler approaches 1."
-
ZCoyote
őstag
Ezeket a híreket mindig jó olvasni csak már jöjjenek azok a programok amik ki is használják a GPU erejét.
Romani ite domum.
-
Abu85
HÁZIGAZDA
Lehetséges, hogy a teljes C++ kód csak GPU-n fusson, hiszen itt is ez történik lényegében. Az algoritmus teljes egészében a GPU-n fut. De ez csak példaprogram, ami azért fontos.
Tulajdonképpen az x86/AMD64/ARM tök mindegy. Ha van C++11 fordító, akkor megy. Gyakorlatilag ez egy teljesen szoftveres megoldás. A működéshez OpenCL drivert követel és kész.A CUDA is tud x86 nélkül futni. Egy host processzor kell neki. Mindegy, hogy milyen architektúrára épül, mert a támogatást egyszerű beépíteni. A CUDA és az x86 viszonya csak később lesz gond, mert az NV az ARM mellé kötelezte el magát, vagyis előbb utóbb a GPU-kat is ARM-hoz igazítják. Innentől kezdve, ha nem ARM CPU a host, akkor a GPU kevesebb fícsőr mellett dolgozhat.
De a CUDA gondja a konzumer rétegen nem ez, hanem az, hogy kevés fejlesztő akar 15%-os piaci részesedésre programot írni. Az OpenCL-lel eközben a teljes piacot elérhetik az alkalmazásukkal. Erre az NVIDIA a CUDA 5-ben reagált, és lecsupaszították az SDK OpenCL részét. Az OpenCL Zone is eltűnt az NV direkten linkelt oldalai közül. A Google-lel még meg lehet találni, de csupán ennyi lett belőle: [link] , pedig régen ennyi volt ott: [link] - kicsit várni kell és behozza a cache-ből a szeptember elejei állapotot. Túl gyorsan nő az OpenCL. Ma már a direkt támogatással azt kockáztatják, hogy kivégzi a CUDA-t. Így viszont a fejlesztők fenyegetik őket, hogy AMD-re váltanak, ha nem változtatnak a politikájukon: Better to focus on OpenCL than CUDA. Nvidia has the best OpenCL right now and we use this for all our own applications development, and steer all our industrial partners this way. If Nvidia starts to de-prioritise OpenCL we’ll have to look at using AMD’s GPUs instead. - Simon McIntosh-Smith - Ehhez hasonló vélemények vannak most. Itt egy petíció ezzel kapcsolatban: [link] - írjátok alá, hátha hat. Persze kérdéses, hogy hat-e, mert az NVIDIA-nak nem üzleti érdeke az OpenCL erősítése. Főleg nem úgy, hogy látják a GCN milyen gyors benne.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
PPatrik
aktív tag
Ez tetszik, majd lehet megnézem magamnak.
-
wad
tag
funkciósablon
Juj.
-
VaniliásRönk
nagyúr
Te is fiam Brutus?! 100%-osan semmilyen valós alkalmazás sem tudja kihasználni a GPU-kat. SETI@Home OpenCL is átlag 50-60% körül terheli az IGP-t, pedig a ZeroCopy még mindig sokkal gyorsabb mint a PCI-E, és ezzel rögtön meg is magyarázatuk a problémát. Nem mintha ez bárkit is meglepetésként kéne hogy érjen...
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
Mögle
csendes tag
+1
http://openclnews.com/apps/P60
OpenCL-t használó alkalmazások. 4 oldal (20 app/lap). Itt az „alkalmazások” közé veszik az SDK-kat, debuggereket, benchmarkokat és hasonló kellékeket, ha ezeket nem számítjuk akkor kb. 2 oldal. Ezt még lehet redukálni ha elhagyjuk az olyan programokat mint a wifi jelszótörő vagy az olyan vicc kategóriás alkalmazásokat mint az AVIVO vagy a WinZip (bár lehet hogy valakinek pont arra van szüksége hogy nem túl jó minőségű videókat állítson elő gyorsan vagy hogy mp3-makat meg jpg-ket tömörítsen nagyon gyorsan ). Nem tudom ez a lista mennyire teljes, de 4 év alatt ez a mennyiség szerintem nem éppen bőséges. Lehet hogy mérnöki/tudományos alkalmazások területe pezseg az OpenCL-től, de mezei felhasználó túlságosan sokat nem profitál belőle és ilyen szempontból (általános célú felhasználás) a felhasználónak csak annyit ér amennyit a matrica a videokártya doboz oldalán.
4 éve vettem egy 4870-et azóta is azt használom. Már akkor is az volt a szlogen hogy jönnek majd a általános célú GPU-t kihasználó alkalmazások, de azóta is jönnek. Remélem most már tényleg Szívesen látnék mondjuk egy x264-et ami nem csak baseline h264-et produkál mint a többi hasonló encoder vagy mondjuk egy olyan transzparens fájlrendszer szintű tömörítést ami on-the-fly tömörít mondjuk lzma2-be. Archiválást megkönnyítené és lerövidítené, biztos nem lenne olyan tömörítési hatásfoka mintha az egész be lenne tarolva és úgy rá az xz-t de biztosan nagyobb lenne mint egy lzo-nak vagy egy deflated zip-nek. Ja meg közben enkriptálhatna is -
dezz
nagyúr
válasz VaniliásRönk #19 üzenetére
Amíg nem közös címtérben dolgoznak (ez majd a köv. generációban valósul meg), addig a RAM-on belül is másolgatni kell a CPU és az IGP memóriaterülete között. Lehet, erre gondoltál, mindenesetre ez a Trinity esetén 18 GB/s-os tempóban valósul meg (1866-os memóriával), ami kicsivel több, mint 2x a PCIe 8 GB/s-éhez képest, de azért villámgyorsnak nem nevezhető. Bár kisebb csomagok másolgatásánál jól jön a jóval kisebb késleltetés, azért van hova fejlődni.
Nem tudom, hol van az előírva, hogy a SETI@home terhelését nem lehet felülmúlni, de számoljunk akkor 60%-kal. A Trinity CPU-s SP peakje (FMA-s kóddal) azt hiszem 121 GFLOPS. Az IGP-jéé pedig úgy 600 körül van, ennek 60%-a 360, ami így is 3x annyi, mint amit CPU-ból tud...
De ez még nem is mutat meg mindent! Ebben a tesztben pl. 20-75x gyorsulásokat mértek, még a Llanóval:
Can OpenGL And OpenCL Overhaul Your Photo Editing Experience?
(#20) Mögle: Elkerülhetetlen, hogy alaposan ráfeküdjenek a fejlesztők erre a témára, mert az elkövetkező pár évben a CPU oldalon csak ilyen 10-20%-os gyorsulások lesznek (AMD-nél több, de az arra kell hogy felzárkózzon az Intelhez)... Márpedig az eladások fenntarthatóságát meg kell alapozni valamivel. Ez most az IGP fejlesztése, így annak kihasználását a procigyártók (még az Intel is) külön támogatni fogják (ill. AMD már most is). De ez a fejlesztők jelentős részének a saját elemi érdeke is.
És nekem úgy tűnik, hogy a lassú felvezetés után éppen most indul be egyre jobban a GPGPU-sítás. Az exponenciális függvény is így szuperál...
[ Szerkesztve ]
-
#10691584
törölt tag
Kezdetnek nem rossz, csak tényleg haladjunk már valamerre mert herevere éra van 2008 óta.
-
Löncsi
őstag
válasz VaniliásRönk #19 üzenetére
SETI 99% GPU terhelést ad...
Elvették a radírját, azt az egész élete egy nagy kompenzálás, hogy ő igenis kan és igenis 2 méteres a fallosza - by stranger28
-
VaniliásRönk
nagyúr
Pontosan erre gondoltam, a ZeroCopy-nak pedig a késleltetése az igazi előnye, a sávszélességnek nem igazán van jelentősége, mert a software-ek a legritkább esetben másolgatnak GB-os adatcsomagokat.
Itt a világfájdalomnak az az oka, hogy a CPU<->GPU adatcsere miatt egy jól megírt program sem tudja teljes mértékben kiaknázni a GPU-k erejét, rosszul megírt programokról meg ne is beszéljünk. Pláne hogy olyanból sincs túl sok egyelőre.
Ezen a problémán ahogy írod is csak a Kaveri fog segíteni, ezért nem is gondolkodtam igazán a Llano Trinityre cserélésén, majd ha jön az utód az FM2+ alaplapokkal egyetemben.
A képekkel való bohóckodás radikális gyorsulása szép, csak nagyon nem jellemző más alkalmazási területekre, hogy van egy viszonylag kis méretű adatcsomagod, ami a számításokhoz szükséges memóriaterülettel együtt sem haladja meg a GPU VRAM-ját, ráadásul az elvégzendő számítások nem függenek semmilyen külső változótól, sem pedig egymástól és egytől egyig képesek lefutni a SP-okon.
Egyébként legyen igazad a GPGPU felfutásáról, részemről nincs ellenvetés. Bár én nem bízok a programozókban ennyire, eddig is elemi érdekük lett volna megtanulni többszálúsítani, dehát a többségnek mégsem jött össze. (hozzátenném a programozó is csak ember, senki sem különb)
#23 Löncsi: Csúcsterhelésben igen, de nem átlagban, legalábbis nem az ATi OpenCL kód a Llanómon.
[ Szerkesztve ]
"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
-
ZCoyote
őstag
Tudom, azért írtam, hogy sajnáljanak
dezz: Valami videó kódoló szoftver volt, a nevét már nem tudom. Azt tudom, hogy az oldalán azt hirdette, hogy használja a gpu-t így lerövidítve a kódolás idejét.
Nem írtam, hogy mind olyan.
Mindössze azt szeretném, hogy a "normál" felhasználói programok között legyen minél több olyan ami ténylegesen kihasználja a gpu erejét.
[ Szerkesztve ]
Romani ite domum.
-
dezz
nagyúr
válasz VaniliásRönk #24 üzenetére
Egyébként most lehetséges olyan, hogy fut egy kernel és közben ki-be másolgatunk a memóriaterületéről? Csak mert ugye jelenleg a másik probléma a kernelek inditási késleltetése, amin a HSA fog segíteni (többek között).
Mondjuk ezek már azért igen összetett algoritmusok és programok, ahol ennyire összedolgozik a CPU és az IGP. A legtöbb mai kódban egy nagyobb blokkban megkapja az IGP az összes adatot és nekiállhat a melónak. Aztán amikor kész, visszaadja az eredményeket szintén egy kisebb-nagyobb blokkban.
Szerintem ezeknél a nagy gyorsulásoknál csak a belső cache-ekben dolgozik... (Csak a művelet elején olvassa be az aktuális képrészletet és írja ki a végén az eredményt a RAM-ba.)
Azért a fontosabb programok többségében, ahol kvázi létkérdés a többszálúsítás, ez már megtörtént.
-
lenox
veterán
Azert azt tegyuk hozza, hogy azota mar pcie 3.0 is van, ami kb. duplazza a sebesseget, szoval kb. ott van akkor, mint a trinity. Meg amugy mar regen nem kell masolni, el tudja erni a cpu memoriat a gpu apuknal is es diszkret kartyaknal is, a latency a fo kulonbseg, ami alkalmazastol fuggoen erdekes vagy nem.
#26: Igen, lehet memoriat masolni mikozben a kernel fut, sot nv quadroknal egyszerre mindket iranyban is lehet adatot kuldeni, mikozben a kernel fut.
[ Szerkesztve ]
-
lenox
veterán
Nem probaltam, de az amd opencl guide szerint pinned host memoryt a gpu direct accessel (tehat nem transfer) 5.5 GB/sec-kel tud olvasni, es 3.7 GB/sec-kel irni. A transfer sebessege mindket iranyban 6.4 GB/sec. Ezek az ertekek nyilvan pcie 2.0 vannak, es ezek nem az elmeleti maxok, hanem a valos elerheto sebesseg.
-
Z10N
veterán
Nem fuzodik szorosan a temahoz:
1) Kiprobaltam a winzip16.5-t (OpenCL gyorsitast bepipaltam) es 0%-t hasznalt a GPU-bol. Raengedtem egy 2GB-os .mp4 videora, de semmi azon kivul, hogy a 4 core-bol kettot hasznalt teljesen (miert nem mind a 4-t?).
2) Aminel viszont mukodik ott meg olyan problemam van, hogy jelen esetben van egy HD6850 (960spu) es egy HD4200 IGP (40spu) es OpenCL alkalmazasoknal sehogy se tudom rabirni, hogy mindkettot kihasznaljak egyszerre (1000spu). Szoval vagy 4core+960spu vagy 4core+40spu, a 4core+40spu+960spu nem mukodik.
3) Korabban emlitetted, hogy az eyefinity-nel 3 kijelzon extended modeban csak a kozepso monitoron gyorsitja a video-t a GPU driverbol es hogy win8-nal (WDDM1.2) ezt mar megoldottak, hogy mindegyiken legyen DXVA. Mit kene atallitani win7 alatt, hogy mukodjon?
ui: A legujabb AMD OpenCL SDK fent van.
[ Szerkesztve ]
# sshnuke 10.2.2.2 -rootpw="Z10N0101"
-
Abu85
HÁZIGAZDA
A WinZip 16.5 az APU-ra van tervezve. Azzal tudsz lényegi gyorsulást elérni. Dedikált GPU-nál függ a gyorsulás attól, hogy mit tömörítesz be.
Persze, hogy nem bírod működésre bírni ezt a két hardvert egyszerre. Vagy az egyikhez tölti be a drivert, vagy a másikhoz. Nem ugyanazt a meghajtót használják.
Win 7-en ebből sosem volt probléma. Win 8-on az volt a baj, hogy az MS is rakott a rendszerbe egy olyasféle kijelzőkezelőt, ami több kijelzőt szabadabban konfigurálja. Ezzel viszont az a baj, hogy csak az első kijelzőn aktív a GPU-s gyorsítás. Az Eyefinity és a Surround eleve úgy működik, hogy, ha létrehozol egy ilyen munkaasztalt, akkor azt egy asztalként fogja kezelni. Ezt csinálja az AMD a Windows 8-ban is, és feltételezhetően az NV is meg fogja így oldani, legalábbis technikai oldalról kivitelezhető.
Az Eyefinity-t úgy állítsd be, hogy egy asztalként legyen kezelve a driveren belül. Ekkor mindegy, hogy hol van a tartalom a gyorsítás aktív lesz. Természetesen a kijelzőket csak a VGA-ra kösd.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
MASSlag
tag
Nem olyan kevés az a 20-40%. Hybrid Path-al Luxrender 2-szer gyorsabb 7950-el, mint 3770k-val, pedig a kártya ~30%-ra van terhelve. A V-ray vagy az Indigo is hasonlóan fut.
Az igazi egy full GPU-s OpenCL render engine lenne. Viszonyítás képen Blender CUDA-s GPU rendererje 40 mp alatt végez azzal amivel egy 3770k kb. 4,5 perc alatt, Nvidia-n hasonlóan megy OpenCL-el is, de AMD-n nem működikA bizonyíték hiánya nem a hiány bizonyítéka
-
Z10N
veterán
Ertem, majd meg kiprobalom. Esetleg lesz majd ilyen hybrid mod? Abbol feltetelezem, hogy APU melle is lehet rakni dedikalt vga-t, akar laptop/desktop (dual/cfx). Igen egy win8-as hirbol remlett, de akkor felreolvastam. Persze, csak a 6850-re vannak rakotve (mDP-aDVI/HDMI/DVI), egyedul a TV van rakotve a HD4200 HDMI-re. Most extended modba van igy tudom dedikalni a folyamatokat kijelzokent. Koszonom a valaszt. #32: Szinten.
# sshnuke 10.2.2.2 -rootpw="Z10N0101"
Új hozzászólás Aktív témák
- GAINWARD RTX 3070 8GB GDDR6 PHOENIX Eladó! 125.000.-
- KFA2 GeForce RTX 3050 EX OC 8GB GDDR6 Videokártya - Számla + Garancia, Ár alatt! BeszámítOK!
- ASUS GeForce RTX 3070 Ti 8GB OC GDDR6X 256bit Amazon Garanciával
- ZOTAC RTX 3070 8GB GDDR6 Twin Edge OC Eladó! 118.000.-
- Keresem - Gigabyte GeForce GTX 980 G1 Gaming