Legfrissebb anyagok

IT café témák

PROHARDVER! témák

Mobilarena témák

GAMEPOD.hu témák

LOGOUT.hu témák

Új hozzászólás Aktív témák

#1 polika senior tag

Új Válasz 2013-11-15 13:17:37 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

polika

senior tag

A HSA/hUMA-hoz képest ez az NV saját megoldása miben lesz más? Ahogy nézem hardveresen egy irányba konvergál a történet, hogy legyen egységes címtérben dolgozó CPU ill GPU. Annyira különbözik az alatta levő hardver hogy az nem lenne optimális NV-nek beállni a HSA mögé vagy ez inkább csak üzletpolitikai döntés?
#2 freeapro senior tag

Új Válasz 2013-11-15 13:17:38 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

freeapro

senior tag

Érdekes, hogy az AMD mennyivel jobban tudja tematizálni a technológiai híreket az OpenCl-el vagy a Mantle-vel mint az Nvidia a Cuda-val, pedig nagy vonalakban ugyanazt a célt követik.
#3 MaUser addikt polika #1

Új Válasz 2013-11-15 13:47:45 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz polika #1 üzenetére

CUDA-ra vannak létező komoly rendszerek. Egyetemeken, fejlesztőcégeknél (mármint akik ténylegesen dolgoznak velük) 99%-ban CUDA van. Két nagy hátránya volt eddig, az egyik, hogy nV-only, ami annyira nem gond, mert AMD is hasonló áron van lényegesen. Ha jönnek a filléres kínai 3rd party-k akkor AMD-nek sem lesz esélye amúgy sem.
A másik pedig, hogy CPU-GPU közös műveletek nagyon lassúak voltak (futásidőben és fejlesztési időben is) a memóriák közötti állandó szinkornizálgatás miatt. Ez utóbbi most megszűnt. HSA "méregfogát" ezzel kihúzták gyakorlatilag, eddig ha valaki gondolkozott a migráláson, ezzel valszeg letesz róla.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#4 Bici félisten MaUser #3

Új Válasz 2013-11-15 13:56:02 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Bici

félisten

válasz MaUser #3 üzenetére

De ettől még nem lesz fizikailag egyben a memória, vagyis a buszokat ezután is terhelni fogja, csak nem a fejlesztőnek kell vele foglalkoznia, hanem a runtime megoldja. Nem?

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
#5 #06658560 törölt tag Bici #4

Új Válasz 2013-11-15 14:01:21 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Bici #4 üzenetére

Amennyiben a címtér közös, akkor a CPU akár direkt keresheti a neki kellő adatot a GPU memóriájában is. Talán nem kell szinkronizálni, maximum a PCI-E busz sebessége jelent büntetést.
#6 Abu85 HÁZIGAZDA MaUser #3

Új Válasz 2013-11-15 14:05:38 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz MaUser #3 üzenetére

A memóriák közötti szinkronizálást nem szünteti meg a CUDA 6, csak leveszi a terhet a válladról. Ami szarul fut az ezután is szarul fog futni, csak nem kell beleölnöd annyi munkaórát. De erre az NV-nek is megvan az integrációja, ami első körben a Maxwell és az ARMv8 párosítása. De ugye az IBM-mel dolgoznak a Poweren is, így a Maxwellt ahhoz is áttervezhetik.
(#7) Kopi31415: A hardver szintjén nem közös a címtér. A CUDA 6 csak annyit csinál, hogy amit eddig a programozó optimalizált, azt a háttérben megcsinálja helyette. Ettől függetlenül a memóriamásolás megtörténik. A beleölt munkaórában vagy előrébb.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#7 #06658560 törölt tag Abu85 #6

Új Válasz 2013-11-15 14:09:08 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Abu85 #6 üzenetére

Ha a címtér közös, akkor miért kell szinkronizálni?Csak direkt hozzáférés kell a CPU-nak a GPU RA-hoz és a GPU-nak a normál RAM-hoz.
Szerk.: akkor így sok értelmét nem látom. Még ha virtuálisan közös címtér lenne, azt látnám előrelépésnek.

[ Szerkesztve ]
#8 Crytek veterán

Új Válasz 2013-11-15 14:11:59 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Crytek

veterán

És milyen jó is lenne nekünk játékosoknak ha ne adj isten összefognának és lenne egy brutális egységes rendszer ami a kenyérpiriton is elmegy nem csak akkor ha x és y VGA-d van!

Next PC Upgrade: 2022
#9 Kotomicuki senior tag Abu85 #6

Új Válasz 2013-11-15 14:20:14 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Kotomicuki

senior tag

válasz Abu85 #6 üzenetére

"Ami szarul fut az ezután is szarul fog futni, csak nem kell beleölnöd annyi munkaórát." - Ez, vhogy kifejezi az elmúlt évek poshadt állóvizét, ami a PC-t eddig jellemezte, de lassan, talán megmozdul vmi. No, nem teljesen a SW-esektől várom a megoldást, mert megfelelő "vas" nélkül csak az ehhez hasonló, fából vaskarikát megoldások születhetnek.
Majd, ha a közös RAM fizikailag is közös lesz, netán eltűnik a háttértár-RAM különállósága is, és az olyan szintű haszonelvűség, amit a (kis) kékek és mikrof*s bemutatott az utóbbi évtizedekben, kiveszik az iparágból, majd akkor jön el a látványos fejlődés kora, majd akkor láthatunk csudákat.

A regisztrációdat véglegesen kitiltottuk a következő ok miatt: III.10.8 Üdvözlettel: PROHARDVER!
#10 polika senior tag Abu85 #6

Új Válasz 2013-11-15 14:21:18 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

polika

senior tag

válasz Abu85 #6 üzenetére

Tovább is mehetünk, egy általános automatizált copy mechanizmus sosem lesz olyan hatékony mint az egyénileg megírt kód. Azaz erős csúsztatás hogy csak minimális hátrányokat okoz.
Én inkább ennek az egésznek az értelmét abban látom hogy a CUDA 6-ot felkészítették az új egységes címteret címző arm/gpu párosra, miközben nem kell ugyanazt a progit egy másik régebbi hardverre újraírni. Az hogy ez a valóságban mennyire életszerű az más kérdés...CUDA5-öst nem éri meg portolni 6-ra régi hardveren mert nem lesz tőle jobb a teljesítmény, sőt valószínű csak roszabb...
#11 polika senior tag Kotomicuki #9

Új Válasz 2013-11-15 14:23:52 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

polika

senior tag

válasz Kotomicuki #9 üzenetére

Igazából én is már a reramot várnám, ahol a sleep/boot meg a mostani memória/háttértár paradigmák értelmüket vesztenék...
#13 Abu85 HÁZIGAZDA polika #10

Új Válasz 2013-11-15 14:43:16 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz polika #10 üzenetére

Nem biztos. Ha azt feltételezed, hogy az adott program tényleg a végletekig le van optimalizálva, akkor nyilván az új CUDA semmit sem ér, de a valóság az, hogy a fejlesztők egy idő után feladják, mert aránytalanul sok munkát igényel a további extra teljesítmény kisajtolása, és ilyenkor bőven előfordulhat, hogy az új CUDA hatékonyabb lesz, mint az előző.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#14 MaUser addikt Abu85 #6

Új Válasz 2013-11-15 16:48:38 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz Abu85 #6 üzenetére

Na ja, de ha ránézel egy .net vagy java kézzel párhuzamosított vs. automatikusan párhuzamosított kódra, rájössz miért fontos, mindez automatikusan történjen. 100-ból 99 programozónak lövése sincs az adott technológiához az api-k hívásán kívül.
Lásd jobb c/c#/c++ coding guide-ok mindig úgy kezdik, hogy ne akarj okosabb lenni a fordítónál, ha úgy hiszed többet tudsz, mint azok a srácok, akik azt írták, akkor szólj nekik és 10x-es pénzért fogsz náluk dolgozni.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#15 LordX veterán Abu85 #13

Új Válasz 2013-11-15 19:28:06 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz Abu85 #13 üzenetére

Azért az a "nyilván" se annyira "nyilván", miért feltételezitek, hogy semmi más javítás, optimalizálás nem történt?
#16 pakriksz őstag MaUser #14

Új Válasz 2013-11-15 20:29:37 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

válasz MaUser #14 üzenetére

Micsoda? automatikusan párhuzamosított kód? Azt hogy?

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#17 Fiery veterán MaUser #14

Új Válasz 2013-11-15 20:44:33 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz MaUser #14 üzenetére

"Lásd jobb c/c#/c++ coding guide-ok mindig úgy kezdik, hogy ne akarj okosabb lenni a fordítónál"
Az a baj, hogy a C forditokkal ellentetben az OpenCL es CUDA forditok eleg butak tudnak neha lenni, nem art nekik egy kis segitseg. A CUDA 6 unified memory "varazslata" meg max. akkor mukodhet a gyakorlatban kielegitoen, ha relative keves masolasi muveletre jut egy csomo GPU szamolgatas (computing). Ellenkezo esetben ugyanolyan sz** lesz, mint egy nem atlapolt kezzel valo memoria masolasi megoldas. Teny, hogy a lusta programozoknak jol johet ez a kis segitseg; de aki lusta GPGPU fejleszto, es nem kotik a kezet guzsba (azaz valaszthat AMD es nVIDIA hardver kozul), az inkabb a HSA kornyeken fog nezelodni, ott legalabb valoban nincs szukseg memoria masolgatasra.

[ Szerkesztve ]
#18 Fiery veterán pakriksz #16

Új Válasz 2013-11-15 20:46:04 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz pakriksz #16 üzenetére

A HSA pl. tud majd ilyet, Java kodot automatikusan vektorizalni es az iGPU-n futtatni.
#19 pakriksz őstag Fiery #18

Új Válasz 2013-11-15 20:55:31 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

válasz Fiery #18 üzenetére

gondolom alap java libes függvényeket átírnak gpu-ra is. De ettől még nem fog egy programot párhuzamosítani, csak pár részfeladatát.
Igazi működő automatikus párhuzamosítás CPU-ra sincs.

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#20 Fiery veterán pakriksz #19

Új Válasz 2013-11-15 21:11:03 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz pakriksz #19 üzenetére

A legtobb szoftvernel eleg csupan reszfeladatokat, meghozza a leginkabb teljesitmeny-erzekeny reszfeladatokat parhuzamositani. Ha azt meg tudja oldani akár a CUDA, akár a HSA, akár barmi mas hatekonyan es egyszeruen, az mar eleg jo lesz a legtobb fejlesztonek.

[ Szerkesztve ]
#21 MaUser addikt pakriksz #16

Új Válasz 2013-11-15 22:10:36 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz pakriksz #16 üzenetére

Az összes modernebb fordító tudja pl ma már azt, ha egy for ciklus nem függ a ciklusváltozótól/előző elemtől, akkor pl. több magra szét tudja dobni a ciklus lépéseit. Nyilván ez nagyon buta példa, de matlab már 1000 éve tudja, ha manuálisan parfor-t használsz akkor megfelelő számú worker-en fog futni a for ciklus. Nyilván innen egy lépés lenne, hogy a PCT méltóztasson ne csak futtatás közben felismerni, ha van ciklusfüggő változó, hanem már a kód írása közben. MS viszont már .net 3.0-át ezzel is hirdette, ott ráadásul sima for-t is szétdob a fordító több magra automatikusan, ha úgy látja, hogy megteheti. Jacket alatt meg ott van a gfor, ami megpróbál vektorizálni pl.
Nyilván a nem erőforrás igényes részeknek meg tökmindegy hány magon futnak.
Nyilván nem az lesz, hogy a fordító felismeri a gányolt fft-t és 4 magra csinál belőle egy olyan binárist mintha cilk fft-t használtál volna tökéletesen.

[ Szerkesztve ]

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#22 pakriksz őstag

Új Válasz 2013-11-15 22:37:47 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

Ez édeskevés, tehát marad továbbra is a szenvedés a többszálúsítással.

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#23 MaUser addikt pakriksz #22

Új Válasz 2013-11-16 00:04:27 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz pakriksz #22 üzenetére

Már miért lenne édeskevés Ezzel az esetek jó része megoldható. A gond ott van ha szálak között kell adatokat kezelned. Itt is két eset van, ha ritkán vannak ilyen esetek, akkor írtsz rá kézzel valami ütemezőt, ha meg gyakran kell szálak között adatokat átadni, akkor nyilván bukta. Ez esetben viszon goto másik algoritmust nézni, mert az esetek túlnyomó többségében lesz olyan, aminek a vége egymástól független vektor és/vagy mátrixművelet lesz. Nyilván lesz egy nagy overhead-ed, de párhuzamosítás miatt mégis jóval gyorsabb leszel. És főleg nem kézzel optimalizálgatsz és csinálsz a végén ugyan valamivel gyorsabb, de 10x nagyobb kódot 10x több hibával.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#24 pakriksz őstag MaUser #23

Új Válasz 2013-11-16 23:05:18 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

válasz MaUser #23 üzenetére

mert ezzel a többszálúsítás kb 30%-át lehet megoldani. a többit szálkezeléssel kell.
Pl csináltam egy programot ami bazi nagy xml-eket módosít javaban. Bár az xml feldolgozó libek tényleg több szálúak, de 1 xml feldolgozása maximum 1,7 magot tudott leherhelni a 4 ből. És ilyenkor jön az hogy "batch"-ban indítom a feldolgozást, több szálon, így 1 helyett mondjuk 4 xml-el dolgozik párhuzamosan, így garantáltan kihasználódik mind a 2 mag.
Vagy megírsz egy játékot threading nélkül szinte semmit sem fog érni hogy néhány alaplib többszálú. Semmi sem fogja azt szétszedni több szálra a lényeget, neked kell szépen külön szálba rakni a rendert, a fizikát, a betöltést, a hangot.

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#25 MaUser addikt pakriksz #24

Új Válasz 2013-11-17 19:38:39 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz pakriksz #24 üzenetére

A xlm-es példádra pont jók a modern fordítók, amit most batch-ként futtatsz, azt felismerik, ha van megkötés azt meg megtalálod a dokumentációban. Javával nem tudom mi a helyzet, már .net 2.0 idején is le volt már maradva, azóta szerencsére nem dolgozom vele, de ismerősök szerint az olló csak nyílik és nyílik.
A másik példánál, ha jól értem, arra kéne a több szál, hogy az interakció minél inkább real-time legyen. Ez tudományos/mérnöki életben nagyon ritka. Nyilván customer programnál ez kell, itt nincs mese, ezt kézzel kell. Azonban egy szálon is ugyanez volt a helyzet, itt nincs difi, csak most nem a programfutási szálat szakítgatod meg kézzel a bement kedvéért, hanem még kiegészül azzal, hogy a programfutási szálát a kívánt interakció mértékében több szálra szedheted szét.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#26 pakriksz őstag MaUser #25

Új Válasz 2013-11-17 22:12:44 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

válasz MaUser #25 üzenetére

Hát már bocs de ezt nem hiszem el... Nem is nagyon létezhet olyan algoritmus ami felismer olyat amit egy embernek sem könnyű...
Ha ez igaz lenne, minden program gyönyörűen skálázódnak akárhány magra, de messze nem így van.
Egyébként rálátok egy .net-es (jelenleg 3.0-ás verzióval van fordítva) játék játék fejlesztésére és sok profi programozó keményen megküzd a többszálúsítással, ami még így sem olyan amilyennek szeretnék bár ez részben a hulladék direct3d korlátainak köszönhető.
Java pedig kb csak abban a linkben van lemaradva kb (amire még mindig nem jöttem rá mi értelme (1 lépés előre 1 lépés hátra)), meg pár hasonló jelentéktelen dologban, engem csak az unsigned számok hiánya zavar.
Gyanítom hogy ha ugyan ezt az xml-es cuccot kipróbálnám .net-ben, és 1 szálra írnám, a for ciklusban bambán egymás után dolgozná fel mindet, ahogy a java, és semmit sem ismerne fel.

[ Szerkesztve ]

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#27 Jack@l veterán pakriksz #26

Új Válasz 2013-11-18 09:30:44 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Jack@l

veterán

válasz pakriksz #26 üzenetére

Lehet át kéne térni .net 4.5-re, me a 3-as má ölég régi jószág... (meglepődnél mik nem vannak benne többszálúsításhoz )

A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
#28 LordX veterán pakriksz #26

Új Válasz 2013-11-18 10:46:58 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz pakriksz #26 üzenetére

Ne keverjétek össze a task alapú párhuzamosítást és az adatpárhuzamosítást. Amit a .NET / Java / akármelyik mainstream programnyelv fordítója tud, az task és short vector (SIMD) párhuzamosságot, a CUDA meg adatpárhuzamosítást használja ki. A kettőnek azon kívül, hogy "párhuzamosítás", túl sok köze nincs egymáshoz. A CUDA felépítése miatt majdhogynem triviális azokat az optimizációkat automatikusan elvégezni, amiből ez a szál kiindult, nyugodtan elhiheted, hogy képes a fordító rá. És az is igaz, hogy nem ősrégi fordító (.NET 3.0 már annak számít) alapján kéne végső igazságokat kijelenteni, bár annyira nem eszik forrón a kását, a mai fordítók nem jól dolgoznak, hanem csak elfogadhatóan..
#29 MaUser addikt pakriksz #26

Új Válasz 2013-11-18 14:00:01 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz pakriksz #26 üzenetére

Most akkor dobjak fel egy fotót arról, hogy az adatbányászati alogritmusaim 4 szálon, gyakorlatilag 90% környékén használják a négymagos procit sima parforban PCT-vel?
A .net-es for párhuzamosításra meg MS-es előadást is tudsz találni, ha nem akarsz kézzel méricskélni.
Egyébként rálátok egy .net-es (jelenleg 3.0-ás verzióval van fordítva) játék játék fejlesztésére és sok profi programozó keményen megküzd a többszálúsítással, ami még így sem olyan amilyennek szeretnék bár ez részben a hulladék direct3d korlátainak köszönhető.
És ők mivel szívnak konkrétan? Gondolom nem azzal, hogy egyszerre négy szálon egymástól független adatokat feldolgozzanak, hanem azzal, hogy szinkronizálják a szálakat.
Gyanítom hogy ha ugyan ezt az xml-es cuccot kipróbálnám .net-ben, és 1 szálra írnám, a for ciklusban bambán egymás után dolgozná fel mindet, ahogy a java, és semmit sem ismerne fel.
Próbáld ki és kiderül. Ha nem vagy elégedett a kapott eredménnyel v. nem akarsz beállításokkal molyolni, akkor ott a Parallel.For utasítás és öröm boldogság egyből. Igaz, ez ha jól rémlik .net 3.5-től van, ellőtte külön kellett feltenni és talán nem is volt hivatalosan release-elve.

[ Szerkesztve ]

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''
#30 pakriksz őstag MaUser #29

Új Válasz 2013-11-18 15:35:33 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

pakriksz

őstag

válasz MaUser #29 üzenetére

parallel for az pont ugyan az az mintha csinálnál külön threadeket, csak rövidebben leírva.
Egyébként java-nál ugyan ezt lehet elérni egy sima forral, és egy executorservice-el.
De ez semmit nem old meg, amire ezt lehet használni, azt amúgy is 2 perc alatt lehet párhuzamosítani, szóval halottnak a csók effekt.
Igen a szinkronizálással szívnak, de ez is a többszálúsítás legnagyobb mumusa.

Troll (nemhivatalos definíció): az akinek véleménye nem tetszik nekünk/nem értünk vele egyet. (10-ből 9 fanboy ezt ajánlja) || Fanboy 8 in 1 (Intel, AMD, Nvidia, konzol, PC,+minden politikai oldal) hiszen "ahol nem mi vagyunk, ott az ellenség"
#31 MaUser addikt pakriksz #30

Új Válasz 2013-11-18 16:56:32 #31
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

MaUser

addikt

válasz pakriksz #30 üzenetére

A parallel.for-ral, cilk_for-ral, parfor-ral megmondod a fordítónak, hogy légyszíves csinálj nekem egyszerűen thread-eket amennyit bírsz és érdemes az erőforrások függvényében és végezd el ugyanazon műveletek az egyes thread-ekben. Ezt nem hiszem, hogy két perc alatt kódolod le, még ha snippetből dolgozol is vagy baromi gyorsan gépelsz, ráadásul itt egyből kapsz visszajelzést is gépelés közben, mert a környezetek ezt támogatják. HA olyan egyszerűek a műveleteid, hogy érdemes GPU-ra váltanod, akkor goto CUDA, az erre való.
Amiről te beszélsz az a szálak szinkronizálása, de ebben semmi új nincs, a szinkronizálás meg egy szál esetén is meg volt (pl. IRQ v. port figyelés, stb.). Ezt az életben nem fogod tudni elkerülni, mert a fordító soha nem fogja kitálni, hogy egymástól függő dolgokat, hol és hogyan akarsz te, mint programozó összefűzni és ennek semmi köze a CUDA-hoz.

''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''