Keresés

Új hozzászólás Aktív témák

  • Drizzt

    nagyúr

    válasz dezz #21 üzenetére

    G80-hoz gondolom még nincsen támogatás??

    I am having fun staying poor.

  • R.Zoli

    őstag

    válasz dezz #25 üzenetére

    Pedig a legtöbbet ez hozná...Egy R600-as GPU olyan 4-5-ször gyorsabban futtatná ezeket a számításokat szerintük mint egy PS3-ban a cell...

  • orbano

    félisten

    válasz dezz #27 üzenetére

    már az is jó lenne, ha a GPU-k bevonásával átlagban a duplájára rúgna a kapacitás. de mivel célirányosan tudják osztani a feladatokat, ezért várható (az összes népszerű gpura portolás után), hogy a lényegi összkapacitás tényleg megtöbbszöröződik.

    már csak azt kéne elérni, hogy a sok kis gagyi grid helyett egy nagy közös legyen...

    meg rendesen kéne ezeket reklámozni, az is durván megsokszorozná a teljesítményt. teszem azt a csatlakozott gépek még a számítógépes vírusok és spamek ellen is tudna ezek mellett segíteni.

    bár az is kérdés, hogy a jövőben milyen támadási felületeket hagynak a gépeken az efféle programok...

    A vér nem válik VAZZE!™

  • Thrawn

    félisten

    válasz dezz #27 üzenetére

    R600-al nincsenek ilyen eredmények?

    ]Phobos[: A SETI rula, de igaz, a rák meg az aids ellen IS kellene használni a számítási kapacitást!
    A World Community Grid erről szól :K

    Different songs for different moods. łłł DIII Thrawn#2856 łłł Look! More hidden footprints! łłł D4BAD łłł WoT: s_thrawn łłł

  • R.Zoli

    őstag

    válasz dezz #27 üzenetére

    Nem kellene több százezer... Elég lenne 1-2 ezer is és iszonyat erőt képviselne, nyílván egyszerűbb feladatokat végezne de akkor is hatalmas ugrás lenne mert a komplex feladatok más kliensre lennének kiosztva... A fórumban a foldingon le van írva több adat is... A korábbi x1900-as szériához képest az R600 bonyolultabb feladatokkal is megbírkózik és 2-4-szer gyorsabb mint mint az x1900-as széria és eddig ők 2-szeres gyorsulást realizáltak ebből,de ez fejlődni fog... A mostani adatokat ha megnézed már a mostani GPU-k is sokkal nagyobb számítási teljesítménnyel rendelkeznek mint a PS3...

    Egyébként Ray tracing-ben naná ,hogy kikap a G80 a celltől... A G80 egy hulladék ilyen feladatokra(miután rasztelizálás a fő erőssége és egy oldboy e tekintetben) , a foldingosok elmodása szerint össze sem lehet hasonlítani tiszta számítási teljesítményben az R600-at a G80-nal... Vannak számítások amiket az R600 10-15-ször gyorsabban hajt végre... Nincs is ezen semmi csodálkoznivaló, az R600 a jövő alapjait hordozza magában ami a ray tracinghez kell majd (és GPGPU-s felhasználáshoz) és ebben egyetértek Abu85-tel ,hogy az NV-nek köze sincsen a ray tracing-höz és a jövőben emiatt hullhatnak ki a versenyből... Jah és ha még jön Larabee... Nagyot fog változni a GPU-k világa az Intel beszálltával és én sem érzem felkészültnek az NV-t erre... Nagyot eshetnek pofára ha már nem most ott vannak a lemaradásaik tekintetében...

  • R.Zoli

    őstag

    válasz dezz #45 üzenetére

    Mindenesetre megnéznék már valami nem-raw-teszt programot, ami sokkal gyorsabb R600-ason, mint G80-on.

    A folding ilyen... Sokkal gyorsabb R600-on mint G80-on :) Régen olvasgattam már de azt írta talán az egyik fejlesztő ,hogy az x1900-as szériánál kicsivel gyorsabb csak a G80, mert sokkal kevéssé alkalmas ilyen feladatokra mint az R600... Igazából nekik nem is az a legnagyobb bajuk a G80-nal ,hogy lassabb mint az R600 hanem sokkal kevesebb dolgot tud megoldani és nehezebb is megírni rá a GPU klienst, az R600-ról szinte úgy beszéltek mint a messiásról ám annyira új még a design számukra és a tudását fel akarják térképezni ,hogy maximálisan kihasználják ezért megy ilyen lassan a GPU kliens fejlesztése...Ezt írta a fejlesztő, van róla a fórumban sok oldalas leírás amikor megjelent az R600 ők akkor írták ezeket...

    Ettől függetlenül én a jövőben úgyis ki akartam próbálni az RV670-et, szerintem crossfire-ben bedobok ilyet a gépbe mert nem lesz túl drága és megnézem mit tud folding alatt... Elméletileg egy nagyobb renderfarm teljesítményét fogja hozni ilyen tudományos számításokban 2 ilyen GPU...De addig egy Yorkfield-et is kell vennem mert sajna a Qaudom 3,6-on (1,38 volton) lezabálja a gatyámat is...Ezt csak azért mondom mert a GPU klienshez kell GPU-nként 1-1 NAGYON ERŐS CPU mag is!!! Sokan erről feledkeznek meg ,hogy a GPU magában semmit sem tud megoldani, a CPU-n is sok múlik... A foldingon azt írták egy Quad magos géppel és 4 darab R600-zal amit lehetne művelni az elképesztő... Ők is tervezik 4-5 ilyen gép összerakását a laborjukban :) Nekem ehhez nincs keretem villyanszámlában :D

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz dezz #53 üzenetére

    A sráccal kapcsolatban: tehát ott egyetlen, utolsó mondatról volt szó. Több kérdés-felelet váltás után. Aki egyátalán nem tud angolul, ennyit az is felfoghatott az egészből - tahát mégis nyilvánvalóan és szándékosan hazudtál alább.

  • Raymond

    félisten

    válasz dezz #58 üzenetére

    Szoval semmi uj. Ezeket mar linkeltem a CELL-es topicban. Az animaciot nem hiszem de valahol megvan mar nagyfelbontasban. Meg akkor toltottem le amikor eloszor mutattak be (jo)pas honapja.

    Privat velemeny - keretik nem megkovezni...

  • dezz

    nagyúr

    válasz dezz #61 üzenetére

    Izé, kicsit figyelmesebben elolvasva azt a static flow controlos részt, már látom, miért írtad, bocs. Bár nem egészen értem ezt, mert akkor a G80 emiatt nem is tudhatna dynamicot, ami érdekes lenne.

    Mindenesetre úgy tűnik, ez egy dologgal több, amiben az R600-as superscalar blokkos végrehajtási mechanizmusa hatékonyabb.

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz dezz #63 üzenetére

    Pontosabban ott nem tudhatna, ahol a pixel/vertex aktuális értékétől függ az ugrás. Ahol ettől független változótól v. ciklusváltozótól függ, ott persze igen.

  • dezz

    nagyúr

    válasz dezz #64 üzenetére

    Mondjuk feldolgozott adat függő ugrásnál az R600 is gondban lehet, hiszen ott sem mehet minden stream proc. unit (5-way superscalar egység) össze-vissza a saját feje (PC-je) után, hanem 8-asával egy-egy szálat hajtanak végre, mindegyikük másik pixelre/vertexre vonatkozóan (pontosabban 16-osával 1-1 szál-párt).

    Na itt meg a Cell előnye jön ki, hogy nem ennyire széles a párhuzamosítás egy SPE-ben, hanem csak 4 elem széles a feldolgozás 32 bites adatnál - és azok is összefüggő adatok.

  • kvp777

    tag

    válasz dezz #68 üzenetére

    Mivel ezt a PS3-mal kapcsolatban is csinálod, ezt már konkrétan FUD-nak nevezhetjük.

    En probalok kedves lenni mindkivel, meg akkor is ha idegesito az illeto. Ez sok embernek sajnos nem sikerul. Egyebkent erdekes, hogy csak a PS3-al kapcsolatban veszed rossz neven a kritikat. Egyebkent amit irok az tobbnyire igaz. Ha esetleg tevednek, akkor korrigalast varnek el nem sardobalast. Ez az alap illem egyik fontos pontja fuggetlenul attol hogy ki mennyire ideges. (egyebkent en pl. miert lennek ideges? nem koltottem a penzem olyan hardverre amit nem tudok hasznalni es minden jatek fut a pcmen amivel jelenleg jatszani akarok)

    "Es szemely szerint en szeretnek standard template library-t hasznalni az spe-ken is. Ha egy texas dsp-n lehet es erdemes, akkor egy cell spe-en miert ne?"
    Nem tudom, most valójában lehet-e vagy sem, mindenestre ez nem egy létszükséglet tudományos és game területen. Javat nem akarsz rajtuk futtatni?

    Az stl keszitoi es elso felhasznaloi a tudomanyos teruletrol jottek. A jatekokat pedig ma mar tobbnyire c++-ban irjak, erosen megtuzdelve objektumorientalt script-ekkel. Mindkettonek feltetele a c++ tamogatasa. (egyebkent a java, a .net es a smalltalk nagyon kenyelmes nyelvek ha konnyen akarunk stabil programot irni)

    Valamit valamiért: 10x-es teljesítmény némi pluszmunkáért cserébe. Ezt a dolgot nem sikerült megértened az előadáson?

    Generacionkent 2x-ezodik a teljesitmeny. Ma a 4 magos cpu-knal jarunk, ez mar eleve 4x-es teljesitmeny. Egy mai x86-os munkaallomas 8 maggal dolgozik. (2x4) A leggyorsabb mai gyarhato hagyomanyos cpu 10Ghz-es, ez az ibm power magos processzora. Kb. ket even belul el elehet erni a mai cell teljesitmenyet, akar igazi technologiai valtas nelkul is, tehat ha ket evnel tovabb tart a program fejlesztese, akkor erdemesebb a jovobeni gyors x86-os cpu-kra dolgozni. (es meg optimalizalni sem kell semmit) Az uj 2 ppe-s, 32 spe-s power gyorsabb lesz es jobb (es vegre rendes ddr-es), de nem lesz annyival jobb, mint mondjuk egy 80 magos intel.

    "Lassuk csak... mondjuk szoftveres read/write cache-ekkel, amik automatikusan kezelik a virtualis lapok irasat, olvasasat es feldolgozasat." Ehhez még nem kell virtuális proci.

    Nem kell, de ha azt hasznalunk, akkor lehet ra irni jit-et es a mai forditoprogramok is tudnak ra dolgozni, arrol nem beszelve hogy a meglevo szoftverek ujraforditas nelkul is futnanak rajta. Keves munka -> sok haszon.

    "A cell spe-k egyetlen hatranya, hogy altalanos cpu-nak hianyzik beloluk a virtualis memoria kezelese"
    Nem azért hiányzik, mert elfelejtették beletenni. Tudod, valamit valamiért. Az előadáson erről is volt szó. Túl sok tranyóba kerülne (ez is többek között), és akkor szó sem lenne 8db SPE-ről.

    Kb. 64 huzalozott komparator regiszter es es par logikai kapu lenne az egesz. (4 KB-os lapok, 64 lapos L1 working set, exception driven software filled tlb) Ez jo esetben is csak par ezer tranzisztor, azaz kb. 500 byte-nyi local store. A 256 KB-hoz kepest nem jelentos. Persze a programozasi stilus nagyon megvaltozna, az spe leginkabb a sun niagara sorozatara hasonlitana.

    "Valahol az intel fele altalanos cpu-k es az nvidia fele brute force-os buta vektoregysegek kozott vannak."
    Nalátod. Akkor miért állítod be úgy, hogy szinte nem is különböznek az utóbbiaktól?

    Programozni ugyanolyan nehez oket.

    "Sem egyik, sem masik. Altalanos logikara jobb a cpu"
    Arra ott van a Cellben a PPE. (De ha szükséges, SPE-n is futhat, scalar adatoknál kb. 1/4 teljesítményen, ami azért még mindig nem olyan rossz.)

    A gf8800-asnal 1/16, ati-n 1/8-ad. Amennyivel jobb egy proci vektorfeladatokra, annyival benabb elagazasos logikanal. Programmed dynamic alu mapping pedig meg nem nagyon van. Azaz van, ha egy xilinx-be ezt tolti az ember. Lehet kapni viszonylag olcson 1 darab power maggal felszerelt, xilinx chipeket. Ezekben ki lehet alakitani annyi es olyan spe-t amilyet az ember megalmodik. Erdekes eredmenyeket lehet kapni vele. 4 ilyen, darabonkent 15 millios fejlesztoi kartyaval mar egesz szep gepet lehet osszehozni. Ha gyartasba kerulne, akkor persze sokkal olcsobban elo lehetne allitani, de ma magyarorszagon inkabb vesznek 100 kartyat 1.5 milliardert, mint hogy egy gyartosoron legyartassak, mert ez meg mindig olcsobb. (a lenyeg hogy szokott mukodni amit a cegnel hazilag osszerakunk) Lehet jobb cpu-kat is kesziteni, mint a cell. En szemely szerint az intel megoldasaban latok nagy jovot, felteve hogy ossze tudjak hozni. De otthon is osszedobtam mar egy-ket cpu-t, alacsony integritasu alkatreszekbol. (lomex-bol vett 20 eve porosodo chipek, prototipus panelen, kezzel forrasztva) A legjobb egy 20 Mhz-es 16 bites skalar cpu lett, bar sajnos nagyon bena az ugyancsak altalam tervezett videokartyaja. (de legalabb van benne linear frame buffer) Viszont szoveges konzol, debugger es 1 azaz egy darab grafikus demo van hozza. :)

    "ugyanis jatekok eseten jelenleg minden programozonak fel kell talalnia a spanyol viaszt." Ez időről időre amúgy is megtörténik!

    A mai nagy cegekre nem jellemzo az innovacio. Az oblivonban pl. csak a script-eket irta a keszito ceg. A terep, a novenyzet, a fizika, az animaciok es az arcmimika is mind keszen vasarolt modulokbol epultek fel. (ezert volt a legtobb bug a script-ekben)

    A wow a legnepszerubb es egyben legkevesbe innovativ mmorpg. A jatekmotor alapja egy mud volt. Csakugy mint ahogy a diablo az open source nethack kodjat kapta, sajnos bugokkal egyutt. (a grafikus motor sajat gyartasu mindket esetben)

    "Ahogy az eloadasban elhangzott, jelenleg sok mindent nem tud a fordito, de a gcc kodja nyilt, megirhatja barki."
    Melyik fordító? A gcc-n kívül még van 2 c(++) fordító Cellre.

    Az ibm forditoja sem tudja a szoftveres smt-t, ami lehetove tenne a kooperativ multitasking-ot spe-n, ami lehetove tenne az external load/store rendszer (dma) rendes kihasznalasat. Igy a legtobb dma muvelet blokkolja az spe-t, a helyett hogy az masik task-ra valtana. A valsz az volt, hogy ha valaki megirja a gcc-hez, akkor berakjak a tobbi forditoba is. Mondjuk en fordito tamogatasa nelkul is meg tudnam irni assembly-ben, de a legtobb jatekot es tudomanyos programot ma mar nem assembly-ben irjak. Egyszeruen nincs ra ido.

    "Ha egy jatekkeszito ceg embereit azzal biztatja az architektura kitalaloja, hogy eloszor irnia kellene egy hasznalhato forditot mielott elkezdene jatekot irni, akkor ez eleg hamar elveszi a kedvet az egesztol."
    Ezek a dolgok könnyítik a munkát, de nem feltételei.

    A mukodo c++ fordito manapsag az egyik alapfeltetele a jatekfejlesztesnek. Sok ceg megtudja, hogy az spe-ken nem lehet objektumorientalt kodot futtatni virtualis memoriaban es inkabb elvetik az spe hasznalatat. (ezert van olyan keves ps3 exkluziv jatek) Ahol hasznaljak ott is tobbnyire az ibm vagy a sony kolcsonadott mernokei kodolnak az spe-kre.

    1. Csak a legprimitívebb fejlesztők használják csak a PPE-t. Úgy kell nekik, ki kíváncsi rájuk.

    Aki jatszani akar, es csak xbox360-ra meg vista-ra jon ki a kedvenc jateka. Az egyikben a hardver, a masikban a szoftver rossz. De mas valasztas nem nagyon van.

    2. Sok kisebb adatcsomagokkal dolgozó rutin c kódja fordítható minden további nélkül SPE-re.

    Igen, vegulis minden el kell hogy ferjen 256Kbyte-ban. Egy mai atlagos 1024x1024-es terkep pedig 1 Mbyte. :-)

    3. Nagyobbaknál is sokszor elég egy egyszerű DMA kezeléssel kiegészíteni.

    Kiveve ha 1 tombben van minden. Ekkor lehet nekiallni atirni mindent. A mai jatekok jo resze nagy tombokben tarolja az adatokat. (lasd terkepek, modellek, texturak, compiled vertex array-k, stb)

    4. Butaság, hogy népszerűtlen: heti szinten átlagosan ugyanannyit adnak el belőle, mint Xbox360-ból. Csak az utóbbinak van 1 év előnye.

    A wii-bol meg tobbet mint a masik kettobol, pedig nem sok elonye van.

    5. A Wii egy más kategória, nem egyforma a törzsközönsége, mint a másik kettőnek.

    Igen, wii-t meg talan en is vennek, bar inkabb halozati medialejatszonak es webbongeszonek. (olcsobb es jobb mint az apple tv) Jatszani inkabb pc-n szoktam. (keves a konzolos mmorpg, strategia es a szabadon moddolhato szerepjatek, pedig en ezeket szeretem)

    ps: Roviden en nem a cell teljesitmenyet vitatom, csak az a velemenyem, hogy nem eri meg faradni azzal, hogy megtanuljuk programozni, mert a ps3 nem akkora piac. Mashol meg nem talalkozik az ember tul gyakran cell-lel. Persze szorakozasbol barki megtanulhatja, vagy azert mert penzt kap erte. Viszont a cegek jo reszenek nem eri meg a faradtsagot es a penzbeli befektetest. Esetleg majd a jovoben, ha mar jobb lesz a tamogatottsaga... de az jelenleg meg messze van.

Új hozzászólás Aktív témák