Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
Ajjaj ... még meg se mutatta az R600, hogy mit tud, de az nv már elkezdte az FX féle stratégiát. Enenk örülök, komolyan. Látszik, hogy már most összeszarták magukat a mérnökök.
Elméletileg most jön az TWIMTBP program újgenerációs változata a ''Ne rakj Shader-t a játékba'', helyett ez valahogy így fog szólni ''Rakhatsz Shadert a játékba, de csak skalár instrukciót és lehetőleg szekvenciálisan fussanak''. Ez a megvalósítás fekszik a G80-nak is, ... pontosabban fogalmazva csak ez fekszik neki, bár ez nézőpont kérdése.Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
válasz (Kolombusz) #32 üzenetére
Az az igazság, hogy nem egyszerű ez a D3D10 API. Ha szabad csúnyán foglamazni, akkor az új MS API kicsit OpenGL-esebbé vált. Húu de csúnyán hangzik.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
''Azért az R600 is elég felemás lett, a 16 ROP 1GHz-en lehet hogy elég lett volna, de jelen állás szerint kevés, az RV630 8 ROP-járól meg ne is beszéljünk...''
Ez nem ilyen egyszerű... Az R6xx család a teljesen blokkosított felépítést támogatja. Egy Render Back blokk-ban van: 4 alpha/fog, 8 Z-(Stencil), 4 blending és 16 mintavételező egység.
Bár nincs értelme leegyszerűsíteni egy rendszert, de ha a ROP-ra úgymond ''primitív'' formában gondolsz akkor a Blending egységgel kell számolni.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Hát mit értesz gyors kari alatt? Nyilván ez viszonyítás kérdése. Jelenleg gyakorlatilag nincs mivel tesztelni a karikat, mert nincs full D3D10-es komplex Shader kód (illetve van a PipeGS, de azt nem fogadod el, döntésed tiszteletben tartom). Ezesetben elméletben kell átgondolni a rendszerek közti különbséget.
Nézd meg a PH! R600 tesztjében a Rightmark Shader eredményeket. fLeSs ugyan elemezte ezt a részt, de lényegesnek tartotta megjegyezni, hogy a tesztprogramok D3D9 SDK-hoz hasonló kódok. Bár fLeSs nem ment bele komolyabb elmezésbe én ezt most a te kedvedért megteszem, remélem nem haragszik meg senki érte.
Régebben írtam, hogy a Unified Shader általános feldolgozókra épül, tehát elméletben mindegy, hogy Vertex-et, vagy Pixel-et számolunk egy hasonló Shader kódnak kb. ugyanolyan gyorsan kell lefutnia. Összehasonlítva az elméleti számítási teljesítményt nézzük csupán a HD2900XT és GF8800GTX eredményeit. Látható, hogy Vertex Shader alatt általánosan a Radeon a gyorsabb, míg Pixel Shader alatt a GF-nél az előny. ''Mindennek megvan a magyarázata'' életfelfogás mellett, és némi utánna járás után rá lehet jönni, hogy a jelenlegi Vertex Shader kódok többnyire általában úgymond float4 MAD instrukciók szekvenciálisan, vagy párhuzamosan. A kialakult teljesítmény érthető megnézve a két GPU architektúráját, a G80 skalárjainak nem fekszik már a Vec4 típus, az R600-at pedig ugye eleve úgy tervezték, hogy a fejlesztőknek csak minimális kompromisszumokat kelljen kötni. Pixel Shaderre áttérve már domborít a GeForce, de miért is fogadnánk el ezt a lehetőséget amikor tudjuk ... bocsánat egyelőre csak feltételezzük , hogy az R600-ban több potenciál rejlik. Ugyanazt csináljuk mint az előbb, a jelenlegi Pixel Shader kódok többnyire általában úgymond int/float skalár illetve float2 MAD instrukciók szekvenciálisan. Megérkeztünk az okokhoz kéremszépen, a G80 pontosan erre lett tervezve (legalábbis ilyen felépítésnek ezek a kódsorozatok fekszenek). Nyilván az R600 nem lassult, csak úgy lett tervezve, hogy általánosan teljesítsen jól, és ne csak pár (minő véletlen, hogy a jelenben ) igen elterjedt esetben.
Egyébként hazudnék ha azt mondanám, hogy az R600-nak nincsenek ingatag pontjai, de ezek jó rendszerprogramozással (ami megjegyzem pokoli nehéz) kiküszöbölhetőek. A G80-ra pedig azt mondtuk eddig ellefél nélkül, hogy jó. Most, hogy megjött végre a kihívó jelentősen átértékelődtek a nézetek.
Finoman szólva is kétséges még a jövő, főleg úgy, hogy az nv-nek megvan a befolyása visszatartani a fejlődést, mint anno az FX idejében
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
-
Abu85
HÁZIGAZDA
válasz ssolitude #59 üzenetére
Az eddigi project úgy ahogy van felejtős.
A DX9/OpenGL Vista alatt működik, problémák főleg nv karik mellett vannak (szvsz driver), az Ati-n +/-3% (ami ugye inkább minusz ) sebesség.Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
A G80 az ami túl jó Vec2-es és skalár kódokban, de amint valami bonyolultabb kódot kap (pl.: Vec4 MAD párhuzamosan) összeomlik. Az R600-at nem az aktiálisan domináló kódokra tervezték, hanem arra, hogy akármilyen kód futtatása mellett ne legyen komoly teljesítmény eltérés (ne omoljon össze).
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
válasz Interceptor #131 üzenetére
A Valve nem tehetett semmit igazából. Nehéz a 256bit-es regiszteren egyszerre eltárolni 3-4 128bites VLIW szót.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
A Valve hardveresen megnövelte a regiszterterületet, mi? Esetleg tömörített?
A FX-nek volt egy fall back módja FP16-ra. Ha már a szabványban előírt FP24-et nem támogatták, illetve az FP32 lassú volt. FP16-os Fall backnél minő véletlen, hogy 4 64bit-es VLIW szó elfér 256bit-en. Netán nem ez volt a gyorsulás oka?
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Ha egy chipet masszív párhuzamosságra terveznek, akkor néhol kompromisszumokat kell kötni. Világos ha egy Superscalár blokk Vec2-es típust kap és nem képes mellé a fordító más kódot berakni akkor lényegében a blokk-on belül kihasználatlan lesz az egységek száma. Ezt még az is tetézi, hogy a VLIW szavak jelenleg nem biztos, hogy megfelelően vannak optimalizálva, a párhuzamos végrehajtáshoz. Ez a kártya még csak most jött ki, az FX is akkor kapott egy jókora teljesítmény löketett amikor kikerült hozzá a Unified Complier. Nyilván a párhuzamosítást a G80-nal ellentétben nem az R600 végzi, a chip hardveresen csak a függőségeket tudja kezelni. A fordítóprogramnak kell arra ügyelni, hogy az R600 már eleve megfelelő kódott kapjon, a G80-nál a végrehajtás sorrendjéről a hardver dönt. Az R600 felépítése meglehetősen bonyolult, de a VLIW mintákat a Superscalár tömb kapja, ezek a tömbök tulajdonképpen azonos képességű ALU-kal (igaz az 5-ből az egyik okosabb a többinél) operálnak, így nem lesz olyan pokolian nehéz programozni a rendszert, mint anno az FX-et.
Pixel számolásnál elég ritka a Vec4-es típus, de nem elképzelhetetlen, hogy ezért, mert eddig nem volt olyan hardver ami megfelelő sebességet pordukál. Vertex Shader esetében ugye főleg ezt a típust használják, hiszen már az eddigi D3D9-es hardverek többsége is Vec5-ös feldolgozokkal menetelt. A G80-on meg is látszik az ehhez hasonló feldolgozók hiánya. Az R580 hozza a chip sebességének a harmadát finoman szólva is jelentősen szerényebb számítási teljesítménnyel.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
válasz Interceptor #164 üzenetére
Hát a szar fogalma képletes értelemben eléggé szubjektív lehet.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
-
Abu85
HÁZIGAZDA
válasz Interceptor #167 üzenetére
Az FX-ek eléggé túlmutattak a D3D9 bizonyos fícsőrjein (persze volt olyan amit nem tudtak), csak azok fránya regiszterek ...
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Elég sokan értenek hozzá itt a PH-n. FLeSs és Rudi cikkében is lehetett érezni, hogy tetszik nekik a kártya, hisz ajánlott minősítést kapott. Egyszerűen az a baj (ami nem baj ), hogy a PH a tényekre öszpontosít. Márpedig a tények jelenleg azt mutatják, hogy a HD2900XT igencsak jó vetélytársa lett a 8800GTS-nek, de még nem több annál.
Ha pusztán a felépítést és a két chipben lévő potenciált nézzük akkor szerintem az R600 jobb, nem is kicsivel. Én simán megvenném a HD2900XT-t, ha lenne rá pénzem, de most nincs.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Mondjuk a CAPCOM annyira nem törte magát a hibátlan protáláson. A legtöbb gépen fagy, vagy el sem indul (nálam pl. a program szabálytalan műveletett hajtott végre). Szvsz erős a gyanum, hogy az NV erőltette, hogy gyorsan kiadják ezt a Beta izét. Ez lehet, hogy az nV-nek jól jött, de a Capcomnak nem, hiszen sokan a Demo alapján vásárolnak teljes játékot. Ugye miért vegyük meg az eredetit, ha már a demo fagy.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Rudi: Az R600 dispatch processzor, kiosztja a VLIW mintákat a superscalár blokk-oknak. Egy R600-hoz hasonló bonyolultságú hardver esetében, elég komoly egység kellene, hogy egymaga hardveresen le tudja kezelni a megfelelő végrehajtási sorrendet, eléggé hosszú memóriaszavakat kell kezelni. Ezt egyszerűen célszerű a fordítóprogramra bízni. Nyilván itt áthelyeződik a teher a tervezőkről a rendszerprogramozókra. Az AMD-nek ebben az irányban kell most megfelelő kapacítást mozgósítani.
Dezz: Jawed elméleti kifejtését láttam, de szvsz jelenleg semmi nem garantálja, hogy ilyen szép kihasználtsággal hajtódik végre egy megfelelő complier nékül fordított kód. Persze driverből lehet mahinálni a dolgokat.Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Hát skacok, ez a két architektúra annyi kérdést vet fel a jövővel kapcsolatban, hogy még maga Nostredamus is hivatást váltana.
[Szerkesztve]Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Szvsz ha kész lesz a K10, akkor jó ötletnek tartanám a HyperTranszport 3 buszon hozzákapcsolt R600-at. Ugye a HT3 brutalgyors, ami már előrevetitheti a CPU-GPU beolvasztás lehetőségeit. Nyilván az új technológiáknak idő kell, ha ezt meglépné az AMD akkor lehet, hogy egyelőre csak rétegpiacot nyerne, de beindulhatnának az ilyen irányú fejlesztések.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
Én ezt másképp látom, az NV3x vs R3xx-at egyértelműen megnyerte az ATi. De az NV4x vs R4xx, szvsz az NV4x nyerte. Nem a teljesítményt nézem, hanem az egész rendszer összképét. Az NV40 sokkal fejlettebb volt az R4xx-nél. A G7x vs R5xx szívem szerint döntetlenre hoznám. Bár ha választani kell akkor G7x, mert az tudta a VTF-et.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA