Legfrissebb anyagok

IT café témák

PROHARDVER! témák

Mobilarena témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Új hozzászólás Aktív témák

#34 Abu85 HÁZIGAZDA

Új Válasz 2007-05-16 18:35:33 #34
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Ajjaj ... még meg se mutatta az R600, hogy mit tud, de az nv már elkezdte az FX féle stratégiát. Enenk örülök, komolyan. Látszik, hogy már most összeszarták magukat a mérnökök.
Elméletileg most jön az TWIMTBP program újgenerációs változata a ''Ne rakj Shader-t a játékba'', helyett ez valahogy így fog szólni ''Rakhatsz Shadert a játékba, de csak skalár instrukciót és lehetőleg szekvenciálisan fussanak''. Ez a megvalósítás fekszik a G80-nak is, ... pontosabban fogalmazva csak ez fekszik neki, bár ez nézőpont kérdése.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#36 Abu85 HÁZIGAZDA (Kolombusz) #32

Új Válasz 2007-05-16 18:38:29 #36
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz (Kolombusz) #32 üzenetére

Az az igazság, hogy nem egyszerű ez a D3D10 API. Ha szabad csúnyán foglamazni, akkor az új MS API kicsit OpenGL-esebbé vált. Húu de csúnyán hangzik.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#45 Abu85 HÁZIGAZDA

Új Válasz 2007-05-16 19:13:03 #45
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

''Azért az R600 is elég felemás lett, a 16 ROP 1GHz-en lehet hogy elég lett volna, de jelen állás szerint kevés, az RV630 8 ROP-járól meg ne is beszéljünk...''
Ez nem ilyen egyszerű... Az R6xx család a teljesen blokkosított felépítést támogatja. Egy Render Back blokk-ban van: 4 alpha/fog, 8 Z-(Stencil), 4 blending és 16 mintavételező egység.
Bár nincs értelme leegyszerűsíteni egy rendszert, de ha a ROP-ra úgymond ''primitív'' formában gondolsz akkor a Blending egységgel kell számolni.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#53 Abu85 HÁZIGAZDA decibel #43

Új Válasz 2007-05-16 19:50:25 #53
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz decibel #43 üzenetére

Hát mit értesz gyors kari alatt? Nyilván ez viszonyítás kérdése. Jelenleg gyakorlatilag nincs mivel tesztelni a karikat, mert nincs full D3D10-es komplex Shader kód (illetve van a PipeGS, de azt nem fogadod el, döntésed tiszteletben tartom). Ezesetben elméletben kell átgondolni a rendszerek közti különbséget.
Nézd meg a PH! R600 tesztjében a Rightmark Shader eredményeket. fLeSs ugyan elemezte ezt a részt, de lényegesnek tartotta megjegyezni, hogy a tesztprogramok D3D9 SDK-hoz hasonló kódok. Bár fLeSs nem ment bele komolyabb elmezésbe én ezt most a te kedvedért megteszem, remélem nem haragszik meg senki érte.
Régebben írtam, hogy a Unified Shader általános feldolgozókra épül, tehát elméletben mindegy, hogy Vertex-et, vagy Pixel-et számolunk egy hasonló Shader kódnak kb. ugyanolyan gyorsan kell lefutnia. Összehasonlítva az elméleti számítási teljesítményt nézzük csupán a HD2900XT és GF8800GTX eredményeit. Látható, hogy Vertex Shader alatt általánosan a Radeon a gyorsabb, míg Pixel Shader alatt a GF-nél az előny. ''Mindennek megvan a magyarázata'' életfelfogás mellett, és némi utánna járás után rá lehet jönni, hogy a jelenlegi Vertex Shader kódok többnyire általában úgymond float4 MAD instrukciók szekvenciálisan, vagy párhuzamosan. A kialakult teljesítmény érthető megnézve a két GPU architektúráját, a G80 skalárjainak nem fekszik már a Vec4 típus, az R600-at pedig ugye eleve úgy tervezték, hogy a fejlesztőknek csak minimális kompromisszumokat kelljen kötni. Pixel Shaderre áttérve már domborít a GeForce, de miért is fogadnánk el ezt a lehetőséget amikor tudjuk ... bocsánat egyelőre csak feltételezzük , hogy az R600-ban több potenciál rejlik. Ugyanazt csináljuk mint az előbb, a jelenlegi Pixel Shader kódok többnyire általában úgymond int/float skalár illetve float2 MAD instrukciók szekvenciálisan. Megérkeztünk az okokhoz kéremszépen, a G80 pontosan erre lett tervezve (legalábbis ilyen felépítésnek ezek a kódsorozatok fekszenek). Nyilván az R600 nem lassult, csak úgy lett tervezve, hogy általánosan teljesítsen jól, és ne csak pár (minő véletlen, hogy a jelenben ) igen elterjedt esetben.
Egyébként hazudnék ha azt mondanám, hogy az R600-nak nincsenek ingatag pontjai, de ezek jó rendszerprogramozással (ami megjegyzem pokoli nehéz) kiküszöbölhetőek. A G80-ra pedig azt mondtuk eddig ellefél nélkül, hogy jó. Most, hogy megjött végre a kihívó jelentősen átértékelődtek a nézetek.
Finoman szólva is kétséges még a jövő, főleg úgy, hogy az nv-nek megvan a befolyása visszatartani a fejlődést, mint anno az FX idejében

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#57 Abu85 HÁZIGAZDA ssolitude #51

Új Válasz 2007-05-16 19:54:27 #57
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz ssolitude #51 üzenetére

Nézd elméletileg nem lehetetlen a D3D10 protálása más operációs rendszerre, de ilyen rövid idő alatt gyakorlatilag kivitelezhetetlen. Illetve a sebesség sem lenne Vista szintű.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#62 Abu85 HÁZIGAZDA ssolitude #59

Új Válasz 2007-05-16 20:02:14 #62
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz ssolitude #59 üzenetére

Az eddigi project úgy ahogy van felejtős.
A DX9/OpenGL Vista alatt működik, problémák főleg nv karik mellett vannak (szvsz driver), az Ati-n +/-3% (ami ugye inkább minusz ) sebesség.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#133 Abu85 HÁZIGAZDA rudi #89

Új Válasz 2007-05-17 10:16:58 #133
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz rudi #89 üzenetére

A G80 az ami túl jó Vec2-es és skalár kódokban, de amint valami bonyolultabb kódot kap (pl.: Vec4 MAD párhuzamosan) összeomlik. Az R600-at nem az aktiálisan domináló kódokra tervezték, hanem arra, hogy akármilyen kód futtatása mellett ne legyen komoly teljesítmény eltérés (ne omoljon össze).

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#134 Abu85 HÁZIGAZDA Interceptor #131

Új Válasz 2007-05-17 10:20:47 #134
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Interceptor #131 üzenetére

A Valve nem tehetett semmit igazából. Nehéz a 256bit-es regiszteren egyszerre eltárolni 3-4 128bites VLIW szót.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#138 Abu85 HÁZIGAZDA Lamair #135

Új Válasz 2007-05-17 10:35:57 #138
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Lamair #135 üzenetére

A Valve hardveresen megnövelte a regiszterterületet, mi? Esetleg tömörített?

A FX-nek volt egy fall back módja FP16-ra. Ha már a szabványban előírt FP24-et nem támogatták, illetve az FP32 lassú volt. FP16-os Fall backnél minő véletlen, hogy 4 64bit-es VLIW szó elfér 256bit-en. Netán nem ez volt a gyorsulás oka?

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#163 Abu85 HÁZIGAZDA rudi #161

Új Válasz 2007-05-17 13:08:19 #163
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz rudi #161 üzenetére

Ha egy chipet masszív párhuzamosságra terveznek, akkor néhol kompromisszumokat kell kötni. Világos ha egy Superscalár blokk Vec2-es típust kap és nem képes mellé a fordító más kódot berakni akkor lényegében a blokk-on belül kihasználatlan lesz az egységek száma. Ezt még az is tetézi, hogy a VLIW szavak jelenleg nem biztos, hogy megfelelően vannak optimalizálva, a párhuzamos végrehajtáshoz. Ez a kártya még csak most jött ki, az FX is akkor kapott egy jókora teljesítmény löketett amikor kikerült hozzá a Unified Complier. Nyilván a párhuzamosítást a G80-nal ellentétben nem az R600 végzi, a chip hardveresen csak a függőségeket tudja kezelni. A fordítóprogramnak kell arra ügyelni, hogy az R600 már eleve megfelelő kódott kapjon, a G80-nál a végrehajtás sorrendjéről a hardver dönt. Az R600 felépítése meglehetősen bonyolult, de a VLIW mintákat a Superscalár tömb kapja, ezek a tömbök tulajdonképpen azonos képességű ALU-kal (igaz az 5-ből az egyik okosabb a többinél) operálnak, így nem lesz olyan pokolian nehéz programozni a rendszert, mint anno az FX-et.
Pixel számolásnál elég ritka a Vec4-es típus, de nem elképzelhetetlen, hogy ezért, mert eddig nem volt olyan hardver ami megfelelő sebességet pordukál. Vertex Shader esetében ugye főleg ezt a típust használják, hiszen már az eddigi D3D9-es hardverek többsége is Vec5-ös feldolgozokkal menetelt. A G80-on meg is látszik az ehhez hasonló feldolgozók hiánya. Az R580 hozza a chip sebességének a harmadát finoman szólva is jelentősen szerényebb számítási teljesítménnyel.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#165 Abu85 HÁZIGAZDA Interceptor #164

Új Válasz 2007-05-17 13:11:41 #165
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Interceptor #164 üzenetére

Hát a szar fogalma képletes értelemben eléggé szubjektív lehet.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#168 Abu85 HÁZIGAZDA Vistaboy #166

Új Válasz 2007-05-17 13:19:11 #168
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Vistaboy #166 üzenetére

A képminőségben már régóta minimális különbségek vannak a két gyártó chipjei közt. Az a legend a már nem állja meg a helyét, hogy az Ati mindig szebb.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#169 Abu85 HÁZIGAZDA Interceptor #167

Új Válasz 2007-05-17 13:21:20 #169
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Interceptor #167 üzenetére

Az FX-ek eléggé túlmutattak a D3D9 bizonyos fícsőrjein (persze volt olyan amit nem tudtak), csak azok fránya regiszterek ...

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#172 Abu85 HÁZIGAZDA Mozso26 #170

Új Válasz 2007-05-17 13:31:18 #172
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Mozso26 #170 üzenetére

Elég sokan értenek hozzá itt a PH-n. FLeSs és Rudi cikkében is lehetett érezni, hogy tetszik nekik a kártya, hisz ajánlott minősítést kapott. Egyszerűen az a baj (ami nem baj ), hogy a PH a tényekre öszpontosít. Márpedig a tények jelenleg azt mutatják, hogy a HD2900XT igencsak jó vetélytársa lett a 8800GTS-nek, de még nem több annál.
Ha pusztán a felépítést és a két chipben lévő potenciált nézzük akkor szerintem az R600 jobb, nem is kicsivel. Én simán megvenném a HD2900XT-t, ha lenne rá pénzem, de most nincs.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#187 Abu85 HÁZIGAZDA dezz #186

Új Válasz 2007-05-17 15:03:50 #187
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz dezz #186 üzenetére

Mondjuk a CAPCOM annyira nem törte magát a hibátlan protáláson. A legtöbb gépen fagy, vagy el sem indul (nálam pl. a program szabálytalan műveletett hajtott végre). Szvsz erős a gyanum, hogy az NV erőltette, hogy gyorsan kiadják ezt a Beta izét. Ez lehet, hogy az nV-nek jól jött, de a Capcomnak nem, hiszen sokan a Demo alapján vásárolnak teljes játékot. Ugye miért vegyük meg az eredetit, ha már a demo fagy.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#200 Abu85 HÁZIGAZDA

Új Válasz 2007-05-17 16:29:16 #200
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Rudi: Az R600 dispatch processzor, kiosztja a VLIW mintákat a superscalár blokk-oknak. Egy R600-hoz hasonló bonyolultságú hardver esetében, elég komoly egység kellene, hogy egymaga hardveresen le tudja kezelni a megfelelő végrehajtási sorrendet, eléggé hosszú memóriaszavakat kell kezelni. Ezt egyszerűen célszerű a fordítóprogramra bízni. Nyilván itt áthelyeződik a teher a tervezőkről a rendszerprogramozókra. Az AMD-nek ebben az irányban kell most megfelelő kapacítást mozgósítani.
Dezz: Jawed elméleti kifejtését láttam, de szvsz jelenleg semmi nem garantálja, hogy ilyen szép kihasználtsággal hajtódik végre egy megfelelő complier nékül fordított kód. Persze driverből lehet mahinálni a dolgokat.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#204 Abu85 HÁZIGAZDA

Új Válasz 2007-05-17 16:44:05 #204
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Hát skacok, ez a két architektúra annyi kérdést vet fel a jövővel kapcsolatban, hogy még maga Nostredamus is hivatást váltana.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#242 Abu85 HÁZIGAZDA dezz #240

Új Válasz 2007-05-18 09:27:56 #242
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz dezz #240 üzenetére

''Senki többet, harmadszor? ''
Hajnal két órakor? Eléggé kocka vagyok, de ilyenkor azért inkább alszom.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#253 Abu85 HÁZIGAZDA

Új Válasz 2007-05-18 15:48:09 #253
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

Szvsz ha kész lesz a K10, akkor jó ötletnek tartanám a HyperTranszport 3 buszon hozzákapcsolt R600-at. Ugye a HT3 brutalgyors, ami már előrevetitheti a CPU-GPU beolvasztás lehetőségeit. Nyilván az új technológiáknak idő kell, ha ezt meglépné az AMD akkor lehet, hogy egyelőre csak rétegpiacot nyerne, de beindulhatnának az ilyen irányú fejlesztések.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#296 Abu85 HÁZIGAZDA gbors #273

Új Válasz 2007-05-19 12:27:56 #296
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz gbors #273 üzenetére

Én ezt másképp látom, az NV3x vs R3xx-at egyértelműen megnyerte az ATi. De az NV4x vs R4xx, szvsz az NV4x nyerte. Nem a teljesítményt nézem, hanem az egész rendszer összképét. Az NV40 sokkal fejlettebb volt az R4xx-nél. A G7x vs R5xx szívem szerint döntetlenre hoznám. Bár ha választani kell akkor G7x, mert az tudta a VTF-et.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#298 Abu85 HÁZIGAZDA gbors #297

Új Válasz 2007-05-19 12:46:59 #298
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz gbors #297 üzenetére

''Lehet, hogy a G80 nem tud thread-et cserélni ciklusvesztés nélkül?''
Ciklusvesztés nélkül nem, de ez eddig is így volt. A beyond3D fórumán olvastam valahol.

[Szerkesztve]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.