-
IT café
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
válasz Petykemano #37339 üzenetére
Persze, de attól még a TSMC elvileg jobb órajelben. És volt rá idejük, hogy portolják. Persze attól még lehet, hogy egyszerűen csak 250 wattos lesz az 590 vagy optimalizáltak valahogy a GloFo 14nm-en.
Egy hét múlva kiderül, vagy legalábbis elvileg november 15-én jön az RX 590.
Make Asia Great Again!
-
-
nagyúr
válasz lezso6 #37354 üzenetére
Ennél jóval prózaibb a dolog - az nVidia nagyon sok munkát tett a Pascal fizikai architektúrájába a magas órajelek érdekében. Engem konkrétan meglepne, ha a két node között jelentős különbség lenne.
"We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."
-
leviske
veterán
válasz dergander #37342 üzenetére
Ez azért múlik az IMC-n is. Hiába raknak mellé drágább memóriákat, ha magasabb órajelen nem képes lekezelni.
(#37352) lezso6: Engem nem lepne meg, ha mostanra jutottak volna el oda, hogy inkább engedik egy kicsit felfelé a lapkaméretet. A GloFo helyzete miatt valószínű, hogy egy darabig muszáj lesz 14nm-es GPU-t is gyártaniuk, ahhoz pedig szükségük lehet a magasabb órajelekre.
Emlékszem, a RV790 idején is nagyobb lapkával sikerült elérni, hogy magasabb órajeleken és alacsonyabb fogyasztással üzemeljen a HD4890, mint a HD4870. Ha a kapacitorgyűrűs megoldás nem lett standard, akkor van rá esély, hogy olyasmivel próbálkoztak be most is.
Így talán volna rá esély, hogy teljesítményben ne legyen olyan vállalhatatlanul nagy szakadék az új GPU és a Polaris alapú termékek közt.
-
-
-
#45185024
törölt tag
Azt tudjátok hogy volt egy kis előadás is horizon utána?
Amúgy Kürt csinál MI oktatást akit érdekel közületek már azoknak aki tud kígyóul...[ Szerkesztve ]
-
válasz #45185024 #37361 üzenetére
Ja, hát a lényeg az, hogy az új Vega 20 alapú Instinct kártyákkal teljes compute piacot célozzák, mert ki***** sokoldalú és univerzális az új ISA. A fő újítás ugye az 4 elemű INT8 illetve a 8 elemű INT4 vektorpátok dot productja (skaláris szorzata), azaz két vektorból csinál egy skalárt.
De ezek már a P100 utáni Pascaloknál már megvolt az INT4 kivételével, szóval az AMD nem talált fel semmit. Ugye P100-nál csak FP16 "dot product" van, de fix funkciós hardverrel, amit Tensornak hívnak. A Turing pedig behozta a Tensor magokba az INT8 és INT4 "dot product" támogatást is.
A Tensornál azért az idézőjeles "dot product", mivel csak be van égetve, önmagában csak dot productot nem tud, legalábbis nagyon nem hatékony a feladatra. A Tensor annyit csinál, hogy összeszoroz 2 db 4x4-es mátrixot és az eredményül kapott 4x4 mátrixhoz hozzáad egy harmadik 4x4-est, effektíve "mátrixos FMAC".
Ez mátrixok esetén baromi hatékony. Azonban a fentiből az is következik, hogy ha te 16 pár teljesen független vektorból akarsz csinálni 16 db dot productot, akkor cseszheted, mert 64-et kapsz, azaz az eredmények 3/4 része kuka, felesleges.
Bár ilyen szituáció nem tudom hol van, azaz amikor a dot productot nem mátrixszorzásra használod, hanem önmagában. Szóval az AMD-s előny valószínűleg nem ér semmit. S fontos adalék, hogy a Vega 20 INT4 dot productja csak 8x8 mátrixon alkalmazható, 4x4-es mátrixon nem, ellentétben a Turinggal.
Szóval összefoglalva az van, hogy az AMD a vektorfeldolgozásra gyúrt rá, míg az NV a mátrixra. Már megint két külön irányban megy a fejlesztés.
[ Szerkesztve ]
Make Asia Great Again!
-
#45185024
törölt tag
válasz lezso6 #37362 üzenetére
Jó hát nem játékra erősítették ez látszik az előrelépéseken is.
Nem 1.25 performancet vártunk a 7nm-től. De szervereknél más a fontosabb
Viszont az 1800-as órajelet akkor is említsük meg mert ez később fontos lehet.
Lisa interjú az előadás után.[ Szerkesztve ]
-
sakal83
addikt
Sziasztok
Mikor es mennyiert jon az rx590? Illetve a 1070hez kepest mire kepes?
-
#45185024
törölt tag
Itt egy firestrike extreme táblázat
meg kell nézni mire elég a 7350 pont
Harcol a Fury X-el[ Szerkesztve ]
-
#45185024
törölt tag
válasz #59036672 #37367 üzenetére
Nézd én ezt elmondtam már a VSben is, de haragaszkodsz akkor itt is megteszem.
Próbáld meg elfelejteni a márkahűségedet.Az hogy minden csíkszélességen 60%ot emel egy kártya teljesítményén egyszerűen nem igaz ! Ez PR tevékenység.
A 12 nm 5% teljesítménynövekedést hoz plusz 200-300 Mhz-et.
A 7nm mint fent is látod 25%-ot hoz de ott az energiahatékonyság kellett a +50% a képen direkt ezért mutattam hogy az emberekben ez rögzüljön.
Ezenkívüll hoz a tsmcnél gyártási technológiája és ennyi.
Amikor cuda magot emelünk , amikor sokkal sokkal több szilíciumot öntünk egy GPUba akkor érzékeltethetünk hatalmas növekedéseket ,több mint 80 százalékkal nőtt a tranzisztor szám 471 (1080ti) 754 nm2 2080TI és 545 a 2080 de a valóság meg az hogy az AMD is csak úgy tudna erősödni ha kihozna egy 5000 6000 shaderes kártyát 12nmen és az is pont 300 felett lenne. Ezt az utat AMD elvetette. Ezen lehet hőbörögni de a 7nmes szervercuccok sokkal zsírosabbak, az epyc /zen2 sokkal zsírosabb piac főleg hogy ragasztgatunk . Viszont ezekkel nincs érdeke hogy lejöjjön árban.[ Szerkesztve ]
-
Petykemano
veterán
válasz #45185024 #37369 üzenetére
Valamelyik nap a VS-ben én is azon lamentáltam, hogy mennyire kevés előrelépés történt az AMD oldalán az elmúlt években:
28planar->(20planar->)14+finfet!->10finfet->7finfet
0.127-um2 ==> 0.027um2
5 generációnyi process fejlődés, 5x kisebb SRAM cellá
4-5 generációnyi architekturális fejlődés.Ehhez képest a 450mm2-es 28nm Hawaiihoz képest a 330mm2 7nm Vega20 épp csak a kétszeres sebességet érheti el ugyanezzel a fogyasztással. És ezt is nagyrészt annak köszönhetően, hogy 1050-ről felment az órajel 1800-ra.
Mintha kissé megállt volna az idő.Az AMD valahol a hawaii és a fiji környékén tényleg elérhette a GCN skálázódási határát: 64CU, 64 ROP.
A vega64 a hawaiihoz képest a TPU adatbázisa szerint 75%-kal gyorsabb.
A boost órajele 50%-kal magasabb.
43%-kal több SP-t tartalmazSzámokban ez annyit jelent, hogy
FP32: 5,632 GFLOPS vs 12,583 GFLOPS (+123%)
Sávszél: 320.0 GB/s vs 483.8 GB/s (+51% + DCC)
Pixel Rate: 64.00 GPixel/s vs 98.30 GPixel/s (+53%)
Texture Rate: 176.0 GTexel/s vs 393.2 GTexel/s (+123%)a 75%-os előnyből (vega6 vs 290X) 50%-ot biztosan az órajel magyaráz és ezzel tudta tartani a lépést a sávszélesség, amit segít a DCC. ha a pixel fill rate-et tekintjük szűk keresztmetszetnek, akkor az abban a fennmaradó részből valamicskét magyarázhat még a dsbr.
De a villantáshoz úgy tűnik, hogy valamilyen nagy csomót kéne átvágni az architektúrában. És úgy tűnik, hogy az utóbbi években ez nem sikerült, vagy nem ezzel próbálkoztak, hanem valahogy az órajelet növelni, mert az mindenen segít.
Találgatunk, aztán majd úgyis kiderül..
-
Televan74
nagyúr
válasz Petykemano #37370 üzenetére
Vagy talán el kellene szakadni a GCN -től,és az alapokat újragondolni.Ha már ennyire nem megy.Nekem úgy tűnik egy kicsit,hogy zsákutcában araszolnak előre,csak még nem tudják hol a vége.
[ Szerkesztve ]
Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
-
HSM
félisten
válasz solfilo #37365 üzenetére
Nekem nem tűnik kevésnek hozzá a szintén 8Ghz-es VRAM, az Rx580-om is úgy vettem észre jobban meghálálja, ha felrántom 1400Mhz GPU órajel fölé, mintha a ramot piszkálnám. Szerintem jó lesz ez, bőven el fogja bírni a magasabb órajelű GPU-t.
(#37370) Petykemano: Szvsz itt már elfogy a 64ROP, plusz a sávszél hozzá. Hatékonyabb és több ROP kéne, ami takarékosabb a sávszéllel, jelenleg szvsz ez az Nv legnagyobb fegyvere. A többi területen szvsz bőven elég erős a két nagy Vega, akár egy 1080Ti ellen is.
Az RX580-on is a 32ROP kevés kicsit, főleg a 1060-hoz képest érezhetően itt-ott és ha belegondolsz, a Vega64 kb annak (RX570) a duplázása felépítésre.
Mondjuk ahol meg inkább számítási kapacitás kell, ott meg az 580 veri a 1060-et, nekem inkább ez a verzió jön be, de mindenképpen érdekes összehasonlítás szempontjából.[ Szerkesztve ]
-
válasz Petykemano #37370 üzenetére
Nem a GCN a probléma, hanem az, hogy fejlesztik, ezt már írtam.
A Vega 20 a tudása miatt nagy. 1/2 FP64 támogatás, 4096 HBM (I/O doesn't scale), SRAM ECC, dot product.
A Vega 10 szintén, egy Fiji die shrink felezett HBM-mel kb 300 mm2 lett volna. Ehhez képest a Vega 10 hatalmas lett, 480 mm2. Van itt DSBR, NGG, 2x FP16 támogatás, ezek nincsenek ingyen tranzisztorok szintjén.
A többi rendben van, még a Fiji mérete is, csak játékban valamiért nem skálázódik jól a kisebbekhez képest. Ugyanez igaz a Vegára is.
De ha a compute-ot nézed, akkor nagyon sokat lép előre a GCN. Csak hát játékban ebből nem látni semmit.
[ Szerkesztve ]
Make Asia Great Again!
-
Petykemano
veterán
-
Petykemano
veterán
-
Petykemano
veterán
-
dergander
addikt
válasz Petykemano #37380 üzenetére
Igen, de akkor módosítani kellett volna sokat, így meg egy rebrand 580, kicsit finomítottan kisebb csíkszélességgel. Ez így költséghatékonyabb, mint még áttervezni +16 ROP valamint a memóriavezérlőt GDDR5x-re.
-
Abu85
HÁZIGAZDA
válasz lezso6 #37379 üzenetére
Az nem. Az SRAM ECC, az lényegében egy end-to-end ECC. De ez önmagában nem elég a RAS-hoz. Ott külön szervizelhetőségi paraméterezhetőség van a rendszerben, hogy a megfeleljen a RAS-funkcionalitásnak, ami végeredményben lehetővé teszi, hogy a szerver 24/7 működjön. Ez azért nem volt eddig benne a GPU-kban, mert marha bonyolult, viszont így megnyíltak a GPU-k is a feladatkritikus rendszereknél.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
HSM
félisten
válasz Petykemano #37380 üzenetére
Nem lenne elég. Mint írtam, ehhez a ROP-ok sávszélesség hatékonyságán is javítaniuk kéne, amit a zöldek már nagyon régóta jól csinálnak.
48ROP csak felesleges költség lett volna, ahhoz már kevés lenne a 256bites GDDR5 busz. Viszont a pletykák alapján lényegesen növelt órajelek kellemesen fognak hatni a meglévő 32ROP tempójára is.
Modern motorokban amúgy szvsz teljesen jó ez a megközelítés, arra a felbontásra (főleg 1080p-sek) ahova ezek a kártyák pozicionálva vannak bőven elég ennyi ROP. Most néztem pl. BF5 tesztet TPU-n, meg is előzte 5%-al a 1060-at. Az 590 pedig ha tényleg alapból felemeli a mostani 1340Mhz 580 órajelet 1500-1600-ra az igazán ütős kis holmi lenne.
Az Tflopsban 1500mhz-es GPU-val már 7Tflopsot tud egy Polaris20, ami már több, mint amit alapból egy GTX1070 tud, ami azért elég derék.
Tehát bár ROP terén limitáltak némileg, számítási kapacitás van dögivel. Viszonyításként egy GTX1060 teljes kiépítésben mindössze durván 4,5Tflops.[ Szerkesztve ]
-
Televan74
nagyúr
Én inkább várok egy tesztet játékokkal és akkor mondom meg milyen ütős egy cucc.Nyers számok olykor becsapóak.10-15% sebesség növekedés a RX590 javára az RX580 szemben tényleg csak a Fatboy -oknak, akarom mondani Fanboy -oknak éri csak meg.
Amikor nincs remény! Jusson eszedbe nincs isten, csak én!
-
syberia
veterán
https://howbad.info/
-
Jack@l
veterán
Abu, mennyi vramot vizionáltál a topiklakóknak, amit a BFV majd enni fog? 12 vagy 16 gb volt amivel a hbcc majd simán elboldogul?
[ Szerkesztve ]
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
HSM
félisten
válasz Petykemano #37393 üzenetére
1560Mhz alapórajel, nem rossz az. Az 580-asom meg se mozdulna ilyen órajelen...
-
Kvg
senior tag
Ezzel a hűtéssel olyan vísítós hangja leyz hogy csak na. Kivancsian várom a guru3d, vagy a kitguru tesztet.
Powercolor csak jobb lehet ennél.
Vega 56 30k val olcsóbb és sokkal gyorsabb. Ez így elég rossz vétel, de a naív emberek úgyis megveszik, mert ez 590 a legújabb széria.[ Szerkesztve ]
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- NVIDIA RTX 3060 Ti Founders Edition 8GB használt videókártya eladó garanciával!
- Inno3D iChill RTX 3070 X3 8GB használt videokártya eladó garanciával!
- Sapphire nitro pulse rx 580 4gb /256 Bit BESZÁMÍTÁSSAL!
- nVidia Quadro RTX A4000 16Gb GDDR6 256bit
- GeForce RTX 3060 Ti GAMING Z TRIO 8GB (ingyen posta)
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest