Új hozzászólás Aktív témák
-
bjasq99
tag
Az emagok kritikájával teljesen egyett értek, azt meg kellett volna tenniük, hogy minden mag egy utasitáskészletet támogat. Az e magoknak is kellett volna támogatni az avx512 -t nyilván kisebb implementációs költséggel 256 széles feldolgozókkal stb. Abban egyetértek, hogy hasamraűtés szerűen nem lehet ISA -t hozni, ahogy az AVX512 -vel tették millió változatával, de ezt orvosolja az avx10. A kaotikus verzióktól eltekintve az avx512 mindenképp létjogosult szerintem, hisz sokkal több utasitás ad a programozó kezébe. Azt nyilván nem gondoltad komolyan, de 4096 bites SIMD valószínűleg nem lesz mert egy cacheline csak 64 byte. A sebességelöny meg igen is jelentős az olyan alkalmazásokaban amelyek ki tudják használni az avx512-t, és igen a fogyasztás megúgrik, de a teljesítmény jobban(továbbra is az olyan kódok amik kihasználják). Az olyan programok pedig amik nem használják nekik nem származik fogyasztás beli többlet, max minimális. Egyszerűen nem éri meg nem beletenni ilyen részegységeket egy p coreba, amiben minden a teljesitményre van kihegyezve, mert ha az összes alkalmazást tekintve átlag csak 1% -ot jelent a szélesebb vektor ISA, akkor is beleteszik, mert másképp elérni azt az 1% -ot még nehezebb lenne. Van is egy olyan törvény miszerint a tranzisztor szám emelkedésével újabb és újabb komplexebb instukciók jelennek meg. Bocs, ne vedd kötegetésnek válaszaim, csak értelmes diskurzust szeretnék.
-
Ehhez pedig legalább 3-5 foglalat típust kell bevezetni, hol itt a baj?
Hold on, trying to give a fuck... Nope, not Happening • Powered by Linux • "Az élet olyan sz@r, szerencsére a felén már túl vagyok" Al Bundy ¤¤¤ Hirdetéseim: https://hardverapro.hu/aprok/hirdeto/vizion/index.html
-
bjasq99
tag
Az avx utasításkészletek nem a dekodolástól fogyasztanak többet hanem a megnövekedet bufferek, floating point unitok és főleg a store unitok miatt. Egyébként minnél komplexebb egy utasitás annál kisebb az overhead. Pl sokkal energiahatékonyabb avx -t használni, mint simán egyszerre csak egy fput használni többször egymás után, mert ilyenkor sokkal nagyobb egységnyi utasításra a dekódolás költsége. Ez számít gpun, de cpun kevésbé mert nem a dekóder viszi el a fogyasztás nagy részét, hanem a predikciók. A komplexebb vektorutasításom ebben is jobbak hisz már eleve átadott párhuzamosságot kap a cpu. Szóval nem az avx utasításkészlet dekóder része miatt tart itt az intel!
-
hokuszpk
nagyúr
"Szerintem az kéne, hogy feltaláljanak egy új AVX utasításkészlet bővítmény, amihez megint új dekóder kell, háromszorosára duzzasztva a dekóder méretét. "
már feltalálták, AMX -nek hívják, az AMD majd talán a Zen6 -ban hozza ; de lehet, hogy nem, mert azért csak kellene mellé a szoftveres optimalizálás ; szóval ráérhet a Zen7 -ig.
[ Szerkesztve ]
Első AMD-m - a 65-ös - a seregben volt...
Új hozzászólás Aktív témák
ph A vállalat ideiglenes két elnök-vezérigazgatot is kinevezett, de kérdéses, hogy hogyan mennek tovább.
Állásajánlatok
Cég: Marketing Budget
Város: Budapest