Legfrissebb anyagok

IT café témák

PROHARDVER! témák

Mobilarena témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Új hozzászólás Aktív témák

#46 NightGT senior tag Abu85 #41

Új Válasz 2019-08-30 10:37:56 #46
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

NightGT

senior tag

válasz Abu85 #41 üzenetére

Akkor tulajdonképpen mi volt a teljesítménybeli elmaradás oka?
Tizedannyi ismeretem sincs a hardver felépítéséről, mint neked, vagy néhány korábbi hozzászólónak. De szívesen olvasnám a véleményedet. Amit nem értek, abban segít a google, meg a korábbi cikkek.
Egyelőre nekem mindebből annyi van meg, hogy az FPU az a Quake, és a Cyrix bukása óta elemi része a processzormagnak. Az FX-ekben meg pont azokon kellett osztozni...
DraXoN kicsivel feljebb már írt néhány pontban az okokról...

[ Szerkesztve ]

Speed is the only truly modern sensation
#58 Raymond félisten Abu85 #41

Új Válasz 2019-08-30 13:40:05 #58
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

félisten

válasz Abu85 #41 üzenetére

"Minden duplikálva volt. Még az FP is."
Az FP nem duplikalasa volt az egyik legjobban vitatott resze a Bulldozer-nek a megjeleneskor hogy azert nem 8 magos. Egy modulban az AMD szerint is ket INT mag es egy FP mag volt.

Privat velemeny - keretik nem megkovezni...
#62 frescho addikt Abu85 #41

Új Válasz 2019-08-30 17:32:37 #62
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

frescho

addikt

válasz Abu85 #41 üzenetére

"A fenti képen zöld és kék színnel van jelölve az egy-egy mag dedikált része, lilával pedig a mindkét mag számára hozzáférhető egységek. Az utasítások végrehajtása a következő utasítások kiválasztásával, azok előfeldolgozásával és dekódolásával kezdődik, ezeket az összefoglaló néven front-endnek hívott megosztott részegységek végzik, órajelenként váltva a két szál között.
Az gyártó (AMD) figyelme leginkább egy úgynevezett Cluster-based multi-threading (klaszter-alapú többszálúsítás) felé irányult, mely a korai prognózisok alapján még plusz 50% szilícium felhasználása mellett 80% teljesítmény növekedést ígért."
---
"A Bulldozer front-endje nem volt alulméretezve. Konkrétan ezt kapta meg a Zen is. Még amikor az AMD a Zen briefingeket tartotta, akkor elmondták, hogy alig módosítottak rajta, mert ez volt a legjobb eleme a Bulldozernek, ami messze túl volt méretezve, így megfelelt a Zen magnak is."
Az, hogy a frontend megfelelt 1 Zen maghoz nem jelenti azt, hogy két Bulldozer maghoz nem volt alulméretezve. Ha jól emlékszem, akkor ezt azóta folyamatosan tovább fejlesztik, a Zen 2 esetében az IPC növelés fontos eleme volt. Analógia: Egy kis autó elég lehet egy 4 fős családnak, de 4 gyerekkel már nem férnek el benne.
"A modul lényege az egyszálú teljesítmény maximalizálása volt, mert ha egy szálon futott a számítás, akkor lényegében az a szál egymaga megkapta a túlméretezett, két szálra tervezett részeket."
A válaszodnak ez a részét gondold át. Egyértelműen elbukott a fejlesztő részleg, ha ez volt a cél, ugyanis 1 szálon a Phenom is simán iskolázta. Sokkal jobban megállja a helyét amit utánna írtál:
"A koncepció az volt benne, hogy ilyen formában sokkal kisebb mértékben kell növelni a lapkaterületet, a nagyobb százalékos előrelépéshez. A CMT +60-80%-ot jelenthetett, miközben lapkaterületben nagyjából +40-50%-ot fizettek. Plusz 100%-ért plusz 100%-ot kellett volna fizetni a lapkaterület szintjén."
Teljesen egyetértek, ha a CPU maximális sok szálú teljesítményét nézzük. De nem egy szál teljesítménye lett így nagyobb, hanem az adott sziliciumra vetített maximálisan elérhető. A kettő között negy különbség van ami miatt sikertelen lett a Bulldozer széria. Többek között ezért idéztem be a cikkeidből az első két képet. Jól látszik, hogy mi közös és az is, hogy a lapka méretében ez mit jelentett.
"Az AMD-nek van is egy compute core whitepaperje. Abban ezt értik mag alatt: egy mag olyan HSA-t támogató, tetszőlegesen programozható hardveres blokk, amely képes legalább egy folyamatot futtatni saját kontextusán, illetve virtuális memóriaterületén belül, függetlenül a többi magtól."
A második ok amiért a képeket beszúrtam a második mondatod. Egy maghoz eszerint kell fetc, decode, FP scheduler és L2 cache is. Ha kiveszem az egyik maggal ezeket, akkor a másik már nem felel meg az állításnak. A 1.5 magnak megfelelő szilicium azt is jelenti, hogy csak 1.5 mag került oda. 1 modul, de nem teljes értékű két mag. Analógiával egy társbérlet nem felel meg egy teljesen saját lakásnak.
Én úgy látom, hogy az AMD helyes döntést hozott. Ha biztosan nyertek volna, akkor az ügyvédi kültséget nem nekik kellett volna állni. Mérlegeltek és úgy látták, hogy a nyerési esélyük alatta van annak amit megér a megegyezés. Műszakilag is jó váltás a Ryzen vonal.

https://frescho.hu
#149 paprobert senior tag Abu85 #41

Új Válasz 2019-09-05 15:24:23 #149
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

paprobert

senior tag

válasz Abu85 #41 üzenetére

"A modul lényege az egyszálú teljesítmény maximalizálása volt, mert ha egy szálon futott a számítás, akkor lényegében az a szál egymaga megkapta a túlméretezett, két szálra tervezett részeket."
vs.
2012-es magyarázatod
"A Bulldozer fő szempontja a throughput teljesítmény kitolása volt, amihez elővették Pollack szabályát. Ha egy szálon várod a teljesítményt, akkor nem az volt a cél, hogy ott jó legyen. Ha a throughput tempót várod, akkor az növekedett."
Itt valami nem kóser.

[ Szerkesztve ]

640 KB mindenre elég. - Steve Jobs