Új hozzászólás Aktív témák
-
Fiery
veterán
Fair teszt, a szokasos magas PH szinvonalon. Koszonjuk, jo volt olvasni!
-
Fiery
veterán
Nem mi fejlesztjuk a LuxMarkot, ugyhogy maximum tippelni tudok. Vagy a benchmark maga "huz" az Intel iGPU-k fele kicsit, azaz eleve ugy irtak meg, hogy jobban fekudjon az Intel iGPU-knak; vagy az Intel-fele OpenCL compiler tartalmaz specifikus optimalizaciokat. Azaz, az Intel kifejezetten felkeszitette a forditojat arra, hogy a LuxMark OpenCL kernelet a leheto leggyorsabb GPU gepi kodra forditsa le. Az OpenCL eseteben a fejlesztoknek meglehetosen korlatozott ralatasa es rahatasa van arra, hogy az OpenCL kodbol pontosan milyen gepi kod keszul, es az mi modon fut le az aktualis hardveren. Ahogy anno a 3DMark eseteben is lehetoseg volt a shader kod teljes lecserelesere a video driver altal, ugy az OpenCL compiler is kepes arra, hogy felismerjen egy adott benchmarkot vagy applikaciot, es egy eloregyartott koddal helyettesitse azt, maximalisan kihasznalva a gyari zseni fejlesztok munkajanak eredmenyet.
De mindez elmeleti lehetoseg csupan, egyaltalan nem biztos, hogy barmelyik GPU-gyarto is foglalkozna ilyen dolgokkal jelenleg. A jovoben biztos vagyok benne, hogy lesz ilyenre pelda, es a benchmark keszitok elobb-utobb ra fognak kenyszerulni arra, hogy dinamikusan generaljak az OpenCL kodot, vagy elore leforditott binaris kodot hasznaljanak (bar ez utobbi nem feltetlenul jarhato vagy celszeru modszer).
-
Fiery
veterán
Extrem optimalizacioval, a megfelelo processzornal, bizonyos kodoknal siman meg lehet "oldani", hogy az x86 CPU/FPU ugyanazt a szamitasi feladatot gyorsabban vegezze, mint az iGPU. Az AIDA64 fraktal benchmarkja peldaul gyorsabban fut a Haswell FPU-jan, mint az iGPU-jan, meghozza nem is kicsit, koszonhetoen az AVX2 es FMA-nak. A Kaveri eseteben ez azert nem realis, mert meglehetosen lassu az FPU, es "tul" eros az iGPU.
Igy neznek ki az egyszeres pontossagu lebegopontos fraktal benchmark eredmenyek az AIDA64 GPGPU benchmarkja eseteben:
Haswell i7-4770: FPU = 124,4 FPS / iGPU = 85,1 FPS
Kaveri A10-7850K: FPU = 31,2 FPS / iGPU = 145,6 FPSEttol fuggetlenul fenntartom azt, amit irtam az OpenCL GPU benchmarkokrol, me'g ha ez nem is feltetlenul igaz a LuxMarkra vagy barmelyik mas, jelenleg letezo OpenCL benchmarkra.
[ Szerkesztve ]
-
-
Fiery
veterán
Az igazsaghoz azert hozzatartozik, hogy eleg melos kihasznalni az AVX2 es FMA-ban rejlo lehetosegeket. Ha a HSA beindul, azzal sokkal konnyebb lesz izmos kodot irni, mint AVX2-re vagy FMA-ra optimalizalni assemblyben peldaul. Ha a fejlesztonek van lehetosege, van ideje es a kepessegei is megfeleloek, akkor viszont brutalisat lehet szakitani AVX2/FMA-val. Plane ha majd lesz 8 magos desktop CPU (Haswell-E) is ilyen kepessegekkel
-
Fiery
veterán
válasz Oliverda #207 üzenetére
Nincs leirva egyertelmuen a jovo A kovetkezo generacio (Carrizo) FM2+-ba fog illeszkedni, viszont az azutan kovetkezo generaciokrol me'g semmit nem lehet tudni. A legvaloszinubb forgatokonyv az, hogy azok teljesen uj foglalatot kapnak, DDR4 memoriaval, es mar nem a Bulldozer architekturara epulnek. Az AMD 2 uj architekturat is belengetett mar, bar nem erositette meg a letezesuket (marmint a tervek letezeset): az egyik Family 20h neven szerepel, SP1 foglalattal; a masik pedig Family 21h, FF1 foglalattal.
-
Fiery
veterán
A Kaveri korul volt nehany kavaras, pl. a Richland is ezert lett bedobva, mint koztes megoldas Amikor a Richlandrol fellebbent a fatyol, onnantol mar lehetett tudni, hogy FM2+ lesz a Kaveri. Aztan ugye volt Kaveri 1.0 meg GDDR5 is menet kozben, amik mentek a levesbe
A Carrizo eleg egyertelmuen FM2+ foglalathoz keszul, nincs egyszeruen ertelme bolygatni a dolgokat. Egyedul a DDR4 tamogatas valtoztathatna ezt meg, de arra en szemely szerint nagyon kicsi eselyt latok, hogy hirtelen ugy berobban a DDR4, hogy 2015 elso feleben muszaj lesz DDR4-es Carrizot kiadni a _desktopra_. Ugyanis a mobil es ultramobil szegmensbe BGA foglalatban (FP4) erkezik a Carrizo, ott meg velhetoen eleve beletervezik a DDR4 opciot is, biztos ami biztos alapon.
[ Szerkesztve ]