Új hozzászólás Aktív témák
-
thgergo
tag
Még futtattam teszteket AVX2 AVX512-re fordítva, közel azonos frekvenciákra limitálva ~2GHz tehát közel IPC-t jelentenek a százalékok:
AMD K10 "Magny Cours": ~60% (128 bit simd)
Westmere-E: ~100% (128 bit simd)
Sandy-E: ~130% IPC AVX1 fordítás (256 bit simd)
Haswell-E: ~160% IPC AVX2 fordítás (256 bit simd)
Skylake-SP: ~175% IPC SSE4.1 fordítás
Skylake-SP: ~190% IPC AVX2 fordítás (2x256 bit simd párhuzamosan)
Skylake-SP: ~195% IPC AVX512 fordítás (512 bit simd)Látható, hogy egyre kevesebb az utasítások értelezésére fordítandó "overhead" SSE-AVX-AVX512 útvonalon, ami szintén megkérdőjelezi, kell-e az AVX512 egyáltalán.
[ Szerkesztve ]
-
-
thgergo
tag
"Tehát két darab 256 bites vektorral dolgozó mag nem lesz olyan hatékony, mint egy 512 bites vektorral dolgozó mag (feltéve, ha azonos az órajel), hiába engedi meg maga az AVX-512 az ilyen irányú skálázást."
Nekem úgy tűnt ez a lefele skálázás nagyon is jó, lásd előző posztot.
Az intel az alapabb bronze-silver-gold Xeonokon letiltja (3xxx-4xxx-5xxx) a dupla AVX FMA unitot.
https://community.intel.com/t5/Intel-ISA-Extensions/State-of-AVX-512-on-Skylake-X/td-p/1143063Nem vagyok benne biztos, de ez nem azt jelenti, hogy a "2x256 bit párhuzamos" lefele skálázott AVX2 működést is letiltja vele? Nem lehet, hogy csak ebből származik a ebből származik sok esetben a lefele skálázás hibája? AVX512 utasításokkal mintha nem lenne külömbség, egy "FMA" port is elegendő.
[ Szerkesztve ]
-
Új hozzászólás Aktív témák
- Napelem
- A Gigabyte is visszaveszi alaplapjainak alapértelmezett tuningját
- Épített vízhűtés (nem kompakt) topic
- Milyen nyomtatót vegyek?
- Rendkívül ütőképesnek tűnik az újragondolt Apple tv
- Kupon kunyeráló
- Suzuki topik
- Bittorrent topik
- Sweet.tv - internetes TV
- Microsoft Office és Office 365 topic
- További aktív témák...