Új hozzászólás Aktív témák

  • Petykemano

    veterán

    "A memóriavezérlőhöz egy 4 MB kapacitású, írható és olvasható másodlagos gyorsítótár és 4 darab ROP blokk kapcsolódik. Ezek a ROP blokkok úgynevezett pixelmotorokat tartalmaznak, egészen pontosan 4-et, és egy pixelmotor 4 blending, illetve 16 Z mintavételező egységből áll. Ez összesen 64 blending és 256 Z mintavételezőt jelent."

    Vega64

    "Mára hivatalossá vált, hogy a közölt adatok helyesek voltak, ugyanis a Raven Ridge SoC APU IGP-jében két darab ROP blokk található, amelyek tartalmazzák az úgynevezett pixelmotorokat, mégpedig egyenként kettőt, és egy ilyen pixelmotor 4 blending, illetve 16 Z mintavételező egységből áll, ami összesen 16 blending és 64 Z mintavételezőt jelent. A ROP blokkok ezúttal is az IGP L2 gyorsítótárának kliensei, aminek hála koherens pixel- és textúraadatokra vonatkozó memóriaelérésekkel lehet számolni."

    Raven Ridge

    Most már értjük, hogy miért szar a vega 64 és miért bivalyerős a Raven ridge

    A számokat nem értem, hogy jönnek ki.
    Tehát mégegyszer:
    Vega64: 4 ROP - ezekben egyenként 4 pixelmotor => 64 blending és 256 Z mintavételező
    RR: 2 ROP - ezekben egyenként 2 pixelmotor => 16 blending és 64 Z mintavételező

    16pixelmotor / 64CU => 4CU / pixelmotor
    4 pixelmotor / 11CU => 2.75CU / pixelmotor

    Ehhez képest a vega M:

    "A shader tömbök szempontjából viszont viszonylag szabad keze volt az Intel mérnökeinek, így leadhattak egészen extrém megrendelést is. Ilyen szempontból az egyedi Radeon pGPU különlegessége a négy darab geometriai motor, aminek nyilván része egy-egy darab tesszellátor is. Ezek a motorok működtetik a shader tömböket, amelyekbe egyenként 6 darab NCU került. Ez nem számít különlegességnek, viszont egy shader tömbön belül egy olyan ROP blokk található, amely négy pixelmotort tartalmaz, és egy pixelmotor 4 blending, illetve 16 Z mintavételező egységből áll. Ez összesen 64 blending és 256 Z mintavételezőt jelent a teljes lapkára nézve"

    [link]

    A vega M megkapta azt a RBE-t, mint ami a vega64-nek is van:
    16 pixelmotor / 24CU => 1.5CU / pixelmotor

    * Feltételezve azt, hogy a CU-k és a RBE azonos frekvencián megy

    Gyanítható, hogy a raven ridge esetén nehezen összehasonlítható a tflops érték az 1030-cal, mert akár bandwidth constraint is lehet. Sok esetben egyébként úgy tűnik, a majdnem másfélszer több CU nem ad annyival többet hozzá, vagyis a 2.75CU/pixelmotor nem hasznosul.

    Ellenben az is gyanítható, hogy a Vega M fog legközelebb állni az fps/tflops tekintetében az nvidia ellenfeléhez.

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák