Keresés

Új hozzászólás Aktív témák

  • #25954560

    törölt tag

    válasz Bici #25 üzenetére

    erdekes latni a reszletes eredmenyek kozott h a PSF sem mindenhato. eleg vegyes a kep, valami gyorsul hangyanyit a kikapcsolasaval.
    ugy latszik ebben a phoronix test suite-ban nincs olyan teszt, ami a PSF elonyeit igazan ki tudna hozni.

  • #25954560

    törölt tag

    válasz DraXoN #54 üzenetére

    "Ennek csak az lehet az oka, hogy kód nem lett teljesen AMDre optimalizálva korábban. "
    nem csak az lehet az oka :) bar egyreszt egyetertek veled.

    a psf csak zen3-mal jott be, tehat ha vannak is trukkok, amiben tud segiteni a fordito, egyreszt lehet h csak a legmodernebb verziok tudjak, masreszt nem kizart h explicite engedelyezni is kene forditaskor ha a fordito nem teszi meg es a phoronix-os ~100 alkalmazas --with-tune=generic -kel forgott, sima gcc10.2. nem mondom h mas eredmeny lett volna mas forditoval vagy maskepp parameterezve, de nem kizart. a teszt igy is ervenyes, hiszen tudni lehet h mivel teszteltek.

    masik ok, amiert nem biztos h erdekes az AMD-re optimalizaltsag az az, hogy a PSF egy elegge alacsonyszintu hardveres megoldas ha jol ertem, nem biztos h egyaltalan meg lehet tamogatni forditassal.

    ha ugyis tudod mi ez, akkor bocs, ugord at legyszi ezt a bekezdest. nagyon konyhanyelven arrol van szo, hogy a pipeline-ban vannak load-ok es store-ok. a procik szoktak ezeknek a felcserelgetesevel is jatszani, de most arrol van szo, hogy ha a csoben van ket utasitas, az elso h tarolj le valamit egy cimre, a masodik meg az h olvass be valami egy cimrol, akkor nem az tortenik h letarolja a memoriaba es az olvasashoz pedig onnan olvassa ki (osszeadodva a ket kesleltetes), hanem rajon h a ket cim ugyanaz, nem kell beolvasni az adatot mert meg epp megvan, tehat odaadja a load-nak, renget idot nyerve. ez a store-to-load forwarding (STLF).
    a PSF annyival lenne okosabb, hogy meg sem varja meg a cimek feloldasat sem, hanem megsaccolja korabbi STLF parok alapjan h a store tartozhat-e valamelyik load-hoz.

    nem kizart, hogy hosszabb pipeline eseten nagyobb lehet a nyereseg (es a veszteseg is hibas elorejelzes miatt), szoval az is lehet h magat a ficsort tesztelik zen3-ban, de csak pl a zen4 v zen5 kesobbi modositaival lesz nagyobb haszna. csak spekulalok. :)

    koszi,
    &rew

  • #25954560

    törölt tag

    válasz ddekany #59 üzenetére

    en is azt probaltam irni h ez mar reg nem a fordito hataskorzete :)
    "...nem biztos h egyaltalan meg lehet tamogatni forditassal."

Új hozzászólás Aktív témák