Keresés

Aktív témák

  • P.H.

    senior tag

    válasz P.H. #28 üzenetére

    @@2ND_STEP lecserélve, "kiegyenesítve", így már 0.9 IPC helyett hozza a 2.0 IPC-t, kevesebb utasítással.
    A teljes, előzőekben említett algoritmus IPC-je így már (mivel a 2. step lefutása a leggyakoribb) 1.9 körüli.

    Carry Flag a programozó legjobb barátja ... legalábbis AMD-n

    @@2ND_STEP:
    xor ecx,ecx
    xor ebx,ebx
    mov esi,[esp+_SAVE+__MTX]
    mov edx,00FFFFFFh
    sub ebx,ebp
    @free0:
    sub ecx,ebp
    @zeroinrow:
    bt dword ptr [edi+ebx],01h
    setc al
    bt dword ptr [edi+ecx],00h
    adc al,00h
    cmp edx,[esi]
    adc al,00h
    jnz @nx2col
    xor edx,edx
    add esp,_SAVE
    add edx,[esi]
    pushad
    jz @@DECIDE_NEXT_STEP
    @nx2col:
    add ecx,01h
    lea esi,[esi+04h]
    jnz @zeroinrow
    add ebx,01h
    jnz @free0

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Aktív témák