Új hozzászólás Aktív témák

  • LordX

    veterán

    válasz buherton #24 üzenetére

    Csak hogy egy nyelvet beszéljünk.

    Ha valamiért a programomban kell egy olyan, hogy átrendezzük a biteket ku.. marha sokszor (mondjuk, a program egy H.264 enkóder), akkor vagy írok egy kisebb programot (pl.), vagy ha van egy FPGA-m, akkor felkonfigurálom úgy, hogy ha beletolom a bitet, azonnal kijön jó sorrendben. És ezzel egy FPGA lehetőségeinek kb. 0%-át használtam ki...

    A példában szereplő probléma SSSE3-al való megvalósítása 85 utasítás (lásd x264 forráskód kommentek nélkül - SSE2-vel kb. 1,5x ennyi), és pár utasítás ezek között sem 1 órajel, hanem 2-3, tehát kb. 100 órajel hosszú programról beszélünk. Legalább ennyiszeresére gyorsíthatna egy FPGA, ha ugyanolyan órajelen menne, és nem lenne IO követelmény, de talán nem 100x lassabb. (Meg talán a környezetet is be lehet rakni az FPGA-ba.)

    [ Szerkesztve ]

Új hozzászólás Aktív témák