Keresés

Új hozzászólás Aktív témák

  • ukornel

    aktív tag

    válasz Jack@l #106 üzenetére

    "Mi baj az adatmásolással? Szükséges rossz, de ha a számítás pár százalékát veszi csak el időben?"
    "Ha"? A feladatok egy részénél lehet, hogy csak ennyit vesz el, de mi van a memóriaigényes, vagy az olyan feladatokkal, ahol sűrűn váltják egymást a jól párhuzamosítható, és a késleltetésre érzékeny részfeladatok? Lásd a #95-ösbeli példákat. Ott az idő nagy része másolgatással telik :(((

    "Apu-n meg ott van a ddr3-4, ami baromi lassú egy dgpuhoz képest"
    Nagy erőkkel dolgoznak az ügyön (HBM, HMC, Wide I/O).

    "sztem sokkal nagyobb overhead mint a feladatok átküldése a kártyára, meg a végeredmény visszamásolása."
    Azért a PCIe busz sebességét, látenciáját ne próbáljuk már a 2-4 csatornás rendszermemóriájáéval összehasonlítani :N

    "Az apu-k sikerességéhez két dolog kéne: hbm2 integrálva alaplapra, baromi sok, legalább 12-16 GB, és sokkal nagyobb igp rész, hogy már egy középkategóriás kártyát megüssön"
    Baromi sok alatt én nem 12-16 GB-ot értenék, ha compute.ról van szó, hanem ennél sokkal többet.
    A HBM2-nek pedig nem alaplapra, hanem interposer-re integrálva lenne értelme, mint a Fury-n, a sávszélesség és a fogyasztás miatt.

    "és sokkal nagyobb igp rész, hogy már egy középkategóriás kártyát megüssön"
    Igen, és biztos vagyok benne, hogy lesz ilyen; lásd #105.

    [ Szerkesztve ]

Új hozzászólás Aktív témák