Új hozzászólás Aktív témák
-
Duck663
őstag
érdekes helyzetben az AMD!
"... ráadásul hálós topológiával vannak összekötve" és "A D1-nek ugyanakkor van egy nagy titka, mégpedig az, hogy minden traning node-on belüli switch csak egy ciklus késleltetéssel működik."
A Tesla mutatja meg azt, hogy hogy a fenébe is kellene sok magot összekötni úgy, hogy közben alacsony maradjon a késleltetés! Ezt a felépítést kellene alkalmaznia az AMD-nek is.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
-
Duck663
őstag
Meg kell "kettőzni" a hálót. Az egyiken (nevezzük elsődlegesnek, vagy belső hálónak) a processzor magok vannak, ezek lehetnek a chipletek, ebbe simán belemehet akár 16 mag is. A második hálóhoz (nevezzük külső hálónak) pedig maguk a chipletek kapcsolódnak, abból pedig megint csak mehet jó pár, és ugyanerre mehet GPU is vagy bármilyen egyéb gyorsító, tetszőleges összeállításban, ami aztán kapcsolódik a memóriához, ugyanúgy mehet bele egy nagy cache is, meg bármi ami kell és ugyanúgy megvan a lehetőség arra, hogy egy chiplet hozható legyen AM4-re, TR-re és EPYC-re. Jó persze leírni könnyebb, mint megcsinálni, de ha a Tesla megoldotta az AMD-nek is meg kell tudnia oldani.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
-
Duck663
őstag
Abu, komolyan ne már! "Az egyes training node-ok minden irányban 512 GB/s-os adatátviteli tempóra képes buszon keresztül vannak összekötve. A lapkán belüli összesített sávszélesség egyébként a 10 TB/s-ot is elérheti." Ha ugyanez 16 magra van, nehogy már szűk keresztmetszet legyen. De ha mégis az leveszik 12-re. Arról nem beszélve, hogy nem ezt kell egy az egyben átvenni, hanem hasonlót kell építeni, saját igényeiknek megfelelően.
Itt ez a 3D V-Cache, gyönyörűen megmutatja, hogy teljesítmény marad a lapkákban (ezt megjegyeztem már korábban is), mert várnia kell az adatokra. A végtelenségig nem lehet növelni a cachek méretét. Az AMD-nek muszáj az adatokra várakozási időt csökkenteni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Mi sem egyszerűbb, minden mag kap saját L1 és L2-t, az L3 viszont már az elsődleges (belső háló) és másodlagos (külső háló) kapcsolódásánál található. Így minden egyes chiplet ilyen módon rendelkezik egy saját L3-mal, amit minden chipleten belüli mag, azonos sebességgel és késleltetés mellett ér el. Ezek után pedig még a memória előtt a másodlagos hálóhoz kapcsolható egy L4 is vagy akár HBM is, amelyet, minden egyes chiplet azonos sebességgel és késleltetés mellett ér el. A chipletenkénti L3 szükséges annak érdekében, hogy a másodlagos háló terheltségét kiegyensúlyozottabbá tegyék, viszont lehet, hogy a méretéből, a mostanihoz viszonyítva lehet faragni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
"Ha valódi megoldást akarsz, akkor kellene a hardverbe egyfajta tag directory, amitől a magok kérdezhetik, hogy melyik adat hol van a gyorsítótárban." Ez teljesen egyértelmű, ezt egy különálló rendszerrel kell megoldani, amiben az információ a hálótól függetlenül, de annak működését meghatározva száguldozik, nem csak azért, hogy az adatok helye meghatározható legyen, hanem azért is, hogy ne lehessen adatot lopni. De miután az itt haladó adatok csak metaadatok, itt már nincs szükség nagy sebességre.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Nincs végtelen skálázódás. De ezzel simán fel lehetne 256 magig is menni, egy tokon belül, úgy hogy megvan a memória koherencia, magas az elérhető memória sávszélesség, miközben a késleltetés is alacsony, sőt a különféle gyorsítók integrálási lehetősége is adott.
Közben pedig tovább lehet gondolni, hogyan léphetünk tovább, feljebb. Attól még, hogy van egy működő rendszerünk a kutatás nem áll(hat) meg, mert előbb-utóbb annak elérjük a határait és tovább kell lépni.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Igen ám, csakhogy az a 40 mag az egyben volt, nem volt csoportokra osztva. Egyébként volt valami kísérleti processzoruk abban 80 mag volt és hálós rendszert használt. Az hogy mi lett vele azt nem tudom.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
A 3D V-Cache bizonyítja, hogy teljesítmény marad a processzorban, egyszerűen adatra vár, hiába skálázódik relatíve jól, ha már tulajdonképpen egy szálon is teljesítményt veszít, és mindezt a magas késleltetés miatt.
Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
-
Duck663
őstag
Épp erről van szó, hogy magas a késleltetés és azt csökkenteni KELL!!! Később ez még rosszabb lesz, ahogy tovább növelik a magszámot. Nem lehet végtelenségig pakolgatni a cacheket ide is és oda is, mert akkor azzal fog elszállni a tranzisztorszám. Arról nem is beszélve, hogy profitot kell termelniük. Az Intelnél látszik, hogy kezdik megrázni magukat, az AMD-nek addig kell erős piaci részesedést kiharcolnia, mert utána egy gőzhengerrel fogják szembetalálni magukat.
"drágán implementálható belső kommunikációs topológiákra" Azt meg meglátjuk a következő generációknál mennyire is volt drága.
"de közben ennek az összes előnyét elvesztik ott, hogy menni kell a memóriáig az adatért." Ezért írtam, hogy a külső hálóhoz mehet L4 vagy HBM, ha szükséges!
Hidd el, jól átgondoltam én ezt, nincs jó úton az AMD ezzel a felépítéssel. Teljesítményt hagy a processzorokban, ezt pedig nem lehet megengedni, ha csúcsra akarnak törni, minden téren és ott is akarnak maradni.Igen-igen, még mindig Win7-et használok, és ha így haladunk még 2030-ban is így lesz.
Új hozzászólás Aktív témák
- A Gigabyte is visszaveszi alaplapjainak alapértelmezett tuningját
- Villanyszerelés
- Politika
- NVIDIA GeForce RTX 4060 / 4070 S/Ti/TiS (AD104/103)
- A Honor és a Huawei uralja a kínai mobilpiacot
- Ezek a OnePlus 12 és 12R európai árai
- Luck Dragon: Asszociációs játék. :)
- Projektor topic
- Linux kezdőknek
- YouTube
- További aktív témák...
- Dell 7920 2x Intel Xeon Gold 6148 (80 szál, 3,7GHz), 192GB - 1,5TB DDR4 ECC, 1TB NVMe SSD 1400W, ÁFA
- Gigabyte H270M + i5 7400 + Zalman CNPS4X + 16 Gb 2.600 Mhz HyperX Beszámitok!
- Beszámítás! GB H610M i5 13400F 32GB DDR4 1TB SSD RTX 3070Ti 8GB MONTECH AIR 1000 Lite Corsair 650W
- Beszámítás! GB H610M i5 13400F 16GB DDR4 250GB SSD RTX 3070Ti 8GB MONTECH AIR 100 Lite Chieftec 700W
- Beszámítás! ASRock H510M i7 10700F 16GB DDR4 500GB SSD RTX 3070 8GB Rampage Shiva Seasonic 650W