-
IT café
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Devid_81
nagyúr
válasz Quadgame94 #43448 üzenetére
Csak nagyon azt mondogatta mindenki, hogy 2025.
Nyilvan Nv oldalon akkor jon amikor akarjak...
-
S_x96x_S
őstag
> Továbbra sem értem hogy kapcsolódik ide , még offtopikként sem.
A topik leírásában szerepel: "esélylatolgatás" + "érdekesség" + "stb." [1]
és szerintem lefedi az nVidia GPU-k alternativ architektúrával (cerebras) szembeni esélylatolgatását.
ami egy elég érdekes téma.
De ha van véleményed, akkor nyugodtan kifejtheted,
hogy a Cerebras architektúrával szemben
milyen esélye lehet a bármilyen hagyományos GPU-nak? ( pl. nVidia GH200 )
bár a Cerebras azt sugalja, hogy minden téren előnyösek, de azért annak is van gyengébb pontja.
A másik poszt a CXL + Gen6 -al kapcsolatos .. az is kapcsolatos architektúra + esélylatolgatás kategóriába.
[1]
"""
A topik témája:
Az NVIDIA éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
"""Mottó: "A verseny jó!"
-
Alogonomus
őstag
"kérdés az hogy mit áldoznak fel érte? mert el kell kezdeniük a gyártást az pedig kilő valami most akár hiánycikknek is tartható pénzt hozó terméket"
Elméletileg az Nvidia 3 nm-en még semmit sem gyártat. Idén a Blackwell és a Hopper lesz az első, ami 3 nm-t használ. Az egyetlen kérdés, hogy a H20 és H200 iránt mekkora lesz az érdeklődés, mert azokon biztosan nagyobb lehet a haszon, mint bármelyik Blackwell kártyán.
-
félisten
válasz S_x96x_S #43454 üzenetére
Kifejetttem, ez a hír nem az Nvidiáról szól, vonatkoztatni sem tudok rájuk belőle, mert ők a tudomásom szerint pletyka szintjén sem gondolkodnak ilyen dolgoban. Az Nvidia, AMD és Intel által használt összeköttetés, mint összehasonlítási alap van benne egy egyszerű említés szintjén.
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
félisten
válasz Alogonomus #43455 üzenetére
Az is igaz, legyen úgy.
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
S_x96x_S
őstag
> Kifejetttem, ez a hír nem az Nvidiáról szól,
tudtommal a H100 még nVidia termék
és ezzel van benchmarkolva Cerebras
H100 = https://www.nvidia.com/en-eu/data-center/h100/Ha nem vigyáz, akkor az Nvidia számára a Cerebras fejlesztései jelentős kihívást jelenthetnek, különösen a magas szintű AI teljesítmény és az energiahatékonyság terén.
( memória sávszélesség + számítási sűrűség )
persze, a független teszteken pontosodik az információ:
"One major advantage Cerebras has is memory bandwidth. Thanks to the 44GB of onboard SRAM — yes, you read that correctly — Cerebras' latest accelerator boasts 21PBps of memory bandwidth,
compared to the 3.9TBps the H100's HBM3 maxes out at.That's not to say Cerebras' systems are faster in every scenario. The company's performance claims rely heavily on sparsity.
While Nvidia is able to achieve a doubling in floating point operations using sparsity, Cerebras claims to have achieved a roughly 8x improvement.That means Cerebras' new CS-3 systems should be a little slower in dense FP16 workloads than a pair of DGX H100 servers consuming roughly the same amount of energy and space at somewhere around 15 petaFLOPS vs 15.8 petaFLOPS (16x H100s 989 teraFLOPS.) We've asked Cerebras for clarification on the CS-3's dense floating performance; we'll let you know if we hear anything back.
https://www.theregister.com/2024/03/13/cerebras_claims_to_have_revived/bővebb elemzés:
https://www.nextplatform.com/2024/03/14/cerebras-goes-hyperscale-with-third-gen-waferscale-supercomputers/> Továbbra sem értem hogy kapcsolódik ide , még offtopikként sem.
hasonlóan mint ez a te régebbi posztod: #34746
az "AMD bemutatóról és benchekről".
tekintsd az én posztomat amolyan
"Cerebras bemutatóról és benchekről"Mottó: "A verseny jó!"
-
Csakhogy legyen ismét egy kis ontopic téma is:
NVIDIA nem tököl, idén is nagyon nagy neveket tudhatnak magukénak.
Gameplay csatornám: https://www.youtube.com/channel/UCG_2-vD7BIJf56R14CU4iuQ
-
Raymond
félisten
válasz huskydog17 #43460 üzenetére
A Black Myth: Wukong mar minden technologiat megkap ami letezik csak maga a jatek nem akar ideerni
Privat velemeny - keretik nem megkovezni...
-
Alogonomus
őstag
Hát ha igaz, hogy a GB203 (RTX 5080) raszterben "csak" az AD102 (RTX 4090) környékét hozza, akkor akár a következő generációban is megismétlődhet a jelenlegi helyzet, hogy van egy kellemetlenül drága csúcs Nvidia kártya, de a már elfogadható árú kártyák szintjén valós verseny alakulhat ki a két gyártó között.
-
Quadgame94
senior tag
válasz Alogonomus #43462 üzenetére
Árban 1200 USD lesz valszeg az az 5080. 500 dollar alatt pedig szinte 0 előrelépés lesz. 5060 Ti 12 GB 399 USD környékén landol majd de jó ha egy 3080/4070 szintjén lesz. És ez nem pesszimizmus. Ez a realitás. Az NV totál érdektelen az 500 dollár alatti szegmensben.
-
félisten
válasz Quadgame94 #43463 üzenetére
Ugyan annyi kártyája van ott mint az AMD nek, illetve igaz a 4070 539 , akkor 1-.
Alogonomus: Az az AD102 nagyon tág fogalom. A 4090 az AD102 nek egy jókora részét nem használja. ha ezt főleg IPC ből hozza össze( nem hiszem hogy a 4nm-->3nm átállásból nagyrészt) az jelentős ugrás.
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
Quadgame94
senior tag
Nem állítottam, hogy az AMD-nek több van. De az érdektelenség az inkább abban merül ki, hogy ár/teljesítményre nem figyelnek. 4060 Ti épphogy gyorsabb mint az előd 3060 Ti, cserébe ugyanannyiba kerül Mostmár 350-360 USD körül van 8 GB változat... Nem értem minek adtak ki egy másik kártyát... simán átnevezhették volna a 3060 Ti-t és kész.
AMD esetében meg talán még gázabb a helyzet. De érdekes az emberek nem lázadoznak... és ezért a kövi genben sem bíznék, hogy jobb lesz ilyen téren.
Pici előrelépésre számítok csak. 8700 XT majd talán lesz egy 4070 és 4070 Super között, cserébe 400-450 USD lesz. Mondanom sem kell, hogy ez valami brilliáns deal lesz
-
válasz Raymond #43461 üzenetére
"Black Myth: Wukong launches August 20th"
Ha nem fog csúszni. Bár engem gameplay és content szempontból a legkisebb mértékben sem érdekel a játék, de kíváncsi vagyok milyen lesz látvány és performance szempontból.
Gameplay csatornám: https://www.youtube.com/channel/UCG_2-vD7BIJf56R14CU4iuQ
-
S_x96x_S
őstag
"I dont want to spoil Nvidia B100 launch tomorrow but this thing is a monster. 2 dies on CoWoS-L, 8x8-Hi HBM3e stacks for 192GB of memory. One year later, B200 goes with 12-Hi stacks and will offer a beefy 288GB. And the performance! it's... oh no Jensen is there... me run away!"
https://twitter.com/XpeaGPU/status/1769241748952223768via:
videocardz: NVIDIA Blackwell “B100” to feature 2 dies and 192GB of HBM3e memory, B200 with 288GBMottó: "A verseny jó!"
-
Raymond
félisten
válasz huskydog17 #43466 üzenetére
Lattam en is, de erre majd visszaterunk augusztus 21-en
Privat velemeny - keretik nem megkovezni...
-
lenox
veterán
válasz S_x96x_S #43458 üzenetére
Amugy ezt most nem ertem pontosan. Van 44 GB on-chip memory, az qrva gyors, ha azon belul marad, akkor olyan gyors, mint 64 H100 (8x DGX H100). Mi van, ha abbol kifut? Azt ertem, hogy az aggregalt interconnect bandwidth nagy, de milyen memory subsystem van, azt nem talalom. Mert a 44 GB kb. semmire nem eleg, ami miatt ilyenre koltene valaki.
-
lenox
veterán
Na lattam, van MemoryX service, meg SwarmX service, de nem talaltam konkret specifikaciot, csak hogy nagyon gyors. 900000 core, core-onkent 48kB mem, de akkor egy core-nak csak 23.3 GB/sec bandiwdth-e van, az nem is sok on-chip bandwidth-bol, tehat gondolom ezek eleg egyszeru core-ok.
-
lenox
veterán
válasz Raymond #43471 üzenetére
Igen, vegigfutottam, de nem talaltam konkretumot, kb. annyit, hogy a SwarmX-ben 'a set of 100Gb/s network interfaces' van, es amugy meg minden mindenre eleg. Vagy az lehet meg, hogy egyaltalan nincs sajat off-chip memoriaja, csak a MemoryX-ben, az osszes adat minden korben bestreamelodik a 44 GB-ba, majd az eredmeny visszamegy, csak akkor nehez elkepzelnem, hogy ez igy tuti optimalis. mivel ugye azt mondjak, hogy 1.2 Tb/sec az IO bandwidth, ez 175 GB/sec. Azt irtak, hogy egy ilyen 64 H100-zal egyforma sebessegu, de 64 H100-nal az IO bandwidth 2048 GB/sec (amibol tenylegesen 1280-nal tobbet tud), es csak 1.2 PB/sec az on-chip bandwidth. Tehat ennek sokkal nagyobb on-chip teljesitmenye van (egy nagysagrenddel), de egy nagysagrenddel lassabb az IO-ja. Ebbol azt varnam, hogy valamilyen feladatra esetleg jo, masfelenel viszont megfojtja az IO.
-
félisten
AGF mai Twitter :
"I dont want to spoil Nvidia B100 launch tomorrow but this thing is a monster. 2 dies on CoWoS-L, 8x8-Hi HBM3e stacks for 192GB of memory. One year later, B200 goes with 12-Hi stacks and will offer a beefy 288GB. And the performance! it's... oh no Jensen is there... me run away!"
WTF szörnyeteg lesz ez...
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
Raymond
félisten
"Vagy az lehet meg, hogy egyaltalan nincs sajat off-chip memoriaja"
Nincs, ezt irja a white paper hogy azzal a weight streaming metodussal nem kell mert minden fantasztikus. A 3.5 reszben van az osszefoglalo es az 5.3 reszben irjak hogy mennyi a bandwidth requirement az egyes modelleknel.
Privat velemeny - keretik nem megkovezni...
-
Busterftw
veterán
Par ora mulva kezdodik az Nvidia keynote. (CET 20:00)
Nvidia Youtube -
M@trixfan
addikt
Itt várható valami érdemleges, esetleg Blackwell workstation jellegű bejelentés?
twitter: MatrixfanLive
-
félisten
válasz M@trixfan #43480 üzenetére
Igen tele van újdonsággal a bemutató ezen a téren. új Nvswitch, Blackwell - Grace kombó, memóriakoherens felépítés, óriási sávszél stb stb. Eléggé odateszik magukat, még nem volt ennyi újdonság bemutatva egy bemutató alatt sztem soha.
[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
Sonja
veterán
Ha csalódni akarsz, bízz az emberekben!
-
félisten
válasz Busterftw #43485 üzenetére
Ami innen átjöhetne( szerntem valami hasonló át is jön) Geforce vonalra az az új dual GPU , Elméletileg teljesen koherensként viselkedik a két GPU az új kapcsolódással.
Azon viszont csodálkozom, hogy 4 NP és nem 3 nm.[ Szerkesztve ]
"A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)
-
S_x96x_S
őstag
TheRegisteres összefoglaló:
https://www.theregister.com/2024/03/18/nvidia_turns_up_the_ai/1.) év második felében , vagy 2025 -ben várható.
"Nvidia tells the register, the B100, B200, and GB200 will all ship in the second half of the year, but it's not clear exactly when in what volume. It wouldn't surprise us if the B200 and GB200 didn't start ramping until sometime in early 2025.
The reason is simple. Nvidia hasn't shipped its HBM3e packed H200 chips yet. Those parts are due out in the second quarter of this year. "persze ha 2025 .. akkora már a PCIe Gen6 nem is annyira újdonság.
( ~ "NVLink on top, PCIe Gen 6 on the bottom" )2.) versenytársak:
- Gaudi 3 : nincs még infó ..
- MI300X: a blackwell papiron jobb, de az FP64 visszalépés.
"According to Nvidia, the Blackwell GPU is capable of delivering 45 teraFLOPS of FP64 tensor core performance. That's a bit of a regression from the 67 teraFLOPS of FP64 Matrix performance delivered by the H100, and puts it a disadvantage against either AMD's MI300X at 81.7 teraFLOPS FP64 vector and 163 teraFLOPS FP64 matrix."
megjegyzés: az MI300X -ből is várható HBM3e
ami az FP teljesítményeket is feljebb húzza az amd oldalon is:
"The existing products use HBM3 memory with eight layers, but Papermaster says AMD has already "architected" for both 12 layers and HBM3e. " ( via )- Cerebras: vegyes ...
"From what we understand, Nvidia's top specced chip should deliver about 5 petaFLOPS of sparse FP16 performance. That cuts Cerebra's lead down to 25x. But as we pointed out at the time, all of this depends on your model being able to take advantage of sparsity."Mottó: "A verseny jó!"
-
Busterftw
veterán
Szerintem a dual GPU + arch hoz annyit, hogy nem kellett az új node. Plusz ugye ez nem 4N mint az Ada, abból (4NP) is custom.
"Ada Lovelace GPUs are built with TSMC’s 4N node — one refinement step away from 4NP. Nvidia notes that it’s using a custom version of this process, however."
Hatalmasat ütött itt most az Nvidia, a többieknek fel kell kötni a gatyát.
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az NVIDIA éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.