-
IT café
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
lenox
veterán
válasz
Raymond #43571 üzenetére
Ez meg a gv100:
Total VRAM 32767 MB, total RAM 32723 MB
Set vram state to: NORMAL_VRAM
Always offload VRAM
Device: cuda:0 Quadro GV100 : native
VAE dtype: torch.float32[Fooocus] Encoding positive #1 ...
[Fooocus Model Management] Moving model(s) has taken 0.17 seconds
[Fooocus] Encoding positive #2 ...
[Fooocus] Encoding negative #1 ...
[Fooocus] Encoding negative #2 ...
[Parameters] Denoising Strength = 1.0
[Parameters] Initial Latent shape: Image Space (1024, 1024)
Preparation time: 2.79 seconds
[Sampler] refiner_swap_method = joint
[Sampler] sigma_min = 0.0291671771556139, sigma_max = 14.614643096923828
Requested to load SDXL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 2.69 seconds
100%|██████████████████████████████████████████████████████████████████████████████████| 30/30 [00:10<00:00, 2.78it/s]
Requested to load AutoencoderKL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 0.25 seconds
Image generated with private log at: C:\Fooocus\Fooocus\outputs\2024-03-29\log.html
Generating and saving time: 15.11 seconds
[Sampler] refiner_swap_method = joint
[Sampler] sigma_min = 0.0291671771556139, sigma_max = 14.614643096923828
Requested to load SDXL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 1.74 seconds
100%|██████████████████████████████████████████████████████████████████████████████████| 30/30 [00:11<00:00, 2.68it/s]
Requested to load AutoencoderKL
Loading 1 new model
[Fooocus Model Management] Moving model(s) has taken 0.25 seconds
Image generated with private log at: C:\Fooocus\Fooocus\outputs\2024-03-29\log.html
Generating and saving time: 14.62 seconds
Requested to load SDXLClipModel
Requested to load GPT2LMHeadModel
Loading 2 new models
Total time: 32.58 seconds
[Fooocus Model Management] Moving model(s) has taken 0.77 seconds -
válasz
Raymond #43573 üzenetére
Az biztos hogy végigpróbálom más biosokkal. Nvsmi-vel lehet húzni korlátozottan de a hbm is csak 810mhz max. Boostot 1380-ra fel tudtam rakni de nem boostol. Tdp limit is 100%hogy van szóval a legjobb v100-as biossa kezdem majd. Meg ugye a pcie 1x bár az nekem nem nagy gond.
Quadro gv100 biosa lenne logikus hátha van rajta venti vezérlés is már ha az áramkör rajta van. (Most kézzel tekergetem egy régi titan szabályzóval)[ Szerkesztve ]
Vintage Story PH szervere újra fut!
-
válasz
Raymond #43561 üzenetére
SD-re felraktam a tensorRT kieget bekapcsolva 8 kikapcsolva 3
Nem tudom hogyan lehetne tesztelni rendesen.
Loading TensorRT engine: T:\AI\stable-diffusion-webui\models\Unet-trt\v1-5-pruned-emaonly_d7049739_cc70_sample=2x4x64x64-timesteps=2-encoder_hidden_states=2x77x768.trt
Loaded Profile: 0
sample = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
timesteps = [(2,), (2,), (2,)]
encoder_hidden_states = [(2, 77, 768), (2, 77, 768), (2, 77, 768)]
latent = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.84it/s]
Total progress: 30it [07:30, 15.00s/it]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.71it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.71it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.30it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.88it/s]
Dectivating unet: [TRT] v1-5-pruned-emaonly████████████████████████████████████████████| 20/20 [00:02<00:00, 8.02it/s]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:06<00:00, 2.93it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:06<00:00, 2.94it/s]
Activating unet: [TRT] v1-5-pruned-emaonly█████████████████████████████████████████████| 20/20 [00:06<00:00, 3.01it/s]
Loading TensorRT engine: T:\AI\stable-diffusion-webui\models\Unet-trt\v1-5-pruned-emaonly_d7049739_cc70_sample=2x4x64x64-timesteps=2-encoder_hidden_states=2x77x768.trt
Loaded Profile: 0
sample = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
timesteps = [(2,), (2,), (2,)]
encoder_hidden_states = [(2, 77, 768), (2, 77, 768), (2, 77, 768)]
latent = [(2, 4, 64, 64), (2, 4, 64, 64), (2, 4, 64, 64)]
100%|██████████████████████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 7.88it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 6.85it/s]
Total progress: 100%|██████████████████████████████████████████████████████████████████| 20/20 [00:02<00:00, 8.00it/s]
[ Szerkesztve ]
Vintage Story PH szervere újra fut!
-
válasz
Raymond #43578 üzenetére
Abból gondolom én is hogy működik mert ki be kapcsolva más az eredmény. Illetve 200w fölé megy a fogyasztás.
CUDA-Z benchmark:GPU Core Performance
Single-precision Float: 13.4887 Tflop/s
Double-precision Float: 441.227 Gflop/s
64-bit Integer: 3298.58 Giop/s
32-bit Integer: 13.5213 Tiop/s
24-bit Integer: 13.3683 Tiop/sFloat32 az hozza a 14Tflopsot (~2080Ti), a Float64 az nem bár az nem is lényeg.
Fooocus használja a Float16-ot a logokból látszik.
Az órajelek még mindíg alacsonyabbak mint kellene, de majd javítok rajta. A pcie sávszél is megoldódik, két-két SMD hiányával tiltották le
[ Szerkesztve ]
Vintage Story PH szervere újra fut!
-
-
válasz
Raymond #43578 üzenetére
MSI afterburner OC scan után.
Az várható volt hogy a HBM2 az 1Ghz-es rajta nem 810.
GPU 1582@0.794v CUDA-Z és Aida tesztek alatt.
Stable diffussion alatt ugyan ennyi, GPU power 210w, board power 262W
Viszont így már 68 fokig felmegy, majd a rendes hűtővel ki fogom tolni a tdp limitet nagyobbra mert tartalék van benne még.Elléggé furcsa íve lett, nem is értem miért ilyen:
[ Szerkesztve ]
Vintage Story PH szervere újra fut!
-
-
-
válasz
Raymond #43590 üzenetére
Nem kapok sajnos. töredéke sincs.
V100 GPU fizikailag ugyan azon számokkal mint a Tesla V100-ason. GV100-893-A1
Szerintem szoftveres a limit. Volt 2 éve egy nagy nvidia driver leak 80Gb forráskóddal, a legtöbb modder azzal dolgozik. Nekem nincs rá tudásom hogy értelmezzem és megírjam hiába tudok alap szinten programozni.Single az okés hozza amit kell. De double 462
Ennek kellene lennie
FP32 (float)14.13 TFLOPS
FP64 (double)7.066 TFLOPS (1:2)[ Szerkesztve ]
Vintage Story PH szervere újra fut!
-
-
-
S_x96x_S
őstag
válasz
Raymond #43859 üzenetére
> Mindegy egyese eladott 8x H100 dobozban ott a Mellanox cuccok is.
Még az új Azure AMD MI300X VM -eket is nVidiás kártyával kötik össze.
"Introducing the new Azure AI infrastructure VM series ND MI300X v5"
"ND MI300X v5 VMs feature high-throughput, low latency InfiniBand communication between different VMs. Each GPU has its own dedicated 400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand link to give 3.2 Tb/s of bandwidth per VM. InfiniBand is the standard for AI workloads needing to scale out to large numbers of VMs/GPUs."Mottó: "A verseny jó!"
-
PuMbA
titán
válasz
Raymond #44214 üzenetére
A 8 GB-os kontra 16GB-os 4060 Ti kártyák képeire gondoltam, ami kiveri a szemünket a hozzászólásban
Jól látszik, hogy hiába használ csak 7GB VRAM-ot a 8GB-os kártyán a Forbidden West, a 16GB-os kártyán majdnem kétszer több az fps és ott már 9,5GB-ot használ.
Ratchet & Clank esetén ugyanez játszódik le. A 12GB-os 4070-et 60%-kal veri a 16GB-os 7900GRE csak a VRAM miatt 1440p maximum grafikán, hiszen más játékokban a két kártya között csak 10% sebesség különbség van.
[ Szerkesztve ]
-
S_x96x_S
őstag
válasz
Raymond #44282 üzenetére
> A FG ( Frame Gen ) az amit a 40-es sorozatra limitaltak.
Akkor ha jól értelek szerinted se igaz,
hogy az RTX2000-res szérián is tökéletesen megy a DLSS 3.7.
Feltéve ha a "tökéletes" alatt az nVidia "Tökéletest" értjük.Amúgy az nVidia (marketing táblázat ) a DLSS verziókra :
https://www.nvidia.com/en-us/geforce/technologies/dlss/Mottó: "A verseny jó!"
-
S_x96x_S
őstag
válasz
Raymond #44286 üzenetére
> Direkt ugy irtam hogy ne zavarjon meg a szamozas
> (fuggetlenul attol hogy azt tenyleg nem erted vagy csak megjatszod).másoknak irtam.
> A FG az amit a 40-es sorozatra limitaltak.
lefordítva:
a DLSS 3.7 -része az FG ; és ez a rész NEM megy az RTX 20 -on.
Ami megfelel a hivatalos nVidia kommunikációnak is.Mottó: "A verseny jó!"
Új hozzászólás Aktív témák
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az NVIDIA éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen