Risponderemo a tutte le tue domande!

Benchmark delle istanze Tesla® di Tensorflow

Riepilogo dei risultati del modello di test per la classificazione delle immagini con i server Tesla® LeaderGPU®.

LeaderGPU® è un nuovo attore nel mercato del GPU Computing e intende cambiare le regole del gioco. In questo momento, il mercato del GPU Computing comprende diversi grandi operatori come Amazon AWS, Google Cloud, ecc. Tuttavia, un grande operatore non sempre significa la migliore offerta di mercato. Il progetto LeaderGPU® , rispetto ad Amazon AWS e Google Cloud, fornisce server fisici, non VPS, dove le risorse hardware possono essere condivise tra diverse decine di utenti.

I test sono stati condotti sui sistemi di calcolo LeaderGPU® Tesla® su dati sintetici dei seguenti modelli di rete: ResNet-50, ResNet-152, VGG16 e AlexNet. Alla fine di questo articolo, troverete i risultati dei test condotti su altri modelli. I test sui dati sintetici sono stati eseguiti utilizzando tf.Variable in analogia con i modelli configurati per ImageNet.

Per eseguire il test sono stati utilizzati i seguenti comandi:

git clone https://github.com/tensorflow/benchmarks.git
python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)

Istanze LeaderGPU® Tesla®

Ambiente di test: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink™ (ltbv46)

Tipo di istanza: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink (ltbv46)
GPU: Schede Nvidia® Tesla® OS: CentOS 7 CUDA® / cuDNN: 9.0 / 7.0.5 TensorFlow™ 1.7 da repo Benchmark GitHub hash: 9165a70 Data del test: 25.04.2018

Opzioni

Inception V3

VGG16

ResNet-50

ResNet-152

Alexnet

Dimensione del batch su GPU

64

32

64

32

512

Ottimizzazione

sgd

sgd

sgd

sgd

sgd

picture

Test dei dati sintetici (immagini / s)

GPU InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet

2x P100

268.24 224.90 446.08 150.04 5252.43

2x PCI V100

430.77 309.82 667.62 213.04 7545.40

2x NVlink™ V100

450.75 417.22 698.97 236.90 8786.56

Altri risultati

Dati sintetici di prova (immagini / s)

2x PCI Tesla® P100

Dimensione del lotto Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1411.48 378.47 224.90 199.87 14944.76 788.43
64 2460.54 473.82 256.68 225.58 29215.60 913.38
128 3576.26 539.08 278.83 243.67 47375.83 1035.37
256 4545.45 561.73 - - 67116.75 1127.05
512 5252.43 - - - 83665.27 1165.75
Dimensione del lotto overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 548.55 248.72 122.22 389.73 220.26 150.04
64 952.51 268.24 133.96 446.08 253.86 176.09
128 1437.54 283.39 - 483.51 - -
256 1847.21 - - - - -
512 2186.47 - - - - -

2x PCI Tesla® V100

Dimensione del lotto Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1665.82 526.55 309.82 282.81 17583.47 1268.95
64 3056.89 695.42 374.22 331.41 32271.30 1487.77
128 4660.06 831.39 410.27 360.79 62652.62 1704.92
256 6255.16 729.42 - - 98828.17 1921.02
512 7545.40 - - - 136553.56 2039.60
Dimensione del lotto overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 625.35 371.94 186.38 579.01 318.30 213.04
64 1194.50 430.77 210.41 667.62 379.37 259.16
128 1934.71 462.09 - 746.73 - -
256 2690.65 - - - - -
512 3267.15 - - - - -

2x NVlink™ Tesla® V100

Dimensione del lotto Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 3743.79 775.95 417.22 360.08 12460.77 1250.49
64 5514.97 904.65 447.46 386.92 28038.87 1546.01
128 6990.88 982.62 465.05 401.43 50064.03 1791.36
256 7960.86 805.59 - - 94842.75 1895.35
512 8786.56 - - - 131914.42 2158.45
Dimensione del lotto overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 1404.21 397.70 195.51 602.97 341.20 236.90
64 2216.08 450.75 220.00 698.97 395.01 272.37
128 3005.20 475.38 - 781.50 - -
256 3656.48 - - - - -
512 4073.38 - - - - -



Aggiornato: 18.03.2025

Pubblicato: 26.04.2018


Hai altre domande? Scrivici!

By clicking «I Accept» you confirm that you have read and accepted the website Terms and Conditions, Privacy Policy, and Moneyback Policy.