Risponderemo a tutte le tue domande!

Tensorflow benchmark comune

Riepilogo dei risultati dei modelli di test per la classificazione delle immagini con i server LeaderGPU®.

Attention: due to the newly amended License for Customer Use of Nvidia® GeForce® Sofware, the GPUs presented in the benchmark (GTX 1080, GTX 1080 TI) can not be used for training neural networks.(except blockchain processing).

LeaderGPU® è un nuovo attore nel mercato del GPU Computing, che intende cambiare le regole del gioco. Al momento, il mercato del GPU Computing è rappresentato da diversi grandi operatori, come AWS, Google Cloud, ecc. Tuttavia, un grande operatore non sempre significa la migliore offerta di mercato. Il progetto LeaderGPU® , rispetto ad AWS e Google Cloud, fornisce server fisici, non VPS, dove le risorse hardware possono essere condivise tra diverse decine di utenti. La tabella seguente confronta il costo dell'elaborazione di 500.000 immagini per il modello Inception V3 da parte di diversi servizi:

Modello GPU Servizio Numero di immagini Tempo Prezzo al minuto Costo totale
Inception V3 8x K80 Nuvola di Google 500000 36m 43sec 0,0825 €* 3,02 €
Inception V3 8x K80 AWS 500000 36m 14sec 0,107 € 3,87 €
Inception V3 8x GTX 1080 LeaderGPU 500000 12m 9sec 0,09 € 1,09 €

La tabella mostra che LeaderGPU® non solo è più veloce del 300% rispetto ai suoi concorrenti, ma è anche più conveniente di almeno il 29% rispetto a Google Cloud e AWS.

I test sono stati condotti sui sistemi di calcolo LeaderGPU®. Per la valutazione dei concorrenti, abbiamo utilizzato i risultati dei test delle istanze di Google e AWS. I test sono stati condotti su dati sintetici dei seguenti modelli di rete ResNet-50, ResNet-152, VGG16 e AlexNet. Alla fine di questo articolo troverete i risultati dei test di altri modelli. I test sui dati sintetici sono stati eseguiti utilizzando tf. Variable in analogia con la configurazione dei modelli per ImageNet.

Test di LeaderGPU® (ltbv20 2x Nvidia® Tesla® P 100)

Ambiente di test:

  • Tipo di istanza: ltbv20
  • GPU: 2x NVIDIA® Tesla® P100
  • OS: CentOS 7
  • CUDA® / cuDNN: 8.0 / 5.1
  • TensorFlow™ hash GitHub: b1e174e
  • hash GitHub del benchmark: 9165a70
  • Data del test: giugno 2017
Opzioni InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
Dimensione del batch su GPU 64 64 32 512 32
Ottimizzazione sgd sgd sgd sgd sgd
Ltbv 20 Nvidia® Tesla® P100 (1, 2 GPUs)

Test dei dati sintetici (immagini/sec)

GPU InceptionV3 ResNet-50 ResNet-152 VGG16 Alexnet
1 136.55 217.76 82.05 137.32 2807.64
2 259.14 410.88 150.41 240.61 5117.86
Altri risultati

Test dei dati sintetici (immagini/sec)

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1516.70 373.45 240.61 203.73 14524.23 714.25
64 2480.30 472.15 274.67 230.73 28599.07 877.76
128 3486.68 540.51 288.80 243.55 44943.19 990.89
256 4440.35 464.69 -* -* 63311.75 1075.38
512 5117.86 -* -* -* 80078.57 1104.74
Dimensione del lotto overfeat inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 574.13 233.99 116.45 361.06 214.15 150.41
64 1052.63 259.14 125.09 410.88 245.36 170.79
128 1509.01 269.51 -* 439.41 -* -*
256 2041.60 -* -* -* -* -*
512 2323.77 -* -* -* -* -*

* La quantità disponibile di memoria ad accesso casuale della GPU non consente di lanciare test su pacchetti di queste dimensioni (dimensione del lotto).

Test LeaderGPU® (GTX 1080)

Ambiente di test:

  • Tipo di istanza: ltbv17, 14, 16
  • GPU: GTX 1080
  • OS: CentOS 7
  • CUDA® / cuDNN: 8.0 / 5.1
  • Codice GitHub di TensorFlow™: b1e174e
  • Benchmark hash GitHub: 9165a70
  • Data del test: giugno 2017
Opzioni InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
Dimensione del batch su GPU 64 64 32 512 32
Ottimizzazione sgd sgd sgd sgd sgd
Ltbv 17, 14, 16 GTX 1080 (2, 4, 8 GPUs)

Test dei dati sintetici (immagini/sec)

GPU InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet
2 187.93 173.2 259.39 109.02 3344.11
4 345.05 276.43 485.92 192.25 6221.67
8 685.59 428.57 949.72 369.02 9405.27
Altri risultati

Test dei dati sintetici (immagini/sec)

2x GTX 1080

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 823.87 223.73 150.50 129.67 14440.58 608.46
64 1517.33 299.24 173.20 149.62 25817.36 676.81
128 2198.87 291.47 -* -* 40910.02 717.52
256 2878.43 -* -* -* 53821.73 730.47
512 3344.11 -* -* -* 66096.43 -*
Dimensione del lotto overfeat inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 284.06 180.62 91.63 245.55 154.15 109.02
64 568.15 187.93 -* 259.39 -* -*
128 911.17 -* -* -* -* -*
256 1211.36 -* -* -* -* -*
512 1424.58 -* -* -* -* -*

* La quantità disponibile di memoria ad accesso casuale della GPU non consente di lanciare test su pacchetti di queste dimensioni (dimensione del lotto).

4x GTX 1080

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1238.14 295.30 272.03 155.75 18389.01 1110.35
64 2375.18 354.55 276.43 169.51 37465.98 1235.77
128 3889.23 321.28 -* -* 60612.34 1365.62
256 5056.10 -* -* -* 89908.56 1394.58
512 6221.67 -* -* -* 114433.39 -*
Dimensione del lotto sovralimentazione inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 450.85 328.23 166.82 447.25 276.27 192.25
64 885.37 345.05 -* 485.92 -* -*
128 1576.74 -* -* -* -* -*
256 2126.47 -* -* -* -* -*
512 2447.81 -* -* -* -* -*

* La quantità disponibile di memoria ad accesso casuale della GPU non consente di lanciare test su pacchetti di queste dimensioni (dimensione del lotto).

8x GTX 1080

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1347.98 381.49 347.37 333.71 27248.65 2023.19
64 2406.83 620.29 428.57 -* 51105.12 2352.15
128 4255.75 -* -* -* 93211.00 2644.26
256 6318.54 -* -* -* 145559.65 2610.21
512 9405.27 -* -* -* 206469.92 -*
Dimensione del lotto sovralimentazione inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 555.36 632.23 323.09 857.12 518.57 369.02
64 1042.12 685.59 -* 949.72 -* -*
128 1735.24 -* -* -* -* -*
256 2575.93 -* -* -* -* -*
512 3815.25 -* -* -* -* -*

* La quantità disponibile di memoria ad accesso casuale della GPU non consente di lanciare test su pacchetti di queste dimensioni (dimensione del lotto).

Test LeaderGPU® (GTX 1080TI)

Ambiente di test:

  • Tipo di istanza: ltbv21, 18
  • GPU: GTX 1080TI
  • OS: CentOS 7
  • CUDA® / cuDNN: 8.0 / 5.1
  • Codice GitHub di TensorFlow™: b1e174e
  • Benchmark hash GitHub: 9165a70
  • Data del test: giugno 2017
Opzioni InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
Dimensione del batch su GPU 64 64 32 512 32
Ottimizzazione sgd sgd sgd sgd sgd
Ltbv 21, 18 GTX 1080TI (2, 4 GPUs)

Test dei dati sintetici (immagini/sec)

GPU InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet
2 264.7 235.15 377.41 127.43 4596.37
4 493.14 401.68 706.95 270.35 8513.54
10 928.26 478.82 1418.60 513.37
Altri risultati

Test dei dati sintetici (immagini/sec)

2x GTX 1080 TI

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 880.18 287.25 190.05 169.67 13411.38 807.60
64 1743.20 385.95 235.15 198.28 28360.89 954.35
128 2808.68 457.54 - - 44453.02 1042.77
256 3777.74 - - - 67451.51 1070.28
512 4596.37 - - - 87898.53 -
Dimensione del lotto overfeat inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 304.50 250.37 125.81 351.21 218.02 127.43
64 607.91 264.70 - 377.41 236.24 -
128 1162.21 - - 381.62 - -
256 1617.89 - - - - -
512 1992.50 - - - - -

4x GTX 1080 TI

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1264.01 378.39 331.08 208.39 19239.51 1487.66
64 2502.01 481.49 401.68 236.07 38818.10 1755.63
128 4539.97 541.39 - - 71457.41 1943.93
256 6787.68 - - - 111721.23 1992.45
512 8513.54 - - - 152549.70 -
Dimensione del lotto overfeat inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 475.69 451.16 228.76 648.11 383.04 270.35
64 942.19 493.14 - 706.95 422.93 -
128 1706.03 - - 722.16 - -
256 2907.18 - - - - -
512 3478.50 - - - - -

10x GTX 1080 TI

Dimensione del lotto alexnet vgg11 vgg16 vgg19 lenet googlenet
32 865.89 368.50 309.07 289.88 18065.32 2200.48
64 1719.84 667.04 478.82 465.45 36486.24 3333.87
128 3344.45 868.66 - - 70077.18 3771.19
256 6159.03 - - - 138600.70 4335.86
512 - - - 237511.15 -
Dimensione del lotto sovralimentazione inceptionv3 inceptionv4 resnet50 resnet101 resnet152
32 346.22 809.19 459.10 1116.42 760.83 513.37
64 676.99 928.26 - 1418.60 937.95 -
128 1322.01 - - 1504.64 - -
256 2387.97 - - - - -
512 - - - - - -

Test AWS EC2 (NVIDIA® Tesla® K80)

Ambiente di test:

  • Tipo di istanza: p2.8xlarge
  • GPU: 8x NVIDIA® Tesla® K80
  • OS: Ubuntu 16.04 LTS
  • CUDA® / cuDNN: 8.0 / 5.1
  • TensorFlow™ hash GitHub: b1e174e
  • Benchmark GitHub hash: 9165a70
  • Data del test: maggio 2017
Opzioni InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
Dimensione del batch su GPU 64 64 32 512 32
Ottimizzazione sgd sgd sgd sgd sgd
p2.8xlarge from AWS (1, 2, 4, 8 GPUs)

Test dei dati sintetici (immagini/sec)

GPU InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
1 30.8 51.5 19.7 684 36.3
2 58.7 98.0 37.6 1244 69.4
4 117 195 74.9 2479 141
8 230 384 149 4853 260

Altri risultati (immagini/sec)

GPU InceptionV3 (dimensione del lotto 32) ResNet-50 (dimensione del lotto 32)
1 29.9 49.0
2 57.5 94.1
4 114 184
8 216 355

I risultati del test provengono da https://www.tensorflow.org/performance/benchmarks#details_for_amazon_ec2_nvidia_tesla_k80

Test di Google Compute Engine (NVIDIA® Tesla® K80)

Ambiente di test:

  • Tipo di istanza: n1-standard-32-k80x8
  • GPU: 8x NVIDIA® Tesla® K80
  • OS: Ubuntu 16.04 LTS
  • CUDA® / cuDNN: 8.0 / 5.1
  • TensorFlow™ hash GitHub: b1e174e
  • Benchmark GitHub hash: 9165a70
  • Data del test: maggio 2017
Opzioni InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
Dimensione del batch su GPU 64 64 32 512 32
Ottimizzazione sgd sgd sgd sgd sgd
n1-standard-32-k80x8 from Google (1, 2, 4, 8 GPUs)

Test dei dati sintetici (immagini/sec)

GPU InceptionV3 ResNet-50 ResNet-152 Alexnet VGG16
1 30.5 51.9 20.0 656 35.4
2 57.8 99.0 38.2 1209 64.8
4 116 195 75.8 2328 120
8 227 387 148 4640 234

Altri risultati (immagini/sec)

GPU InceptionV3 (dimensione del lotto 32) ResNet-50 (dimensione del lotto 32)
1 29.3 49.5
2 55.0 95.4
4 109 183
8 216 362

I risultati del test provengono da https://www.tensorflow.org/performance/benchmarks#details_for_google_compute_engine_nvidia_tesla_k80

Ora valutiamo i costi di calcolo dell'elaborazione delle immagini.

Nella tabella seguente, calcoleremo il costo e il tempo di elaborazione di 500.000 immagini utilizzando i modelli Inception V3, ResNet-60 e ResNet-152 e troveremo l'offerta migliore. Come si può vedere dalla tabella, LeaderGPU® è l'offerta di mercato più vantaggiosa tra gli altri fornitori considerati.

Modello GPU Piattaforma Numero di immagini Tempo Prezzo (al minuto) Costo totale
Inception V3 8x K80 Nuvola di Google 500000 36m 43sec 0,0825 €* 3,02 €*
Inception V3 8x K80 AWS 500000 36m 14sec 0,107 €* 3,87 €*
Inception V3 8x 1080 LeaderGPU 500000 12m 9sec 0,09 € 1,09 €
ResNet-50 8x K80 Nuvola di Google 500000 21m 32sec 0,0825 €* 1,77 €*
ResNet-50 8x K80 AWS 500000 21m 42 sec 0,107 €* 2,32 €*
ResNet-50 8x 1080 LeaderGPU® 500000 8m 46sec 0,09 € 0,79 €
ResNet-152 8x K80 Nuvola di Google 500000 56m 18sec 0,0825 €* 4,64 €*
ResNet-152 8x K80 AWS 500000 55m 55sec 0,107 €* 5,98 €*
ResNet-152 8x 1080 LeaderGPU® 500000 22m 35sec 0,09 € 2,03 €

* Il servizio cloud di Google non viene fornito al minuto. Il costo al minuto è calcolato in base al prezzo orario ($ 5,645).

LEGAL WARNING:

PLEASE READ THE LICENSE FOR CUSTOMER USE OF NVIDIA® GEFORCE® SOFTWARE CAREFULLY BEFORE AGREEING TO IT, AND MAKE SURE YOU USE THE SOFTWARE IN ACCORDANCE WITH THE LICENSE, THE MOST IMPORTANT PROVISION IN THIS RESPECT BEING THE FOLLOWING LIMITATION OF USE OF THE SOFTWARE IN DATACENTERS:

«No Datacenter Deployment. The SOFTWARE is not licensed for datacenter deployment, except that blockchain processing in a datacenter is permitted.»

BY AGREEING TO THE LICENSE AND DOWNLOADING THE SOFTWARE YOU GUARANTEE THAT YOU WILL MAKE CORRECT USE OF THE SOFTWARE AND YOU AGREE TO INDEMNIFY AND HOLD US HARMLESS FROM ANY CLAIMS, DAMAGES OR LOSSES RESULTING FROM ANY INCORRECT USE OF THE SOFTWARE BY YOU.



Aggiornato: 17.03.2025

Pubblicato: 07.12.2017


Hai altre domande? Scrivici!

By clicking «I Accept» you confirm that you have read and accepted the website Terms and Conditions, Privacy Policy, and Moneyback Policy.