In diesem Beitrag werden wir die NVIDIA-GPU-Treiber CUDA10.1, cuDNN7.6.5 und tensorflow 2.3.0 in der Ubuntu 18.04-Umgebung installieren. Die Umgebung ist wie folgt. GPU : GTX1060 OS : Ubuntu18.04 Python : 3.6.9
** Das folgende Referenzverfahren ist ein Beispiel. Verwenden Sie es daher als Referenz und auf eigenes Risiko. ** ** ** Da ich kein Ingenieur bin, gibt es auch einige Notationen, die schwer zu lesen sind, aber bitte verzeihen Sie mir.
Bis jetzt habe ich mit tensorflow1.xx + keras gelernt, aber ich war auch an tensorflow2 interessiert, also habe ich mich entschlossen, angesichts der Zukunft auf tensorflow2 umzusteigen. Abgesehen davon wird die verwendete GPU in Zukunft durch die Ampere-Generation ersetzt. CUDA11 und cuDNN8 werden in der Ampere-Generation benötigt, und ab November 2020 soll der Betrieb mit Tensorflow-Nightly (2.4.0rc) bestätigt worden sein, aber es scheint, dass er in der offiziellen Version nicht unterstützt wird.
Wenn Sie die GPU verwenden möchten, um das Lernen zu beschleunigen, müssen Sie vorsichtig mit den Versionen von Tensorflow, CUDA und cuDNN sein. Siehe Offizielle Tensorflow-Site. Bei der Installation von Tensorflow 2.3.0 wie unten gezeigt muss cuDNN 7.6 und CUDA 10.1 sein. Beachten Sie insbesondere, dass CUDA 10.1 und nicht 10.1 oder höher sein muss.
Dieser Artikel basiert auf Folgendem.
-Wenn der NVIDIA-Treiber und CUDA installiert sind, löschen Sie sie mit dem folgenden Befehl.
sudo apt --purge remove nvidia-*
sudo apt --purge remove cuda-*
Der GPU-Treiber von -NVIDIA kann mit apt mit dem folgenden Befehl installiert werden.
In meiner Umgebung war die Installation erfolgreich, ohne den Ubuntu-Standardtreiber Nouveau zu deaktivieren.
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt update
ubuntu-drivers devices
Hier sehen Sie eine Liste der installierbaren Versionen auf der Konsole.
In meiner Umgebung war ab November 2020 nvidia-driver-455 die Empfehlung.
sudo apt install nvidia-driver-<version>
(Hinweis: Geben Sie für
Geben Sie nvidia-smi
ein und wenn die angegebene Version angezeigt wird, ist dies erfolgreich.
Laden Sie die CUDA-Deb-Datei von NVIDIA Site herunter. Machen. Installieren Sie das heruntergeladene Verzeichnis nach dem Wechseln mit dem folgenden Befehl. ** Der letzte Befehl ist der Punkt! (Der Grund wird später beschrieben) **
sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.105-418.39_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-<version>/7fa2af80.pub
sudo apt-get update
sudo apt-get install cuda-toolkit-<version>
Auf der offiziellen NVIDIA-Website steht "sudo apt-get install cuda". Wenn Sie dies jedoch tun, ändert sich die GPU-Treiberversion nicht und es kann zu einer unbeabsichtigten Umgebung kommen.
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda/lib64:$LD_LIBRARY_PATH"
Geben Sie "nvcc -V" in die Konsole ein und es wird wie unten gezeigt angezeigt.
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2019 NVIDIA Corporation
Built on Fri_Feb__8_19:08:17_PST_2019
Cuda compilation tools, release 10.1, V10.1.105
Es scheint, dass CUDA zwei APIs hat, eine Laufzeit- und eine Treiber-API, und es scheint kein Problem zu geben, selbst wenn die von nvidia -smi
und nvcc -V
angezeigten CUDA-Versionen unterschiedlich sind. Ich habe die Erfahrung gemacht, die Installation zu wiederholen, um tatsächlich mit diesen Versionen übereinzustimmen, aber am Ende stellte sich heraus, dass es kein Problem gibt, Tensorflow zu verwenden, selbst wenn die Versionen unterschiedlich sind.
(Bitte sagen Sie mir, ob die Erkennung unterschiedlich ist.)
Wenn alles gut geht, ist es fast vorbei.
Sie können cuDNN kostenlos herunterladen, registrieren Sie sich jedoch vor dem Herunterladen als Mitglied auf der NVIDIA-Website.
Klicken Sie auf Archivierte cuDNN-Versionen, um den vorherigen cuDNN zu finden.
Laden Sie dieses Mal die Deb-Datei von Runtime Library, Developer Library und Code Samples von cuDNN 7.6.5 herunter, die Ubuntu 18.04 entsprechen.
Führen Sie im heruntergeladenen Verzeichnis Folgendes aus.
sudo dpkg -i libcudnn7_7.6.5.32-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.6.5.32-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.6.5.32-1+cuda10.1_amd64.deb
Führen Sie eines der Codebeispiele aus. Wenn keine Fehler vorliegen, ist dies in Ordnung.
cp -r /usr/src/cudnn_samples_v7/ $HOME
cd $HOME/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN
Noch ein Atemzug. Tensorflow2 erfordert ein Upgrade von pip3.
python3 -m pip install --upgrade pip
Installieren Sie Tensorflow. Wenn Sie die Version nicht angeben, wird eine unbeabsichtigte Version installiert. Ersetzen Sie den Teil 2.3.0
und geben Sie ihn ein.
python3 -m pip install tensorflow==<version>
import tensorflow as tf
tf.__version__
Wenn die beabsichtigte Version angezeigt wird, ist sie erfolgreich.
Wir haben eine Umgebung zum Lernen mit GPU von Gtensorflow unter Ubuntu 18.04 erstellt. Ich möchte diesen Artikel erneut aktualisieren, nachdem ich ihn durch die RTX30-Serie der Ampere-Generation ersetzt habe. Da der Ingenieur nicht mein Hauptgeschäft ist, gibt es viele Punkte, die ich nicht erreichen kann, aber ich hoffe, dass es hilfreich sein wird.
Recommended Posts