Ich habe mit einer Deep-Learning-Umgebung unter Ubuntu 16.04 entwickelt. Als ich "Software Update" angewendet habe, war das zu aktualisierende Element "nvidia 367", was mich misstrauisch machte. Beim Neustart wurde cudnn nicht gefunden und es trat ein Segmentierungsfehler auf, wie unten gezeigt. ..
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcublas.so locally
I tensorflow/stream_executor/dso_loader.cc:102] Couldn't open CUDA library libcudnn.so. LD_LIBRARY_PATH:
I tensorflow/stream_executor/cuda/cuda_dnn.cc:2259] Unable to load cuDNN DSO
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcufft.so locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:108] successfully opened CUDA library libcurand.so locally
I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:925] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero
I tensorflow/core/common_runtime/gpu/gpu_init.cc:102] Found device 0 with properties:
name: GeForce GTX 1080
major: 6 minor: 1 memoryClockRate (GHz) 1.7335
pciBusID 0000:02:00.0
Total memory: 7.92GiB
Free memory: 7.81GiB
W tensorflow/stream_executor/cuda/cuda_driver.cc:572] creating context when one is currently active; existing: 0x34500e0
Segmentation fault (Core-Dump)
Als Ergebnis des Versuchs verschiedener Dinge
CUDA_VISIBLE_DEVICES=1
Es scheint, dass ich es so spezifizieren musste ... Bis jetzt hat es funktioniert, ohne es zu spezifizieren ... Es funktionierte, indem die in .bashrc zu verwendende GPU angegeben wurde. In meiner Umgebung hatte ich zwei GT 610 und GTX 1080 eingesetzt, daher denke ich, dass dies notwendig war.
Recommended Posts