[PYTHON] Umgang mit CUDA-Fehler "Bei dem Versuch, einen Wert abzurufen, anstatt einen Fehler zu behandeln. Intern: Geräteattribut 13 für Gerät 0 konnte nicht abgerufen werden: CUDA_ERROR_UNKNOWN: Unbekannter Fehler" beim Deep Learning

Zweck

Wenn Sie versuchen, durch tiefes Lernen mit der GPU zu lernen, Der folgende Fehler kann auftreten.

2019-11-18 04:16:42.405806: F tensorflow/stream_executor/lib/statusor.cc:34] Attempting to fetch value instead of handling error Internal: failed to get device attribute 13 for device 0: CUDA_ERROR_UNKNOWN: unknown error

Auch wenn Sie im Internet nach der Ursache dieses Fehlers suchen, Es gibt keine sehr guten Informationen. Vielleicht verstehe ich einfach kein Englisch oder Chinesisch.

Zeigen Sie, dass Sie es auf Ihre eigene Weise verstehen können.

Zeigen Sie die Umgebung als Referenz an

tensorflow           1.14.0
tensorflow-estimator 1.14.0
tensorflow-gpu       1.14.0

Fehler Gegenmaßnahmen

Es kann eine Version von Tensorflow sein, aber Als ein Fall Nur zu wenig Speicher (in diesem Fall CPU-Speicher, kein GPU-Speicher) Und dieser Fehler Ich habe bestätigt, dass es herauskommen wird.

wenn, ** Wenn Sie die CPU-Speichernutzung reduzieren können Bitte versuchen Sie dies. ** ** **

Apropos, Ich habe keine Ahnung, was dieser Fehler ist. (Vielleicht ist es kein verständlicher Fehler.)

Ein weiterer Fehler (völlig ungelöst.)

Der folgende Fehler kann auftreten. Erstens kann ich die Bedeutung der Fehlermeldung nicht gut verstehen. Selbst wenn ich online nachschaue, gibt es keine nützlichen Informationen.

Fehlerauszug

RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0; 4.00 GiB total capacity; 2.90 GiB already allocated; 30.80 MiB free; 9.54 MiB cached)

Das ganze

D:\_mish1\Mish-master\Mish-master\Examples and Benchmarks>python _res50_1.py
Files already downloaded and verified
Files already downloaded and verified
Traceback (most recent call last):
  File "_res50_1.py", line 329, in <module>
    logps = model.forward(inputs)
  File "_res50_1.py", line 242, in forward
    x = self.conv2(x)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\module.py", line 547, in __call__
    result = self.forward(*input, **kwargs)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\container.py", line 92, in forward
    input = module(input)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\module.py", line 547, in __call__
    result = self.forward(*input, **kwargs)
  File "_res50_1.py", line 208, in forward
    return f_mish(self.split_transforms(x) + self.shortcut(x))
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\module.py", line 547, in __call__
    result = self.forward(*input, **kwargs)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\container.py", line 92, in forward
    input = module(input)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\module.py", line 547, in __call__
    result = self.forward(*input, **kwargs)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\modules\batchnorm.py", line 81, in forward
    exponential_average_factor, self.eps)
  File "C:\Users\XYZZZ\AppData\Roaming\Python\Python37\site-packages\torch\nn\functional.py", line 1656, in batch_norm
    training, momentum, eps, torch.backends.cudnn.enabled
RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0; 4.00 GiB total capacity; 2.90 GiB already allocated; 30.80 MiB free; 9.54 MiB cached)

Zusammenfassung

Wenn jemand dies sehen und das Problem lösen kann, wäre ich dankbar.

Verwandte Person)

Verwenden Sie Python ohne Stress! (In Python ist alles als Objekt implementiert.) Verwenden Sie Python ohne Stress! (In der Nähe von Pylint) Verwenden Sie Python ohne Stress! (Ausdruck und Erklärung) Lernen Sie Python sorgfältig in Englisch und Japanisch.

von jetzt an

Wenn Sie Kommentare haben, lassen Sie es uns bitte wissen. : Süßigkeiten: Wird studieren,

Recommended Posts

Umgang mit CUDA-Fehler "Bei dem Versuch, einen Wert abzurufen, anstatt einen Fehler zu behandeln. Intern: Geräteattribut 13 für Gerät 0 konnte nicht abgerufen werden: CUDA_ERROR_UNKNOWN: Unbekannter Fehler" beim Deep Learning
Umgang mit Python-Fehler "Attributfehler: module'scipy.misc 'hat kein Attribut'imresize'" beim Deep Learning
Gegenmaßnahmen für den Fehler "Oberes Verzeichnis kann nicht abgerufen werden" bei Verwendung von Deep Learning ②, das mit dem Spyder von ANACONDA von Grund auf neu erstellt wurde
Umgang mit Tensorflow-Fehler "Importfehler: DLL-Laden fehlgeschlagen: Angegebenes Modul nicht gefunden" in Deep Learning
Was tun, wenn Sie sich über "Wertefehler: unbekannt lokal: UTF-8" in python manage.py syncdb ärgern?