Ich wollte im Colaboratory die Wahrheit über das Bild erfahren, aber es war schwierig, an verschiedenen Orten Informationen zu sammeln. Also habe ich beschlossen, das fertige Produkt so einzufügen, wie es ist. Python Für diejenigen, die es irgendwie verstehen.
Tu es nicht https://colab.research.google.com/drive/1ETjxVKCA3zv391tEAY5RHM_cyipIA9D-?hl=ja
Ich glaube nicht, dass irgendjemand es so benutzen kann, wie es ist, aber ich hoffe, es hilft jemandem. ** Ich habe es geschafft, ohne mit Jupyter-Notebook oder Python vertraut zu sein, also hoffe ich, dass Sie auf etwas hinweisen können. ** ** **
Das wollte ich tun.
Schreiben Sie eine Erklärung, was Sie leicht tun. Gehen Sie zu Colaboratory und sehen Sie sich den Code an.
Mounten Sie Google Drive. Wie du siehst. Es scheint, dass GitHub in der Welt oft verwendet wird. Mit GoogleDrive ist die Authentifizierung jedes Mal problematisch.
Extrahieren Sie die ZIP-Datei mit den Trainingsdaten auf Google Drive auf die Festplatte. Es ist möglich, jedes Bild von Trainingsdaten von Google Drive zu lesen, es ist jedoch langsam. Dies liegt daran, dass es viel schneller ist, eine ZIP-Datei zu erstellen, alles auf die Festplatte zu extrahieren und dann von der Festplatte zu lesen.
Ich wollte, dass die Trainingsdaten und Testdaten die gleiche Anzahl von Wahrheiten aufweisen, also habe ich einen Generator "generate_paths" erstellt, der beim Mischen abwechselnd Bildpfade mit der Wahrheit zurückgibt. Das ist, 0-1, 0-2, 0-3, 0-4, 0-5 als falsch Als wahr 1-1, 1-2, 1-3, 1-4, 1-5 Angenommen, es gab 10 Bilder von 0-3, 1-5, 0-1, 1-1, 0-2, 1-3, 0-4, 1-4, 0-5, 1-2 Gibt wie zurück.
Es wäre möglicherweise einfacher zu verstehen gewesen, wenn Sie die Liste normal gemischt hätten, ohne einen Generator zu verwenden.
Bei der Methode "load_data" werden die Bilder tatsächlich gelesen und zu einem Array verarbeitet. Die meisten Bilder, die in dieser Zeit behandelt wurden, haben einen weißen Hintergrund, daher habe ich sie auf "1 - X / 255" gesetzt und sie auf einen Gleitkommawert von 0 zu 1 invertiert. Es ist ungefähr 0 und manchmal gibt es eine 1. Es gibt auch Farbbilder, daher beträgt die Anzahl der Eingangskanäle 3.
Ich werde mein Bestes geben, um zu lernen. Vergessen Sie nicht, die Zeit zu sparen, die Sie beendet haben, damit Sie wissen, wann Sie fertig sind.
import datetime
tz_jst = datetime.timezone(datetime.timedelta(hours=9), name="JST")
now = datetime.datetime.now(tz_jst)
str_now = now.strftime("%Y/%m/%d %H:%M:%S")
print(f"Das Training ist vorbei{str_now}")
Speichern Sie das gesamte Modell und seine Architektur.
Zeigen Sie es mit "% matplotlib inline" auf dem Bildschirm an und speichern Sie es in Google Drive.
Labor, GPU usw. sind sehr bequem und kostenlos zu verwenden. Es wäre schön, überall darauf zugreifen zu können, auch von einem iPhone aus. Es ist jedoch traurig, dass GPU und TPU tagsüber nicht verwendet werden können.
In Bezug auf das Lernergebnis, Genauigkeit, über 0,7 ... Ich habe verschiedene Versuche und Irrtümer ausprobiert, aber es ist ein wenig subtil ... Ich kann nicht sagen, was die Trainingsdaten sind, aber ich glaube, dass die Trainingsdaten für dieses Ergebnis schlecht (oder eher schlecht) sind.
Recommended Posts