[PYTHON] Über die Hauptaufgaben der Bildverarbeitung (Computer Vision) und die verwendete Architektur
Zweck dieses Beitrags
Erstellen Sie eine Anleitung zur Auswahl einer Implementierungsmethode, wenn Sie Probleme im Zusammenhang mit der Bildverarbeitung lösen.
- Da es sich um einen Anfänger handelt, würde ich es begrüßen, wenn Sie auf Exzesse, Mängel oder Fehler in der Beschreibung hinweisen könnten.
Problemlösungsablauf
Artikel |
Inhalt |
Aufgabendefinition |
Definieren Sie, als welche Aufgabe das zu lösende Problem behandelt wird |
Architekturentscheidungen |
Bestimmen Sie die Hauptarchitektur aus den definierten Aufgaben |
Bestimmung des Bewertungsindex |
Bestimmen Sie den geeigneten Bewertungsindex für das Problem |
Schlüsselaufgaben der Bildverarbeitung
Wenn das Problem, das Sie lösen möchten, die Bilderkennung ist, definieren Sie, welche Aufgabe es gemäß Ihren Anforderungen ist
- Bildklassifizierung
- Objekterkennung
- Semantische Segmentierung
- Erkennung von Anomalien
Berühmte Architektur für jede Aufgabe
- Funktionen und Verwendung jeder Architektur werden in Zukunft hinzugefügt.
Bildklassifizierung
Objekterkennung
Semantische Segmentierung
- U-Net
- SegNet
- PSPNet
- GCN
- DeepLabv3+
Erkennung von Anomalien
- Modell basierend auf Auto-Encoder (Standardmodell ist nicht festgelegt, da es keine bestimmte Aufgabe gibt)
Referenz: https://www.youtube.com/watch?v=vFpZrxaq5xU
Bewertungsindex für jede Aufgabe
- Zukünftige Wartung mit Ausnahme der semantischen Segmentierung
Semantische Segmentierung
- Pixel Wise Accuracy
- Mean Accuracy
- Mean Intersection over Union(Mean IoU)
- Precision, Recall, F1 score