[PYTHON] A propos des principales tâches de traitement d'image (vision par ordinateur) et de l'architecture utilisée
Objectif de ce message
Créez un guide pour choisir une méthode de mise en œuvre lors de la résolution de problèmes liés au traitement d'image.
- Parce que c'est un débutant, je vous serais reconnaissant si vous pouviez signaler des excès, des lacunes ou des erreurs dans la description.
Flux de résolution de problèmes
article |
Contenu |
Définition de tâche |
Définissez quelle tâche le problème à résoudre sera traité comme |
Décisions d'architecture |
Déterminer l'architecture principale à partir des tâches définies |
Détermination de l'indice d'évaluation |
Déterminez l'indice d'évaluation approprié pour le problème |
Tâches clés du traitement d'image
Lorsque le problème que vous souhaitez résoudre est la reconnaissance d'image, définissez de quelle tâche il s'agit en fonction de vos besoins
- Classification des images
- Détection d'objets
- Segmentation sémantique
- Détection d'anomalies
Une architecture célèbre pour chaque tâche
- Les fonctionnalités et l'utilisation de chaque architecture seront ajoutées à l'avenir.
Classification des images
Détection d'objets
Segmentation sémantique
- U-Net
- SegNet
- PSPNet
- GCN
- DeepLabv3+
Détection d'anomalies
- Modèle basé sur l'auto-encodeur (le modèle standard n'est pas fixe car il n'y a pas de tâche spécifique)
Référence: https://www.youtube.com/watch?v=vFpZrxaq5xU
Index d'évaluation pour chaque tâche
- Maintenance future sauf segmentation sémantique
Segmentation sémantique
- Pixel Wise Accuracy
- Mean Accuracy
- Mean Intersection over Union(Mean IoU)
- Precision, Recall, F1 score