[PYTHON] A propos des principales tâches de traitement d'image (vision par ordinateur) et de l'architecture utilisée
        
      
      
   
      
Objectif de ce message
Créez un guide pour choisir une méthode de mise en œuvre lors de la résolution de problèmes liés au traitement d'image.
- Parce que c'est un débutant, je vous serais reconnaissant si vous pouviez signaler des excès, des lacunes ou des erreurs dans la description.
 
Flux de résolution de problèmes
| article | 
Contenu | 
| Définition de tâche | 
Définissez quelle tâche le problème à résoudre sera traité comme | 
| Décisions d'architecture | 
Déterminer l'architecture principale à partir des tâches définies | 
| Détermination de l'indice d'évaluation | 
Déterminez l'indice d'évaluation approprié pour le problème | 
Tâches clés du traitement d'image
Lorsque le problème que vous souhaitez résoudre est la reconnaissance d'image, définissez de quelle tâche il s'agit en fonction de vos besoins
- Classification des images
 
- Détection d'objets
 
- Segmentation sémantique
 
- Détection d'anomalies
 
Une architecture célèbre pour chaque tâche
- Les fonctionnalités et l'utilisation de chaque architecture seront ajoutées à l'avenir.
 
Classification des images
Détection d'objets
Segmentation sémantique
- U-Net
 
- SegNet
 
- PSPNet
 
- GCN
 
- DeepLabv3+
 
Détection d'anomalies
- Modèle basé sur l'auto-encodeur (le modèle standard n'est pas fixe car il n'y a pas de tâche spécifique)
 
Référence: https://www.youtube.com/watch?v=vFpZrxaq5xU
Index d'évaluation pour chaque tâche
- Maintenance future sauf segmentation sémantique
 
Segmentation sémantique
- Pixel Wise Accuracy
 
- Mean Accuracy
 
- Mean Intersection over Union(Mean IoU)
 
- Precision, Recall, F1 score