[PYTHON] A propos des principales tâches de traitement d'image (vision par ordinateur) et de l'architecture utilisée

Objectif de ce message

Créez un guide pour choisir une méthode de mise en œuvre lors de la résolution de problèmes liés au traitement d'image.

Parce que c'est un débutant, je vous serais reconnaissant si vous pouviez signaler des excès, des lacunes ou des erreurs dans la description.

Flux de résolution de problèmes

article	Contenu
Définition de tâche	Définissez quelle tâche le problème à résoudre sera traité comme
Décisions d'architecture	Déterminer l'architecture principale à partir des tâches définies
Détermination de l'indice d'évaluation	Déterminez l'indice d'évaluation approprié pour le problème

Tâches clés du traitement d'image

Lorsque le problème que vous souhaitez résoudre est la reconnaissance d'image, définissez de quelle tâche il s'agit en fonction de vos besoins

Classification des images
Détection d'objets
Segmentation sémantique
Détection d'anomalies

Une architecture célèbre pour chaque tâche

Les fonctionnalités et l'utilisation de chaque architecture seront ajoutées à l'avenir.

Classification des images

AlexNet
VGG16
ResNet

Détection d'objets

Yolo-v2, yolo-v3
SSD

Segmentation sémantique

U-Net
SegNet
PSPNet
GCN
DeepLabv3+

Détection d'anomalies

Modèle basé sur l'auto-encodeur (le modèle standard n'est pas fixe car il n'y a pas de tâche spécifique)

Référence: https://www.youtube.com/watch?v=vFpZrxaq5xU

Index d'évaluation pour chaque tâche

Maintenance future sauf segmentation sémantique

Segmentation sémantique

Pixel Wise Accuracy
Mean Accuracy
Mean Intersection over Union(Mean IoU)
Precision, Recall, F1 score

Recommended Posts

A propos des principales tâches de traitement d'image (vision par ordinateur) et de l'architecture utilisée

À propos du comportement de copy, deepcopy et numpy.copy

À propos de la vitesse de traitement de SVM (SVC) de scikit-learn

Traitement d'image? L'histoire du démarrage de Python pour

À propos du comportement de la file d'attente pendant le traitement parallèle

Pensez à la nouvelle génération de Rack et WSGI

Notes personnelles sur l'intégration de vscode et anaconda

100 traitement de la langue knock-42: Affichage de la phrase de la personne concernée et de la personne concernée

Traitement linguistique 100 knocks-29: Obtenez l'URL de l'image du drapeau

La fonction d'affichage d'image d'iTerm est pratique lors du traitement d'images.

100 coups sur le traitement d'image !! (001 --010) Soigneusement et soigneusement

À propos des composants de Luigi

À propos des fonctionnalités de Python

Traitement de l'expansion et de la contraction de l'image

Comprendre la fonction de convolution en utilisant le traitement d'image comme exemple

Affichez l'image de la caméra connectée à l'ordinateur personnel sur l'interface graphique.

Flux d'obtention du résultat du traitement asynchrone à l'aide de Django et Celery

Lisez l'image du jeu de puzzle et sortez la séquence de chaque bloc

Considérez la vitesse de traitement pour déplacer le tampon d'image avec numpy.ndarray

Vérifier le taux de compression et le temps de PIXZ utilisé en pratique