Implementierte einige der anderen Anwendungen in Kapitel 15 der Sparse Modeling.
Notizbuch ch15-02.ipynb ch15-04.ipynb ch15-05.ipynb
_ K-SVD Trennung von Strichzeichnung und Textur durch lokale Analyse morphologischer Komponenten (MCA) unter Verwendung eines Wörterbuchs _
_ Interpolieren Sie fehlende Pixel mit lokaler Inpainting mit redundantem DCT-Wörterbuch_
Die Zahlen sind [Spitzensignal-Rausch-Verhältnis (PSNR)](https://ja.wikipedia.org/wiki/peak Signal-Rausch-Verhältnis)
_ K-Interpoliere fehlende Pixel durch lokales Inpainting mit dem SVD-Wörterbuch_
Entfernung von Impulsrauschen
Barbara wurde weißes Rauschen mit einer Standardabweichung von 10 hinzugefügt, um ein Testbild zu erstellen.
Ich habe ein Wörterbuch mit K-SVD gelernt. Die Patchgröße beträgt $ 8 \ mal 8 $. Die Anzahl der Atome wurde auf 256 eingestellt. Die Stoppbedingungen für die Verfolgung des orthogonalen Matchings (OMP) wurden auf die Anzahl der Atome $ k_ {0} = 4 $ und die Toleranz $ \ epsilon = 8 ^ {2} \ mal 20 ^ {2} $ eingestellt. Die Anzahl der Wiederholungen von K-SVD wurde auf 25 eingestellt.
Die Gesamtzahl der aus dem Bild extrahierten Patches betrug 255.025. Aufgrund von Speichermangel wurde die Anzahl der für eine Iteration von K-SVD verwendeten Patches auf 1/10 reduziert. Die für K-SVD verwendeten Patches wurden bei jeder Iteration zufällig extrahiert.
K-SVD Wörterbuch
Die Aktivität des Atoms wurde wie folgt berechnet.
Atomaktivität (0 für Schwarz, 1 für Weiß) Atome mit einer Aktivität von weniger als 0,3 waren Strichzeichnungen und die anderen waren Texturen. Dunkelgrau ist das Strichzeichnungsatom und Hellgrau ist das Texturatom.
Das Strichzeichnungsbild kann aus dem Strichzeichnungsatom und dem Koeffizienten seines spärlichen Ausdrucks erhalten werden. Das Bild der Textur kann aus dem Atom der Textur und dem Koeffizienten ihres spärlichen Ausdrucks erhalten werden.
Weißes Rauschen mit einer Standardabweichung von 20 zu Paprika hinzugefügt. 25%, 50% und 75% der Pixel wurden zufällig auf 0 gelöscht und als Testbild verwendet. Die Position des fehlenden Pixels war bekannt.
Die Patchgröße beträgt $ 8 \ mal 8 $. Die Anzahl der Atome wurde auf 256 eingestellt. OMP wurde geändert, um fehlende Pixel zu maskieren und eine spärliche Darstellung zu finden. Die OMP-Stoppbedingungen sind $ k_ {0} = 4 $ und $ \ epsilon = (8 ^ {2} -p) \ mal 20 ^ {2} \ mal 1,1 $. $ p $ ist die Anzahl der fehlenden Pixel im Patch. Das Bild kann aus dem gewünschten spärlichen Ausdruck wiederhergestellt werden.
Die K-SVD wurde wie folgt modifiziert.
Der Anfangswert von K-SVD war ein redundantes DCT-Wörterbuch. Die Anzahl der Wiederholungen betrug 15. 12.800 zufällig ausgewählte Patches wurden für eine Iteration von K-SVD verwendet.
K-SVD-Wörterbuch aus Bildern mit 25% Verlust
K-SVD-Wörterbuch aus Bildern mit 50% Verlust
K-SVD-Wörterbuch aus Bildern, bei denen 75% fehlen
Der Pixelwert von 10% der Pixel wurde zufällig um +50 oder -50 erhöht, um ein Testbild zu erhalten. Der Pixelwert wurde auf ein Maximum von 255 und ein Minimum von 0 gekürzt. Der Unterschied zum Inpainting besteht darin, dass die Position des fehlenden Pixels nicht bekannt ist.
Das Impulsrauschen wurde mit einem Medianfilter entfernt. Die Kernelgröße des Medianfilters beträgt $ 3 \ times 3 $. Pixel, bei denen der Absolutwert der Differenz zwischen dem verrauschten Bild und dem vom Medianfilter entfernten Bild größer als 27 war, wurden als mit Impulsrauschen kontaminierte Pixel definiert.
Das PSNR wurde verbessert, indem ein Medianfilter nur auf die von der Schätzmaske erfassten Pixel angewendet wurde. Gleiches gilt für die Entfernung von OMP-Rauschen unter Verwendung eines redundanten DCT-Wörterbuchs. Die Patchgröße für die Entfernung von OMP-Rauschen durch ein redundantes DCT-Wörterbuch beträgt $ 8 \ mal 8 $, die Anzahl der Atome beträgt 256, die OMP-Stoppbedingung beträgt $ k_ {0} = 256 $, $ \ epsilon = (8 ^ {2} -p) \ mal 5 ^ {2} \ mal 1.1 $.
Recommended Posts