Wenn Sie cnn mit pytorch schreiben, verwenden Sie torch.nn und schreiben Sie wie folgt
conv1 = torch.nn.Conv2d(in_channels , out_channels , kernel_size , stride , padding)
Da in_channel und out_channels die Anzahl der Kanäle im Kernel sind, haben sie nichts mit der Bildgröße zu tun.
Es ist die Größe der Pooling-Ebene und die Größe des Schrittes, die die Eingabe- und Ausgabebildgröße (Feature-Map) bestimmen. Wenn Sie also zwei oder mehr Ebenen von cnn stapeln, funktioniert es meiner Meinung nach, wenn Sie darauf achten, dass der out_channel der vorherigen Ebene dem in_channel der nächsten Ebene entspricht.
Recommended Posts