[PYTHON] Lassen Sie uns R-CNN mit Sklearn-theano machen

Einführung

Ich habe versucht, BING mit OpenCV als Vorverarbeitung von CNN zu verwenden [Ich habe versucht, die selektive Suche als R-CNN zu verwenden] (http://qiita.com/Almond/items/7850cf81903fbe2a2c6c)

Bisher habe ich R-CNN mit BING und Selective Search durchgeführt. Wenn Sie jedoch CNN (Faltungsprozess) ausführen, möchten Sie zu diesem Zeitpunkt einen objektähnlichen Teil finden? Seien Sie versichert, Sie können es tun! Dieses Mal werden wir also die Position mit CNN schätzen. (* GitHub von Sklearn-theano beschreibt die Schätzung der Lokalisierung - Position, daher werde ich diesen Ausdruck unten verwenden.)

Was ist Sklearn-theano?

Sklearn-theano ist eine Bibliothek, die tiefes Lernen erleichtert, indem sie Theano abstrahiert, einen Rahmen für tiefes Lernen. Ein ähnliches ist Keras. Das ist beliebt und sieht ziemlich gut aus, aber dieses Mal ist es unbenannt? Ich werde versuchen, Sklearn-theano zu verwenden.

Sklearn-theano kann das

Wie oben erwähnt, kann Sklearn-theano sowohl Bilder als auch Positionsschätzungen leicht klassifizieren und schätzen. Darüber hinaus können Sie ganz einfach die Bibliotheken berühmter Orte wie OverFeat, AlexNet, VGGNet und GoogLeNet ausprobieren. Ich möchte praktische Probleme mit verschiedenen trainierten Modellen lösen. Warum versuchen Sie es nicht mit Sklearn-theano?

Lass es uns sofort benutzen

https://github.com/sklearn-theano/sklearn-theano Klonen Sie das obige Repository und installieren Sie es mit dem Befehl python setup.py install. Außerdem ist dieses Paket erforderlich. Wenn Sie es nicht installiert haben, installieren Sie es zuerst. ・ Numpy ・ Scipy ・ Theano ・ Scikit-lernen ・ Pilow

Ergebnis

Diesmal habe ich versucht, plot_single_localization.py in Sample zu verwenden. Die Position des Tieres wird im letzten Frame geschätzt. Um es ziemlich grob zu erklären, schätzen wir zuerst die Punkte, bei denen es sich wahrscheinlich um Objekte im Bereich des gelben Quadrats handelt, und erkennen dann die gesammelte Punktgruppe als endgültiges Objekt. Auf dieser Seite finden Sie den detaillierten Erkennungsprozess.

figure_sloth_example.png

Die Bearbeitungszeit beträgt übrigens ca. 310 Sekunden .... ca. 5 Minuten! !! !! !! lange. .. .. Die offizielle Aussage sagt 352,80 Sekunden, also scheint es keinen Fehler zu geben.

Zusammenfassung

Dieses Mal habe ich eine kleine Bibliothek namens Sklearn-theano verwendet, um die Position mit CNN zu schätzen. Wenn es Ihnen nichts ausmacht, sich etwas Zeit zu nehmen, können Sie es versuchen. Ich denke jedoch, dass es schwierig ist, wenn Geschwindigkeit erforderlich ist. ** Wenn jemand eine allgemeine Objekterkennungsmethode kennt, die Echtzeit standhält, lassen Sie es mich bitte wissen **

Recommended Posts

Lassen Sie uns R-CNN mit Sklearn-theano machen
Lassen Sie uns mit Python Image Scraping durchführen
Lassen Sie uns MySQL-Daten mit Python bearbeiten
Web Scraping mit Python (Wettervorhersage)
Web Scraping mit Python (Aktienkurs)
Lass uns Raspberry Pi machen?
Mach Houdini mit Python3! !! !!
Spielen wir mit der 4. Dimension der 4. Dimension
Mach Django mit CodeStar (Python3.6.8, Django2.2.9)
Spielen wir mit Amedas Daten - Teil 1
Mach Django mit CodeStar (Python3.8, Django2.1.15)
Machen wir Othello mit wxPython
Spielen wir mit Amedas Daten - Teil 4
Schreiben wir Python mitinema4d.
Führen Sie eine AES-Verschlüsselung mit DJango durch
Spielen wir mit Amedas Daten - Teil 3
Spielen wir mit Amedas Daten - Teil 2
Lassen Sie uns Git-Cat mit Python bauen
Machen Sie so etwas wie Fuzzing mit acceptRegex.py
Führen Sie mehrstufige SSH mit Fabric durch
Wechseln Sie nicht mit pyenv global!
Lass uns "Hello World" in 40 Sprachen machen! !!
Was tun mit der Installation von Magics?
Lassen Sie uns eine GUI mit Python erstellen.
HTTPS mit Django und Let's Encrypt
Lass uns mit Selene Deep SEA lernen
Machen wir einen Blockbruch mit wxPython
Lass uns mit Python mit Python spielen [Anfänger]
Schwanzrekursion mit Python2 durchführen
Was tun mit PYTHON Release?
Ich möchte ○○ mit Pandas machen
Lassen Sie uns ein Diagramm mit Python erstellen! !!
Machen wir mit xCAT einen Spacon
Machen wir Othellos KI mit Chainer-Teil 2-
Lassen Sie uns mit Azure Face Emotionen erkennen
Lassen Sie uns die Stimme mit Python # 1 FFT analysieren
Python | Was Sie mit Python machen können