[PYTHON] Probieren Sie die Audiosignalverarbeitung mit librosa-Beginner aus

Einführung

Der Autor hat keine Kenntnisse über die Verarbeitung von Sprachsignalen und die Spracherkennung. Dieser Artikel wird nicht für Profis auf der Straße empfohlen (; ´ ・ ω ・) Übrigens habe ich vor, Anfänger, Fortgeschrittene und Fortgeschrittene zu werden.

Motivation

Bei der Arbeit kam eine Geschichte wie "Songs empfehlen!" Heraus.

Wird Musikempfehlung als Spracherkennung eingestuft?

Die Antwort ist nein. Spracherkennung ist der Prozess, bei dem eine Maschine eine von Menschen gesprochene Stimme in Zeichen umwandelt, sodass Musikempfehlungen nicht als Spracherkennung bezeichnet werden. (Diese Seite war sehr leicht zu verstehen.) Musikempfehlung scheint ein Forschungsgebiet namens MIR zu sein, und die Verarbeitung von Sprachsignalen scheint der Kern zu sein.

Was ist MIR?

Abkürzung für MusicInformatioRetrieval. Textdaten werden als Eingabe für die Liedsuche nach Künstlernamen oder Liednamen verwendet, was normalerweise verwendet wird, aber MIR verwendet die Sprachwellenform selbst als Eingabe.

Unten finden Sie ein spezielles Beispiel für MIR

Praktische Tools und Bibliotheken für die Sprachsignalverarbeitung

Ich habe die obigen drei berührt, aber für mich, einen Anfänger der Sprachsignalverarbeitung, war librosa besser als SPTK. (SPTK war mühsam beim Aufbau der Umgebung ...) Es wird auch Personen empfohlen, die die Sprachsignalverarbeitung während des maschinellen Lernens mit Python studieren möchten. (Obwohl es natürlich möglich ist, SPTK aus Python zu schreiben)

Deshalb ist die Einführung lang geworden, aber dieses Mal werde ich librosa einführen.

(Der Artikel über den Aufbau eines ähnlichen Musiksystems mit SPTK war übrigens zu gut. Http://aidiary.hatenablog.com/entry/20121014/1350211413)

Installieren Sie librosa

Ich war ziemlich ungeduldig, weil das "Jupyter-Notizbuch" während der Umgebungskonstruktion nicht bestanden hat, deshalb werde ich das Verfahren zusammenfassen.

Verfahren

    1. Neuinstallation von Anaconda (wird wahrscheinlich nicht unter Mac oder Linux benötigt, ich denke, es wird unter Windows nicht benötigt, wenn die neuesten Versionen von Anaconda und Python)
  1. DL von resampy

    1. DL von librosa
  2. Installieren von Microsoft Visual C ++ - Compiler für Python 2.7

  3. Öffnen Sie die 64-Bit-Eingabeaufforderung von Visual C ++ 2008 und führen Sie die folgenden Befehle in den Verzeichnissen reampy und librosa aus.

    python setup.py build python setup.py install

In Python

 library(librosa)

Wenn es vorbei ist, ist es in Ordnung

Alte Umgebung: Python2.7.11: Anaconda2-4.0.7 Neue Umgebung: Python2.7.12: Anaconda2-4.2.0

Vor dem Berühren von Librosa

Hier ist eine Zusammenfassung dessen, was ich getan habe, als ich mit der Verarbeitung von Audiosignalen begonnen habe.

図1.gif 図2.gif

Endlich das Hauptthema

librosa ist ein Python-Paket für die Musikanalyse. Module für MIR werden bereitgestellt.

Was ich getan habe, als ich mich auf das [librosa-Tutorial] bezogen habe (http://librosa.github.io/librosa/tutorial.html)

von jetzt an

Impressionen

――Ich habe versucht, in die Welt der Sprachsignalverarbeitung einzutauchen, um eine Waffe namens maschinelles Lernen zu verwenden, aber ich werde mehr lernen, weil ich nicht genug Wissen habe. ――Personal stellte sich heraus, dass die Motivation zum Lernen erheblich gesteigert wurde, als die Eingabedaten des maschinellen Lernens in Sprache umgewandelt wurden. Eigentlich war es diesmal die größte Entdeckung.

Referenz-URL-Zusammenfassung

Vielen Dank. Bitte freuen Sie sich auf das nächste Mal!

Recommended Posts

Probieren Sie die Audiosignalverarbeitung mit librosa-Beginner aus
Akustische Signalverarbeitung mit Python (2)
Versuchen Sie, Audio mit M5 STACK auszugeben
Versuchen Sie es mit Python.
Bildverarbeitung mit MyHDL
Datensätze mit Pandas verarbeiten (1)
Datensätze mit Pandas verarbeiten (2)
Versuchen Sie SNN mit BindsNET
Bildverarbeitung mit Python
Parallelverarbeitung mit Mehrfachverarbeitung
Versuchen Sie eine Regression mit TensorFlow
Bildverarbeitung mit PIL
Akustische Signalverarbeitung beginnend mit Python-Lassen Sie uns ein dreidimensionales akustisches System erstellen
Bildverarbeitung mit Python (Teil 2)
100 Sprachverarbeitungsklopfen mit Python 2015
Versuchen Sie, den Boden durch Rekursion herauszufordern
Versuchen Sie die Funktionsoptimierung mit Optuna
Betten Sie Audiodaten in Jupyter ein
Versuchen Sie es mit TensorFlow
Parallelverarbeitung mit lokalen Funktionen
Bildverarbeitung mit PIL (Pillow)
Versuchen Sie, PythonTex mit Texpad zu verwenden.
"Apple-Verarbeitung" mit OpenCV3 + Python3
Versuchen Sie die Kantenerkennung mit OpenCV
Versuchen Sie, RBM mit Chainer zu implementieren.
Versuchen Sie Google Mock mit C.
Versuchen Sie es mit matplotlib mit PyCharm
Versuchen Sie die GUI-Programmierung mit Hy
Versuchen Sie Auto Encoder mit Pytorch
Probieren Sie die Python-Ausgabe mit Haxe 3.2 aus
Versuchen Sie die Matrixoperation mit NumPy
Versuchen Sie, XOR mit PyTorch zu implementieren
Versuchen Sie, CNN mit ChainerRL auszuführen
Probieren Sie verschiedene Dinge mit PhantomJS aus
Versuchen Sie Deep Learning mit FPGA
Parallele Verarbeitung mit Parallel von Scikit-Learn
Bildverarbeitung mit Python (Teil 1)
Bildverarbeitung mit Python (3)
Versuchen Sie, Python mit Try Jupyter auszuführen
Versuchen Sie, Parfüm mit Go zu implementieren
Probieren Sie Selenium Grid mit Docker aus
Versuchen Sie die Gesichtserkennung mit Python
Probieren Sie OpenCV mit Google Colaboratory aus
Versuchen Sie es mit Kaggle leicht maschinell
Versuchen Sie TensorFlow MNIST mit RNN
Versuchen Sie, Jupyter Hub mit Docker zu erstellen
Datenverarbeitungstipps mit Pandas
Versuchen Sie es mit Folium mit Anakonda
[Python] Bildverarbeitung mit Scicit-Image