Rufen Sie die Python-Bibliothek zur Textnormalisierung in MATLAB auf

Einführung

Es gibt Fälle, in denen ich eine vorhandene Textanalysefunktion, die in einer anderen Sprache geschrieben ist, für die Textanalyse verwenden möchte. Deshalb habe ich es versucht. Rufen wir ein Python-basiertes Dokumentinitialisierungstool namens neologdn von MATLAB auf. Ich bin neu in Python und es tut mir leid, wenn ich viele Fehler mache.

Umgebung

MATLAB R2020a Python 3.6

Verfahren

Es gibt eine offizielle Seite mit dem Namen "Aufrufen von Python-Bibliotheksfunktionen". Bereiten Sie sich also darauf vor. Es sind sowohl MATLAB- als auch Python-Umgebungen erforderlich, aber selbst wenn Sie Python in einem Wort sagen, gibt es eine, die das Aufrufen von MATLAB unterstützt, und dies scheint einfacher zu sein, so die offizielle Seite Ich habe es installiert.

Geben Sie auf der MATLAB-Seite Folgendes als Testversion ein.

MATLAB


py.os.listdir('.')

Dann konnte ich die Liste der Dateien mit os.listdir auf der Python-Seite anzeigen.

Bereiten Sie sich als Nächstes auf die Verwendung von neologdn vor, einem Tool, das Japanisch normalisiert.

neologdn is a Japanese text normalizer for mecab-neologd. The normalization is based on the neologd's rules: https://github.com/neologd/mecab-ipadic-neologd/wiki/Regexp.ja

Installieren Sie neologd.

Eingabeaufforderung


py -m pip install neologdn

Sie sind jetzt bereit.

Lassen Sie uns den Beispielsatz in der Readme-Datei von neologd in MATLAB ausführen.

MATLAB


>> py.neologdn.normalize("Hankaku Kana")

ans = 

Python str hat keine Eigenschaften.

Taschentuch

>> py.neologdn.normalize("Symbol in voller Breite! ?? @ #")

ans = 

Python str hat keine Eigenschaften.

Symbol in voller Breite!?@#

>> py.neologdn.normalize("Symbolausnahme in voller Breite "・"")

ans = 

Python str hat keine Eigenschaften.

Symbolausnahme in voller Breite "・"

>> py.neologdn.normalize("Lange Tonverkürzung")

ans = 

Python str hat keine Eigenschaften.

Lange Tonverkürzung

>> py.neologdn.normalize("Tilda Lösche wir~~ ∾ ~ 〰 ~ i")

ans = 

Python str hat keine Eigenschaften.

Tilda Entfernungsweg

>> py.neologdn.normalize("Verschiedene Bindestriche ˗֊ ------ - ⁃⁻₋−")

ans = 

Python str hat keine Eigenschaften.

Verschiedene Bindestriche-

>> py.neologdn.normalize("PRML ergänzendes Lesebuch")

ans = 

Python str hat keine Eigenschaften.

PRML-Zusatzleser

>> py.neologdn.normalize(" Natural Language Processing ")

ans = 

Python str hat keine Eigenschaften.

    Natural Language Processing

>> py.neologdn.normalize("Süß gut gut gut", pyargs('repeat',6))

ans = 

Python str hat keine Eigenschaften.

Süß gut gut

>> py.neologdn.normalize("Abfall Abfall Abfall Abfall", pyargs('repeat',1))

ans = 

Python str hat keine Eigenschaften.

Abfall

>> 

Sie können es nach dem Read Me verarbeiten. Das Ergebnis scheint übrigens in str-Typ zurückgegeben zu werden. image.png

Es wäre nützlich, diese normalisieren zu können, bevor Sie sie mit der Text Analytics Toolbox in Token aufteilen.

Recommended Posts

Rufen Sie die Python-Bibliothek zur Textnormalisierung in MATLAB auf
Rufen Sie Matlab von Python zur Optimierung auf
Rufen Sie Polly aus dem AWS SDK für Python auf
Ich wollte die Python-Bibliothek von MATLAB verwenden
Verwenden Sie IvyFEM (Finite-Elemente-Methodenbibliothek für .NET) aus Python
Rufen Sie C von Python mit DragonFFI auf
3.6 Textnormalisierung 3.7 Reguläre Ausdrücke zum Tokenisieren von Text
Extrahieren Sie mit Python Text aus Bildern
<Für Anfänger> Python-Bibliothek <Für maschinelles Lernen>
Tipps zum Aufrufen von Python von C.
Rufen Sie Python von Nim mit Nimpy auf
Rufen Sie C / C ++ von Python auf dem Mac auf
Rufen Sie die c-Sprache von Python aus auf (python.h)
Rufen Sie mit ctypes Ihre eigene gemeinsam genutzte Bibliothek in C-Sprache von Python aus auf
[google-oauth] [python] Google APIs-Clientbibliothek für Python
"Python AI Programmierung" ab 0 für Windows
Hinweis für Pyjulia, die Julia aus Python anruft
Python> Ausgaben von 1 bis 100, 501 bis 600> Für CSV
Aufrufbefehle von Python (Windows Edition)
Versuchen Sie, Studio Library von Python aus zu betreiben. [Anim speichern]
Wickeln Sie C mit Cython für Python ein
~ Tipps für Python-Anfänger mit Liebe von Pythonista ① ~
Rufen Sie Python-Skripte aus Embedded Python in C ++ / C ++ auf
Wrap C ++ mit Cython zur Verwendung von Python
~ Tipps für Python-Anfänger mit Liebe von Pythonista ② ~
Eine einfache Möglichkeit, Java von Python aus aufzurufen
Registrierung bei PyPI aus einer modernen Python-Bibliothek selbst erstellt
2016-10-30 sonst für Python3> für:
Python 3.6 E-Mail-Bibliothek
Python [für mich]
Python ast Bibliothek
SQL zu SQL
Installieren Sie PyCall auf Raspberry PI und versuchen Sie, die GPIO-Bibliothek für Python von Ruby zu verwenden
MeCab von Python
Python Library Hinweis
Installieren Sie psycopg2 (pgsql-Bibliothek für Python3) auf Apple Silicon
Python: Japanischer Text: Charakteristisch für Sprache aufgrund von Wortähnlichkeit
Python-Textlesung für mehrere Zeilen und eine Zeile
Übersetzen von Visual Studio 2017 nach Python (Microsoft Translator Text API)
[Python] Kein Wert für das Argument selbst im ungebundenen Methodenaufruf
[Python] Ruft den Gesetzestext aus der e-GOV-Gesetz-API ab
Rufen wir Ihre eigene C ++ - Bibliothek mit Python auf (Einstellungen)
Python-Lernnotiz für maschinelles Lernen von Chainer aus Kapitel 2
Rufen Sie Ihr eigenes Python-Modul aus dem ROS-Paket auf
Python: Japanischer Text: Charakteristisch für Sprache aus Wortkontinuität
[Python] So rufen Sie eine Funktion von c aus Python auf (ctypes edition)