[PYTHON] Fügen Sie MeCab ein Wörterbuch hinzu

Es tut mir leid, ich bin ein Anfänger, um auf Qiita zu posten, daher finde ich das Layout seltsam. Ich wäre Ihnen dankbar, wenn Sie mir Ratschläge zum Layout und zum Schreiben geben könnten.

【Überblick】

Verfahren zum Hinzufügen eines neuen Wortes (Benutzerwörterbuch) zu MeCab

【Umgebung】

Mac OS X

【Vorsichtsmaßnahmen】

  1. Es wird davon ausgegangen, dass MeCab installiert ist
  2. Das Verzeichnis, in dem das MeCab-Wörterbuch gespeichert ist, hängt von der Umgebung ab. Überprüfen Sie daher den Speicherort jedes Verzeichnisses (in den meisten Fällen befindet es sich in / usr / local / lib / mecab / dic / ipadic).
  3. Wenn Sie macabrc nicht neu schreiben, müssen Sie den Pfad jedes Mal übergeben, wenn Sie das Benutzerwörterbuch (mecab -u user.dic) ausführen. Öffnen Sie / usr / local / etc / mecabrc mit einem Editor und schreiben Sie es wie folgt neu
 userdic	= /usr/local/lib/mecab/dic/ipadic/user.dic(links;Löschen)

[Dateibeschreibung]

1.create_dic.py (für Python 3.X ein Programm zum Erstellen von newword_dic.csv aus newword_list.txt)

create_dic.py


if __name__ == "__main__":
        fin = open("newword_list.txt")
        fout = open("newword_dic.csv","w")
        for line in fin:
                line=line.rstrip('\n')
                word = line.split(',')
                cost = int(max(-36000, -400*len(word[0])**1.5))
                fout.write("%s,-1,-1,%d,Substantiv,Allgemeines,*,*,*,*,*,*,%s,%s\n" % (word[0],cost,word[1],word[1]))
        fin.close()
        fout.close()

2.newword_list.txt (Liste mit neuen Wörtern. Grundsätzlich kann nur diese Textdatei bearbeitet werden)

Schwertkunst Online, Schwertkunst Onrain Die Menschheit hat abgelehnt, die Menschheit hat abgelehnt Magisches Mädchen Lyrical Nanoha, Magisches Mädchen Lyrical Nanoha Künstliche Intelligenz, künstliche Intelligenz

  1. newword_dic.csv (Wörterbuch im MeCab-Format)

スクリーンショット 2016-10-07 14.07.13.png

【Verfahren】

  1. Fügen Sie newword_list.txt ein neues Wort hinzu, wie im Beispiel gezeigt (Beispiel: Magical Girl Lyrical Nanoha, Mahou Shojo Rikaru Nanoha)
  2. Erstellen Sie aus newword_list.txt ein MeCab-Wörterbuch (newword_dic.csv)
  python create_dic.py
  1. Kompilieren Sie newword_dic.csv in ein Format (.dic), das mit MeCab verwendet werden kann, und fügen Sie es dem Wörterbuch hinzu.
  sudo /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 newword_dic.csv
  1. Verschieben Sie das hinzugefügte Wörterbuch in das Verzeichnis, in dem das MeCab-Systemwörterbuch vorhanden ist.
  sudo mv user.dic /usr/local/lib/mecab/dic/ipadic
  1. Starten Sie das Mecab vom Terminal aus   スクリーンショット 2016-10-07 14.13.03.png

In diesem Fall wird das Benutzerwörterbuch korrekt zu MeCab hinzugefügt

Verweise

http://tseiya.hatenablog.com/entry/2012/09/19/191114

Recommended Posts

Fügen Sie MeCab ein Wörterbuch hinzu
Fügen Sie MeCab ein Benutzerwörterbuch hinzu
[Morphologische Analyse] So fügen Sie Mecab ein neues Wörterbuch hinzu
MeCab: Hinzufügen neuer Wörter zum benutzerdefinierten Wörterbuch (Windows)
So fügen Sie MicroPython ein C-Modul hinzu ...
Metaklasse (delete) zum Generieren eines Wörterbuchs
Fügen Sie Ihrem Computer eine GPIO-Karte hinzu. (1)
So fügen Sie ein Paket mit PyCharm hinzu
Verschiedene Möglichkeiten, ein Wörterbuch zu erstellen (Erinnerungen)
Skript zum Erstellen einer Mac-Wörterbuchdatei
Fügen Sie VSCode eine virtuelle Python-Umgebung hinzu
Fügen Sie einen Befehl hinzu, um ähnliche Dateien zusammen zu markieren
So erstellen Sie ein Wörterbuch mit einer hierarchischen Struktur.
So fügen Sie einen Suchpfad für Python-Module hinzu
Generieren Sie ein MeCab-Wörterbuch aus Nico Nico Encyclopedia-Daten
So fügen Sie Python ein Modul hinzu, das Sie in Julialang eingefügt haben
[Bachstelze] Fügen Sie dem Bachstelzenprojekt eine Anmeldeseite hinzu
Faltung zu MNIST hinzufügen
Verwendung des Wörterbuchs {}
Zugriff auf Wörterbuchfelder
So konvertieren Sie ein Klassenobjekt mit SQLAlchemy in ein Wörterbuch
So schreiben Sie einen Listen- / Wörterbuchtyp von Python3
Generieren Sie ein Bash-Skript, um die Einstellungen des Datadog-Monitors hinzuzufügen
Einführung in den Wörterbuch-Suchalgorithmus
[Django] Muster zum Hinzufügen verwandter Datensätze nach dem Erstellen eines Datensatzes
Erstellen Sie ein Wörterbuch in Python
Hinzufügen / Entfernen des Kernels zu JupyterLab
Verwenden Sie MeCab, um Messwerte abzurufen
Ein Weg zum mittleren Python
Eine super Einführung in Linux
So konvertieren Sie mit Python [Anwendung] von einem Array in ein Wörterbuch
So rufen Sie eine Funktion auf
Seitenzahl zu PDF hinzufügen
Laden Sie eine Datei in Dropbox hoch
Senden Sie ein Signal an den Unterprozess
Fügen Sie Heatrapy eine Funktion hinzu, die Wärme + Wärme bei Temperatur übertragen kann
Verwenden Sie MeCab, um schlampige Sätze "langsam" zu übersetzen.
Praktische Funktion zum Hinzufügen von Spalten an einer beliebigen Stelle in Pandas DataFrame
Wie man ein Terminal hackt
Die übliche Art, einen Kernel mit Jupyter Notebook hinzuzufügen
Versuchen Sie, eine Sprache auszuwählen
Eine relativ einfache Möglichkeit, ein NEologd-Wörterbuch in das Windows-System-Wörterbuch einzufügen
Erweitern Sie ein in Python verschachteltes Wörterbuch, um etwas wie Pandas MultiIndex zu tun
[Python] So fügen Sie einer Tabelle Zeilen und Spalten hinzu (pandas DataFrame)
So überprüfen Sie die Speichergröße eines Wörterbuchs in Python
Versuchen Sie, eine Bezier-Kurve zu zeichnen
Hinweise zum lokalen Ausführen von Errbot
Fügen Sie mit ArcPy Felder zu Features hinzu
Konvertieren Sie A4 PDF alle 2 Seiten in A3
Schritte zum Erstellen eines Django-Projekts
Fügen Sie dem Matplotlib-Histogramm ein kumulatives Verhältnis hinzu
Ein Memorandum zur Umstellung auf Manjaro Linux
Erstellen Sie ein verschachteltes Wörterbuch mit defaultdict
Wie man einen lockeren Bot macht
So erstellen Sie ein Conda-Paket
Schreiben Sie die Standardausgabe in eine Datei
Python 2.7 Fügen Sie Dash.app japanische Dokumentation hinzu