[PYTHON] Ersetzen Sie die eindeutige Darstellung der gelesenen Textdatei durch eine Beschriftung (mit GiNZA).

Ich hatte es so schwer wie es war, also werde ich es vorerst veröffentlichen. Es kann einen besseren Weg geben. Wenn Sie ein Anfänger wie ich sind, beziehen Sie sich bitte darauf.

Die Umgebung ist Python 3.6.9 und Ubuntu 18.04.4.

change_NER.py


# coding:utf-8
import spacy

with open('input.txt','r') as f:
  nlp = spacy.load('ja_ginza')
  data = f.read()
  doc = nlp(data)

with open('output.txt','w') as f:

    text = list(data)                               #Zeichen in Liste speichern
    entity = [ent.label_ for ent in doc.ents]       #Einzigartiges Ausdrucksetikett
    start = [ent.start_char for ent in doc.ents]    #Von welchem Charakter ist der einzigartige Ausdruck
    end = [ent.end_char for ent in doc.ents]        #Wie viele Zeichen sind eindeutige Ausdrücke?
    num = 0                                        
    stop = False

    for i in range(len(text)):
        if i == start[num]:
            f.write(entity[num])
            if num < len(start) - 1: #Prävention außerhalb des Bereichs
                num += 1
            stop = True

        elif stop == True:
            if i < end[num-1]: #Nur die Anzahl der Zeichen im eindeutigen Ausdruck
                continue    #Verbrauchen i
            elif i == end[num-1]:
                stop = False
                f.write(text[i])

        else:
            f.write(text[i])

Recommended Posts

Ersetzen Sie die eindeutige Darstellung der gelesenen Textdatei durch eine Beschriftung (mit GiNZA).
Lesen Sie die Datei in Python mit einem relativen Pfad aus dem Programm
Ersetzen Sie den Verzeichnisnamen und den Dateinamen im Verzeichnis zusammen mit einem Linux-Befehl.
Abrufen des Dateinamens in einem Ordner mithilfe von glob
[Sublime Text 2] Führen Sie immer eine bestimmte Datei im Projekt aus
Verarbeiten Sie den Inhalt der Datei der Reihe nach mit einem Shell-Skript
[Python] Lesen Sie eine CSV-Datei mit großen Datenmengen mithilfe eines Generators
Ein Memo, das durch Umbenennen der Dateinamen im Ordner mit Python organisiert wird
Extrahieren Sie mit Python Zeilen, die den Bedingungen entsprechen, aus einer Textdatei
Lesen Sie die Python # .txt-Datei für Super-Anfänger in Python mit .py
Lesen wir die RINEX-Datei mit Python ①
Erstellen Sie eine große Textdatei mit Shellscript
Lesen Sie die Datei Zeile für Zeile mit Python
Lesen Sie die Datei Zeile für Zeile mit Python
Erstellen Sie mit dem Python-Anforderungsmodul einen Datensatz mit Anhängen in KINTONE
Zeichendatendatei mit numpy lesen
[Python] Lesen Sie die angegebene Zeile in der Datei
Lesen von Zeichen in Bildern mit Python OCR
Verschiedene Möglichkeiten, die letzte Zeile einer CSV-Datei in Python zu lesen
Speichern Sie die Einstellungsbedingungen als CSV-Datei mit UDF Manager mit OCTA
Lesen einer CSV-Datei mit Python 2/3
Erstellen Sie eine GIF-Datei mit Pillow in Python
[Python] Holen Sie sich die Dateien mit Python in den Ordner
Mit OpenJtalk auf Japanisch sprechen (Textdatei lesen)
Lesen Sie eine Datei mit verstümmelten Linien in Python
Mit gTTS auf Japanisch sprechen (Textdatei lesen)
Führen Sie eine Entitätsanalyse mit spaCy / GiNZA in Python durch
Speichern Sie das Objekt in einer Datei mit pickle
Erstellen Sie eine MIDI-Datei in Python mit pretty_midi
Lesen Sie mit Python Zeile für Zeile aus der Datei
So lesen Sie Dateien in verschiedenen Verzeichnissen
Ich habe versucht, den Text in der Bilddatei mit Tesseract der OCR-Engine zu extrahieren
Python2 / numpy> Ersetzen Sie nur eine bestimmte Spalte in einer Datei durch Spaltendaten aus einer anderen Datei> numpy.c_
Ich möchte nur Pods mit dem angegebenen Label mit Label Selector in Client-go extrahieren
Konvertieren Sie eine Textdatei mit hexadezimalen Werten in eine Binärdatei
Lesen Sie die CSV-Datei und zeigen Sie sie im Browser an
Lesen Sie die Linkliste im CSV-Format mit dem Graph-Tool
Führen Sie eine Python-Datei mit relativem Import in PyCharm aus
Speichern Sie das Pystan-Modell und erhalten Sie eine Pickle-Datei
[Python] Lesen Sie die CSV-Datei und zeigen Sie die Abbildung mit matplotlib an
Greifen Sie über das Ausführungsskript mit einem relativen Pfad auf die Datei zu.
Benennen Sie Remote-Dateien mithilfe von NcFTP in der Shell um und ersetzen Sie sie
Lesen Sie die GRIB2-Datei der Meteorological Agency auf pygrib
Verarbeiten Sie die Dateien im Ordner in der Reihenfolge mit dem Shell-Skript
So generieren Sie eine Abfrage mit dem IN-Operator in Django
[Hinweis] Import von Dateien in das übergeordnete Verzeichnis in Python
Lesen Sie die VTK-Datei und zeigen Sie die Farbkarte mit Jupiter an.
Einstellungen zum Ausführen eines Tests jedes Mal, wenn Sie eine Datei mit watchmedo (watchdog) im Editor speichern