[Lass uns mit Python spielen] Ziel ist die automatische Satzgenerierung ~ Lies .txt und mache daraus eine Satzeinheit ~

Einführung

Dies ist das zweite Mal, dass eine automatische Satzgenerierung angestrebt wird. Letztes Mal habe ich eine morphologische Analyse durchgeführt, um die Struktur von Sätzen zu untersuchen. Dieses Mal werde ich .txt lesen und es nacheinander in Sätze unterteilen.

Sätze lesen

Bereiten Sie die zuvor erstellten Textdaten mit einem Notizblock oder ähnlichem vor. Seien Sie vorsichtig mit der Codierungsmethode. (Im Beispiel ist es 'utf-8'.) Lassen Sie uns den Text lesen und anzeigen.

import re
a = open('test.txt', 'r', encoding = "utf-8") 
original_text = a.read()
print(original_text) #Text anzeigen

Ich fühle mich so. 2020-02-11.png

Textdaten organisieren

Als nächstes organisieren Sie die Textdaten. Abhängig davon, wie Sie den Originaltext schreiben, müssen Sie Ihre eigenen Anpassungen vornehmen. Der Code ist für meine Textdaten. (Im Fall von Frigana wie 'Text' muss es beispielsweise gelöscht werden.)

first_sentence = '"Erklärung von Python."'
last_sentence = 'Das Reptil Nishiki Snake, was das englische Wort Python bedeutet, wird als Maskottchen und Symbol der Python-Sprache verwendet.'
#Textdaten organisieren.
_, text = original_text.split(first_sentence)
text, _ = text.split(last_sentence)
text = first_sentence + text + last_sentence

text = text.replace('!', '。') #!! Was? Zu. Ändern. Achten Sie auf volle und halbe Winkel
text = text.replace('?', '。')
text = text.replace('(', '').replace(')', '') #Löschen ().
text = text.replace('\r', '').replace('\n', '') #Wird mit Zeilenumbrüchen in Textdaten angezeigt\Löschen n
text = re.sub('[、「」?]', '', text) 
sentences = text.split('。') #.. Teile Sätze in Sätze mit
print('Wortzahl:', len(sentences))
sentences[:10] #10 Sätze anzeigen

Das konnte ich tun 2020-02-11 (1).png

Das war's für diesen Code. Jetzt haben Sie eine Satz-für-Satz-Liste! Ich habe vor, dies durch morphologische Analyse in einen Satz zu fassen.

Plaudern

Ich bin persönlich auf einige von ihnen gestoßen, deshalb werde ich sie vorstellen.

Ist es so ein Ort? Es hat lange gedauert, weil ich es nicht bemerkt habe, obwohl es relativ einfach war. Nachdem ich darüber nachgedacht hatte, was mit den Beispielsätzen im Artikel zu tun ist, wurde es sicher (Wikipedia's Erklärung von Python).

Recommended Posts

[Lass uns mit Python spielen] Ziel ist die automatische Satzgenerierung ~ Lies .txt und mache daraus eine Satzeinheit ~
[Lass uns mit Python spielen] Ziel ist die automatische Satzgenerierung ~ Abschluss der automatischen Satzgenerierung ~
Fraktal zum Erstellen und Spielen mit Python
[Python3] Automatische Texterzeugung mit janome und markovify
[Lass uns mit Python spielen] Ein Haushaltsbuch erstellen
[Zum Spielen] Versuche Yuma zu einem LINE Bot zu machen (Python)
Lesen Sie die json-Datei mit Python, formatieren Sie sie und geben Sie json aus
Verknüpfen Sie Python Enum mit einer Funktion, um es aufrufbar zu machen
[Lass uns mit Python spielen] Bildverarbeitung zu Monochrom und Punkten
Lass uns mit Python mit Python spielen [Anfänger]
Lassen Sie uns ein Diagramm mit Python erstellen! !!
2. Erstellen Sie mit Python einen Entscheidungsbaum von 0 und verstehen Sie ihn (2. Grundlagen des Python-Programms)
Lesen Sie die Python # .txt-Datei für Super-Anfänger in Python mit .py
Lassen Sie uns ein Bilderkennungsmodell mit Ihren eigenen Daten erstellen und spielen!
Lesen Sie die CSV-Datei mit Python und konvertieren Sie sie unverändert in DataFrame
Machen Sie mit Python einen Entscheidungsbaum von 0 und verstehen Sie ihn (4. Datenstruktur)
Lassen Sie uns mit Python ein Shiritori-Spiel machen
Lesen wir die RINEX-Datei mit Python ①
Lassen Sie uns mit Python langsam sprechen
[Python] Lassen Sie uns matplotlib mit Japanisch kompatibel machen
Lesen Sie Python csv und exportieren Sie es nach txt
[Python] Bilder mit OpenCV lesen (für Anfänger)
Erstellen Sie ein Webframework mit Python! (1)
Machen wir einen Twitter-Bot mit Python!
Erstellen Sie ein Webframework mit Python! (2)
Lassen Sie uns mit Python Receive spielen und den Text des Eingabeformulars speichern / anzeigen
Versuchen wir es mit der Analyse! Kapitel 8: Analyseumgebung für Windows Erstellt mit Python und Eclipse (PyDev)