[PYTHON] [Fehler] Ich wollte Sätze mit Flairs TextRegressor generieren

Hinweis! Es ist nur eine Fehlergeschichte. Wenn Sie also ein Dokument erstellen möchten, empfehle ich, sich umzudrehen!

Ich habe versucht, Sätze mit Flair zu generieren, einer sehr praktischen NLP-Bibliothek, aber das konnte ich überhaupt nicht. Aus dem Namen von TextRegressor habe ich das Gefühl, dass durch Regressionsanalyse ein Text generiert wird ...? Flair Es ist wahnsinnig praktisch, aber es gibt nicht viele Artikel auf Japanisch, deshalb schreibe ich einen Artikel, auch wenn es keine große Sache ist.

Ergebnisse

https://github.com/ochiba0227/flair_text_regressor

Trainingsdaten erstellen

Da es nicht in Flairs Tutorial erscheint, TextRegressor-Testcode und [Implementierung des TextRegressor-Modells](https: / Ich las aus /github.com/flairNLP/flair/blob/master/flair/models/text_regression_model.py) und bereitete einen Satz mit der folgenden Bezeichnung vor. Es scheint, dass nur Float-Typ für das Etikett verwendet werden kann, daher habe ich vorerst die gleiche Nummer eingegeben. Vielleicht können Sie die Artikel lernen, die vom Label generiert wurden, aber dieses Mal werden wir alles mit einem Durcheinander lernen.

Beschrifteter Text
Dies ist dem Artikeltitel von [TechCrunch](https://jp.techcrunch.com/) entlehnt.
label_topic text
1 Um das Problem zu lösen, dass bei jedem Start von Windows eine Fehlermeldung angezeigt wird
Wenn es sich um ein 1-Schlüssel-Gehäuse handelt, ist der in Deutschland hergestellte "Wunderkey" multifunktional und für den Außenbereich empfohlen!
1 Stellen Sie es einfach in die Waschmaschine. Die Kraft des natürlichen "Jods" kann Schimmel für 3 Monate verhindern, und die Wäsche wird auch sterilisiert und desodoriert!
1 Drei Dinge zuzubereiten, leicht zu kochen. Für eine Woche vorgefertigt+Zusammenfassung der Einwegrezepte
1 Was sind die Tipps für die Verwendung von Slack bei Remote-Arbeiten? Praktische Technik, um SlackJapan-Vertreter Sasaki zu fragen
1 [Heutige Verkaufsinformationen] Bei Amazon Time Sale, 1,Multifunktionale Smartwatch im 000-Yen-Bereich und 2,Ein klappbares Schreibtischlicht, das zu einer mobilen Batterie im Bereich von 000 Yen wird, ist ein Schnäppchen
1 Denken Sie eher an Effizienz als an mühsame Anstrengungen. "Nicht allein" Selbststudienmethode aktiver Universitätsstudenten
1 Kombinierte Tasche, perfekt für Geschäftsreisen und einfache Ausflüge [Das heutige Life-Hack-Tool]
1 Es können verschiedene Abbildungen und Layouts ausgewählt werden, und es sind auch alphabetische Zeichen möglich. Namensaufkleber, der Sie zum Drücken bringt
1 Diese neue Koronavirus-Epidemie endet nicht sofort. Es bleibt keine andere Wahl, als die Realität zu akzeptieren und zu leben
1 Beseitigen Sie Bewegungsmangel! Empfohlene Heimfitnessvideos / -spiele / -anwendungen
1 Mir ist bei der Fernarbeit aufgefallen "Nur PC ist Wi-Fi langsam "Problem. Was ist der Grund und Gegenmaßnahmen?
1 Telearbeit empfohlene Ware! Ich habe versucht, "beblau" zu verwenden, das einen Notebook-PC und Peripheriegeräte zusammen tragen kann
1 Einfache und köstliche Sardellenbutter kann in jedem Gericht verwendet werden
1 [Nur für Leser 10%Aus] Wenn sich etwas bewegt, ertönt ein Warnton und eine Benachrichtigung an Ihr Smartphone. "TracMo Leaf", das verfolgt werden kann, um Diebstahl und zurückgelassene Dinge zu verhindern
1 Wie ist es, mit Ihrer Familie zu arbeiten? Was ist die Herausforderung? | Alle arbeiten fern
1 Vorsichtsmaßnahmen bei der Herstellung von Desinfektionsmitteln zu Hause | Es ist gefährlich, wenn die Materialien in die falsche Reihenfolge gebracht werden
1 [Heutige Verkaufsinformationen] Bei Amazon Time Sale erhalten Sie ein Schnäppchen beim Mundspülen mit 6 Arten von Effekten wie Bleaching und Sterilisation im 900-Yen-Bereich und Gelkissen gegen Rückenschmerzen bei guter Atmungsaktivität.
1 Gleichgewicht und Ruhe auch in schwierigen und schwierigen Situationen. Zwei Wörter "können nicht übersetzt werden"
1 Für diejenigen, die ihre Brusttasche nicht verdrehen möchten, ein Fall, in dem mehrere Stifte sofort herausgenommen werden können [Heutiges Life-Hack-Tool]

Lernen

Teilen Sie die oben erstellten Daten in train.tsv, dev.tsv, test.tsv. Platzieren Sie die Datei in "resources / data" und führen Sie my_text_regressor.py aus.

Satzerzeugung (konnte nicht)

Dieses Mal generieren wir ein Dokument, das mit `beginnt, wenn Windows gestartet wird. Die Ergebnisse sind wie folgt.

# create example sentence
sentence = Sentence('Wenn Windows startet', use_tokenizer=japanese_tokenizer)
print(sentence.to_tokenized_string())
# predict tags and print
regressor.predict(sentence)
sentence.to_dict()

{'entities': [],
 'labels': [{'confidence': 1.0, 'value': '0.8864221572875977'}],
 'text': 'Wenn Windows startet'}

Oh, der Text wurde nur vektorisiert ...? Was für ein Chaos.

Impressionen

Da es kein Tutorial gibt, war das Lesen des Quellcodes etwas mühsam ... Während des Lernens wird eine Fehlermeldung angezeigt, daher ist diese Funktion wahrscheinlich noch in der Entwicklung. Um ehrlich zu sein, hat es ungefähr eine Stunde gedauert, aber ich war traurig ... Es ist nicht so gut, es mit Schwung zu tun. Es ist bedauerlich, dass ich das nicht kann. Deshalb möchte ich das nächste Mal GPT-2 leise verwenden und versuchen, Sätze zu generieren.

Es scheint, dass einige Leute bereits den japanischen Wikipedia-Korpus lernen. https://qiita.com/tanreinama/items/3b73fdeff09dfe74ef52

Recommended Posts

[Fehler] Ich wollte Sätze mit Flairs TextRegressor generieren
[Einführung in Pytorch] Ich möchte Sätze in Nachrichtenartikeln generieren
Hash-Kette wollte ich vermeiden (2)
Ich wollte die Klassifizierung von CIFAR-10 mit dem Chainer-Trainer in Frage stellen
Ich wollte cGAN zu ACGAN weiterentwickeln
Hash-Kette wollte ich vermeiden (1)
Ich wollte einen Satz wie "Fucking Rashomon" (vergangene Form) generieren
Ich habe versucht, verschiedene Sätze mit der automatischen Zusammenfassungs-API "summpy" zusammenzufassen.
Ich habe versucht, Azure Speech to Text zu verwenden.
Ich wollte ABC160 mit Python lösen
Ich wollte ABC159 mit Python lösen
Ich wollte ABC172 mit Python lösen
Ich wollte unbedingt mit Selen kopieren
DQN mit TensorFlow implementiert (ich wollte ...)
Ich wollte den NOMURA Contest 2020 mit Python lösen
i-Town Page Scraping: Ich wollte den Platz von Wise-Kun einnehmen
Ich möchte mit Python eine E-Mail von Google Mail senden.
Ich habe versucht, WAV-Dateien mit Pydub zu synthetisieren.
Ich möchte CSV-Dateien mit Vega-Lite visualisieren!
Ich wollte mit der Bezier-Kurve spielen
Ich wollte Python 3.4.3 mit Homebrew + pyenv installieren
Ich habe versucht, eine zufällige Zeichenfolge zu generieren
[Ich möchte Bilder mit Tensorflow klassifizieren] (2) Lassen Sie uns Bilder klassifizieren
Ich habe ein ○ ✕ Spiel mit TensorFlow gemacht
Ich wollte nur Pythons Pickle-Modul verstehen